Что это за символ Unicode в моем буфере обмена?

51

Есть ли быстрый и простой способ найти кодовую точку Unicode для любого символа? Например, я вижу забавного персонажа на веб-странице или в файле PDF, или в каком-то другом документе.

В настоящее время я копирую символ в буфер обмена, сохраняю его в файл и просматриваю файл с помощью шестнадцатеричной программы просмотра. В качестве альтернативы я могу открыть Microsoft Word, вставить и сделать Alt + X. Оба эти метода немного громоздки. Есть ли более простой способ?

Я использую Notepad ++, поэтому, если есть какой-то способ сделать это с помощью Notepad ++, это будет подходящим ответом (это менее громоздко, чем необходимость открывать Word). Или, может быть, есть способ сделать это с помощью небольшого специализированного приложения?

DodgyCodeException
источник
5
ltg.ed.ac.uk/~richard/utf-8.html Хороший инструмент, стоит отметить!
tkausl
Как принять принятый ответ? Он не упоминает Unicode вообще и не работает для Unicode. Как именно это решило ваш вопрос? Попробуйте 😍 и увидите, что это не сработает. Он даже не отображает персонажа.
Томас Веллер
@ThomasWeller вы делаете хорошее замечание, и я изменил свой принятый ответ. Кажется, что Notepad ++ может работать только с 16-битными символами и не понимает кодовые точки больше 0xFFFF, как в вашем примере символа.
DodgyCodeException
@ user202729 Это не 2 года. Там написано «спросил 15 декабря», что означает «15 декабря этого года», а не «декабрь 2015». Так что всего 3 дня. Я не понимаю, почему за этот вопрос проголосовали. Это был только простой вопрос о чем-то простом, что меня интересовало.
DodgyCodeException
1
Что это за Unicode, онлайн-инструмент , babelstone.co.uk/Unicode/whatisit.html
DrMoishe Pippik,

Ответы:

31

Я много работаю с символами Unicode, поэтому специально для этого написал небольшое приложение для Windows:

Unicode Character Informer ( Документация )

Кроме того, мой текстовый редактор Rejbrand Text Editor имеет обширную поддержку символов Unicode.

Андреас Рейбранд
источник
1
Спасибо! Это довольно полезно. Могу ли я предложить F1 должна быть справочной функцией, которая вызовет небольшое окно, содержащее ссылку на вашу веб-страницу документации.
DodgyCodeException
6
Из любопытства, на какой работе ты работаешь?
Ooker
Я использую bash, unipropsкоторый, похоже, выводит похожую информацию.
TRiG
К вашему сведению, я скачал ваш информер юникодных символов, и моя антивирусная программа очень боялась этого. Не позволил бы мне использовать его, если я не добавлю его в белый список, поэтому я не собираюсь его использовать. У вас есть безвирусная копия? ха-ха, я знаю, что на самом деле в нем нет вируса - но все же, почему мой AV ненавидит его так сильно? Кстати, это Symantec Endpoint Protection.
rory.ap
@ rory.ap: Я гарантирую, что он полностью свободен от вирусов. К сожалению, ложноположительные проблемы распространены (возможно, особенно для приложений, написанных на Delphi). Это то, что я очень хорошо знаю, и то, что действительно расстраивает меня. Сегодня трудно быть разработчиком программного обеспечения Win32 в свободное время. Я просто хотел бы, чтобы люди перестали создавать вредоносные программы, поэтому серьезные разработчики хобби не пострадали бы от ложных срабатываний ... Может быть, подписание кода улучшит ситуацию, но это не бесплатно, и все программное обеспечение, которое я создаю, я раздаю бесплатно. :(
Андреас Рейбранд
34

Notepad ++ имеет предустановленный плагин, называемый Converter, который имеет возможность конвертировать ASCII в HEX и наоборот. Этот инструмент весьма полезен для преобразования файлов данных в формате HEX, которые должны быть преобразованы в ASCII, для чтения:

введите описание изображения здесь

Вот как это работает:

введите описание изображения здесь

пижон
источник
2
Спасибо! Кстати, какое программное обеспечение вы используете для создания такого анимированного GIF-файла?
DodgyCodeException
44
Ха ха! Я только что заметил слово "восьмиугольник" в этом диалоговом окне. Это означает основание 18. Разработчик означает восьмеричное, конечно (основание 8).
DodgyCodeException
5
@DodgyCodeException Я думаю, что LICEcap
user11153
3
@DodgyCodeException screentogif.com хорош для записи анимированных картинок.
Дэвид
5
Когда я вставляю 😍, там написано D83D. Так что это только половина правды и НЕ работает с символами Юникода.
Томас Веллер
17

Когда я сталкиваюсь с этой проблемой, быстрый поиск в Google обычно дает быстрый ответ. Например, когда я гуглю "😍 unicode", я получаю такой результат: Поиск в Google для "смайлика с глазами в форме сердца"

Мне нравится этот метод, потому что:

  • Работает на любом компьютере с интернетом
  • Вам не нужно ничего устанавливать
  • Необходимые нажатия клавиш ( Ctrl+ C& Ctrl+ T& Ctrl+ V& Enter) - это действия с мышечной памятью для меня и, вероятно, для большинства других разработчиков / машинисток.
Эрик Систранд
источник
9

Есть хороший маленький сайт под названием Unicode Character Inspector (созданный Тимом Уитлоком), который делает именно это. Я нахожу это более удобным, чем текстовый редактор или настольная программа.

Баптист Канделе
источник
3
Чтобы сделать это еще быстрее, вы можете настроить в своем браузере ярлык поисковой системы, чтобы он сразу переходил на информационную страницу о введенном символе. Это работает, потому что вы можете указать символ как параметр строки запроса, как https://apps.timwhitlock.info/unicode/inspect?s={some unicode character here}.
Эрик Сеастранд
9

В Unix-подобной системе *:

unicode -s "$(xsel -ob)"

Вы можете создать псевдоним этого или создать скрипт для его запуска.

Вывод выглядит так:

U+2672 UNIVERSAL RECYCLING SYMBOL
UTF-8: e2 99 b2 UTF-16BE: 2672 Decimal: ♲ Octal: \023162
♲ (♲)
Uppercase: 2672
Category: So (Symbol, Other)
Bidi: ON (Other Neutrals)

* Похоже, что оригинальный постер, вероятно, использует Windows, но (а) это не указано, и (б) это решение может помочь другим.

wchargin
источник
Спасибо! Хотя я в основном использую Windows, я также использую Linux, и в любом случае я могу загрузить порт Windows этой утилиты (например, GnuWin).
DodgyCodeException
6

Вы можете использовать PowerShell!

[char]::ConvertToUtf32((gcb), 0)

Это печатает первую кодовую точку Unicode текста в буфере обмена.

Если вам не нужно беспокоиться о символах вне Базовой многоязычной плоскости (которые будут представлены в строках .NET как суррогатное с высоким и низким суррогатом), вы можете использовать это вместо:

[int](gcb)[0]

Если вы предпочитаете его в шестнадцатеричном формате , вы можете использовать спецификатор формата :

'0x{0:x}' -f [char]::ConvertToUtf32((gcb), 0)
Бен Н
источник
5

Примечание для любых пользователей Emacs: вы можете ввести C-u C-x =текст, и он даст вам кучу информации о символе под курсором, включая кодовую точку Unicode, имя в базе данных Unicode, категории и т. Д.

             position: 146 of 147 (99%), column: 0
            character: ♲ (displayed as ♲) (codepoint 9842, #o23162, #x2672)
    preferred charset: unicode (Unicode (ISO10646))
code point in charset: 0x2672
               script: symbol
               syntax: w    which means: word
             category: .:Base
             to input: type "C-x 8 RET 2672" or "C-x 8 RET UNIVERSAL RECYCLING SYMBOL"
          buffer code: #xE2 #x99 #xB2
            file code: #xE2 #x99 #xB2 (encoded by coding system utf-8-unix)
              display: by this font (glyph code)
    xft:-PfEd-Mensch-normal-normal-normal-*-16-*-*-*-m-0-iso10646-1 (#x985)

Character code properties: customize what to show
  name: UNIVERSAL RECYCLING SYMBOL
  general-category: So (Symbol, Other)
  decomposition: (9842) ('♲')
Нил Робертс
источник
3

Есть Вим? Просто вставьте его, наведите на него курсор и нажмите ga. Я использую это все время для странных персонажей.

Silverwolf
источник
2

Я использую http://unicode.scarfboy.com , который прост и работает хорошо.

Нет не указано мое настоящее имя
источник
2
Пожалуйста, добавьте краткое описание того, что делает сайт, есть ли какой-то конкретный способ его использования и как он конкретно отвечает на вопрос ОП. Однострочного ответа обычно недостаточно для правильного ответа на вопрос.
Computercarguy
2

Я считаю, что конвертер кодов Unicode Ришарда Ишиды (ссылка на GitHub) очень полезен, среди прочего, для поиска кодов Unicode . Он также обеспечивает переводы / преобразования в другие кодовые точки, кодировки и, например, escape-последовательности.

Unicode Converter

Вы также можете зайти на главную веб-страницу Ричарда Ишиды (rishida.net) , так как она содержит (ссылки на) множество ценных инструментов и информации, особенно если вы заинтересованы в интернационализации и кодировке символов. Например, другой очень полезный инструмент, связанный там, это его инструмент Uniview (ссылка на github) .

UniView

И, наконец, очень полезным, на мой взгляд, является, в основном, для пользователей Mac, программа MacOS Character Viewer , доступная через меню ввода , которое можно включить в « Системных настройках» → « Клавиатура».

Хотя веб-сайт поддержки Apple в основном посвящен тому, как вставлять смайлики (…), просмотрщик символов на самом деле очень полезен для поиска определенных («специальных») символов и их кодовых точек в нескольких различных кодировках, а также для поиска того, какие Шрифты в вашей системе содержат определенные глифы.

Просмотрщик персонажей

Ура!

Арри
источник
Я думаю, что Character Viewer, как показано на рисунке, является по крайней мере одной старой версией (ОС); Высокая Сьерра дает гораздо менее удобное «Показать эмодзи и символы».
Антон Шервуд
@AntonSherwood ничего не изменилось, что я могу сказать. Вы можете выбрать опцию Emoji и Символы «Настроить список», какие таблицы показывать. По-моему, Unicode по умолчанию не виден.
Гайфа
Я могу подтвердить, что у Сьерры есть полная панель Персонажей, а у Сьерры нет?
SilverWolf
Ну, мы чему-то учимся каждый день. Спасибо @ Guifa. Я сделал это немного больше по своему вкусу - но не могу воспроизвести показанный скриншот.
Антон Шервуд
2

Вы также можете использовать следующий сайт: https://unicode-table.com/en/ Просто вставьте своего персонажа, и вы получите код Unicode и HTML-код.

Алина Ладыгина
источник
1

Если у вас есть Microsoft Word, вставьте туда текст, выберите символ (или щелкните справа от него) и нажмите Alt+ X.

G-Man
источник
Это уже обеспечено самим вопросом.
Стефан Бийзиттер
0

Я собираюсь упомянуть http://amp-what.com/, так как он действительно прост в использовании благодаря своему полю быстрого поиска и поддерживает различные нотации (& code, кодовые точки Unicode , последовательность символов кодирования URI).

Пример изображения

493msi
источник
0

Вот еще один ответ, используя идею от user202729:

Добавьте URL в закладки javascript:alert(prompt().codePointAt(0).toString(16))и используйте браузер для его запуска. (Работает в Chrome и Firefox. Не работает в IE, но это может быть связано с настройками безопасности.)

В отличие от других ответов, не требуется подключение к Интернету, нет необходимости загружать внешнюю утилиту, не зависящую от ОС.

DodgyCodeException
источник