Вопросы с тегом «unicode»

Unicode - это стандарт компьютерной индустрии для согласованного кодирования, представления и обработки текста, выраженного в большинстве мировых систем письма.

62
Как я могу установить кодировку VIM по умолчанию в UTF-8?

Я хотел бы внести свой вклад в проект с открытым исходным кодом, предоставляющий переведенные строки. Одним из их требований является то, что участники должны использовать UTF-8 в качестве кодировки для PO-файлов. Я использую VIM 7.3 на Linux. Как я могу быть уверен, что кодировка VIM установлена...

54
Почему printf «сжимается» умлаут?

Если я выполню следующий простой скрипт: #!/bin/bash printf "%-20s %s\n" "Früchte und Gemüse" "foo" printf "%-20s %s\n" "Milchprodukte" "bar" printf "%-20s %s\n" "12345678901234567890" "baz" Это печатает: Früchte und Gemüse foo Milchprodukte bar 12345678901234567890 baz то есть текст с умлаутами...

50
Неверная фильтрация utf8

У меня есть текстовый файл в неизвестной или смешанной кодировке. Я хочу видеть строки, которые содержат последовательность байтов, которая не является допустимой UTF-8 (путем передачи текстового файла в какую-то программу). Эквивалентно, я хочу отфильтровать строки, которые являются...

38
Какие шрифты хороши для символов Юникод

Поэтому я посмотрел на этот ответ по stackoverflow и понял, что мои шрифты не покрывают большую часть спектра unicode utf-8 (так как я получаю много квадратов). Кто-нибудь знает шрифт, который будет охватывать весь этот...

36
Должны ли мы использовать символы UTF-8, такие как ⏰ в скрипте bash / shell?

Простой код здесь работает, как и ожидалось, на моей машине, если запущен с bash: function ⏰(){ date } ⏰ Может ли быть проблема для других людей, использующих это, или это универсально? Мне интересно, потому что я никогда не видел ничего подобного в другом исходном коде. Изменить: Есть...

36
Как сделать так, чтобы tr знал не-ascii (юникод) символы?

Я пытаюсь удалить некоторые символы из файла (UTF-8). Я использую trдля этого: tr -cs '[[:alpha:][:space:]]' ' ' <testdata.dat Файл содержит несколько иностранных символов (например, «Латвийская» или «àé»). trкажется, не понимает их: он рассматривает их как не-альфа и удаляет тоже. Я попытался...

29
Обновил мой сервер arch linux и теперь я получаю tmux: нужен язык UTF-8 (LC_CTYPE), но есть ANSI_X3.4-1968

Я недавно обновил свой сервер Arch Linux, и во время этого процесса tmux обновился. Я использовал tmuxво время обновления и использовал его потом, но все во время одного сеанса SSH. Однако теперь, когда я пытаюсь выполнить любую tmuxкоманду, я получаю эту ошибку: tmux: need UTF-8 locale (LC_CTYPE)...

27
Как указать символы, используя шестнадцатеричные коды в `grep`?

Этот вопрос был перенесен из Stack Overflow, потому что на него можно ответить в Unix и Linux Stack Exchange. Мигрировал 8 лет назад . Я использую следующую команду для определения диапазона набора символов для шестнадцатеричного кода от 0900 (вместо अ) до 097F (вместо व). Как я могу использовать...

23
В bash, как я могу преобразовать кодовую точку Unicode [0-9A-F] в печатный символ?

У меня есть список кодовых точек Unicode, но я не знаю "простого" способа конвертировать эти шестнадцатеричные значения в действительные символы, которые они представляют ... Я слышал, что Zsh имеет echo -e '\u0965', но я использую Bash 4.1. Есть ли что-то такое же простое, как метод zsh, для bash?...

22
Преобразование форм нормализации Unicode в командной строке Unix

В Unicode некоторые комбинации символов имеют более одного представления. Например, символ ä может быть представлен как «ä», то есть кодовая точка U + 00E4 (два байта c3 a4в кодировке UTF-8) или как «ä», то есть две кодовые точки U + 0061 U + 0308 (три байта 61 cc 88в UTF-8). Согласно стандарту...

19
Может ли профиль терминала Gnome использовать UTF-8 по умолчанию?

Я нахожусь в системе Ubuntu (я думаю). У меня нет root, поэтому я не могу изменить локаль. Я хочу, чтобы мой профиль терминала по умолчанию использовал UTF-8 по умолчанию. Должен быть способ сделать это, либо .gconf/apps/gnome-terminal/где-то в каталоге, либо в переменной окружения, либо во что-то...

18
Есть ли универсальный способ написания символов Unicode?

Иногда я хочу написать специальные символы Unicode, такие как em-dash (-), в различных программах, таких как vim, Chrome (как сейчас!) Или LibreOffice. В LibreOffice я могу добиться этого через специальное диалоговое окно, расположенное в меню «Вставка». Другие программы, похоже, не имеют...

18
Как правильно распаковать архив ZIP с именами на иврите?

Кто-то прислал мне ZIP-файл, содержащий файлы с ивритскими именами (и созданный в Windows, не уверен, каким инструментом). Я использую LXDE на Debian Stretch. Менеджер архивов Gnome распаковывает файл, но ивритские символы искажены. Я думаю, что я получаю октеты UTF-8, расширенные до символов...

16
Почему некоторые символы юникода не выводятся на мой терминал?

Я использую Arch Linux с простым терминалом, использующим шрифт Adobe Source Code Pro. Мой язык правильно установлен LANG=en_US.UTF-8. Я хочу напечатать символы Unicode, представляющие игральные карты, на мой терминал. Я использую Википедию для справки . Символы Юникода для карточных мастей...

16
coreutils, которые знают?

Когда я использовал cutсегодня, я обнаружил, что это не символ UTF-8 как символ, а 3 символа, потому что его длина составляет 3 байта. Похоже, что это в целом верно для многих инструментов. Существуют ли версии с поддержкой coreutilsUTF-8? Мой localeвывод: LANG=en_US.UTF-8 LC_CTYPE="en_US.UTF-8"...