Вопросы с тегом «character-encoding»

18
Кодировки символов, поддерживаемые more, cat и less

У меня есть текстовый файл в следующем формате file: Текст ISO-8859, с ограничителями строки CRLF Этот файл содержит текст на французском языке с акцентами. Моя оболочка способна отображать акцент и emacsв режиме консоли способна правильно отображать эти акценты. Моя проблема в том more, catи...

17
Иностранные символы не будут отображаться в SSH

У меня есть некоторые проблемы с использованием sshи удаленного сервера (к которому у меня нет доступа администратора). В частности, там есть несколько папок с корейским и кириллическим текстом. Когда я отображаю содержимое родительской папки с lsпомощью символов, они экранируются как «?»....

16
SSH и кодировка символов

Когда я sshв свой VPS, у меня irssiработает на экране. Когда кто-то отправляет символ Unicode (например, © или €), irssiотображается мусор, когда я использую его через экран в sshсеансе. Если я подключусь к нему irssiс помощью прокси-модуля irssi, из irssi, запущенного на моем локальном компьютере,...

15
Не можете использовать `cut -c` (` --characters`) с UTF-8?

Команда cutимеет опцию -cдля работы с символами вместо байтов с опцией -b. Но это, похоже, не работает, в en_US.UTF-8локали: Второй байт дает второй символ ASCII (который точно так же кодируется в UTF-8): $ printf 'ABC' | cut -b 2 B но не дает второго из трех греческих не-ASCII символов в локали...

14
Печать десятичного знака в символ ascii, моя команда не выводит, как задумано

Я хотел вывести строку всех символов ascii с помощью следующей команды for i in `seq 32 127`; do printf "%c" $i; done Вывод вышеуказанной команды: 33333334444444444555555555566666666667777777777.............. Это первая (слева) цифра каждого числа. Просматривая этот сайт, я наткнулся на ответ на...

14
iconv Недопустимая последовательность ввода - почему?

При попытке преобразовать текстовый файл в его ASCII-эквивалент я получаю сообщение об ошибке iconv: illegal input sequence at position. Я использую команду iconv -f UTF-8 -t ascii//TRANSLIT file Оскорбительный персонаж есть æ. Сам текстовый файл присутствует здесь . Почему это говорит о...

13
Может ли vim отображать только символы ASCII и обрабатывать другие байты как двоичные данные?

Я уже знаю vim -b, однако, в зависимости от используемой локали, он отображает многобайтовые символы (например, UTF-8) в виде отдельных букв. Как я могу попросить vimотображать только печатные символы ASCII и обрабатывать остальные как двоичные данные, независимо от...

12
Несколько вопросов о кодировке символов файловой системы в Linux

Из-за большого объема обмена файлами между Windows ( кодировка GBK ) и Linux ( кодировка UTF-8 ), он легко столкнется с проблемами кодировки символов, такими как: Файлы zip / tar, имя которых содержит китайские символы в системе Windows, разархивируйте / разархивируйте их в системе Linux. запустить...

12
Wget возвращает двоичный файл вместо HTML?

Я использую wget для загрузки статической HTML-страницы. W3C Validator сообщает, что страница закодирована в UTF-8. Тем не менее, когда я загружаю файл после загрузки, я получаю кучу глупостей. Я нахожусь на Ubuntu, и я думал, что кодировка по умолчанию была UTF-8? Вот что говорит мой файл локали....

12
Почему wc -m и wc -c разные?

Как программист на Си, я был удивлен, увидев, что wc -c(который подсчитывает количество байтов) и wc -m(который подсчитывает количество символов) выдает очень разные результаты для моего длинного текстового файла. Мне всегда говорили, что sizeof(char)это 1 байт. qdii@nomada ~/Documents $ wc -c...

12
Как исправить русские буквы в приложении Wine при настройке LANG не помогает?

Приложение с русским пользовательским интерфейсом показывает вопросительные знаки вместо большей части своего текста (хотя некоторые элементы отображаются нормально). Язык системы английский (en_US, en_IE), я пробовал Ubuntu ant XUbuntu 12.04 с Wine 1.5. Я пытался запустить приложение с...

11
Почему мои имена файлов выглядят «нормально» в Linux, а не удаленно в Windows?

Во время работы с коллегой я обнаружил странную проблему, которая, похоже, связана с кодированием. Мы работаем с некоторыми изображениями , которые имеют достаточно простые имена файлов , таких как city.gifили wine.gif, но как можно было бы ожидать , все становится более сложным при использовании...

11
Некоторые приложения не принимают символы из клавиши «Создать»

Проблема в том, что ключ compose работает нормально, но некоторые приложения не принимают некоторые символы из него. Например, я могу напечатать символ ∞в Emacs ( Compose+ 8+ 8), но это не сработает в FireFox, Konsole и Kate. Но многие другие символы, например €набранные там (в FireFox, Konsole и...

11
поддержка кодировки utf-8 с помощью lpr

При попытке отправить текстовый файл на принтер через lprс xterm, содержание было испорчено до неузнаваемости, причиной которого была в конечном счете восходит к кодированию файла. Если я вместо этого обработаю текст с помощью iconv(например, iconv -f utf-8 -t ascii//TRANSLIT), то файл печатается...

11
Какие кодировки символов поддерживаются posix?

POSIX определяет поведение инструментов , таких как grep, awk, sed, и т.д. , которые работают против текстовых файлов. Поскольку это текстовый файл, я думаю, что есть проблема (ы) кодировки символов. Вопрос: Какие кодировки символов поддерживаются POSIX? (или текстовые файлы какой кодировки могут...

11
Влияние $ LANG на терминал

Я пытаюсь узнать, как $LANGпеременная ведет себя с gnome-терминал (и его параметр предпочтения кодировки символов). Я использовал iso8859-1 (latin1) в качестве основного набора символов, и все мои имена файлов закодированы как таковые. Для следующих тестов я создам ls -lкаталог с испанскими...

11
терминал: отображение специальных символов

В некоторых программах, таких как htopлинии и кадры, отображаются неправильно. Вместо этого они отображаются как -и /. Но на другой машине они отображаются правильно в виде правильных строк: Я не уверен, является ли это проблемой терминала, или, возможно, необходим какой-то пакет. Если это...

10
специальный символ в имени файла (\ # 033OA)

У меня небольшая проблема с очень упрямой ошибкой во время rsync. Это вызвано файлом со специальным символом в имени файла. Были и другие, но я мог бы разобраться, выполнив некоторые преобразования в кодировке имени файла. Однако этот файл я даже не могу найти. Итак, вот что говорит rsync:...

10
Как я могу определить странного персонажа?

Я пытаюсь определить странный символ, который я нашел в файле, с которым я работаю: $ cat file � $ od file 0000000 005353 0000002 $ od -c file 0000000 353 \n 0000002 $ od -x file 0000000 0aeb 0000002 Файл использует кодировку ISO-8859 и не может быть преобразован в UTF-8: $ iconv -f ISO-8859 -t...