Вопросы с тегом «encoding»

190
Microsoft Excel искажает диакритические знаки в файлах .csv?

Я программно экспортирую данные (используя PHP 5.2) в тестовый файл .csv. Пример данных: Numéro 1(обратите внимание на ударение на е). Данные utf-8(без предварительной спецификации). Когда я открываю этот файл в MS Excel, отображается как Numéro 1. Я могу открыть это в текстовом редакторе...

180
В чем разница между кодированием / декодированием?

Я никогда не был уверен, что понимаю разницу между декодированием str / unicode и кодированием. Я знаю, что str().decode()для случая, когда у вас есть строка байтов, которая, как вы знаете, имеет определенную кодировку символов, при условии, что это имя кодировки вернет строку Unicode. Я знаю, что...

177
Позвольте объекту JSON принимать байты или позволить выводить строки urlopen

В Python 3 я запрашиваю документ json с URL. response = urllib.request.urlopen(request) responseОбъект представляет собой файл-подобный объект с readи readlineметоды. Обычно объект JSON можно создать с помощью файла, открытого в текстовом режиме. obj = json.load(fp) Что я хотел бы сделать, это: obj...

173
Зачем указывать @charset «UTF-8»; в вашем файле CSS?

Я видел эту инструкцию как самую первую строку из множества CSS-файлов, которые были переданы мне: @charset "UTF-8"; Что он делает, и нужно ли это правило? Кроме того, если я включу этот метатег в свой элемент head, исключит ли это необходимость его присутствия в моих файлах CSS? <meta...

171
Как определить кодировку файла в OS X?

Я пытаюсь ввести некоторые символы UTF-8 в файл LaTeX в TextMate (который говорит, что его кодировка по умолчанию - UTF-8), но LaTeX, кажется, не понимает их. Запуск cat my_file.texпоказывает символы правильно в терминале. Запуск ls -alпоказывает то, что я никогда раньше не видел: «@» в списке...

163
«TypeError: (Integer) не является сериализуемым JSON» при сериализации JSON в Python?

Я пытаюсь отправить простой словарь в файл json из python, но получаю сообщение «TypeError: 1425 is JSON serializable». import json alerts = {'upper':[1425],'lower':[576],'level':[2],'datetime':['2012-08-08 15:30']} afile = open('test.json','w') afile.write(json.dumps(alerts,encoding='UTF-8'))...

163
Правильный способ определения кодировки исходного кода Python

PEP 263 определяет, как объявлять кодировку исходного кода Python. Обычно первые 2 строки файла Python должны начинаться с: #!/usr/bin/python # -*- coding: <encoding name> -*- Но я видел много файлов, начинающихся с: #!/usr/bin/python # -*- encoding: <encoding name> -*- =>...

151
В чем разница между кодировкой и кодировкой?

Я запутался в кодировке текста и кодировке. По многим причинам, я должен изучать не-Unicode, не-UTF8 материал в моей предстоящей работе. Я нахожу слово «charset» в заголовках писем, как в «ISO-2022-JP», но в текстовых редакторах такой кодировки нет. (Я осмотрел разные текстовые редакторы.) В чем...

148
В OS X Lion LANG не установлен в UTF-8, как это исправить?

Я пытаюсь настроить postgress в OS X Lion и обнаруживаю, что неправильно настроена среда LOCALE var. Вот что установлено: LANG= LC_COLLATE="C" LC_CTYPE="C" LC_MESSAGES="C" LC_MONETARY="C" LC_NUMERIC="C" LC_TIME="C" LC_ALL= Я ожидаю что-то с UTF-8. Это чистая установка OS X Lion с испанским языком....

148
Почему функция PHP json_encode преобразует строки UTF-8 в шестнадцатеричные объекты?

У меня есть PHP-скрипт, который работает с различными языками. К сожалению, всякий раз, когда я пытаюсь использовать json_encode, любой вывод Unicode преобразуется в шестнадцатеричные объекты. Это ожидаемое поведение? Есть ли способ преобразовать вывод в символы UTF-8? Вот пример того, что я вижу:...

147
«\ D» в регулярном выражении означает цифру?

Я обнаружил , что в 123, \dспички 1и , 3но не 2. Мне было интересно, \dсоответствует ли цифра, удовлетворяющая какому требованию? Я говорю о регулярных выражениях в стиле Python. Плагин регулярных выражений в Gedit использует регулярные выражения в стиле Python. Я создал текстовый файл с...

146
Изменить кодировку Python по умолчанию?

Когда я запускаю свои приложения с консоли, у меня возникает много проблем с "не могу кодировать" и "не могу декодировать" с Python . Но в Eclipse PyDev IDE кодировка символов по умолчанию установлена ​​на UTF-8 , и я в порядке. Я искал установку кодировки по умолчанию, и люди говорят, что Python...

146
Как я могу преобразовать строку в UTF-8 в C #?

У меня есть строка, которую я получаю из стороннего приложения, и я хотел бы правильно отобразить ее на любом языке, используя C #, на моей Windows Surface. Из-за неправильной кодировки часть моей строки на испанском выглядит так: Acción тогда как это должно выглядеть так: Acción Согласно ответу...

146
PHP: конвертировать любую строку в UTF-8, не зная исходного набора символов, или хотя бы попытаться

У меня есть приложение, которое работает с клиентами со всего мира, и, естественно, я хочу, чтобы все, что входит в мои базы данных, было в кодировке UTF-8. Основная проблема для меня заключается в том, что я не знаю, какой будет кодировка источника какой-либо строки - это может быть из текстового...

143
Java: как определить правильную кодировку кодировки потока

Со ссылкой на следующий поток: Приложение Java: невозможно правильно прочитать файл в кодировке iso-8859-1 Каков наилучший способ программного определения правильной кодировки кодировки входного потока / файла? Я пробовал использовать следующее: File in = new File(args[0]); InputStreamReader r =...

140
Почему Python печатает символы юникода, если кодировка по умолчанию - ASCII?

Из оболочки Python 2.6: >>> import sys >>> print sys.getdefaultencoding() ascii >>> print u'\xe9' é >>> Я ожидал, что после оператора печати будет какая-то тарабарщина или ошибка, поскольку символ «é» не является частью ASCII, и я не указал кодировку. Думаю, я...