Вопросы с тегом «utf-8»

245
URL декодировать UTF-8 в Python

Я провел много времени, насколько я новичок в Python. Как я мог когда-либо расшифровать такой URL: example.com?title=%D0%BF%D1%80%D0%B0%D0%B2%D0%BE%D0%B2%D0%B0%D1%8F+%D0%B7%D0%B0%D1%89%D0%B8%D1%82%D0%B0 к этому в Python 2.7: example.com?title==правовая+защита url=urllib.unquote(url.encode("utf8"))...

243
UTF-8 байт [] в строку

Давайте предположим, что я только что использовал a BufferedInputStreamдля чтения байтов текстового файла в кодировке UTF-8 в байтовый массив. Я знаю, что могу использовать следующую процедуру для преобразования байтов в строку, но есть ли более эффективный / более умный способ сделать это, чем...

228
«Неверное строковое значение» при попытке вставить UTF-8 в MySQL через JDBC?

Вот как устанавливается мое соединение: Connection conn = DriverManager.getConnection(url + dbName + "?useUnicode=true&characterEncoding=utf-8", userName, password); И я получаю следующую ошибку при попытке добавить строку в таблицу: Incorrect string value: '\xF0\x90\x8D\x83\xF0\x90...' for...

207
Мне действительно нужно кодировать '&' как '& amp;'?

Я использую &символ ' ' с HTML5 и UTF-8 на своем сайте <title>. Google показывает амперсанд отлично на его выдаче, как и все браузеры в их названиях. http://validator.w3.org дает мне это: & не начал ссылку на символ. (и, вероятно, следовало бы избежать как &amp;.) Мне...

204
Запись в файл UTF-8 на Python

Я действительно запутался с codecs.open function. Когда я делаю: file = codecs.open("temp", "w", "utf-8") file.write(codecs.BOM_UTF8) file.close() Это дает мне ошибку UnicodeDecodeError: кодек «ascii» не может декодировать байт 0xef в позиции 0: порядковый номер не в диапазоне (128) Если я сделаю:...

193
Как преобразовать строку в UTF-8 в Python

У меня есть браузер, который отправляет символы utf-8 на мой сервер Python, но когда я получаю его из строки запроса, Python возвращает кодировку ASCII. Как я могу преобразовать простую строку в UTF-8? ПРИМЕЧАНИЕ. Строка, передаваемая из Интернета, уже закодирована в UTF-8, я просто хочу, чтобы...

191
Как я могу вывести UTF-8 CSV на PHP, который Excel будет читать правильно?

У меня есть очень простая вещь, которая просто выводит некоторые вещи в формате CSV, но это должен быть UTF-8. Я открываю этот файл в TextEdit или TextMate или Dreamweaver, и он правильно отображает символы UTF-8, но если я открываю его в Excel, он делает это глупо - вместо этого. Вот что у меня...

190
Кодировать строку в UTF-8

У меня есть строка с символом «-», и у меня есть некоторые проблемы с ней. Мне нужно закодировать эту строку в кодировку UTF-8. Я попробовал это таким образом, но это не работает: byte ptext[] = myString.getBytes(); String value = new String(ptext, "UTF-8"); Как мне закодировать эту строку в...

180
Как написать файл UTF-8 с Java?

У меня есть текущий код, и проблема в том, что он создает файл кодовой страницы 1252, я хочу заставить его создать файл UTF-8 Может ли кто-нибудь помочь мне с этим кодом, так как я говорю, что в настоящее время он работает ... но мне нужно принудительно сохранить на UTF ... я могу передать параметр...

171
Как определить кодировку файла в OS X?

Я пытаюсь ввести некоторые символы UTF-8 в файл LaTeX в TextMate (который говорит, что его кодировка по умолчанию - UTF-8), но LaTeX, кажется, не понимает их. Запуск cat my_file.texпоказывает символы правильно в терминале. Запуск ls -alпоказывает то, что я никогда раньше не видел: «@» в списке...

169
u '\ ufeff' в строке Python

Я получаю сообщение об ошибке со следующей скороговоркой: UnicodeEncodeError: 'ascii' codec can't encode character u'\ufeff' in position 155: ordinal not in range(128) Не уверен, что это u'\ufeff'такое, оно появляется, когда я просматриваю веб-страницы. Как я могу исправить ситуацию?...

164
ошибка UnicodeDecodeError: кодек «utf-8» не может декодировать байт 0xff в позиции 0: недопустимый начальный байт

https://github.com/affinelayer/pix2pix-tensorflow/tree/master/tools Произошла ошибка при компиляции «process.py» на вышеуказанном сайте. python tools/process.py --input_dir data -- operation resize --outp ut_dir data2/resize data/0.jpg -> data2/resize/0.png Traceback (последний вызов был...

158
MySQL «неправильное значение строки» ошибка при сохранении строки Unicode в Django

При попытке сохранить first_name, last_name в модель Django auth_user я получил странное сообщение об ошибке. Неудачные примеры user = User.object.create_user(username, email, password) user.first_name = u'Rytis' user.last_name = u'Slatkevičius' user.save() >>> Incorrect string value:...

148
В OS X Lion LANG не установлен в UTF-8, как это исправить?

Я пытаюсь настроить postgress в OS X Lion и обнаруживаю, что неправильно настроена среда LOCALE var. Вот что установлено: LANG= LC_COLLATE="C" LC_CTYPE="C" LC_MESSAGES="C" LC_MONETARY="C" LC_NUMERIC="C" LC_TIME="C" LC_ALL= Я ожидаю что-то с UTF-8. Это чистая установка OS X Lion с испанским языком....

146
PHP: конвертировать любую строку в UTF-8, не зная исходного набора символов, или хотя бы попытаться

У меня есть приложение, которое работает с клиентами со всего мира, и, естественно, я хочу, чтобы все, что входит в мои базы данных, было в кодировке UTF-8. Основная проблема для меня заключается в том, что я не знаю, какой будет кодировка источника какой-либо строки - это может быть из текстового...