Вопросы с тегом «utf-8»

106
UnicodeDecodeError: кодек ascii не может декодировать байт 0xef в позиции 1

У меня возникают проблемы с кодированием строки в UTF-8. Я пробовал множество вещей, в том числе с помощью string.encode('utf-8')и unicode(string), но получаю сообщение об ошибке: UnicodeDecodeError: кодек ascii не может декодировать байт 0xef в позиции 1: порядковый номер не в диапазоне (128) Это...

105
Изменение кодировки вывода PowerShell по умолчанию на UTF-8

По умолчанию, когда вы перенаправляете вывод команды в файл или перенаправляете его во что-то другое в PowerShell, используется кодировка UTF-16, что бесполезно. Я хочу изменить его на UTF-8. Это можно сделать в каждом конкретном случае, заменив >foo.txtсинтаксис на, | out-file foo.txt...

104
C # Преобразование строки из UTF-8 в ISO-8859-1 (Latin1) H

Я погуглил по этой теме и просмотрел все ответы, но до сих пор не понимаю. В основном мне нужно преобразовать строку UTF-8 в ISO-8859-1, и я делаю это, используя следующий код: Encoding iso = Encoding.GetEncoding("ISO-8859-1"); Encoding utf8 = Encoding.UTF8; string msg =...

103
Как использовать греческие символы в ggplot2?

Мои категории нужно называть греческими буквами. Я использую ggplot2, и он прекрасно работает с данными. К сожалению, я не могу понять, как разместить эти греческие символы на оси x (в отметках), а также сделать так, чтобы они появлялись в легенде. Есть ли способ это сделать? ОБНОВЛЕНИЕ: я...

99
Использование StringWriter для сериализации XML

В настоящее время я ищу простой способ сериализации объектов (в C # 3). Я погуглил несколько примеров и придумал что-то вроде: MemoryStream memoryStream = new MemoryStream ( ); XmlSerializer xs = new XmlSerializer ( typeof ( MyObject) ); XmlTextWriter xmlTextWriter = new XmlTextWriter (...

97
Сколько символов может кодировать UTF-8?

Если UTF-8 имеет 8 бит, не означает ли это, что может быть не более 256 различных символов? Первые 128 кодовых точек такие же, как в ASCII. Но в нем говорится, что UTF-8 может поддерживать до миллиона символов? Как это работает?...

97
Как декодировать escape-последовательности Unicode, такие как «\ u00ed», в правильные символы в кодировке UTF-8?

Есть ли в PHP функция, которая может декодировать escape-последовательности Unicode, такие как " \u00ed" to " í" и все другие подобные случаи? Я нашел здесь аналогичный вопрос, но, похоже, он не работает....

96
Пример недопустимой строки utf8?

Я тестирую, как часть моего кода обрабатывает неверные данные, и мне нужно несколько серий байтов с недопустимым UTF-8. Можете ли вы опубликовать некоторые, а в идеале, объяснение, почему они плохие / где вы их взяли?...

96
Чтение InputStream как UTF-8

Я пытаюсь прочитать text/plainфайл через Интернет построчно. Код, который у меня есть прямо сейчас: URL url = new URL("http://kuehldesign.net/test.txt"); BufferedReader in = new BufferedReader(new InputStreamReader(url.openStream())); LinkedList<String> lines = new LinkedList(); String...

94
Элегантный способ поиска файлов UTF-8 с помощью спецификации?

В целях отладки мне нужно рекурсивно искать в каталоге все файлы, которые начинаются с отметки порядка байтов (BOM) UTF-8. Мое текущее решение - это простой сценарий оболочки: find -type f | while read file do if [ "`head -c 3 -- "$file"`" == $'\xef\xbb\xbf' ] then echo "found BOM in: $file" fi...

94
Чтение CSV-файла UTF8 с помощью Python

Я пытаюсь прочитать CSV-файл с акцентированными символами с помощью Python (только французские и / или испанские символы). Основываясь на документации Python 2.5 для csvreader ( http://docs.python.org/library/csv.html ), я придумал следующий код для чтения файла CSV, поскольку csvreader...

92
Установите кодировку файла в UTF8 с спецификацией в Sublime Text 3

Когда я открываю файл в Sublime Text 3, внизу у меня есть возможность установить кодировку символов, как показано на скриншоте. Существует возможность установить его в UTF-8 , что после некоторых исследований означает UTF-8 без спецификации, но я хочу установить его в UTF-8 с спецификацией, как...

92
Эквивалент Java JavaScript encodeURIComponent, который производит идентичный вывод?

Я экспериментировал с различными фрагментами кода Java, пытаясь придумать что-то, что будет кодировать строку, содержащую кавычки, пробелы и «экзотические» символы Unicode, и производить вывод, идентичный функции JavaScript encodeURIComponent . Моя тестовая строка на пытки: "А" Б ± " Если я введу...

89
Кодировка символов JSON - хорошо ли UTF-8 поддерживается браузерами или мне следует использовать числовые escape-последовательности?

Я пишу веб-сервис, который использует json для представления своих ресурсов, и я немного зациклился на том, как лучше всего закодировать json. Читая json rfc ( http://www.ietf.org/rfc/rfc4627.txt ), становится ясно, что предпочтительной кодировкой является utf-8. Но RFC также описывает механизм...

88
Действительно хороший, плохой пример тестовых данных UTF-8 [закрыто]

Закрыто. Этот вопрос не соответствует рекомендациям по переполнению стека . В настоящее время он не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он соответствовал теме Stack Overflow. Закрыт 3 года назад . Уточните этот вопрос Итак, у нас есть шпаргалка по XSS для проверки...

87
Сохраните все файлы в проекте Visual Studio как UTF-8

Интересно, можно ли сохранить все файлы в проекте Visual Studio 2008 в определенной кодировке символов. У меня есть решение со смешанными кодировками, и я хочу сделать их одинаковыми (UTF-8 с подписью). Я знаю, как сохранять отдельные файлы, но как насчет всех файлов в проекте?...

86
Использование 'use utf8;' дает мне "Широкий характер в печати"

Если я запустил следующую программу Perl: perl -e 'use utf8; print "鸡\n";' Я получаю это предупреждение: Wide character in print at -e line 1. Если я запустил эту программу Perl: perl -e 'print "鸡\n";' Я не получаю предупреждения. Я думал, что use utf8необходимо использовать символы UTF-8 в...

86
Как удалить символы, отличные от UTF-8, из текстового файла

У меня есть куча файлов на арабском, английском и русском языках, закодированных в utf-8. Пытаясь обработать эти файлы с помощью сценария Perl, получаю такую ​​ошибку: Malformed UTF-8 character (fatal) Проверяя содержимое этих файлов вручную, я обнаружил в них странные символы. Сейчас ищу способ...