Вопросы с тегом «utf-8»

UTF-8 - это кодировка символов, которая описывает каждую кодовую точку Unicode с использованием последовательности байтов от одного до четырех байтов. Он обратно совместим с ASCII, но поддерживает представление всех кодовых точек Unicode.

1191
UTF-8 полностью

Я настраиваю новый сервер и хочу полностью поддерживать UTF-8 в моем веб-приложении. Я пытался сделать это в прошлом на существующих серверах, и мне всегда приходилось прибегать к ISO-8859-1. Где именно мне нужно установить кодировку / кодировки? Я знаю, что для этого мне нужно настроить Apache,...

607
Excel в CSV с кодировкой UTF8 [закрыто]

Закрыто. Этот вопрос не соответствует рекомендациям по переполнению стека . В настоящее время он не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он соответствовал теме переполнения стека. Закрыто 4 месяца назад . У меня есть файл Excel, в котором есть некоторые испанские...

557
Почему современный Perl по умолчанию избегает UTF-8?

Интересно, почему большинство современных решений, построенных с использованием Perl, не поддерживают UTF-8? по умолчанию . Я понимаю, что для основных скриптов Perl существует много проблем, которые могут сломать вещи. Но, с моей точки зрения, в 21 - м веке, большие новые проекты (или проекты с...

526
Лучший способ конвертировать текстовые файлы между наборами символов?

Какой самый быстрый и простой инструмент или метод для преобразования текстовых файлов между наборами символов? В частности, мне нужно конвертировать из UTF-8 в ISO-8859-15 и наоборот. Все идет: одна строка на вашем любимом языке сценариев, инструменты командной строки или другие утилиты для ОС,...

487
UTF-8, UTF-16 и UTF-32

Каковы различия между UTF-8, UTF-16 и UTF-32? Я понимаю, что все они будут хранить Unicode, и что каждый использует различное количество байтов для представления символа. Есть ли преимущество выбора одного над...

474
Сохранение текстов utf-8 в json.dumps как UTF8, а не как escape-последовательность

образец кода: >>> import json >>> json_string = json.dumps("ברי צקלה") >>> print json_string "\u05d1\u05e8\u05d9 \u05e6\u05e7\u05dc\u05d4" Проблема: она не читается человеком. Мои (умные) пользователи хотят проверять или даже редактировать текстовые файлы с помощью дампов...

455
Можно ли заставить Excel автоматически распознавать файлы CSV UTF-8?

Я разрабатываю часть приложения, которое отвечает за экспорт некоторых данных в файлы CSV. Приложение всегда использует UTF-8 из-за его многоязычности на всех уровнях. Но открытие таких файлов CSV (содержащих, например, диакритические знаки, буквы кириллицы, греческие буквы) в Excel не дает...

395
Что такое Юникод, UTF-8, UTF-16?

Что является основой для Unicode и зачем нужен UTF-8 или UTF-16? Я исследовал это в Google и искал здесь, но мне это не ясно. В VSS при сравнении файлов иногда появляется сообщение о том, что два файла имеют разные UTF. Почему это так? Пожалуйста, объясните в простых...

367
Как заставить UTF-8 работать в веб-приложениях Java?

Мне нужно, чтобы UTF-8 работал в моем веб-приложении Java (сервлеты + JSP, среда не использовалась) для поддержки äöåи т. Д. Для обычного финского текста и кириллицы, например, ЦжФдля особых случаев. Моя установка следующая: Среда разработки: Windows XP Производственная среда: Debian Используемая...

362
Установка кодировки символов Java по умолчанию

Как правильно установить кодировку символов по умолчанию, используемую JVM (1.5.x) программно? Я читал, что -Dfile.encoding=whateverраньше это был путь для старых JVM. У меня нет такой роскоши по причинам, в которые я не пойду. Я пытался: System.setProperty("file.encoding", "UTF-8"); И свойство...

341
В чем разница между кодировками utf8mb4 и utf8 в MySQL?

В чем разница между utf8mb4и utf8кодировками в MySQL ? Я уже знаю о кодировках ASCII , UTF-8 , UTF-16 и UTF-32 ; но мне любопытно узнать, в чем отличие utf8mb4группы кодировок от других типов кодирования, определенных в MySQL Server . Есть ли какие-то особые преимущества / предложения...

304
Определите кодировку и сделайте все в UTF-8

Я читаю много текстов из различных RSS-каналов и вставляю их в свою базу данных. Конечно, в каналах используется несколько разных кодировок символов, например, UTF-8 и ISO 8859-1. К сожалению, иногда возникают проблемы с кодировкой текстов. Пример: «Ss» в «Fußball» в моей базе данных должно...

279
UTF-8: генерал? Бен? Unicode?

Я пытаюсь выяснить, какую сортировку я должен использовать для различных типов данных. 100% содержимого, которое я буду хранить, отправлено пользователем. Насколько я понимаю, я должен использовать UTF-8 General CI (без учета регистра) вместо UTF-8 Binary. Однако я не могу найти четкого различия...

259
Как использовать UTF-8 в свойствах ресурса с ResourceBundle

Мне нужно использовать UTF-8 в свойствах моего ресурса, используя Java ResourceBundle. Когда я ввожу текст прямо в файл свойств, он отображается как mojibake. Мое приложение работает на Google App Engine. Кто-нибудь может дать мне пример? Я не могу получить эту...