Вопросы с тегом «utf-8»

569
Является ли использование «utf8 = ✓» более предпочтительным, чем «utf8 = true»?

Недавно я видел несколько URI, содержащих параметр запроса "utf8 = ✓". Мое первое впечатление (после размышлений «ммм, выглядит круто») состояло в том, что это можно использовать для обнаружения нарушенной кодировки символов. Итак, это лучший способ решить потенциальные проблемы с кодировкой...

115
Как определить кодировку файла?

В моей файловой системе (Windows 7) у меня есть несколько текстовых файлов (это файлы сценариев SQL, если это имеет значение). При открытии с помощью Notepad ++ в меню «Кодировка» сообщается, что некоторые из них имеют кодировку «UCS-2 Little Endian», а некоторые - «UTF-8 без BOM». В чем здесь...

91
В чем преимущество выбора кодировки ASCII перед UTF-8?

Все символы в ASCII могут быть закодированы с использованием UTF-8 без увеличения объема памяти (для обоих требуется один байт памяти). UTF-8 имеет дополнительное преимущество поддержки символов помимо «ASCII-символов». Если это так, почему мы когда-нибудь выберем кодировку ASCII вместо UTF-8? Есть...

86
Сможет ли UTF-8 поддерживать включение огромного инопланетного языка с миллионами новых персонажей?

Если произошло инопланетное вторжение, и мы были вынуждены поддерживать их языки во всех наших существующих компьютерных системах, разработан ли UTF-8 таким образом, чтобы учесть их возможно огромное количество символов? (Конечно, мы не знаем, есть ли у инопланетян языки на самом деле, говорят ли...

65
Следует ли использовать Latin-1 поверх UTF-8, когда речь идет о конфигурации базы данных?

Мы используем MySQL в компании, в которой я работаю, и мы создаем как клиентские, так и внутренние приложения, используя Ruby on Rails. Когда я начал работать здесь, я столкнулся с проблемой, с которой я никогда не сталкивался раньше; база данных на производственном сервере установлена ​​на...

31
Следует ли считать устаревшими кодировки символов помимо UTF-8 (и, возможно, UTF-16 / UTF-32)?

Моя любимая мозоль смотрит на очень много программных проектов, которые имеют горы кода для поддержки набора символов. Не поймите меня неправильно, я за совместимость, и я рад, что текстовые редакторы позволяют открывать и сохранять файлы в нескольких наборах символов. Что меня раздражает, так это...

17
Почему UTF-8 тратит несколько битов в своей кодировке

Согласно статье в Википедии , UTF-8 имеет такой формат: Первый код Последний код Байты Байт 1 Байт 2 Байт 3 Байт 4 точка точка используется U + 0000 U + 007F 1 0xxxxxxx U + 0080 U + 07FF 2 110xxxxx 10xxxxxx U + 0800 U + FFFF 3 1110xxxx 10xxxxxx 10xxxxxx U + 10000 U + 1FFFFF 4 11110xxx 10xxxxxx...

16
UTF-16 фиксированной или переменной ширины? Почему у UTF-8 нет проблемы порядка следования байтов?

UTF-16 фиксированной или переменной ширины? Я получил разные результаты из разных источников: С http://www.tbray.org/ongoing/When/200x/2003/04/26/UTF : UTF-16 хранит символы Unicode в шестнадцати разрядных блоках. С http://en.wikipedia.org/wiki/UTF-16/UCS-2 : UTF-16 (16-битный формат...

10
Должен ли мой исходный код быть в UTF-8?

Я чувствую, что часто вы на самом деле не выбираете, в каком формате находится ваш код. Я имею в виду, что большинство моих инструментов в прошлом решили за меня. Или я даже не думал об этом. Я использовал TextPad для Windows на днях, и когда я сохранял файл, он подсказывал мне ASCII, UTF-8/16,...