Вопросы с тегом «character-encoding»

115
Как определить кодировку файла?

В моей файловой системе (Windows 7) у меня есть несколько текстовых файлов (это файлы сценариев SQL, если это имеет значение). При открытии с помощью Notepad ++ в меню «Кодировка» сообщается, что некоторые из них имеют кодировку «UCS-2 Little Endian», а некоторые - «UTF-8 без BOM». В чем здесь...

91
В чем преимущество выбора кодировки ASCII перед UTF-8?

Все символы в ASCII могут быть закодированы с использованием UTF-8 без увеличения объема памяти (для обоих требуется один байт памяти). UTF-8 имеет дополнительное преимущество поддержки символов помимо «ASCII-символов». Если это так, почему мы когда-нибудь выберем кодировку ASCII вместо UTF-8? Есть...

64
Почему так много хешированных и зашифрованных строк заканчиваются знаком равенства?

Я работаю в C # и MSSQL, и, как и следовало ожидать, я храню свои пароли как соленые и хэшированные Когда я смотрю на хеш, хранящийся в столбце nvarchar (например, из провайдера членства aspnet). Мне всегда было любопытно, почему сгенерированные значения Salt и Hash всегда заканчиваются одним или...

34
Почему нам нужно поставить N перед строками в Microsoft SQL Server?

Я изучаю T-SQL. Из примеров, которые я видел, чтобы вставить текст в varchar()ячейку, я могу написать только строку для вставки, но для nvarchar()ячеек в каждом примере строки начинаются с буквы N. Я пробовал следующий запрос к таблице, в которой есть nvarchar()строки, и она отлично работает,...

31
Следует ли считать устаревшими кодировки символов помимо UTF-8 (и, возможно, UTF-16 / UTF-32)?

Моя любимая мозоль смотрит на очень много программных проектов, которые имеют горы кода для поддержки набора символов. Не поймите меня неправильно, я за совместимость, и я рад, что текстовые редакторы позволяют открывать и сохранять файлы в нескольких наборах символов. Что меня раздражает, так это...

26
Является ли символ возврата каретки устаревшим

Я написал библиотеку с открытым исходным кодом, которая анализирует структурированные данные, но намеренно исключил обнаружение возврата каретки, потому что не вижу смысла. Это добавляет дополнительную сложность и накладные расходы для небольшой выгоды. К моему удивлению, пользователь представил...

24
Какие проблемы побуждают людей использовать специфичные для Японии кодировки, а не Unicode?

На работе я сталкиваюсь с множеством японских текстовых файлов в Shift-JIS и других кодировках. Это вызывает много проблем mojibake (нечитаемый символ) для всех пользователей компьютера. Unicode предназначался для решения такого рода проблем путем определения единого набора символов для всех...

17
Почему UTF-8 тратит несколько битов в своей кодировке

Согласно статье в Википедии , UTF-8 имеет такой формат: Первый код Последний код Байты Байт 1 Байт 2 Байт 3 Байт 4 точка точка используется U + 0000 U + 007F 1 0xxxxxxx U + 0080 U + 07FF 2 110xxxxx 10xxxxxx U + 0800 U + FFFF 3 1110xxxx 10xxxxxx 10xxxxxx U + 10000 U + 1FFFFF 4 11110xxx 10xxxxxx...

16
UTF-16 фиксированной или переменной ширины? Почему у UTF-8 нет проблемы порядка следования байтов?

UTF-16 фиксированной или переменной ширины? Я получил разные результаты из разных источников: С http://www.tbray.org/ongoing/When/200x/2003/04/26/UTF : UTF-16 хранит символы Unicode в шестнадцати разрядных блоках. С http://en.wikipedia.org/wiki/UTF-16/UCS-2 : UTF-16 (16-битный формат...

10
Должен ли мой исходный код быть в UTF-8?

Я чувствую, что часто вы на самом деле не выбираете, в каком формате находится ваш код. Я имею в виду, что большинство моих инструментов в прошлом решили за меня. Или я даже не думал об этом. Я использовал TextPad для Windows на днях, и когда я сохранял файл, он подсказывал мне ASCII, UTF-8/16,...