Вопросы с тегом «encoding»

258
Как мне декодировать строку в кодировке base64?

Я пытаюсь «расшифровать» следующую строку Base64: OBFZDTcPCxlCKhdXCQ0kMQhKPh9uIgYIAQxALBtZAwUeOzcdcUEeW0dMO1kbPElWCV1ISFFKZ0kdWFlLAURPZhEFQVseXVtPOUUICVhMAzcfZ14AVEdIVVgfAUIBWVpOUlAeaUVMXFlKIy9rGUN0VF08Oz1POxFfTCcVFw1LMQNbBQYWAQ == Вот что я знаю о самой строке: Исходная строка сначала проходит...

245
URL декодировать UTF-8 в Python

Я провел много времени, насколько я новичок в Python. Как я мог когда-либо расшифровать такой URL: example.com?title=%D0%BF%D1%80%D0%B0%D0%B2%D0%BE%D0%B2%D0%B0%D1%8F+%D0%B7%D0%B0%D1%89%D0%B8%D1%82%D0%B0 к этому в Python 2.7: example.com?title==правовая+защита url=urllib.unquote(url.encode("utf8"))...

245
Заменить не-ASCII символы одним пробелом

Мне нужно заменить все не-ASCII (\ x00- \ x7F) символы пробелом. Я удивлен, что это не так просто в Python, если я что-то упустил. Следующая функция просто удаляет все не-ASCII символы: def remove_non_ascii_1(text): return ''.join(i for i in text if ord(i)<128) И этот заменяет не-ASCII символы...

240
Как преобразовать строки в и из байтовых массивов UTF8 в Java

В Java у меня есть String, и я хочу закодировать его как байтовый массив (в UTF8 или в какой-либо другой кодировке). С другой стороны, у меня есть байтовый массив (в некоторой известной кодировке), и я хочу преобразовать его в строку Java. Как мне сделать эти...

239
Сколько байтов занимает один символ Unicode?

Я немного запутался в кодировках. Насколько я знаю, старые символы ASCII занимали один байт на символ. Сколько байтов требуется для символа Юникода? Я предполагаю, что один символ Unicode может содержать все возможные символы из любого языка - я прав? Так сколько байт нужно для каждого символа? А...

227
Конвертировать массив индексов в 1-й горячий кодированный массив

Допустим, у меня есть 1d NumPy массив a = array([1,0,3]) Я хотел бы закодировать это как 2d 1-горячий массив b = array([[0,1,0,0], [1,0,0,0], [0,0,0,1]]) Есть ли быстрый способ сделать это? Быстрее, чем просто перебрать, aчтобы установить элементы b, то...

225
Записывает текст Unicode в текстовый файл?

Я вытаскиваю данные из документа Google, обрабатываю их и записываю в файл (который в итоге вставлю на страницу Wordpress). У него есть не-ASCII символы. Как я могу безопасно преобразовать их в символы, которые можно использовать в исходном коде HTML? В настоящее время я конвертирую все в Unicode...

224
Представляет ли `+` в схеме URL / хосте / пути пробел?

Мне известно, что +в строке запроса URL-адреса указан пробел. Это также имеет место за пределами области строки запроса? То есть, делает следующий URL: http://a.com/a+b/c на самом деле представляют: http://a.com/a b/c (и, следовательно, должны быть закодированы, если это действительно должно быть...

224
Как вы повторяете 4-значный символ Unicode в Bash?

Я хотел бы добавить череп и скрещенные кости Юникода в мою подсказку оболочки (в частности, «ЧЕРЕП И КРЕСТЫ» (U + 2620)), но я не могу понять магическое заклинание, которое заставило бы эхо выплюнуть его или любое другое, 4-значный Unicode символ. Двузначные легко. Например, echo -e "\ x55",. В...

220
Как определить кодировку текста?

Я получил некоторый текст в кодировке, но я не знаю, какая кодировка была использована. Есть ли способ определить кодировку текстового файла с помощью Python? Как я могу определить кодировку / кодовую страницу текстового файла имеет дело с C...

217
«Для строки в…» приводит к UnicodeDecodeError: кодек «utf-8» не может декодировать байт

Вот мой код, for line in open('u.item'): #read each line всякий раз, когда я запускаю этот код, он выдает следующую ошибку: UnicodeDecodeError: 'utf-8' codec can't decode byte 0xe9 in position 2892: invalid continuation byte Я попытался решить эту проблему и добавить дополнительный параметр в open...

216
Что такое вертикальная вкладка?

Каково было историческое использование символа вертикальной табуляции ( \vна языке C, ASCII 11)? У него когда-нибудь была клавиша на клавиатуре? Как кто-то это сгенерировал? Есть ли еще какой-либо язык или система, которая используется сегодня, когда символ вертикальной табуляции делает что-то...

211
Почему имена кодировок не являются константами?

Проблемы с кодировками сами по себе сбивают с толку и усложняют, но, кроме того, вы должны помнить точные имена ваших кодировок. Это "utf8"? Или "utf-8"? Или может быть "UTF-8"? При поиске примеров кода в интернете вы увидите все вышеперечисленное. Почему бы просто не сделать их именованными...

207
Мне действительно нужно кодировать '&' как '& amp;'?

Я использую &символ ' ' с HTML5 и UTF-8 на своем сайте <title>. Google показывает амперсанд отлично на его выдаче, как и все браузеры в их названиях. http://validator.w3.org дает мне это: & не начал ссылку на символ. (и, вероятно, следовало бы избежать как &amp;.) Мне...

206
Получить кодировку файла в Windows

Это на самом деле не вопрос программирования, есть ли командная строка или инструмент Windows (Windows 7) для получения текущей кодировки текстового файла? Конечно, я могу написать небольшое приложение на C #, но я хотел знать, есть ли что-то уже...

197
Попытка установить объект не-списка свойств как NSUserDefaults

Я думал, что знаю, что является причиной этой ошибки, но я не могу понять, что я сделал не так. Вот полное сообщение об ошибке, которое я получаю: Попытка установить объект не-списка свойств ( «<BC_Person: 0x8f3c140>» ) в качестве значения NSUserDefaults для ключа personDataArray У меня есть...