Вопросы с тегом «encoding»

86
Как удалить символы, отличные от UTF-8, из текстового файла

У меня есть куча файлов на арабском, английском и русском языках, закодированных в utf-8. Пытаясь обработать эти файлы с помощью сценария Perl, получаю такую ​​ошибку: Malformed UTF-8 character (fatal) Проверяя содержимое этих файлов вручную, я обнаружил в них странные символы. Сейчас ищу способ...

85
Кодирование / декодирование URL-адресов в C ++ [закрыто]

Закрыто. Этот вопрос не соответствует рекомендациям по переполнению стека . В настоящее время он не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он соответствовал теме Stack Overflow. Закрыт 2 года назад . Уточните этот вопрос Кто-нибудь знает какой-нибудь хороший код на C...

85
Преобразование байтового массива в String (Java)

Я пишу веб-приложение в Google App Engine. Он позволяет людям в основном редактировать html-код, который сохраняется в виде .htmlфайла в хранилище blobstore. Я использую fetchData для возврата byte[]всех символов в файле. Я пытаюсь распечатать HTML-код, чтобы пользователь мог отредактировать...

85
Как я могу отправлять и получать сообщения WebSocket на стороне сервера?

Как я могу отправлять и получать сообщения на стороне сервера с помощью WebSocket в соответствии с протоколом? Почему я получаю кажущиеся случайными байты на сервере при отправке данных из браузера на сервер? Это данные как-то закодированы? Как обрамление работает в направлениях сервер → клиент и...

85
Есть ли набор файлов «Lorem ipsums» для тестирования проблем с кодировкой символов?

Для верстки у нас есть наш знаменитый текст «Lorem ipsum», чтобы проверить, как он выглядит. Я ищу набор файлов, содержащих текст, закодированный в нескольких разных кодировках, которые я могу использовать в своих тестах JUnit для тестирования некоторых методов, которые имеют дело с кодировкой...

84
Как преобразовать строку с кодировкой Unicode в строку букв

У меня есть строка с сбежавшим Unicode символами, \uXXXXи я хочу , чтобы преобразовать его в обычные буквы Unicode. Например: "\u0048\u0065\u006C\u006C\u006F World" должен стать "Hello World" Я знаю, что когда я печатаю первую строку, она уже отображается Hello world. Моя проблема в том, что я...

84
Как записать UTF-8 в файл CSV

Я пытаюсь создать текстовый файл в формате csv из PyQt4 QTableWidget. Я хочу написать текст в кодировке UTF-8, потому что он содержит специальные символы. Я использую следующий код: import codecs ... myfile = codecs.open(filename, 'w','utf-8') ... f = result.table.item(i,c).text()...

83
Программирование на C: как программировать для Unicode?

Какие предварительные условия необходимы для выполнения строгого программирования Unicode? Означает ли это, что мой код charнигде не должен использовать типы и что нужно использовать функции, которые могут иметь дело с wint_tи wchar_t? И какую роль в этом сценарии играют многобайтовые...

83
fileReader.readAsBinaryString для загрузки файлов

Попытка использовать fileReader.readAsBinaryString для загрузки файла PNG на сервер через AJAX, урезанный код (fileObject - это объект, содержащий информацию о моем файле); var fileReader = new FileReader(); fileReader.onload = function(e) { var xmlHttpRequest = new XMLHttpRequest(); //Some AJAX-y...

83
Использование функций unicode () и encode () в Python

У меня проблема с кодированием переменной пути и ее вставкой в базу данных SQLite . Я попытался решить эту проблему с помощью функции кодирования ("utf-8"), которая не помогла. Затем я использовал функцию unicode (), которая дает мне тип unicode . print type(path) # <type 'unicode'> path =...

83
Какова реальная цель кодирования Base64?

Зачем нужна кодировка Base64? Я новичок и действительно не понимаю, зачем вам запутывать байты во что-то еще (если только это не шифрование). В одной из книг я читал, что кодирование Base64 полезно, когда двоичная передача невозможна. Например. Когда мы публикуем форму, она кодируется. Но почему...

82
Сколько символов в GUID?

Сколько символов в GUID при использовании кодировки ASCII? Меня интересует стиль Microsoft, который включает фигурные скобки и тире.

81
Декодирование Python Unicode не поддерживается

У меня проблема с кодировкой на Python. Я пробовал разные методы, но не могу найти лучший способ закодировать свой вывод в UTF-8. Вот что я пытаюсь сделать: result = unicode(google.searchGoogle(param), "utf-8").encode("utf-8") searchGoogleвозвращает первый результат Google для param. Это ошибка,...

80
Кодирование FPDF utf-8 (КАК)

Кто-нибудь знает, как установить кодировку в пакете FPDF на utf-8? Или, по крайней мере, ISO-8859-7 (греческий), который поддерживает греческие символы? В основном я хочу создать файл PDF, содержащий греческие символы. Любые предложения помогут. Джордж...

79
Каково максимальное количество байтов для символа в кодировке UTF-8?

Каково максимальное количество байтов для одного символа в кодировке UTF-8? Я буду шифровать байты строки, закодированной в UTF-8, и поэтому мне нужно иметь возможность определить максимальное количество байтов для строки в кодировке UTF-8. Может ли кто-нибудь подтвердить максимальное количество...