Вопросы с тегом «encoding»

116
Писать текстовые файлы без метки порядка байтов (BOM)?

Я пытаюсь создать текстовый файл с помощью VB.Net с кодировкой UTF8 без спецификации. Кто-нибудь может мне помочь, как это сделать? Я могу записать файл в кодировке UTF8, но как удалить из него отметку порядка байтов? edit1: я пробовал такой код; Dim utf8 As New UTF8Encoding() Dim utf8EmitBOM As...

113
Предупреждение "несопоставимый символ для кодировки" в Java

В настоящее время я работаю над Java-проектом, который при компиляции выдает следующее предупреждение: /src/com/myco/apps/AppDBCore.java:439: warning: unmappable character for encoding UTF8 [javac] String copyright = "� 2003-2008 My Company. All rights reserved."; Я не уверен, как SO отобразит...

110
Как работает «кодировка переменной ширины» UTF-8?

В стандарте unicode достаточно кодовых точек, поэтому вам нужно 4 байта для их хранения. Вот что делает кодировка UTF-32. Тем не менее, кодировка UTF-8 каким-то образом сжимает их в гораздо меньшие пространства, используя так называемое «кодирование переменной ширины». Фактически, ему удается...

110
Пространство html отображается как% 2520 вместо% 20

Передача имени файла браузеру Firefox приводит к замене пробелов на %2520 вместо %20. У меня есть следующий HTML-код в файле с именем myhtml.html: <img src="C:\Documents and Settings\screenshots\Image01.png"/> Когда я загружаюсь myhtml.htmlв firefox, изображение отображается как неработающее....

109
Как получить значение ASCII строки в C #

Я хочу получить значение ASCII символов в строке на C #. Если моя строка имеет значение «9quali52ty3», мне нужен массив со значениями ASCII каждого из 11 символов. Как я могу получить значения ASCII в C...

109
Android: для связи по протоколу HTTP следует использовать Accept-Encoding: gzip.

У меня HTTP-соединение с веб-сервером, запрашивающим данные JSON. Я хочу сжать этот поток данных с помощью Content-Encoding: gzip. Есть ли способ установить Accept-Encoding: gzipв моем HttpClient? Поиск gzipв справочниках Android не обнаруживает ничего, связанного с HTTP, как вы можете видеть здесь...

109
ruby 1.9: неверная последовательность байтов в UTF-8

Я пишу краулер на Ruby (1.9), который потребляет много HTML с множества случайных сайтов. При попытке извлечь ссылки я решил просто использовать .scan(/href="(.*?)"/i)вместо nokogiri / hpricot (значительное ускорение). Проблема в том, что теперь я получаю много " invalid byte sequence in UTF-8"...

108
Как добиться безопасного кодирования URL-адресов Base64 в C #?

Я хочу добиться безопасного кодирования URL-адресов Base64 на C #. В Java у нас есть общая Codecбиблиотека, которая дает мне строку с безопасным кодированием URL. Как я могу добиться того же с помощью C #? byte[] toEncodeAsBytes = System.Text.ASCIIEncoding.ASCII.GetBytes("StringToEncode"); string...

108
Использование Javascript atob для декодирования base64 неправильно декодирует строки utf-8

Я использую window.atob()функцию Javascript для декодирования строки в кодировке base64 (в частности, содержимого в кодировке base64 из GitHub API). Проблема в том, что я возвращаю символы в кодировке ASCII (например, â¢вместо ™). Как я могу правильно обработать входящий поток в кодировке base64,...

107
Как правильно кодировать символы Unicode в URL?

Я знаю нестандартную схему% uxxxx, но это не кажется разумным выбором, так как схема была отклонена W3C. Несколько интересных примеров: Сердечный персонаж. Если я введу это в свой браузер: http://www.google.com/search?q=♥ Затем скопируйте и вставьте его, я вижу этот URL...

105
Изменение кодировки вывода PowerShell по умолчанию на UTF-8

По умолчанию, когда вы перенаправляете вывод команды в файл или перенаправляете его во что-то другое в PowerShell, используется кодировка UTF-16, что бесполезно. Я хочу изменить его на UTF-8. Это можно сделать в каждом конкретном случае, заменив >foo.txtсинтаксис на, | out-file foo.txt...

105
Android. WebView и loadData

Можно использовать следующий метод для настройки содержимого loadData веб-представления (String data, String mimeType, String encoding) Как решить проблему с неизвестной кодировкой html-данных ?! А есть список кодировок ?! Из своего колледжа я знаю, что в моем случае html поступает из БД и...

104
C # Преобразование строки из UTF-8 в ISO-8859-1 (Latin1) H

Я погуглил по этой теме и просмотрел все ответы, но до сих пор не понимаю. В основном мне нужно преобразовать строку UTF-8 в ISO-8859-1, и я делаю это, используя следующий код: Encoding iso = Encoding.GetEncoding("ISO-8859-1"); Encoding utf8 = Encoding.UTF8; string msg =...

104
Значение - <? Xml version = «1.0» encoding = «utf-8»?>

Я новичок в XML и пытаюсь понять основы. Я прочитал строку ниже в «Изучение XML», но для меня она все еще непонятна. Может ли кто-нибудь указать мне на книгу или веб-сайт, которые ясно объясняют эти основы? Из изучения XML : Объявление XML описывает некоторые из наиболее общих свойств документа,...

103
Почему кодировка base64 требует заполнения, если длина ввода не делится на 3?

Какова цель заполнения в кодировке base64. Ниже приводится выдержка из Википедии: "Выделяется дополнительный символ заполнения, который может использоваться для преобразования закодированного вывода в целое число, кратное 4 символам (или, что эквивалентно, когда незашифрованный двоичный текст не...

102
Чтение символов из файла в Python

В текстовом файле есть строка «Мне это не нравится». Однако, когда я считываю это в строке, это становится «Я не \ xe2 \ x80 \ x98t как это». Я понимаю, что \ u2018 является представлением "'" в Юникоде. я использую f1 = open (file1, "r") text = f1.read() команда для чтения. Теперь, возможно ли...

101
Код ASCII 7-битный или 8-битный?

Мой учитель сказал мне, что ASCII - это 8-битная схема кодирования символов. Но он определен только для кодов 0-127, что означает, что его можно уместить в 7 бит. Так нельзя ли утверждать, что бит ASCII на самом деле является 7-битным кодом? И что мы вообще имеем в виду, когда говорим, что ASCII -...