Вопросы с тегом «unicode»

225
Записывает текст Unicode в текстовый файл?

Я вытаскиваю данные из документа Google, обрабатываю их и записываю в файл (который в итоге вставлю на страницу Wordpress). У него есть не-ASCII символы. Как я могу безопасно преобразовать их в символы, которые можно использовать в исходном коде HTML? В настоящее время я конвертирую все в Unicode...

224
В чем разница между _tmain () и main () в C ++?

Если я запускаю свое приложение C ++ с помощью следующего метода main (), все в порядке: int main(int argc, char *argv[]) { cout << "There are " << argc << " arguments:" << endl; // Loop through each argument and print its number and value for (int i=0; i<argc; i++) cout...

224
Как вы повторяете 4-значный символ Unicode в Bash?

Я хотел бы добавить череп и скрещенные кости Юникода в мою подсказку оболочки (в частности, «ЧЕРЕП И КРЕСТЫ» (U + 2620)), но я не могу понять магическое заклинание, которое заставило бы эхо выплюнуть его или любое другое, 4-значный Unicode символ. Двузначные легко. Например, echo -e "\ x55",. В...

217
JavaScript + Юникод регулярные выражения

Как я могу использовать регулярные выражения с поддержкой Юникода в JavaScript? Например, должно быть что-то похожее на \wто, что может соответствовать любой кодовой точке в категории «Буквы или метки» (не только ASCII), и, надеюсь, иметь фильтры типа [[P *]] для пунктуации и т....

216
Представление структуры каталогов и файлов в синтаксисе уценки

Я хочу описать структуру каталогов и файлов в некоторых моих сообщениях в блоге Jekyll. Предоставляет ли Markdown удобный способ вывода такой вещи? Например, по этой ссылке на веб-сайте Jekyll вы можете видеть, что структура каталогов и файлов выводится на страницу очень аккуратно: . ├──...

213
Python __str__ против __unicode__

Есть ли соглашение Python, когда вы должны реализовать __str__()против __unicode__(). Я видел, как классы переопределяют __unicode__()чаще, чем, __str__()но они не выглядят согласованными. Существуют ли конкретные правила, когда лучше реализовать одно против другого? Это необходимо / хорошая...

212
Как проверить, находится ли строка в Python в ASCII?

Я хочу проверить, есть ли строка в ASCII или нет. Я знаю ord(), однако, когда я пытаюсь ord('é'), у меня есть TypeError: ord() expected a character, but string of length 2 found. Я понял, что это вызвано тем, как я собирал Python (как объяснено в ord()документации ). Есть ли другой способ...

208
Что такое «соединительные символы» в идентификаторах Java?

Я читаю для SCJP, и у меня есть вопрос относительно этой строки: Идентификаторы должны начинаться с буквы, символа валюты ($) или соединительного символа, такого как подчеркивание (_). Идентификаторы не могут начинаться с цифры! В нем говорится, что допустимое имя идентификатора может начинаться с...

193
Как преобразовать строку в UTF-8 в Python

У меня есть браузер, который отправляет символы utf-8 на мой сервер Python, но когда я получаю его из строки запроса, Python возвращает кодировку ASCII. Как я могу преобразовать простую строку в UTF-8? ПРИМЕЧАНИЕ. Строка, передаваемая из Интернета, уже закодирована в UTF-8, я просто хочу, чтобы...

191
Есть ли символ символа Unicode для обозначения «Поиск» [закрыто]

Закрыто . Этот вопрос основан на мнении . В настоящее время он не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы ответить на него фактами и цитатами, отредактировав этот пост . Закрыто 4 года назад . Улучшить этот вопрос Юникод имеет миллион иконоподобных глифов, но их очень...

183
Насколько хорошо Юникод поддерживается в C ++ 11?

Я читал и слышал, что C ++ 11 поддерживает Unicode. Несколько вопросов по этому поводу: Насколько хорошо стандартная библиотека C ++ поддерживает Unicode? Делает std::stringто, что должен? Как мне это использовать? Где потенциальные проблемы?...

180
В чем разница между кодированием / декодированием?

Я никогда не был уверен, что понимаю разницу между декодированием str / unicode и кодированием. Я знаю, что str().decode()для случая, когда у вас есть строка байтов, которая, как вы знаете, имеет определенную кодировку символов, при условии, что это имя кодировки вернет строку Unicode. Я знаю, что...

169
(grep) Regex для соответствия не-ASCII символам?

В Linux у меня есть каталог с большим количеством файлов. Некоторые из них имеют символы не ASCII, но все они действительны в формате UTF-8 . В одной программе есть ошибка, которая не позволяет ей работать с именами, отличными от ASCII, и я должен выяснить, сколько из них затронуто. Я собирался...

169
u '\ ufeff' в строке Python

Я получаю сообщение об ошибке со следующей скороговоркой: UnicodeEncodeError: 'ascii' codec can't encode character u'\ufeff' in position 155: ordinal not in range(128) Не уверен, что это u'\ufeff'такое, оно появляется, когда я просматриваю веб-страницы. Как я могу исправить ситуацию?...

166
Конкретное регулярное выражение Javascript для акцентированных символов (диакритические знаки)

Я посмотрел на переполнение стека ( замена символов ... например , как JavaScript не соответствует стандарту Unicode относительно RegExp и т. Д.) И не нашел конкретного ответа на вопрос: How can JavaScript match for accented characters (those with diacritical marks)? Я заставляю поле в...

164
Символ Unicode в строке PHP

Этот вопрос выглядит смущающе простым, но я не смог найти ответ. Что такое PHP эквивалент следующей строки кода C #? string str = "\u1000"; В этом примере создается строка с одним символом Unicode, чье «числовое значение Unicode» равно 1000 в шестнадцатеричном формате (4096 в десятичном виде). То...