Вопросы с тегом «unicode»

118
CSS: как добавить пробел перед содержимым элемента?

Ни один из следующих кодов не работает: p:before { content: " "; } p:before { content: " "; } Как добавить пробел перед содержимым элемента? Примечание. Мне нужно раскрасить левую границу и левое поле для семантического использования и использовать пространство как бесцветное поле....

115
Как напечатать символ Unicode в Python?

Я хочу сделать словарь, в котором английские слова указывают на русский и французский переводы. Как распечатать символы юникода в Python? Кроме того, как вы храните символы Unicode в...

114
Создание символа Unicode из его номера

Я хочу отобразить символ Unicode в Java. Если я сделаю это, все будет нормально: String symbol = "\u2202"; символ равен «∂». Это то, что я хочу. Проблема в том, что я знаю номер Unicode, и мне нужно создать из него символ Unicode. Я попробовал (для меня) очевидное: int c = 2202; String symbol =...

110
Как я могу вывести UTF-8 из Perl?

Я пытаюсь написать сценарий Perl, используя прагму «utf8», и получаю неожиданные результаты. Я использую Mac OS X 10.5 (Leopard) и редактирую с помощью TextMate. Все мои настройки и для моего редактора, и для операционной системы по умолчанию настроены на запись файлов в формате utf-8. Однако,...

110
Как работает «кодировка переменной ширины» UTF-8?

В стандарте unicode достаточно кодовых точек, поэтому вам нужно 4 байта для их хранения. Вот что делает кодировка UTF-32. Тем не менее, кодировка UTF-8 каким-то образом сжимает их в гораздо меньшие пространства, используя так называемое «кодирование переменной ширины». Фактически, ему удается...

108
Какие символы Unicode, отличные от BMP, наиболее часто используются на практике? [закрыто]

Закрыто . Этот вопрос должен быть более конкретным . В настоящее время он не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он фокусировался только на одной проблеме, отредактировав этот пост . Закрыт 6 лет назад . Уточните этот вопрос По вашему опыту, какие символы Unicode,...

107
Как правильно кодировать символы Unicode в URL?

Я знаю нестандартную схему% uxxxx, но это не кажется разумным выбором, так как схема была отклонена W3C. Несколько интересных примеров: Сердечный персонаж. Если я введу это в свой браузер: http://www.google.com/search?q=♥ Затем скопируйте и вставьте его, я вижу этот URL...

106
Как я могу выполнить операцию «начинается с» с учетом языка и региональных параметров с середины строки?

У меня есть требование , которое является относительно неясным, но он чувствует , как это должно быть возможно с помощью BCL. Для контекста я анализирую строку даты / времени в Noda Time . Я поддерживаю логический курсор для моей позиции во входной строке. Таким образом, хотя полная строка может...

106
UnicodeDecodeError: кодек ascii не может декодировать байт 0xef в позиции 1

У меня возникают проблемы с кодированием строки в UTF-8. Я пробовал множество вещей, в том числе с помощью string.encode('utf-8')и unicode(string), но получаю сообщение об ошибке: UnicodeDecodeError: кодек ascii не может декодировать байт 0xef в позиции 1: порядковый номер не в диапазоне (128) Это...

105
Использование awk для удаления метки порядка байтов

Как бы awk выглядеть сценарий (предположительно однострочный) для удаления спецификации ? Технические характеристики: печатать каждую строку после первой (NR > 1 ) для первой строки: если она начинается с #FE #FFили #FF #FE, удалите их и распечатайте остальные...

105
Как я могу перебирать кодовые точки юникода в строке Java?

Я знаю String#codePointAt(int), но он индексируется по charсмещению, а не по смещению кодовой точки. Я думаю попробовать что-то вроде: используя String#charAt(int)для получения charиндекса тестирование, charнаходится ли в диапазоне высоких суррогатов если это так, используйте...

104
Как заставить интерпретатор Python правильно обрабатывать символы, отличные от ASCII, в строковых операциях?

У меня есть строка, которая выглядит так: 6 918 417 712 Четкий способ обрезать эту строку (как я понимаю в Python) - просто сказать, что строка находится в переменной с именем s, мы получаем: s.replace(' ', '') Это должно делать свое дело. Но, конечно, он жалуется, что не-ASCII-символ '\xc2'в...

104
Ошибка кодирования Unicode Python

Я читаю и разбираю XML-файл Amazon, и, хотя в XML-файле отображается ', при попытке его распечатать я получаю следующую ошибку: 'ascii' codec can't encode character u'\u2019' in position 16: ordinal not in range(128) Из того, что я читал в Интернете, ошибка возникает из-за того, что XML-файл...

104
Длина строки в байтах в JavaScript

В моем коде JavaScript мне нужно составить сообщение на сервер в следующем формате: <size in bytes>CRLF <data>CRLF Пример: 3 foo Данные могут содержать символы Юникода. Мне нужно отправить их как UTF-8. Я ищу наиболее кроссбраузерный способ вычисления длины строки в байтах в JavaScript....

103
Python str против типов юникода

Работая с Python 2.7, мне интересно, какое реальное преимущество дает использование типа unicodeвместо str, поскольку оба они, похоже, могут содержать строки Unicode. Есть ли какая-то особая причина, кроме возможности устанавливать коды Unicode в unicodeстроках с помощью escape-символа \?:...

103
Как использовать греческие символы в ggplot2?

Мои категории нужно называть греческими буквами. Я использую ggplot2, и он прекрасно работает с данными. К сожалению, я не могу понять, как разместить эти греческие символы на оси x (в отметках), а также сделать так, чтобы они появлялись в легенде. Есть ли способ это сделать? ОБНОВЛЕНИЕ: я...

102
Чтение символов из файла в Python

В текстовом файле есть строка «Мне это не нравится». Однако, когда я считываю это в строке, это становится «Я не \ xe2 \ x80 \ x98t как это». Я понимаю, что \ u2018 является представлением "'" в Юникоде. я использую f1 = open (file1, "r") text = f1.read() команда для чтения. Теперь, возможно ли...