Как найти длину строки (количество символов в строке), не разбивая ее на R? Я знаю, как найти длину списка, но не строки.
А как насчет строк Unicode? Как найти длину (в байтах) и количество символов (руны, символы) в строке Unicode?
Связанный вопрос:
r
string
unicode
string-length
Игорь Чубин
источник
источник
x
.Ответы:
См
?nchar
. Например:источник
nchar(NA)
NA
s. (Хотя это задокументировано так).stri_length
fromstringi
- он отлично работает с NA и работает быстрее :) Проверьте мой пост!nchar(NA) ## [1] NA
: см. Nchar RDocumentationИспользуйте
stringi
пакет иstri_length
функциюЗачем? Потому что это самый быстрый из представленных решений :)
а также отлично работает с NA
источник
stri_length('\u0105')
длина равна одному, но ... используютсяstri_numbytes('\u0105')
2 байтаnchar()
настоящее время имеет аргумент счет для NA - х:allowNA = FALSE
Вы также можете использовать
stringr
пакет:источник
Проверьте это
источник
Опция keepNA = TRUE предотвращает проблемы с NA
источник
nchar(NA) ## [1] NA
: см. Nchar RDocumentationвам может понадобиться сначала преобразовать в символьный вектор;
источник
nchar
. Для факторных входовnchar
выдает ошибку и, следовательно, сначала вам нужно будет выполнить преобразование, как показано.