“Python nltk tokinize” Ответ

Python nltk tokinize

>>> import nltk
>>> sentence = """At eight o'clock on Thursday morning
... Arthur didn't feel very good."""
>>> tokens = nltk.word_tokenize(sentence)
>>> tokens
['At', 'eight', "o'clock", 'on', 'Thursday', 'morning',
'Arthur', 'did', "n't", 'feel', 'very', 'good', '.']
Tame Trout

Импорт word_tokenize

import nltk
from nltk import word_tokenize
Itchy Impala

nltk python, как токенизировать текст

>>> tokens = word_tokenize(raw)
>>> type(tokens)
<class 'list'>
>>> len(tokens)
254354
>>> tokens[:10]
['The', 'Project', 'Gutenberg', 'EBook', 'of', 'Crime', 'and', 'Punishment', ',', 'by']
GelatinousMustard

Ответы похожие на “Python nltk tokinize”

Вопросы похожие на “Python nltk tokinize”

Больше похожих ответов на “Python nltk tokinize” по Python

Смотреть популярные ответы по языку

Смотреть другие языки программирования