В чем разница между лемматизацией и стеммингом?
Когда я использую каждый? Кроме того ... зависит ли лемматизация NLTK от частей речи? Было бы точнее, если бы это было
Когда я использую каждый? Кроме того ... зависит ли лемматизация NLTK от частей речи? Было бы точнее, если бы это было
Я пробовал PorterStemmer и Snowball, но оба работают не со всеми словами, пропустив некоторые очень распространенные. Мои тестовые слова: « кошки, бегущие, бегали, кактусы, кактусы, сообщества кактусов », и оба получают менее половины правильных ответов. Смотрите также: Алгоритм стемминга, который...