В чем разница между парсером группы интересов и анализатором зависимостей ? Каковы различия в использовании этих двух?
Дерево синтаксического анализа группы интересов разбивает текст на подфразы. Нетерминалы в дереве - это типы фраз, терминалы - это слова в предложении, а края не помечены. Для простого предложения «Джон видит Билла» анализ группы интересов будет выглядеть так:
Sentence
|
+-------------+------------+
| |
Noun Phrase Verb Phrase
| |
John +-------+--------+
| |
Verb Noun Phrase
| |
sees Bill
Анализ зависимости связывает слова в соответствии с их отношениями. Каждая вершина в дереве представляет собой слово, дочерние узлы - это слова, которые зависят от родителя, а ребра помечаются отношениями. Анализ зависимости типа «Джон видит Билла» будет:
sees
|
+--------------+
subject | | object
| |
John Bill
Вам следует использовать тот тип парсера, который максимально приближает вас к вашей цели. Если вас интересуют подфразы в предложении, вы, вероятно, захотите выполнить синтаксический анализ аудитории. Если вас интересуют отношения зависимости между словами, вам, вероятно, понадобится анализ зависимости.
Парсер Стэнфордского университета может предоставить вам оба варианта ( онлайн-демонстрация ). Фактически, способ, которым это действительно работает, состоит в том, чтобы всегда анализировать предложение с помощью синтаксического анализатора избирательного округа, а затем, если необходимо, он выполняет детерминированное (основанное на правилах) преобразование в дереве синтаксического анализа избирательного округа, чтобы преобразовать его в дерево зависимостей.
Больше можно найти здесь: