Разница между парсером интересов и анализатором зависимостей

Дерево синтаксического анализа группы интересов разбивает текст на подфразы. Нетерминалы в дереве - это типы фраз, терминалы - это слова в предложении, а края не помечены. Для простого предложения «Джон видит Билла» анализ группы интересов будет выглядеть так:

                  Sentence
                     |
       +-------------+------------+
       |                          |
  Noun Phrase                Verb Phrase
       |                          |
     John                 +-------+--------+
                          |                |
                        Verb          Noun Phrase
                          |                |
                        sees              Bill

Анализ зависимости связывает слова в соответствии с их отношениями. Каждая вершина в дереве представляет собой слово, дочерние узлы - это слова, которые зависят от родителя, а ребра помечаются отношениями. Анализ зависимости типа «Джон видит Билла» будет:

              sees
                |
        +--------------+
subject |              | object
        |              |
      John            Bill

Вам следует использовать тот тип парсера, который максимально приближает вас к вашей цели. Если вас интересуют подфразы в предложении, вы, вероятно, захотите выполнить синтаксический анализ аудитории. Если вас интересуют отношения зависимости между словами, вам, вероятно, понадобится анализ зависимости.

Парсер Стэнфордского университета может предоставить вам оба варианта ( онлайн-демонстрация ). Фактически, способ, которым это действительно работает, состоит в том, чтобы всегда анализировать предложение с помощью синтаксического анализатора избирательного округа, а затем, если необходимо, он выполняет детерминированное (основанное на правилах) преобразование в дереве синтаксического анализа избирательного округа, чтобы преобразовать его в дерево зависимостей.

Больше можно найти здесь:

http://en.wikipedia.org/wiki/Phrase_structure_grammar

http://en.wikipedia.org/wiki/Dependency_grammar

DHG
источник

В отношении НЛП, где приложение для составного синтаксического анализа? Анализ зависимостей очень полезен, но где именно я могу использовать выходные данные составного синтаксического анализа?

arjun

> Подходы к синтаксическому анализу, основанные на компонентах, предоставляют аналогичную информацию, но ее часто приходится извлекать из деревьев с помощью таких методов, как правила поиска головы, описанные в главе 11. web.stanford.edu/~jurafsky/slp3/11.pdf

gkiko

@arjun есть много приложений для составного синтаксического анализа. Просто чтобы назвать одно в качестве примера здесь, при извлечении информации / отношения из текста вам может потребоваться только извлечь VP / NP / предложения из текста, а затем классифицировать пары этих фраз / предложений как указывающие на тип отношения или нет. Таким образом, в этом случае мне не обязательно нужна детальная информация о связи во фразе / предложении, мне просто нужны фрагменты фразы / предложения из текста. И вот тут-то и пригодится анализатор избирательного округа.

Педрам,

Разница между парсером интересов и анализатором зависимостей

Ответы: