Я читал, что представление о распределении основано на гипотезе о том, что слова, встречающиеся в сходном контексте, имеют сходное значение.
Word2Vec и Doc2Vec оба смоделированы в соответствии с этой гипотезой. Но в оригинальной статье даже они названы как Distributed representation of words and phrases
и Distributed representation of sentences and documents
. Итак, основаны ли эти алгоритмы на распределенном представлении или распределенном представлении.
Как насчет других моделей, таких как LDA и LSA.
male
royal
female
royal
Туриан, Иосиф, Лев Ратинов и Йошуа Бенжио. « Представления слов: простой и общий метод для обучения под наблюдением ». Материалы 48-го ежегодного собрания ассоциации по компьютерной лингвистике. Ассоциация компьютерной лингвистики, 2010 г., определяет распределенные представления и распределенные представления следующим образом:
К вашему сведению: в чем разница между векторами слов, представлениями слов и вложениями векторов?
источник
Distributional
Он имеет матрицу размера WxC, а затем сокращается до Wxd, где d - размер вектора вложения. Он использует размеры окна, чтобы определить контекст.Distributed
: Плотные, низкоразмерные векторы. Он сохраняет скрытые особенности (семантические свойства) в этих измерениях.Ответ от Андрея Кутузова через гугл-группы был удовлетворительным
источник