Какова роль МДС в современной статистике?

18

Недавно я столкнулся с многомерным масштабированием. Я пытаюсь лучше понять этот инструмент и его роль в современной статистике. Итак, вот несколько руководящих вопросов:

  • На какие вопросы он отвечает?
  • Какие исследователи часто заинтересованы в его использовании?
  • Существуют ли другие статистические методы, которые выполняют аналогичные функции?
  • Какая теория развивается вокруг этого?
  • Какое отношение имеет «MDS» к «SSA»?

Я заранее прошу прощения за то, что задал такой смешанный / неорганизованный вопрос, но такова природа моей нынешней стадии в этой области.

Таль Галили
источник
7
Иллюстрации в других местах SE посвящены первым двум пунктам: gis.stackexchange.com/a/20428 ; gis.stackexchange.com/a/15567
whuber

Ответы:

24

В случае, если вы примете краткий ответ ...

На какие вопросы он отвечает? Визуальное отображение попарных различий в евклидовом (в основном) пространстве малой размерности.

Какие исследователи часто заинтересованы в его использовании? Каждый, кто стремится либо показать группы точек, либо получить представление о возможных скрытых измерениях, по которым точки дифференцируются. Или кто просто хочет превратить матрицу близости в данные точек переменных X.

Существуют ли другие статистические методы, которые выполняют аналогичные функции? PCA (линейный, нелинейный), анализ соответствия, многомерное развертывание (версия MDS для прямоугольных матриц). Они по-разному связаны с МДС, но редко рассматриваются как ее заменители. (Линейные PCA и CA являются тесно связанными операциями сокращения пространства линейной алгебры на квадратных и прямоугольных матрицах соответственно. MDS и MDU являются аналогичными итеративными в общем случае нелинейными алгоритмами подгонки пространства на квадратных и прямоугольных матрицах соответственно.)

Какая теория развивается вокруг этого? Матрица наблюдаемых различий превращается неравенства таким образом, чтобы свести к минимуму ошибки отображения различий с помощью евклидовых расстояний в - мерном пространстве: . Преобразование может быть запрошено линейным (метрический MDS) или монотонным (неметрический MDS). может быть абсолютной ошибкой или квадратом ошибки или другой функцией напряжения . Вы можете получить карту для одной матрицыSTЕDмSTзнак равномD+ЕЕS(классическая или простая MDS) или карта для множества матриц одновременно с дополнительной картой весов (индивидуальные различия или взвешенные MDS). Существуют и другие формы, такие как повторная МДС и генерализованная МДС. Итак, MDS - это разнообразная техника.

Какое отношение «MDS» имеет к «SSA»? Понятие об этом можно найти на странице Википедии MDS.

Обновление для последнего пункта. Эта техническая заметка из SPSS оставляет впечатление, что SSA - это случай многомерного развертывания (процедура PREFSCAL в SPSS). Последнее, как я уже отмечал выше, является алгоритмом MDS, применяемым к прямоугольным (а не квадратно-симметричным) матрицам.

ttnphns
источник
3
(+1) Хорошее резюме! Форрест Янг (уже цитируемый @whuber в своем комментарии), Йошио Такане и Ян де Леув имеют несколько очень хороших статей по MDS.
Chl
@chl, спасибо: полезные статьи на странице Такане в изобилии
ttnphns
6

@ttnphns предоставил хороший обзор. Я просто хочу добавить пару небольших вещей. Greenacre проделал большую работу с анализом корреспонденции и с тем, как он связан с другими статистическими методами (такими как MDS, но также PCA и другие), вы можете посмотреть на его материал (например, эта презентация может быть полезно). Кроме того, МДС , как правило , используется , чтобы сделать сюжет (хотя можно просто извлечь некоторую числовую информацию), и он написал книгу , этот общий тип сюжета и поместить его в Интернете бесплатно здесь(хотя только одна глава о заговорах MDS как таковых). Наконец, с точки зрения типичного использования, он очень часто используется в исследованиях рынка и позиционировании продуктов, где исследователи используют его для описания того, как потребители думают о сходстве между различными конкурирующими продуктами; Вы не хотите, чтобы ваш продукт плохо отличался от остальных.

Gung - Восстановить Монику
источник
1
(+1) Понимание Biplots , по Гауэр и колл. Это также отличная книга (поставляется с бинарным пакетом R , только для Windows), около 50 стр. по MDS и нелинейным блокам.
ЧЛ
2
@ CHL, спасибо за совет, эта книга выглядит интересно.
gung - Восстановить Монику
1

Еще одним преимуществом является то, что вы можете использовать MDS для анализа данных, для которых вы не знаете важных переменных или измерений. Стандартная процедура для этого будет: 1) иметь участники ранжировать, сортировать или непосредственно идентифицировать сходство между объектами; 2) преобразовать ответы в матрицу различий; 3) применить MDS и, в идеале, найти 2 или 3D модель; 4) разработать гипотезы об измерениях, структурирующих карту.

Мое личное мнение состоит в том, что существуют другие инструменты сокращения измерений, которые обычно лучше подходят для этой цели, но то, что обеспечивает MDS, - это возможность развить теории об измерениях, которые используются для организации суждений. Важно также помнить о степени стресса (искажения, вызванные уменьшением размеров) и учитывать это в своем мышлении.

Я думаю, что одна из лучших книг по MDS - «Прикладное многомерное масштабирование» Боргом, Гроененом и Майром (2013).

user3550400
источник