Недавно я столкнулся с многомерным масштабированием. Я пытаюсь лучше понять этот инструмент и его роль в современной статистике. Итак, вот несколько руководящих вопросов:
- На какие вопросы он отвечает?
- Какие исследователи часто заинтересованы в его использовании?
- Существуют ли другие статистические методы, которые выполняют аналогичные функции?
- Какая теория развивается вокруг этого?
- Какое отношение имеет «MDS» к «SSA»?
Я заранее прошу прощения за то, что задал такой смешанный / неорганизованный вопрос, но такова природа моей нынешней стадии в этой области.
multidimensional-scaling
Таль Галили
источник
источник
Ответы:
В случае, если вы примете краткий ответ ...
На какие вопросы он отвечает? Визуальное отображение попарных различий в евклидовом (в основном) пространстве малой размерности.
Какие исследователи часто заинтересованы в его использовании? Каждый, кто стремится либо показать группы точек, либо получить представление о возможных скрытых измерениях, по которым точки дифференцируются. Или кто просто хочет превратить матрицу близости в данные точек переменных X.
Существуют ли другие статистические методы, которые выполняют аналогичные функции? PCA (линейный, нелинейный), анализ соответствия, многомерное развертывание (версия MDS для прямоугольных матриц). Они по-разному связаны с МДС, но редко рассматриваются как ее заменители. (Линейные PCA и CA являются тесно связанными операциями сокращения пространства линейной алгебры на квадратных и прямоугольных матрицах соответственно. MDS и MDU являются аналогичными итеративными в общем случае нелинейными алгоритмами подгонки пространства на квадратных и прямоугольных матрицах соответственно.)
Какая теория развивается вокруг этого? Матрица наблюдаемых различий превращается неравенства таким образом, чтобы свести к минимуму ошибки отображения различий с помощью евклидовых расстояний в - мерном пространстве: . Преобразование может быть запрошено линейным (метрический MDS) или монотонным (неметрический MDS). может быть абсолютной ошибкой или квадратом ошибки или другой функцией напряжения . Вы можете получить карту для одной матрицыS T Е D м S→ Tзнак равномD + E Е S (классическая или простая MDS) или карта для множества матриц одновременно с дополнительной картой весов (индивидуальные различия или взвешенные MDS). Существуют и другие формы, такие как повторная МДС и генерализованная МДС. Итак, MDS - это разнообразная техника.
Какое отношение «MDS» имеет к «SSA»? Понятие об этом можно найти на странице Википедии MDS.
Обновление для последнего пункта. Эта техническая заметка из SPSS оставляет впечатление, что SSA - это случай многомерного развертывания (процедура PREFSCAL в SPSS). Последнее, как я уже отмечал выше, является алгоритмом MDS, применяемым к прямоугольным (а не квадратно-симметричным) матрицам.
источник
@ttnphns предоставил хороший обзор. Я просто хочу добавить пару небольших вещей. Greenacre проделал большую работу с анализом корреспонденции и с тем, как он связан с другими статистическими методами (такими как MDS, но также PCA и другие), вы можете посмотреть на его материал (например, эта презентация может быть полезно). Кроме того, МДС , как правило , используется , чтобы сделать сюжет (хотя можно просто извлечь некоторую числовую информацию), и он написал книгу , этот общий тип сюжета и поместить его в Интернете бесплатно здесь(хотя только одна глава о заговорах MDS как таковых). Наконец, с точки зрения типичного использования, он очень часто используется в исследованиях рынка и позиционировании продуктов, где исследователи используют его для описания того, как потребители думают о сходстве между различными конкурирующими продуктами; Вы не хотите, чтобы ваш продукт плохо отличался от остальных.
источник
Еще одним преимуществом является то, что вы можете использовать MDS для анализа данных, для которых вы не знаете важных переменных или измерений. Стандартная процедура для этого будет: 1) иметь участники ранжировать, сортировать или непосредственно идентифицировать сходство между объектами; 2) преобразовать ответы в матрицу различий; 3) применить MDS и, в идеале, найти 2 или 3D модель; 4) разработать гипотезы об измерениях, структурирующих карту.
Мое личное мнение состоит в том, что существуют другие инструменты сокращения измерений, которые обычно лучше подходят для этой цели, но то, что обеспечивает MDS, - это возможность развить теории об измерениях, которые используются для организации суждений. Важно также помнить о степени стресса (искажения, вызванные уменьшением размеров) и учитывать это в своем мышлении.
Я думаю, что одна из лучших книг по MDS - «Прикладное многомерное масштабирование» Боргом, Гроененом и Майром (2013).
источник