Простое объяснение графика параллельных координат

13

Я прочитал и видел много графиков параллельных координат. Может ли кто-нибудь ответить на следующие вопросы:

  1. Что такое параллельные координаты (PCP) в простых словах, чтобы непрофессионал мог понять?
  2. Математическое объяснение с некоторой интуицией, если это возможно
  3. Когда PCP полезен и когда их использовать?
  4. Когда это PCP не полезно , и когда их следует избегать?
  5. Возможные преимущества и недостатки PCP
suncoolsu
источник
Отличная тема - Вы получите много +1 за этот вопрос ...
Тал Галили
1
@Tal .. спасибо :-) Но я хотел узнать больше и, возможно, расширить статью в Вики, которая не слишком информативна.
Suncoolsu
Отличный стимул :)
Тал Галили

Ответы:

6

Мне кажется, что основная функция PCP состоит в том, чтобы выделять однородные группы людей или, наоборот, (в двойственном пространстве, по аналогии с PCA) специфические модели ассоциации по различным переменным. Он создает эффективную графическую сводку многомерного набора данных, когда не слишком много переменных. Переменные автоматически масштабируются до фиксированного диапазона (обычно 0–1), что эквивалентно работе со стандартизированными переменными (чтобы предотвратить влияние одной переменной на другие из-за проблемы масштабирования), но для очень многомерного набора данных (# переменных> 10), вы определенно должны смотреть на другие дисплеи, такие как график флуктуаций или тепловая карта, которые используются в исследованиях микрочипов.

Это помогает отвечать на такие вопросы, как:

  • Существует ли какая-либо последовательная схема индивидуальных баллов, которая может быть объяснена определенным членством в классе (например, гендерная разница)?
  • Икс1Икс2

На следующем графике данных радужной оболочки ясно видно, что виды (здесь показаны разными цветами) демонстрируют очень различающиеся профили при рассмотрении длины и ширины лепестка или что Iris setosa (синий) являются более однородными по длине лепестка ( т.е. их дисперсия ниже), например.

альтернативный текст

Вы даже можете использовать его в качестве основы для методов классификации или уменьшения размеров, таких как PCA. Чаще всего, при выполнении PCA, помимо уменьшения пространства функций, вы также хотите выделить группы людей (например, есть люди, которые систематически получают более высокие оценки по некоторой комбинации переменных); обычно это происходит путем применения некоторой иерархической кластеризации к показателям факторов и выделения итогового членства кластера в пространстве факторов (см. пакет FactoClass R.)

Он также используется в кластерных диаграммах ( Визуализация неиерархического и иерархического кластерного анализа ), целью которого является изучение эволюции распределения кластеров при увеличении количества кластеров (см. Также, Какие критерии остановки для агломерационной иерархической кластеризации используются на практике? ).

Такие отображения также полезны, когда они связаны с обычными точечными диаграммами (которые по конструкции ограничены 2D-отношениями), это называется чисткой и доступно в системе визуализации данных GGobi или в программном обеспечении Mondrian .

хл
источник
4

Что касается вопросов 3, 4 и 5, я бы посоветовал вам проверить эту работу

Восприятие паттернов в параллельных координатах: определение порогов для идентификации отношений с помощью: Джимми Йоханссона, Камиллы Форселл, Матса Линда, Мэтью Купера в Information Visualization, Vol. 7, № 2. (2008), с. 152-162.

Подводя итог своим выводам, люди в состоянии определить направление наклона отношений между каждым узлом, но не настолько хороши в определении силы отношений или степени наклона. Они дают предлагаемые уровни шума, в которых люди все еще могут расшифровать отношения в статье. К сожалению, статья не обсуждает идентификацию подгрупп через цвет, как демонстрирует chl.

Энди У
источник
4

Пожалуйста, посетите http://www.cs.tau.ac.il/~aiisreal/, а также посмотрите на новую книгу

Параллельные координаты - Эта книга о визуализации, систематически включающей в процесс решения проблем фантастическое распознавание человеческих образов ... www.springer.com/math/cse/book/978-0-387-21507-5.

В гл. 10 есть много реальных примеров с многомерными данными, показывающими, как можно использовать параллельные координаты (сокращ. || -cs). Также стоит изучить некоторые математические приемы для визуализации и работы с многомерными / многомерными отношениями (поверхностями), а не только с точечными наборами. Это интересно видеть и работать с аналогами знакомых объектов во многих измерениях, таких как полоса Мебиуса, выпуклые множества и многое другое.

Короче говоря, || -cs - это многомерная система координат, в которой оси параллельны друг другу, что позволяет увидеть множество осей. Методология была применена к алгоритмам разрешения конфликтов в области управления воздушным движением, компьютерного зрения, управления процессами и поддержки принятия решений.

user1366
источник