Ресурсы для обучения использованию (/ созданию) динамической (/ интерактивной) статистической визуализации

14

Я хотел бы узнать немного больше об интерактивной визуализации данных (масштабирование, наведение, чистка, отображение точек и так далее). Буду рад любому:

  1. Учебное пособие / руководство / книга (?) / Видео о том, как использовать такие методы для статистического исследования.
  2. Указатели на хорошие / интересные интерактивные пакеты data-viz (в R и за ее пределами)

Просто , чтобы начать мяч прокатки, я знаю , что в R есть различные способы , чтобы получить интерактивную визуализацию, как rggobi , новый googleViz R пакет , то пакет анимации и некоторые другие. Но если есть другие пакеты, которые стоит изучить (предлагающие вещи, которых нет у R), я был бы рад узнать о них (например, jmp, mathlab, spss, sas, excel и т. Д.).

PS: это первый вопрос, чтобы использовать тег «интерактивная визуализация»

Таль Галили
источник
Я предполагаю, что @Shane будет что сказать здесь, говоря о webvis (парсер для protovis), так как protovis (посвященный веб-визуализации) ( vis.stanford.edu/protovis ) содержит возможность интерактивной графики ...
Робин Джирард
В R, есть также iPlots и RGL , но Javascript- или решения , основанные на Python может быть более гибким.
Винсент Зонекинд

Ответы:

13

Помимо Protovis (HTML + JS) или Mayavi (Python), я бы порекомендовал обработку, которая является

язык программирования с открытым исходным кодом и среда для людей, которые хотят создавать изображения, анимацию и взаимодействия. Изначально разработанный для того, чтобы служить в качестве скетчбука программного обеспечения и для обучения основам компьютерного программирования в визуальном контексте.

На http://www.openprocessing.org/ есть много скриптов с открытым исходным кодом , а также много связанных книг , посвященных обработке, но также и визуализации данных.

Я знаю, что есть проект, обеспечивающий интерфейс R, rprocessing , но я не знаю, как это происходит. Есть также интерфейс с clojure / incanter (см., Например, Создание обработки визуализаций с Clojure и Incanter ).

Существует множество онлайн-ресурсов, среди которых заметки о классе Стэнфорда, например, CS448B или 7 классических основополагающих документов, которые вы, возможно, не хотите публично признаться в том, что не знаете .

хл
источник
6

Еще несколько пакетов, чтобы добавить к предложению Chl обработки для создания интерактивных визуализаций. Все они основаны на javascript и могут работать в браузере, поэтому могут использоваться как для публикации, так и для собственного анализа:

  • D3.js является преемником Protovis. Он более мощный, поскольку у вас больше контроля над созданными объектами (они являются собственными объектами DOM, т.е. вы имеете полный контроль над ними с помощью javascript), но некоторые предпочитают Protovis для простоты. Хороший технический D3 против Protovis обсуждение здесь .
  • Raphael.js - это хороший вариант для настраиваемой интерактивности массового рынка, поскольку он не только рассчитан на будущее (без флеш-памяти), но и работает в таких старых браузерах, как IE6 (единственное, с чем мне не знакомы - старые версии браузер Android). Как и D3, все является объектами DOM, на которые можно ориентироваться, и у них есть хорошие встроенные средства управления API для анимации и интерактивности. Он не предлагает ничего из коробки, специфичной для визуализации: это очень мощный и гибкий бланк, отличный выбор для разработки пользовательских визуализаций, но не для вашего первоначального предварительного анализа. Сначала ознакомьтесь с вашими данными.
  • gRaphael.js - это стандартные диаграммы (гистограммы, линии и т. д.) для Рафаэля. Это простой, но работает и может быть построен на - может быть полезным ингредиентом, если вы строите свой собственный набор.

Что касается вашего другого вопроса об обучении, для общих принципов заслуживает упоминания Дизайн информационных панелей , если вы хотите создать массив интерактивных стандартных инструментов общего назначения для ваших данных.

Интерактивные визуализации находятся на грани между статистикой и дизайном интерактивности : так что книги об этом могут быть полезны. У меня нет никакого личного опыта в учебниках по интерактивному дизайну, но я большой поклонник Универсальных принципов дизайна . Это может быть излишним для ваших нужд, но подумайте о том, чтобы заглянуть в столбец « Удобство использования» на его превосходной странице «Категориальное содержание» и прочитать перечисленные главы (прогрессивное раскрытие, отношение сигнал-шум и т. Д.).

Кроме того, для любого новичка в программировании, Интерактивность программирования является хорошим местом для начала развития технических навыков (в него также входит здоровенная глава по обработке).

Но зная , что работает и что возможно, вы не можете победить обучения , делая , и хороший удар старт может быть рассмотреть вопрос о заднем и анализе именитых большого ценника общего назначение интерактивных пакеты визуализации , как таблицы и СОЙ и подумайте, почему их функции разработаны именно так, как они есть.

user56reinstatemonica8
источник
Спасибо за редактирование в ссылках whuber - обыграй меня!
user56reinstatemonica8
4

В дополнение к обработке, обратите внимание на Nodebox на основе Python (1, 2, OpenGL), который был вдохновлен обработкой:

Nodebox 1 - только Mac, а Nodebox 2 и версия OpenGL - кроссплатформенные.

В Python есть множество библиотек обработки данных, которые можно импортировать в Nodebox, например, scipy.org.

Эд Хаген
источник
1

В качестве отдельного подхода к существующим ответам вскоре после того, как я опубликовал свой первый длинный список, появился WEAVE : пакет для визуализации данных с открытым исходным кодом. Вот краткое описание WEAVE для ведущих данных в блоге Flowing Data.

Целесообразно использовать другой подход к визуализации данных в зависимости от того, где вы находитесь в процессе. Чем раньше вы - чем более необработанные и неисследованные ваши данные - тем больше у вас шансов получить выгоду от готовых, гибких универсальных пакетов, таких как WEAVE, и его коммерческих аналогов с закрытым исходным кодом, таких как Tableau и JMP, - вы сможете быстро и безболезненно, чтобы узнать данные и выяснить, какие линии атаки следует использовать, чтобы получить максимальную отдачу от них.

По мере того как вы узнаете больше о данных, ваш фокус, скорее всего, сместится в сторону коммуникации или «управляемого исследования» - более настраиваемых визуализаций исследовательских данных, разработанных на основе предостережений, нюансов и областей интереса, которые вы теперь обнаружили в данных. Это где чистые продукты, такие как программные инструменты векторного рисования, перечисленные выше, вступают в свои права.

user56reinstatemonica8
источник