Вопросы с тегом «data-visualization»

10
Графическая энциклопедия

Мне нужно создать многопользовательское веб-приложение, которое будет об измерениях трафика, прогнозах и т. Д. На данный момент я знаю, что буду использовать гистограммы и круговые диаграммы. К сожалению, эти типы диаграмм недостаточно богаты для представления всех данных, которые я собираю и...

10
Визуализация 2-буквенных комбинаций

Ответы на этот вопрос по SO вернули набор из примерно 125 одно- или двухбуквенных имен: /programming/6979630/what-1-2-letter-object-names-conflict-with-existing -r-объекты [1] "Ad" "am" "ar" "as" "bc" "bd" "bp" "br" "BR" "bs" "by" "c" "C" [14] "cc" "cd" "ch" "ci" "CJ" "ck" "Cl" "cm" "cn" "cq" "cs"...

10
В R, что является лучшим графическим драйвером для использования графиков в Microsoft Word?

Я использую R для создания аккуратных графиков, которые я использую в документах Microsoft Office. Согласно этой странице , наилучшее качество достигается с помощью драйвера PDF. К сожалению, Word не поддерживает импорт рисунков в формате PDF. Что я должен...

10
Первый быстрый взгляд на набор данных

Прошу прощения за мое невежество, но ... Я продолжаю оказываться в ситуации, когда сталкиваюсь с кучей новых данных, которые мне удалось найти. Эти данные обычно выглядят примерно так: Date Number1 Number2 Category1 Category2 20120125 11 101 Dog Brown 20120126 21 90 Cat Black 20120126 31 134 Cat...

10
Построение прогнозных значений во временных рядах ARIMA в R

Вероятно, в этом вопросе есть несколько серьезных недоразумений, но это не означает, что вычисления правильны, а скорее мотивируют изучение временных рядов с некоторым вниманием. Пытаясь понять применение временных рядов, кажется, что удаление данных делает прогноз будущих значений...

10
R линейная регрессия категориальной переменной «скрытое» значение

Это всего лишь пример, с которым я сталкивался несколько раз, поэтому у меня нет примеров данных. Запуск модели линейной регрессии в R: a.lm = lm(Y ~ x1 + x2) x1является непрерывной переменной x2является категориальным и имеет три значения, например, «Низкий», «Средний» и «Высокий». Однако вывод,...

10
Оценка кластеров цепей Маркова первого порядка

Я сгруппировал свой набор данных из нескольких тысяч цепей Маркова первого порядка примерно в 10 кластеров. Есть ли какой-нибудь рекомендуемый способ, как я могу оценить эти кластеры и выяснить, какие элементы в кластерах совместно используются и как они отличаются от других кластеров? Таким...

10
Существует ли верхний предел количества интервалов в гистограмме?

Я прочитал несколько статей и выдержки из книг, которые объясняют, как выбрать хорошее количество интервалов (бинов) для гистограммы набора данных, но мне интересно, есть ли жесткое максимальное количество интервалов, основанное на количестве точек в набор данных или какой-то другой критерий....

10
Графики в регрессионном разрыве дизайна в «Stata» или «R»

Lee и Lemieux (стр. 31, 2009) предлагают исследователю представить графики при выполнении анализа разрыва непрерывности регрессии (RDD). Они предлагают следующую процедуру: «... для некоторой полосы пропускания и для некоторого числа бинов и слева и справа от значения отсечки, соответственно, идея...

10
Как вы представляете двоичные результаты в сравнении с непрерывным предиктором?

У меня есть некоторые данные, которые мне нужно визуализировать, и я не уверен, как лучше это сделать. У меня есть некоторый набор базовых предметов с соответствующими частотами и результатами . Теперь мне нужно показать, насколько хорошо мой метод «находит» (то есть, 1-результат) низкочастотные...

10
Как просматривать данные больших временных рядов в интерактивном режиме?

Я часто имею дело с разумным размером данных временных рядов, 50-200 миллионов удваивается с соответствующими временными метками и хотел бы динамически их визуализировать. Существует ли существующее программное обеспечение для этого? Как насчет библиотек и форматов данных? Zoom-кеш - один из...

10
Построить дерево вероятностей пути для поездок через веб-сайт

В настоящее время я делаю анализ на веб-сайте, который требует, чтобы я создал схему дерева решений, показывающую вероятный маршрут, по которому люди идут, когда они приходят на веб-сайт. Я имею дело с a, data.frameкоторый показывает пути всех клиентов к сайту, начиная с домашней страницы....

10
Интерпретация графиков условной плотности

Я хотел бы знать, как правильно интерпретировать графики условной плотности. Я вставил две ниже, которые я создал в R с cdplot. Например, равна ли вероятность того, что Result равен 1, когда Var 1 равен 150 приблизительно 80%? Темно-серая область - это то, что является условной вероятностью того,...

10
Как визуализировать байесовскую доброту, пригодную для логистической регрессии

Для задачи байесовской логистической регрессии я создал апостериорное предиктивное распределение. Я выбираю из прогнозирующего распределения и получаю тысячи выборок (0,1) для каждого наблюдения, которое у меня есть. Визуализация пригодности менее интересна, например: На этом графике показаны 10...

10
Модель истории дискретного времени (выживания) в R

Я пытаюсь вписать модель с дискретным временем в R, но я не уверен, как это сделать. Я читал, что вы можете организовать зависимую переменную в разных строках, по одной для каждого временного наблюдения, и использовать glmфункцию со ссылкой logit или cloglog. В этом смысле, у меня есть три колонки:...

10
Исследование матрицы рассеяния для многих переменных

Я анализирую набор данных со многими параметрами (скажем, 50-200), и мне интересно посмотреть на связи между переменными (например, с точки зрения диаграмм рассеяния с 2 переменными или гистограмм 2d). Однако для этого количества параметров кажется невозможным нарисовать массив графиков 200х200...

10
Составление сводной статистики со средним, сд, мин и макс?

Я из области экономики и обычно в дисциплине сводная статистика переменных представлена ​​в таблице. Тем не менее, я хочу построить их. Я мог бы изменить коробчатый график так, чтобы он отображал среднее, стандартное отклонение, минимум и максимум, но я не хочу этого делать, поскольку прямоугольные...

10
Визуализация многих искаженных распределений

У меня есть серия дистрибутивов с левосторонним и тяжелым хвостом, которые я хотел бы показать. Есть 42 распределения через три фактора (помечено как A, Bи Cниже). Кроме того, изменение сокращается через фактор B. У меня проблема в том, что распределение трудно дифференцировать по шкале результата...

10
Как извлечь информацию из матрицы графика рассеяния, когда у вас большое N, дискретные данные и много переменных?

Я играю с набором данных о раке молочной железы и создал диаграмму рассеяния всех атрибутов, чтобы понять, какие из них оказывают наибольшее влияние на предсказание класса malignant(синий) benign(красный). Я понимаю, что строка представляет ось x, а столбец представляет ось y, но я не вижу, какие...

10
Как визуализировать проценты по сравнению с количеством записей.

Я пытаюсь найти лучший способ визуализировать приведенную ниже таблицу и подчеркнуть эффективность лечения в сравнении с количеством пациентов, которые попробовали лечение. Вот ссылка на реальную страницу: http://curetogether.com/cluster-headaches/treatments/ Каков наилучший способ подчеркнуть...