Вопросы с тегом «data-visualization»

11
Что такое «багплот» или «двумерный боксплот»?

Я нашел статью, которая представляет многомерную (двумерную здесь) версию коробочного графика - багплот. Что это за мешок? Я вижу серию вложенных полигонов, основанных на вершинах, один из тех полигонов объявлен как пакет. В чем идея построения вложенного многоугольника? Какой из полигонов является...

11
R / mgcv: Почему тензорные продукты te () и ti () производят разные поверхности?

mgcvПакет Rимеет две функции для установки взаимодействия Тензор продукта: te()и ti(). Я понимаю основное разделение труда между ними (подгонка нелинейного взаимодействия против разложения этого взаимодействия на основные эффекты и взаимодействие). Чего я не понимаю, так это почему te(x1, x2)и...

11
Чтение сюжетов типа «ящик с усами»: возможно ли выявить существенные различия между группами?

Предположим, что мы смотрим на этот сюжет с рамками и усами: Между четвергом и пятницей, я думаю, большинство согласится с тем, что, похоже, существенная разница во времени сна. Это статистически обоснованная гипотеза? Можем ли мы заметить существенные различия из-за того, что ни один из диапазонов...

11
QQ интерпретация сюжета

Рассмотрим следующий код и вывод: par(mfrow=c(3,2)) # generate random data from weibull distribution x = rweibull(20, 8, 2) # Quantile-Quantile Plot for different distributions qqPlot(x, "log-normal") qqPlot(x, "normal") qqPlot(x, "exponential", DB = TRUE) qqPlot(x, "cauchy") qqPlot(x, "weibull")...

11
Что такое хорошая визуализация для пуассоновских регрессий?

Я хочу связать дефекты кода с такими показателями сложности кода, как близость. Одна из распространенных моделей состоит в том, чтобы рассматривать это как процесс Пуассона, где продолжительность - это то, сколько времени затрачивается на кодирование, а плотность - это функция сложности кода. Я...

11
Визуализация данных больших размеров

У меня есть образцы двух классов, которые являются векторами в многомерном пространстве, и я хочу построить их в 2D или 3D. Я знаю о методах уменьшения размерности, но мне нужен действительно простой и легкий в использовании инструмент (в matlab, python или в готовом .exe). Также мне интересно,...

11
Как спроектировать многомерное пространство в двухмерную плоскость?

У меня есть набор точек данных в N-мерном пространстве. Кроме того, у меня также есть центроид в этом же N-мерном пространстве. Существуют ли какие-либо подходы, которые могут позволить мне проецировать эти точки данных в двумерное пространство, сохраняя информацию об их относительном расстоянии в...

11
Совокупный / Совокупный график (или «Визуализация кривой Лоренца»)

Я не знаю, как называются такие сюжеты, и поэтому я дал этому вопросу глупое название. Допустим, у меня есть заказанный набор данных следующим образом 4253 4262 4270 4383 4394 4476 4635 ... Каждое число соответствует количеству публикаций, которые определенный пользователь внес на сайт. Я...

11
Что это означает, когда все ребра в реальной сети / графике статистически так же вероятны случайно?

Я использовал метод извлечения магистральной сети, описанный в этой статье: http://www.pnas.org/content/106/16/6483.abstract По сути, авторы предлагают метод, основанный на статистике, который дает вероятность для каждого ребра в графе, что ребро могло произойти случайно. Я использую типичное...

11
Работает ли модульность сети Ньюмана для взвешенных графов со знаком?

Модульность графа определяется на его странице в Википедии . В другом посте кто-то объяснил, что модульность можно легко вычислить (и максимизировать) для взвешенных сетей, поскольку матрица смежности может содержать оцененные связи. Тем не менее, я хотел бы знать, будет ли это работать со...

11
Как лучше всего визуализировать эффекты категорий и их распространенность в логистической регрессии?

Мне нужно представить информацию об основных предикторах голосов кандидата, используя данные опроса общественного мнения. Я выполнил логистическую регрессию, используя все переменные, которые меня интересуют, но я не могу найти хороший способ представить эту информацию. Мой клиент заботится не...

11
Как интерпретировать остаточные цвета на мозаичном графике?

Это мозаичный график набора данных таблицы сопряженности, HairEyeColorописанный здесь . Как мне интерпретировать цвета, представляющие остатки? В чем разница между высокими и положительными остатками Пирсона (показаны синим цветом) по сравнению с низкими и отрицательными, показанными красным...

10
Как искать долины на графике?

Я изучаю некоторые данные о геномном покрытии, которые в основном представляют собой длинный список (несколько миллионов значений) целых чисел, каждый из которых говорит о том, насколько хорошо (или «глубоко») охвачена эта позиция в геноме. Я хотел бы найти «долины» в этих данных, то есть регионы,...

10
Разъяснения относительно чтения номограммы

Ниже приведена номограмма, созданная из набора данных mtcars с пакетом rms для формулы: mpg ~ wt + am + qsec Сама модель кажется хорошей с R2 0,85 и P <0,00001 > mod Linear Regression Model ols(formula = mpg ~ wt + am + qsec, data = mtcars) Model Likelihood Discrimination Ratio Test Indexes...

10
Сложный регрессионный график в R

Мне нужно нарисовать сложную графику для визуального анализа данных. У меня есть 2 переменные и большое количество случаев (> 1000). Например (число равно 100, если дисперсия меньше "нормальной"): x <- rnorm(100,mean=95,sd=50) y <- rnorm(100,mean=35,sd=20) d <- data.frame(x=x,y=y) 1)...

10
Как отобразить матрицу корреляций с отсутствующими записями?

Я хотел бы получить графическое представление корреляций в статьях, которые я собрал до сих пор, чтобы легко изучить взаимосвязи между переменными. Раньше я рисовал (грязный) график, но у меня сейчас слишком много данных. В основном у меня есть таблица с: [0]: имя переменной 1 [1]: имя переменной 2...

10
В R, что является лучшим графическим драйвером для использования графиков в Microsoft Word?

Я использую R для создания аккуратных графиков, которые я использую в документах Microsoft Office. Согласно этой странице , наилучшее качество достигается с помощью драйвера PDF. К сожалению, Word не поддерживает импорт рисунков в формате PDF. Что я должен...

10
Первый быстрый взгляд на набор данных

Прошу прощения за мое невежество, но ... Я продолжаю оказываться в ситуации, когда сталкиваюсь с кучей новых данных, которые мне удалось найти. Эти данные обычно выглядят примерно так: Date Number1 Number2 Category1 Category2 20120125 11 101 Dog Brown 20120126 21 90 Cat Black 20120126 31 134 Cat...

10
R линейная регрессия категориальной переменной «скрытое» значение

Это всего лишь пример, с которым я сталкивался несколько раз, поэтому у меня нет примеров данных. Запуск модели линейной регрессии в R: a.lm = lm(Y ~ x1 + x2) x1является непрерывной переменной x2является категориальным и имеет три значения, например, «Низкий», «Средний» и «Высокий». Однако вывод,...

10
Что подразумевается под PCA, сохраняя только большие попарные расстояния?

В настоящее время я читаю технику визуализации t-SNE, и было упомянуто, что одним из недостатков использования анализа главных компонентов (PCA) для визуализации многомерных данных является то, что он сохраняет только большие попарные расстояния между точками. Значимые точки, которые находятся...