Вопросы с тегом «data-visualization»

13
Боксплотный эквивалент для дистрибутивов с тяжелыми хвостами?

Для приблизительно нормально распределенных данных коробочные диаграммы - отличный способ быстро визуализировать медиану и распространение данных, а также присутствие любых выбросов. Однако для распределений с более тяжелыми хвостами многие точки показаны как выбросы, поскольку выбросы определяются...

13
Пакет GBM против Карет с использованием GBM

Я занимался настройкой модели caret, но затем перезапустил модель, используя gbmпакет. Насколько я понимаю, caretпакет использует gbmи вывод должен быть одинаковым. Тем не менее, только быстрый запуск теста data(iris)показывает несоответствие в модели около 5% с использованием RMSE и R ^ 2 в...

12
Неправильно ли использовать линейные графики для дискретных данных?

Я часто видел дискретные наборы данных, построенные в виде линейных графиков, но мне приходит в голову, что линия выводит значение в точке между интервалами измерения, что не имеет смысла для дискретных наборов данных. Таким образом, неверно ли использование линейных графиков для дискретных данных?...

12
Какая польза от t-SNE, кроме визуализации данных?

В каких ситуациях мы должны использовать t-SNE (кроме визуализации данных)? T-SNE используется для уменьшения размерности. Ответ на этот вопрос предполагает, что t-SNE следует использовать только для визуализации, и что мы не должны использовать его для кластеризации. Тогда какая польза от...

12
Как сделать хорошую шкалу интенсивности цвета?

Я отнюдь не хорош в статистике, но думаю, что попал в нужное место. Мой вопрос прост: Моя проблема состоит в сравнении численности населения нескольких штатов в маленькой стране, но в некоторых штатах население составляет 3000 000 человек, а в некоторых - 2000 человек. Я рисую это на карте, и...

12
Рисование нескольких графиков на графике в R [закрыто]

Закрыто. Этот вопрос не по теме . В настоящее время он не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он соответствовал теме перекрестной проверки. Закрыто 4 года назад . Я хотел бы построить четыре барплота на одном графике в R. Я использовал следующий код. Здесь, как...

12
Как я могу создавать красивые графики автоматически?

Например. такие как те на этой странице http://store.steampowered.com/hwsurvey Есть ли готовое программное обеспечение, которое может сделать это? В качестве альтернативы, какие-либо рекомендации для другого программного обеспечения, которое делает что-то подобное? Я знаю, что это на самом деле не...

12
Как мне интерпретировать этот Scatter Plot?

У меня есть точечная диаграмма, размер выборки которой равен числу людей по оси x и средней зарплате по оси y. Я пытаюсь выяснить, влияет ли размер выборки на среднюю зарплату. Это сюжет: Как мне интерпретировать этот...

12
Можно ли строить линию регрессии для ранжированных данных (корреляция Спирмена)?

У меня есть данные, для которых я рассчитал корреляцию Спирмена и хочу визуализировать их для публикации. Зависимая переменная ранжируется, независимая переменная - нет. То, что я хочу визуализировать, является скорее общей тенденцией, чем фактическим наклоном, поэтому я оценил независимую и...

12
Логистическая квантильная регрессия - как лучше всего передать результаты

В предыдущем посте я задавался вопросом, как справиться с оценками EQ-5D . Недавно я наткнулся на логистическую квантильную регрессию, предложенную Bottai и McKeown, которая представляет элегантный способ справиться с ограниченными результатами. Формула проста: л о гя т ( у) = Л о г( у- ум я нYм а...

12
Различия между PROC Mixed и lme / lmer в R - степени свободы

Примечание: этот вопрос является репостом, так как мой предыдущий вопрос пришлось удалить по юридическим причинам. Сравнивая PROC MIXED из SAS с функцией lmeиз nlmeпакета в R, я наткнулся на некоторые довольно запутанные различия. Более конкретно, степени свободы в разных тестах различаются между...

12
Построение кривой вероятности для логит-модели с несколькими предикторами

У меня есть следующая функция вероятности: Prob=11+e−zProb=11+e−z\text{Prob} = \frac{1}{1 + e^{-z}} где z=B0+B1X1+⋯+BnXn.z=B0+B1X1+⋯+BnXn.z = B_0 + B_1X_1 + \dots + B_nX_n. Моя модель выглядит Pr(Y=1)=11+exp(−[−3.92+0.014×(bid)])Pr(Y=1)=11+exp⁡(−[−3.92+0.014×(bid)])\Pr(Y=1) = \frac{1}{1 +...

12
Как я могу интерпретировать график процента усечения относительно среднего значения?

Для части домашнего задания меня попросили вычислить усеченное среднее для набора данных, удалив самое маленькое и самое большое наблюдение, и интерпретировать результат. Среднее значение было ниже, чем среднее значение. Моя интерпретация заключалась в том, что это произошло потому, что базовое...

12
Как рассчитать «Пути к Белому дому», используя R?

Я только что наткнулся на этот замечательный анализ, который одновременно интересен и красив: http://www.nytimes.com/interactive/2012/11/02/us/politics/paths-to-the-white-house.html Мне интересно, как такое «дерево путей» может быть построено с использованием R. Какие данные и алгоритм нужны для...

12
Почему нам нужен график трассировки для результатов MCMC

Я читаю исследовательские работы с использованием методов MCMC, и я вижу, что большинство из них содержат графики. Зачем нам нужны трассировки участков в цепочке Монте-Карло Маркова? На что указывает трассировка...

12
Какие популярные варианты визуализации 4-мерных данных?

Скажем, у меня есть следующие четырехмерные данные, где первые три можно рассматривать как координаты, а последние можно рассматривать как значения. c1, c2, c3, value 1, 2, 6, 0.456 34, 34, 12 0.27 12, 1, 66 0.95 Как лучше визуализировать влияние первых трех координат на последнее значение? Я знаю...

12
График QQ не соответствует гистограмме

У меня есть гистограмма, плотность ядра и соответствующее нормальное распределение финансовых отчетов, которые превращаются в убытки (знаки меняются), и обычный график QQ этих данных: График QQ ясно показывает, что хвосты установлены неправильно. Но если я взгляну на гистограмму и установленное...