Вопросы с тегом «data-visualization»

31
Визуализация миллиона, выпуск PCA

Можно ли визуализировать результаты анализа основных компонентов способами, которые дают больше понимания, чем просто сводные таблицы? Возможно ли это сделать, когда число наблюдений велико, скажем, ~ 1e4? И возможно ли это сделать в R [приветствуются другие...

31
Статистические методы для более эффективного построения данных, когда присутствуют миллионы точек?

Я считаю, что R может занять много времени для создания графиков, когда присутствуют миллионы точек - неудивительно, учитывая, что точки строятся индивидуально. Кроме того, такие графики часто слишком загромождены и плотны, чтобы быть полезными. Многие из точек перекрываются и образуют черную...

31
Выполнение статистического теста после визуализации данных - выемка данных?

Я предложу этот вопрос на примере. Предположим, у меня есть набор данных, такой как набор данных по ценам на жилье в Бостоне, в котором у меня есть непрерывные и категориальные переменные. Здесь у нас есть переменная «качество», от 1 до 10, и цена продажи. Я могу разделить данные на дома «низкого»,...

31
Инструменты с открытым исходным кодом для визуализации многомерных данных?

Помимо gnuplot и ggobi , какие инструменты с открытым исходным кодом люди используют для визуализации многомерных данных? Gnuplot - более или менее базовый пакет для построения графиков. Ггоби может сделать несколько изящных вещей, таких как: анимировать данные вдоль измерения или среди дискретных...

31
За каким распространением следуют мои данные?

Допустим, у меня есть 1000 компонентов, и я собираю данные о том, сколько раз они регистрируют сбой, и каждый раз, когда они регистрируют сбой, я также отслеживаю, сколько времени понадобилось моей команде, чтобы устранить проблему. Короче говоря, я записывал время ремонта (в секундах) для каждого...

31
Как построить границу решения классификатора k-ближайшего соседа из элементов статистического обучения?

Я хочу создать сюжет, описанный в книге ElemStatLearn «Элементы статистического обучения: сбор данных, вывод и прогноз. Второе издание» Тревора Хасти, Роберта Тибширани и Джерома Фридмана. Сюжет: Мне интересно, как я могу получить этот точный график R, особенно обратите внимание на графику сетки и...

31
Линейный график имеет слишком много линий, есть ли лучшее решение?

Я пытаюсь составить график количества действий пользователей (в данном случае «лайков») с течением времени. Таким образом, у меня есть «Количество действий» в качестве моей оси Y, моя ось X - время (недели), и каждая строка представляет одного пользователя. Моя проблема в том, что я хочу посмотреть...

31
Рекомендации по цвету и толщине линий для линейных участков

Много было написано о выборе цвета, удобного для слепых, для карт, полигонов и заштрихованных областей в целом (см., Например, http://colorbrewer2.org ). Мне не удалось найти рекомендации по цветам линий и различной толщине линий для линейных графиков. Цели: легко различать линии, даже когда они...

30
Оптимизация для кривых Precision-Recall при дисбалансе класса

У меня есть задача классификации, где у меня есть несколько предикторов (один из которых является наиболее информативным), и я использую модель MARS для построения моего классификатора (меня интересует любая простая модель, и использование glms для иллюстративных целей будет тоже хорошо). Теперь у...

30
Интерпретация болтов в анализе главных компонентов

Я наткнулся на этот хороший учебник: Руководство по статистическому анализу с использованием R. Глава 13. Анализ основных компонентов: Олимпийский гепатлон о том, как делать PCA на языке R. Я не понимаю интерпретацию рисунка 13.3: Итак, я строю первый собственный вектор против второго собственного...

30
Визуализация пересечений множества множеств

Есть ли модель визуализации, которая хороша для отображения пересечения многих множеств? Я думаю что-то вроде диаграмм Венна, но это может как-то подойти для большего числа наборов, таких как 10 или более. Википедия показывает некоторые диаграммы Венна с более высокими наборами, но даже диаграммы с...

30
Какой хороший способ использовать R для создания диаграммы рассеяния, которая разделяет данные по обработке?

Locked . Этот вопрос и его ответы заблокированы, потому что вопрос не по теме, но имеет историческое значение. В настоящее время он не принимает новые ответы или взаимодействия. Я очень плохо знаком с R и статистикой в ​​целом, но мне нужно составить график рассеяния, который, я думаю, может быть...

30
Интерпретация сюжета (глм.модель)

Может кто-нибудь сказать мне, как интерпретировать графики «остатки против подгонки», «нормальный q-q», «масштаб-местоположение» и «остатки против плеча»? Я подгоняю биномиальный GLM, сохраняю его и затем...

29
Какой тест я могу использовать для сравнения уклонов двух или более регрессионных моделей?

Я хотел бы проверить разницу в ответе двух переменных на один предиктор. Вот минимальный воспроизводимый пример. library(nlme) ## gls is used in the application; lm would suffice for this example m.set <- gls(Sepal.Length ~ Petal.Width, data = iris, subset = Species == "setosa") m.vir <-...

28
Проблемы с круговыми диаграммами

Похоже, что все чаще обсуждают круговые диаграммы. Основными аргументами против этого являются: Площадь воспринимается с меньшей силой, чем длина. Круговые диаграммы имеют очень низкое отношение данных к пикселям Тем не менее, я думаю, что они могут быть как-то полезны при изображении пропорций. Я...

28
Зачем использовать цветовую карту Viridis над струей?

Как было объявлено в https://www.youtube.com/watch?v=xAoljeRJ3lU , Matplotlib меняет цветовую карту по умолчанию с jet на viridis. Однако я не очень хорошо понимаю это. Может потому что я дальтоник? Оригинальная струя цветовой карты выглядит очень сильной, я чувствую контраст: Хотя новой цветовой...

28
Какие есть альтернативы сломанным топорам?

Пользователи часто испытывают желание разбить значения осей, чтобы представить данные разных порядков величины на одном графике (см. Здесь ). Хотя это может быть удобно, это не всегда предпочтительный способ отображения данных (в лучшем случае может вводить в заблуждение). Каковы альтернативные...

28
Вычисление повторяемости эффектов по модели Лмера

Я только что наткнулся на эту статью , в которой описывается, как вычислить повторяемость (или надежность, или внутриклассовую корреляцию) измерения с помощью моделирования смешанных эффектов. Код R будет: #fit the model fit = lmer(dv~(1|unit),data=my_data) #obtain the variance estimates vc =...

27
Как добавить нелинейную линию тренда на график рассеяния в R? [закрыто]

Закрыто. Этот вопрос не по теме . В настоящее время не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он соответствовал теме перекрестной проверки. Закрыто в прошлом году . У меня есть точечный график. Как я могу добавить нелинейную линию...

27
Создание визуально привлекательных карт плотности плотности в R

Хотя я знаю, что существует ряд функций для генерации тепловых карт в R, проблема в том, что я не могу создавать визуально привлекательные карты. Например, изображения ниже являются хорошими примерами тепловых карт, которых я хочу избежать. В первом явно не хватает деталей, а в другом (основанном...