Вопросы с тегом «data-visualization»

46
Интерпретация логарифмически преобразованного предиктора и / или ответа

Мне интересно, имеет ли это значение при интерпретации того, являются ли логически преобразованными только зависимые, как зависимые, так и независимые, или только независимые переменные. Рассмотрим случай log(DV) = Intercept + B1*IV + Error Я могу интерпретировать IV как процентное увеличение, но...

45
Как определить, должна ли ось Y графика начинаться с нуля?

Один из распространенных способов «лежать с данными» - это использовать масштаб по оси Y, который создает впечатление, что изменения более значительны, чем они есть на самом деле. Когда я просматриваю научные публикации или лабораторные отчеты студентов, меня часто расстраивает этот «грех...

45
Как правильно строить тренды

Я создаю график, показывающий тенденции смертности (на 1000 чел.) В разных странах, и история должна исходить из того, что Германия (голубая линия) - единственная, чья тенденция увеличивается после 1932 года. моя первая (базовая) попытка По моему мнению, этот график уже показывает то, что мы хотим...

44
Какой ваш любимый статистический график?

Это мой любимый Этот пример в юмористическом ключе (заслуга моего бывшего профессора, Стивена Гортмейкера), но мне также интересны графики, на которых вы чувствуете себя прекрасно, которые отражают статистическую информацию или метод, а также ваши идеи о них. Одна запись за ответ. Конечно, этот...

44
Как избежать наложения меток на графике R? [закрыто]

Я пытаюсь обозначить довольно простую диаграмму рассеяния в R. Это то, что я использую: plot(SI, TI) text(SI, TI, Name, pos=4, cex=0.7) Результат посредственный, как вы можете видеть (нажмите, чтобы увеличить): Я пытался компенсировать это с помощью textxyфункции, но это не лучше . Увеличение...

43
Как визуализировать подходящую модель множественной регрессии?

В настоящее время я пишу статью с несколькими множественными регрессионными анализами. Хотя визуализация одномерной линейной регрессии проста с помощью диаграмм рассеяния, мне было интересно, есть ли хороший способ визуализации множественных линейных регрессий? В настоящее время я просто строю...

42
Как сделать обнаружение сообщества в взвешенной социальной сети / графике?

Мне интересно, может ли кто-нибудь предложить хорошие отправные точки, когда дело доходит до обнаружения сообщества / разбиения / кластеризации графа на графе, который имеет взвешенные , ненаправленные ребра. У рассматриваемого графа приблизительно 3 миллиона ребер, и каждое ребро выражает степень...

40
Эффект подавления в регрессии: определение и визуальное объяснение / изображение

Что такое переменная-супрессор в множественной регрессии и какие могут быть способы визуального отображения эффекта подавления (его механизм или свидетельство в результатах)? Я хотел бы пригласить всех, у кого есть мысли,...

40
Каким лучшим методам следует руководствоваться при подготовке участков?

Я обычно делаю свой собственный особенный выбор при подготовке участков. Тем не менее, мне интересно, есть ли лучшие практики для создания участков. Примечание: комментарий Роба к ответу на этот вопрос очень актуален...

39
Функция графического обзора данных (сводная) в R

Я уверен, что раньше я сталкивался с подобной функцией в пакете R, но после интенсивного поиска в Google я, кажется, нигде не могу ее найти. Функция, о которой я думаю, создала графическое резюме для заданной ей переменной, создавая вывод с некоторыми графиками (гистограммой и, возможно, графиком с...

38
Нужно ли изучать ggplot2 или ggvis?

Нужно ли изучать ggplot2 или ggvis? Я не обязательно хочу изучать оба, если один из них превосходит в любом отношении. Почему сообщество R продолжает создавать новые пакеты с перекрывающимися функциями? В вводном посте не упоминается слово, почему ggvis создан, поскольку сложный пакет для...

38
Будет ли PCA работать для логических (двоичных) типов данных?

Я хочу уменьшить размерность систем более высокого порядка и захватить большую часть ковариации предпочтительно в двухмерном или одномерном поле. Я понимаю, что это можно сделать с помощью анализа основных компонентов, и я использовал PCA во многих сценариях. Однако я никогда не использовал его с...

37
Как визуализировать / понять, что делает нейронная сеть?

Нейронные сети часто рассматриваются как «черные ящики» из-за их сложной структуры. Это не идеально, так как часто полезно иметь интуитивное представление о том, как модель работает внутри. Каковы методы визуализации работы обученной нейронной сети? В качестве альтернативы, как мы можем извлечь...

37
Когда t-SNE вводит в заблуждение?

Цитата одного из авторов: t-распределенное стохастическое вложение соседей (t-SNE) - это ( выигрышный ) метод уменьшения размерности, который особенно хорошо подходит для визуализации многомерных наборов данных. Это звучит довольно здорово, но об этом говорит автор. Еще одна цитата автора...

36
Экспериментальные данные, подтверждающие визуализации в стиле Tufte?

Вопрос: Существуют ли экспериментальные данные в поддержку минималистских визуализаций, основанных на данных, в стиле Tufte, по сравнению с визуализированными диаграммой визуализациями, скажем, Найджела Холмса ? Я спросил , как добавить диаграмму-мусор на R участки здесь и ответчики бросили...

34
Почему существует разница между ручным вычислением 95-процентного доверительного интервала и использованием функции confint () в R?

Дорогие, я заметил нечто странное, что не могу объяснить, не так ли? В итоге: ручной подход к вычислению доверительного интервала в модели логистической регрессии и функция R confint()дают разные результаты. Я проходил Прикладную логистическую регрессию Хосмера и Лемешоу (2-е издание). В 3-й главе...

34
Как интерпретировать среднее значение силуэта?

Я пытаюсь использовать силуэт графика, чтобы определить количество кластеров в моем наборе данных. Учитывая набор данных Train , я использовал следующий код Matlab Train_data = full(Train); Result = []; for num_of_cluster = 1:20 centroid = kmeans(Train_data,num_of_cluster,'distance','sqeuclid'); s...

33
Существует ли вариант коробчатого графика для распределенных данных Пуассона?

Я хотел бы знать, есть ли вариант коробочного графика, адаптированный к распределенным данным Пуассона (или, возможно, другим дистрибутивам)? При гауссовском распределении, с усами, расположенными при L = Q1 - 1,5 IQR и U = Q3 + 1,5 IQR, у боксплотта есть свойство, что будет примерно столько же...

32
Наборы данных, построенные с целью, аналогичной таковой в квартете Анскомба

Я только что натолкнулся на квартет Анскомба (четыре набора данных, которые имеют почти неразличимую описательную статистику, но выглядят совсем иначе при построении графика), и мне любопытно, есть ли другие более или менее известные наборы данных, которые были созданы, чтобы продемонстрировать...