Вопросы с тегом «histogram»

Гистограмма - это графическое представление частот непрерывной переменной. Переменная делится на ячейки, и для каждой ячейки отображается полоса, пропорциональная ее частоте в данных.

111
Оценка приблизительного распределения данных на основе гистограммы

Предположим, я хочу посмотреть, являются ли мои данные экспоненциальными на основе гистограммы (то есть смещены вправо). В зависимости от того, как я сгруппирую или скопирую данные, я могу получить совершенно разные гистограммы. Один из наборов гистограмм, по-видимому, будет экспоненциальным....

80
Расчет оптимального количества бинов в гистограмме

Я заинтересован в поиске как можно более оптимального метода для определения количества бинов, которые я должен использовать в гистограмме. Мои данные должны быть в диапазоне от 30 до 350 объектов максимум, и в частности я пытаюсь применить пороговое значение (как метод Оцу), где "хорошие" объекты,...

48
R - QQPlot: как посмотреть, нормально ли распределяются данные

Я построил это после теста на нормальность Шапиро-Вилка. Тест показал, что вполне вероятно, что население нормально распределено. Однако как увидеть это «поведение» на этом сюжете? ОБНОВИТЬ Простая гистограмма данных: ОБНОВИТЬ Тест Шапиро-Вилка говорит:...

33
Как оценить сходство двух гистограмм?

Учитывая две гистограммы, как мы оцениваем, похожи они или нет? Достаточно ли просто посмотреть на две гистограммы? Простое сопоставление один к одному имеет проблему, заключающуюся в том, что если гистограмма немного отличается и немного смещается, то мы не получим желаемый результат. Какие-либо...

29
Чем распределение Пуассона отличается от нормального распределения?

Этот вопрос был перенесен из переполнения стека, потому что на него можно ответить по перекрестной проверке. Мигрировал 7 лет назад . Я сгенерировал вектор, который имеет распределение Пуассона, следующим образом: x = rpois(1000,10) Если я использую гистограмму hist(x), распределение выглядит как...

22
Преимущества использования QQ-графиков над гистограммами

В этом комментарии Ник Кокс написал: Объединение в классы - древний метод. Хотя гистограммы могут быть полезны, современное статистическое программное обеспечение позволяет легко и целесообразно адаптировать распределения к необработанным данным. Биннинг просто отбрасывает детали, которые имеют...

21
Как спроецировать новый вектор на пространство PCA?

После выполнения анализа главных компонентов (PCA) я хочу спроецировать новый вектор на пространство PCA (т.е. найти его координаты в системе координат PCA). Я рассчитал PCA на языке R, используя prcomp. Теперь я должен быть в состоянии умножить свой вектор на матрицу вращения PCA. Должны ли...

21
Как проверить, является ли мой дистрибутив мультимодальным?

Когда я строю гистограмму моих данных, она имеет два пика: Означает ли это потенциальное мультимодальное распределение? Я запустил dip.testв R ( library(diptest)), и вывод: D = 0.0275, p-value = 0.7913 Я могу заключить, что мои данные имеют мультимодальное распределение? ДАННЫЕ 10346 13698 13894...

19
Хорошо подходит для 2D гистограмм

У меня есть два набора данных, представляющих параметры звезд: наблюдаемый и смоделированный. С помощью этих наборов я создаю так называемую двухцветную диаграмму (TCD). Образец можно увидеть здесь: Быть наблюдаемые данные и Аргументы B данных , извлеченные из модели (не говоря уже о черных линиях,...

18
Сравнение двух гистограмм с использованием расстояния хи-квадрат

Я хочу сравнить два изображения лиц. Я рассчитал их LBP-гистограммы. Итак, теперь мне нужно сравнить эти две гистограммы и получить что-то, что скажет, насколько эти гистограммы равны (0 - 100%). Существует много способов решения этой задачи, но авторы метода LBP подчеркивают (Face Face with Local...

18
Как работает тест Пиарсона «Чи-квадрат»

После недавнего отрицательного голосования я пытался проверить свое понимание теста Пирсона Чи в квадрате. Я обычно использую статистику хи-квадрат (или уменьшенную статистику хи-квадрат) для подгонки или проверки результирующей подгонки. В этом случае дисперсия обычно представляет собой не...

15
Мое распределение нормальное; Тест Колмогорова-Смирнова не согласен

У меня проблема с нормальностью некоторых данных, которые у меня есть: я выполнил тест Колмогорова, который говорит, что он ненормален с p = .0000, я не понимаю: асимметрия моего распределения = -. 497, и эксцесс = -0,024 Вот график моего распространения, который выглядит очень нормально ... (У...

14
Лучший способ поставить две гистограммы в одном масштабе?

Допустим, у меня есть два распределения, которые я хочу сравнить в деталях, то есть таким образом, чтобы форма, масштаб и сдвиг были легко видны. Хороший способ сделать это - построить гистограмму для каждого распределения, поместить их в один и тот же масштаб Х и сложить одну под другой. При этом,...

14
Карет глмнет против cv.glmnet

Кажется, существует большая путаница при сравнении использования glmnetвнутри caretдля поиска оптимальной лямбды и использования cv.glmnetдля выполнения той же задачи. Было задано много вопросов, например: Модель классификации train.glmnet против cv.glmnet? Как правильно использовать glmnet с...

13
Нужна помощь в определении распределения по его гистограмме

У меня есть выборка населения зарегистрированных максимумов амплитуды сигнала. Население составляет около 15 миллионов образцов. Я составил гистограмму населения, но не могу угадать распределение с такой гистограммой. EDIT1: файл с необработанными значениями образца находится здесь: необработанные...

13
Какую информацию предоставляет блочный график, а гистограмма - нет?

Гистограммы дают хорошее представление о распределении переменной. Тем не менее, блочные графики пытаются сделать то же самое, но не дают хорошего представления о распределении этой переменной. Я не понимаю, почему люди используют коробочные участки. Гистограммы лучше во всех отношениях. Есть ли...

13
Является ли визуализация достаточным основанием для преобразования данных?

проблема Я хотел бы изобразить дисперсию, объясняемую каждым из 30 параметров, например, как график с отдельной полосой для каждого параметра и дисперсию по оси y: Тем не менее, отклонения сильно отклонены к небольшим значениям, включая 0, как можно видеть на гистограмме ниже: Если я преобразую их...

13
Уместно ли отобразить среднее значение в гистограмме?

Можно ли добавить вертикальную линию к гистограмме для визуализации среднего значения? Мне кажется, это нормально, но я никогда не видел этого в учебниках и тому подобном, поэтому мне интересно, есть ли какое-то соглашение не делать этого? График предназначен для курсовой работы, я просто хочу...

12
Как оценить третий квартиль бин-данных?

Есть ли какая-то техническая хитрость для определения третьего квартиля, если он принадлежит открытому интервалу, который содержит более четверти населения (поэтому я не могу закрыть интервал и использовать стандартную формулу)? редактировать В случае, если я что-то неправильно понял, я предоставлю...