Вопросы с тегом «eda»

11
Если моя гистограмма показывает колоколообразную кривую, могу ли я сказать, что мои данные нормально распределены?

Я создал гистограмму для возраста респондента и сумел получить очень хороший колоколообразный изгиб, из которого я пришел к выводу, что распределение нормальное. Затем я выполнил тест нормальности в SPSS, с n = 169. Значение p (Sig.) Теста Колмогорова-Смирнова меньше 0,05, и поэтому данные нарушили...

11
Как интерпретировать участки с надрезами

Делая некоторые EDA, я решил использовать рамочный график, чтобы проиллюстрировать разницу между двумя уровнями фактора. Способ, которым ggplot отображал рамочный график, был удовлетворительным, но немного упрощенным (первый график ниже). Изучая характеристики коробочных участков, я начал...

10
Первый быстрый взгляд на набор данных

Прошу прощения за мое невежество, но ... Я продолжаю оказываться в ситуации, когда сталкиваюсь с кучей новых данных, которые мне удалось найти. Эти данные обычно выглядят примерно так: Date Number1 Number2 Category1 Category2 20120125 11 101 Dog Brown 20120126 21 90 Cat Black 20120126 31 134 Cat...

10
Советы и рекомендации для начала статистического моделирования?

Я работаю в области интеллектуального анализа данных, и у меня было очень мало формального обучения статистике. В последнее время я читаю много работ, посвященных байесовским парадигмам для изучения и майнинга, что мне очень интересно. У меня вопрос (в нескольких частях), учитывая проблему, есть ли...

10
Что подразумевается под «Пусть данные говорят сами за себя»?

Читая следующую статью , я натолкнулся на следующее утверждение: Как уже упоминалось, он часто представлен без какой-либо ссылки на вероятностные модели, в соответствии с идеей Benzecri [1973] «позволить данным говорить самим за себя». (Цитата из JP Benzécri. L'analyse des données. Том II:...

9
Параметрический, полупараметрический и непараметрический бутстрап для смешанных моделей

Следующие прививки взяты из этой статьи . Я новичок в начальной загрузке и пытаюсь реализовать параметрическую, полупараметрическую и непараметрическую загрузку начальной загрузки для линейной смешанной модели с R bootпакетом. Код R Вот мой Rкод: library(SASmixed) library(lme4) library(boot)...

9
Руководство по открытию новых знаний в данных

Я планирую что-то, чтобы подчеркнуть себя или кого-то еще. Обычно вопрос начинает этот процесс, и часто спрашивающий надеется на конкретный ответ. Как я могу узнать интересные вещи о данных менее предвзятым способом? Прямо сейчас я примерно следую этому методу: Сводные статистические данные....

9
Почему тот факт, что 1 медиана ниже, чем другой медианы, не означает, что большинство в группе 1 меньше, чем большинство в группе 2?

Я полагал, что приведенные ниже прямоугольники могут быть интерпретированы как «большинство мужчин быстрее, чем большинство женщин» (в этом наборе данных), главным образом потому, что среднее время мужчин было меньше среднего времени женщин. Но курс EDX на R- и статистика викторине сказал мне , что...