Вопросы с тегом «hypothesis-testing»

60
Почему параметрическая статистика всегда предпочтительнее непараметрической?

Может ли кто-нибудь объяснить мне, почему кто-то выбрал бы параметрический непараметрический статистический метод для проверки гипотез или регрессионного анализа? На мой взгляд, это все равно, что заняться рафтингом и выбрать не водостойкие часы, потому что вы можете их не намочить. Почему бы не...

60
Объясните комикс из желейных бобов xkcd: Что делает его смешным?

Я вижу, что один из двадцати общих тестов, которые они выполняют, , поэтому они ошибочно полагают, что во время одного из двадцати тестов результат значительный ( ).0,05 = 1 / 20p<0.05p<0.05p < 0.050.05=1/200.05=1/200.05 = 1/20 комикс желейных бобов xkcd - "Значительный" Название:...

60
Почему сбор данных до получения значительного результата увеличивает частоту появления ошибок типа I?

Мне было интересно, почему именно сбор данных, пока не будет получен значительный результат (например, ) (т. Е. P-хакерство), увеличивает частоту ошибок типа I?p<.05p<.05p \lt .05 Я также был бы очень признателен за Rдемонстрацию этого...

59
Если мы не сможем отвергнуть нулевую гипотезу в большом исследовании, разве это не доказательство нулевой?

Основным ограничением проверки значимости нулевой гипотезы является то, что она не позволяет исследователю собирать доказательства в пользу нулевой ( Источник ) Я вижу, что это утверждение повторяется в нескольких местах, но я не могу найти оправдания для этого. Если мы проводим большое...

58
Двухсторонние тесты ... Я просто не уверен. В чем смысл?

Следующий отрывок из записи: В чем различия между односторонним и двусторонним тестами? , на сайте помощи статистики UCLA. ... рассмотреть последствия пропуска эффекта в другом направлении. Представьте, что вы разработали новый препарат, который, по вашему мнению, является улучшением по сравнению с...

56
Как получить p-значение (проверить значимость) эффекта в смешанной модели lme4?

Я использую lme4 в R, чтобы соответствовать смешанной модели lmer(value~status+(1|experiment))) где значение непрерывно, статус и эксперимент являются факторами, и я получаю Linear mixed model fit by REML Formula: value ~ status + (1 | experiment) AIC BIC logLik deviance REMLdev 29.1 46.98 -9.548...

56
Является ли «гибрид» между подходами Фишера и Неймана-Пирсона к статистическому тестированию действительно «бессвязной путаницей»?

Существует определенная школа мысли, согласно которой наиболее распространенный подход к статистическому тестированию представляет собой «гибрид» между двумя подходами: подход Фишера и Неймана-Пирсона; эти два подхода, как утверждается в заявлении, являются «несовместимыми», и, следовательно,...

56
Зачем продолжать учить и использовать проверку гипотез (когда есть доверительные интервалы)?

Зачем продолжать учить и использовать тестирование гипотез (со всеми его сложными концепциями и которые являются одними из самых статистических грехов) для задач, где существует интервальная оценка (уверенность, начальная загрузка, достоверность или что-то еще)? Какое лучшее объяснение (если...

52
Камминг (2008) утверждает, что распределение значений p, полученных в репликациях, зависит только от исходного значения p. Как это может быть правдой?

Я читал 2008 документ Джеффа Камминг репликации и Интервалы: значения предсказывать будущее лишь смутно, но доверительные интервалы делают намного лучше pppppp р р[~ 200 ссылок в Google Scholar] - и смущает одно из центральных требований. Это одна из серии статей, где Камминг спорит с и...

51
Есть ли у нас проблема «жалких голосов»?

Я знаю, это может звучать как не по теме, но выслушайте меня. В Stack Overflow и здесь мы получаем голоса за сообщения, все это хранится в табличной форме. Например: идентификатор сообщения идентификатор голосования тип голосования дата и время ------- -------- --------- -------- 10 1 2 2000-1-1...

50
Правильное написание (капитализация, курсив, перенос слов) «р-значение»?

Я понимаю, что это педантично и банально, но как исследователь в области вне статистики, с ограниченным формальным образованием в области статистики, я всегда задаюсь вопросом, правильно ли я пишу «р-значение». В частности: Предполагается ли заглавная буква "p"? Предполагается, что буква «р»...

48
Является ли хи-квадрат всегда односторонним тестом?

Опубликованная статья ( pdf ) содержит эти 2 предложения: Кроме того, искажение информации может быть вызвано применением неправильных правил или недостаточным знанием статистического теста. Например, общее значение df в ANOVA может быть принято за ошибку df в отчете о тесте, или исследователь...

48
Как мне проверить, что две непрерывные переменные независимы?

Предположим , у меня есть образец от совместного распределения и . Как проверить гипотезу о том , что и являются независимыми ?X Y X Y(Xn,Yn),n=1..N(Xn,Yn),n=1..N(X_n,Y_n), n=1..NXXXYYYXXXYYY Не делается никаких предположений относительно законов совместного или предельного распределения и...

47
Статистический вывод, когда выборка «является» населением

Представьте, что вы должны составлять отчеты о количестве кандидатов, которые ежегодно сдают данный тест. Кажется довольно сложным сделать вывод о наблюдаемом проценте успеха, например, для более широкой популяции из-за специфики целевой популяции. Таким образом, вы можете считать, что эти данные...

46
Почему тестирование частых гипотез смещается в сторону отклонения нулевой гипотезы с достаточно большими выборками?

Я просто читал эту статью о байесовском факторе для совершенно не связанной проблемы, когда наткнулся на этот отрывок Тестирование гипотез с байесовскими факторами является более надежным, чем тестирование с использованием частых гипотез, поскольку байесовская форма позволяет избежать смещения при...

46
Почему «статистически значимо» недостаточно?

Я завершил анализ данных и получил «статистически значимые результаты», что соответствует моей гипотезе. Однако студент-статистик сказал мне, что это преждевременный вывод. Почему? Что-нибудь еще нужно было включить в мой...

46
Интерпретация логарифмически преобразованного предиктора и / или ответа

Мне интересно, имеет ли это значение при интерпретации того, являются ли логически преобразованными только зависимые, как зависимые, так и независимые, или только независимые переменные. Рассмотрим случай log(DV) = Intercept + B1*IV + Error Я могу интерпретировать IV как процентное увеличение, но...

45
Мотивация колмогоровского расстояния между распределениями

Есть много способов измерить, насколько похожи два вероятностных распределения. Среди методов, которые популярны (в разных кругах): Колмогоровское расстояние: расстояние между функциями распределения; расстояние Канторовича-Рубинштейна: максимальная разница между ожиданиями относительно двух...

45
Как интерпретировать ANOVA и MANOVA типа I, типа II и типа III?

Мой основной вопрос заключается в том, как интерпретировать выходные данные (коэффициенты, F, P) при проведении ANOVA типа I (последовательного)? Моя конкретная исследовательская проблема немного сложнее, поэтому я разобью свой пример на части. Во-первых, если меня интересует влияние плотности...

44
При объединении p-значений, почему бы не просто усреднить?

Недавно я узнал о методе Фишера для комбинирования p-значений. Это основано на том факте, что значение p при нулевом значении соответствует равномерному распределению и что которое, я думаю, это гений Но мой вопрос: зачем идти по этому извилистому пути? и почему бы не (что не так) просто...