Вопросы с тегом «hypothesis-testing»

12
Проверка гипотезы на разницу в медиане между более чем двумя образцами

Вопрос Результаты тестов трех групп людей сохраняются в виде отдельных векторов в R. set.seed(1) group1 <- rnorm(100, mean = 75, sd = 10) group2 <- rnorm(100, mean = 85, sd = 10) group3 <- rnorm(100, mean = 95, sd = 10) Я хочу знать, есть ли значительная разница в медиане между этими...

12
-test В.С. -test для сравнения шансов подхватить простуду в 2 -х группах

Я только что прочитал в довольно уважаемом (популярном) научном журнале (немецкий PM, 02/2013, с.36) об интересном эксперименте (к сожалению, без источника). Это привлекло мое внимание, потому что интуитивно я сомневался в значимости результата, но предоставленной информации было достаточно для...

12
Почему F-тест в гауссовых линейных моделях является наиболее мощным?

Y=μ+σGY=μ+σGY=\mu+\sigma Gμμ\muWWWGGGRnRn\mathbb{R}^nFFFH0:{μ∈U}H0:{μ∈U}H_0\colon\{\mu \in U\}U⊂WU⊂WU \subset Wf=ϕ(2logsupμ∈W,σ>0L(μ,σ|y)supμ∈U,σ>0L(μ,σ|y)).f=ϕ(2log⁡supμ∈W,σ>0L(μ,σ|y)supμ∈U,σ>0L(μ,σ|y)).f=\phi\left( 2\log \frac{\sup_{\mu \in W, \sigma>0} L(\mu, \sigma | y)}{\sup_{\mu...

12
Почему в тесте независимости используется распределение хи-квадрат?

В тесте на соответствие критерия используется следующая статистика : В тесте предоставление этого условия выполнены, как используются - распределение для вычисления р-значение, учитывая правда можно было бы наблюдать такое значение в репрезентативной выборке одного и того же...

12
Точный критерий Фишера и гипергеометрическое распределение

Я хотел лучше понять точный критерий Фишера, поэтому я разработал следующий пример игрушки, где f и m соответствуют мужской и женской части, а n и y соответствуют «потреблению соды», например: > soda_gender f m n 0 5 y 5 0 Очевидно, это резкое упрощение, но я не хотел, чтобы контекст мешал....

12
Если распределение тестовой статистики является бимодальным, означает ли p-значение что-либо?

Р-значение определяется вероятностью получения тест-статистики, по крайней мере, такой же экстремальной, как и наблюдаемая, при условии, что нулевая гипотеза верна. Другими словами, P(X≥t|H0)P(X≥t|H0)P( X \ge t | H_0 ) Но что если тест-статистика является бимодальной по распределению? означает ли...

12
Как выполнить тест начальной загрузки, чтобы сравнить средства двух образцов?

У меня есть две сильно искаженные выборки, и я пытаюсь использовать начальную загрузку, чтобы сравнить их с помощью t-статистики. Как правильно это сделать? Процесс, который я использую Я обеспокоен целесообразностью использования стандартной ошибки исходных / наблюдаемых данных на последнем этапе,...

12
Почему это распределение равномерно?

Мы изучаем байесовское статистическое тестирование и сталкиваемся со странным (по крайней мере, мне) явлением. Рассмотрим следующий случай: мы заинтересованы в измерении того, какая популяция, A или B, имеет более высокий коэффициент конверсии. Для проверки мы устанавливаем , то есть вероятность...

12
Как выполнить вменение значений в очень большом количестве точек данных?

У меня очень большой набор данных и около 5% случайных значений отсутствуют. Эти переменные связаны друг с другом. В следующем примере набор данных R - просто игрушечный пример с фиктивными коррелированными данными. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000,...

12
Разница между сериями с дрейфом и сериями с трендом

Ряд с дрейфом может быть смоделирован как где - дрейф (постоянный), а . YT= c + ϕ yт - 1+ εTyt=c+ϕyt−1+εty_t = c + \phi y_{t-1} + \varepsilon_tсccϕ = 1ϕ=1\phi=1 Ряд с трендом можно смоделировать как где - дрейф (постоянная), - детерминированный тренд времени, а .YT= с + δt + ϕ yт - 1+...

12
В чем разница между «проверкой гипотез» и «выбором модели»?

В литературе оба термина часто используются как синонимы или переплетаются. Сейчас я пытаюсь найти четкое различие между обоими терминами. С моей точки зрения, гипотеза обычно выражается через модель. Поэтому, даже если мы проверяем гипотезу «ноль против альтернативы», с моей точки зрения, мы...

12
Какова связь между ANOVA для сравнения средств нескольких групп и ANOVA для сравнения вложенных моделей?

До сих пор я видел, как ANOVA используется двумя способами: Во-первых , в моем вводном тексте статистики ANOVA был представлен как способ сравнения средних трех или более групп, как улучшение по сравнению с парным сравнением, чтобы определить, имеет ли одно из средств статистически значимое...

11
Каковы «желательные» статистические свойства теста отношения правдоподобия?

Я читаю статью , метод которой полностью основан на тесте отношения правдоподобия. Автор говорит, что тест LR против односторонних альтернатив является UMP. Он продолжает, утверждая, что «... даже если невозможно доказать, что [тест LR] является наиболее мощным, тест LR часто имеет желательные...

11
В чем разница между Z-показателями и p-значениями?

В алгоритмах сетевых мотивов довольно часто возвращают как значение p, так и Z-показатель для статистики: «Входная сеть содержит X копий подграфа G». Подграф считается мотивом, если он удовлетворяет р-значение <А, Z-оценка> B и X> C, для некоторых пользовательских (или определенных...

11
Какова мощность регрессионного теста F?

Классический F-тест для подмножеств переменных в полилинейной регрессии имеет вид где - сумма квадратов ошибок в «уменьшенной» модели, которая вложена в «большую» модель , а - степени свободы две модели. При нулевой гипотезе, что дополнительные переменные в «большой» модели не имеют линейной...

11
Семейная граница ошибок: приводит ли повторное использование наборов данных в различных исследованиях независимых вопросов к множественным проблемам тестирования?

Если группа исследователей выполняет множественные (гипотезные) тесты на заданном наборе данных, существует большой объем литературы, в которой утверждается, что они должны использовать некоторую форму коррекции для множественного тестирования (Bonferroni и т. Д.), Даже если тесты независимы. У...

11
Тест Фридмана против теста Уилкоксона

Я пытаюсь оценить производительность алгоритма классификации машинного обучения под наблюдением. Наблюдения делятся на номинальные классы (2 на данный момент, однако я хотел бы обобщить это для многоклассовых проблем), составленные из 99 субъектов. Один из вопросов, на которые я бы хотел ответить,...

11
Проверка веб-тестов a / b путем повторного запуска эксперимента - это действительно ли так?

На вебинаре, проведенном на днях компанией по тестированию a / b, их резидент «Data Scientist» объяснил, что вам следует проверить свои результаты, повторно выполнив эксперимент. Исходя из этого, если вы выбрали 95% достоверности, существует вероятность 5% (1/20) ложного срабатывания. Если вы...

11
Проверка, существенно ли отличаются два коэффициента регрессии (в идеале R)

Если это дублирующий вопрос, пожалуйста, укажите правильный путь, но похожие вопросы, которые я нашел здесь, не были достаточно похожими. Предположим, я оцениваю модельY= α + βИкс+ тыY=α+βX+uY=\alpha + \beta X + u и найдите, что . Однако оказывается, что , и я подозреваю, что , и, в частности, что...

11
Статистика теста Дурбина Уотсона

Я применил тест DW к моей регрессионной модели в R, и я получил статистику теста DW 1,78 и значение p 2,2e-16 = 0. Означает ли это, что не существует автокорреляции между невязками, потому что stat близок к 2 с небольшим p-значением, или это означает, что хотя stat близок к 2, p-значение мало, и...