Вопросы с тегом «hypothesis-testing»

12
Точный тест Фишера с весами?

Кто-нибудь знает вариант точного теста Фишера, который учитывает вес? Например, веса выборки . Таким образом, вместо обычной кросс-таблицы 2x2 каждая точка данных имеет значение «масса» или «размер», взвешивающее точку. Пример данных: A B weight N N 1 N N 3 Y N 1 Y N 2 N Y 6 N Y 7 Y Y 1 Y Y 2 Y Y 3...

12
Какова связь между ANOVA для сравнения средств нескольких групп и ANOVA для сравнения вложенных моделей?

До сих пор я видел, как ANOVA используется двумя способами: Во-первых , в моем вводном тексте статистики ANOVA был представлен как способ сравнения средних трех или более групп, как улучшение по сравнению с парным сравнением, чтобы определить, имеет ли одно из средств статистически значимое...

12
Проверка эквивалентности не вложенных моделей

Скажем, - линейная функция от и фиктивная . Моя гипотеза состоит в том, что само по себе , как гедонистическому индексу вектора других переменных, . У меня есть поддержка для этого в из (т.е. , , ..., ) на . Есть ли способ проверить эквивалентность этих двух моделей:x d d Z M A N O V A Z z 1 z 2 z...

12
Как строго обосновать выбранные коэффициенты ложноположительных / ложноотрицательных ошибок и базовое соотношение затрат?

контекст Группа социологов и статистиков ( Benjamin et al., 2017 ) недавно предположила, что типичный ложноположительный показатель ( = .05), используемый в качестве порога для определения «статистической значимости», должен быть скорректирован до более консервативного порога. ( = .005)....

12
Регулировка значения p для адаптивного последовательного анализа (для теста хи-квадрат)?

Я хотел бы знать, какая статистическая литература имеет отношение к следующей проблеме, и, возможно, даже идея о том, как ее решить. Представьте себе следующую проблему: У нас есть 4 возможных лечения некоторых заболеваний. Чтобы проверить, какое лечение лучше, мы проводим специальное исследование....

12
Статистический тест для значения, находящегося значительно дальше от населения, означает: это Z-тест или T-тест?

Насколько значимым является значение по сравнению со списком значений? В большинстве случаев статистическое тестирование предполагает сравнение выборочного набора с популяцией. В моем случае выборка производится по одному значению, и мы сравниваем его с населением. Я дилетант в тестировании...

12
Интерпретация результатов Rs ur.df (модульный тест Дикки-Фуллера)

Я выполняю следующий модульный корневой тест (Dickey-Fuller) для временного ряда, используя ur.df()функцию в urcaпакете. Команда: summary(ur.df(d.Aus, type = "drift", 6)) Выход: ############################################### # Augmented Dickey-Fuller Test Unit Root Test #...

12
Соревнования Kaggle просто выиграны случайно?

Соревнования Kaggle определяют итоговые рейтинги на основе проведенного тестового набора. Выдержанный тестовый набор является образцом; он не может быть репрезентативным для моделируемого населения. Поскольку каждое представление похоже на гипотезу, алгоритм, выигравший соревнование, может,...

12
Критерии выбора «лучшей» модели в скрытой марковской модели

У меня есть набор данных временного ряда, к которому я пытаюсь подогнать скрытую марковскую модель (HMM), чтобы оценить количество скрытых состояний в данных. Мой псевдокод для этого следующий: for( i in 2 : max_number_of_states ){ ... calculate HMM with i states ... optimal_number_of_states =...

12
Проверка гипотез с большими данными

Как вы выполняете проверки гипотез с большими данными? Я написал следующий скрипт MATLAB, чтобы подчеркнуть мою путаницу. Все, что он делает, это генерирует два случайных ряда и запускает простую линейную регрессию одной переменной с другой. Он выполняет эту регрессию несколько раз, используя...

12
Если какой-либо параметрический тест не отклоняет нуль, его непараметрическая альтернатива делает то же самое?

Если предполагается, что непараметрические тесты имеют меньшую мощность, чем их параметрические альтернативы, означает ли это, что если какой-либо параметрический тест не отклоняет нуль, то его непараметрическая альтернатива также не отвергает ноль? Как это может измениться, если предположения о...

12
Проверка гипотезы на разницу в медиане между более чем двумя образцами

Вопрос Результаты тестов трех групп людей сохраняются в виде отдельных векторов в R. set.seed(1) group1 <- rnorm(100, mean = 75, sd = 10) group2 <- rnorm(100, mean = 85, sd = 10) group3 <- rnorm(100, mean = 95, sd = 10) Я хочу знать, есть ли значительная разница в медиане между этими...

12
-test В.С. -test для сравнения шансов подхватить простуду в 2 -х группах

Я только что прочитал в довольно уважаемом (популярном) научном журнале (немецкий PM, 02/2013, с.36) об интересном эксперименте (к сожалению, без источника). Это привлекло мое внимание, потому что интуитивно я сомневался в значимости результата, но предоставленной информации было достаточно для...

12
Почему F-тест в гауссовых линейных моделях является наиболее мощным?

Y=μ+σGY=μ+σGY=\mu+\sigma Gμμ\muWWWGGGRnRn\mathbb{R}^nFFFH0:{μ∈U}H0:{μ∈U}H_0\colon\{\mu \in U\}U⊂WU⊂WU \subset Wf=ϕ(2logsupμ∈W,σ>0L(μ,σ|y)supμ∈U,σ>0L(μ,σ|y)).f=ϕ(2log⁡supμ∈W,σ>0L(μ,σ|y)supμ∈U,σ>0L(μ,σ|y)).f=\phi\left( 2\log \frac{\sup_{\mu \in W, \sigma>0} L(\mu, \sigma | y)}{\sup_{\mu...

12
Почему в тесте независимости используется распределение хи-квадрат?

В тесте на соответствие критерия используется следующая статистика : В тесте предоставление этого условия выполнены, как используются - распределение для вычисления р-значение, учитывая правда можно было бы наблюдать такое значение в репрезентативной выборке одного и того же...

12
Точный критерий Фишера и гипергеометрическое распределение

Я хотел лучше понять точный критерий Фишера, поэтому я разработал следующий пример игрушки, где f и m соответствуют мужской и женской части, а n и y соответствуют «потреблению соды», например: > soda_gender f m n 0 5 y 5 0 Очевидно, это резкое упрощение, но я не хотел, чтобы контекст мешал....

12
Если распределение тестовой статистики является бимодальным, означает ли p-значение что-либо?

Р-значение определяется вероятностью получения тест-статистики, по крайней мере, такой же экстремальной, как и наблюдаемая, при условии, что нулевая гипотеза верна. Другими словами, P(X≥t|H0)P(X≥t|H0)P( X \ge t | H_0 ) Но что если тест-статистика является бимодальной по распределению? означает ли...

12
Как выполнить тест начальной загрузки, чтобы сравнить средства двух образцов?

У меня есть две сильно искаженные выборки, и я пытаюсь использовать начальную загрузку, чтобы сравнить их с помощью t-статистики. Как правильно это сделать? Процесс, который я использую Я обеспокоен целесообразностью использования стандартной ошибки исходных / наблюдаемых данных на последнем этапе,...

12
Почему это распределение равномерно?

Мы изучаем байесовское статистическое тестирование и сталкиваемся со странным (по крайней мере, мне) явлением. Рассмотрим следующий случай: мы заинтересованы в измерении того, какая популяция, A или B, имеет более высокий коэффициент конверсии. Для проверки мы устанавливаем , то есть вероятность...

12
Как выполнить вменение значений в очень большом количестве точек данных?

У меня очень большой набор данных и около 5% случайных значений отсутствуют. Эти переменные связаны друг с другом. В следующем примере набор данных R - просто игрушечный пример с фиктивными коррелированными данными. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000,...