Вопросы с тегом «hypothesis-testing»

13
LARS против координатного спуска для лассо

Каковы плюсы и минусы использования LARS [1] по сравнению с использованием координатного спуска для подбора L1-регуляризованной линейной регрессии? Я в основном заинтересован в аспектах производительности (мои проблемы, как правило, Nисчисляются сотнями тысяч и p<20). Однако, любые другие идеи...

13
Почему неправильно останавливать тестирование A / B до достижения оптимального размера выборки?

Я отвечаю за представление результатов A / B-тестов (на разных сайтах) в моей компании. Мы запускаем тест в течение месяца, а затем регулярно проверяем p-значения до тех пор, пока не достигнем значимости (или откажемся, если значимость не будет достигнута после длительного выполнения теста), что я...

13
Можно ли использовать квадрат Чи для сравнения пропорций?

Я читал, что тест хи-квадрат полезен, чтобы увидеть, значительно ли образец отличается от набора ожидаемых значений. Например, вот таблица результатов опроса относительно любимых цветов людей (всего n = 15 + 13 + 10 + 17 = 55 респондентов): red,blue,green,yellow 15,13,10,17 Тест хи-квадрат может...

13
Противоречивые подходы к выбору переменных: AIC, p-значения или оба?

Из того, что я понимаю, выбор переменных на основе p-значений (по крайней мере, в контексте регрессии) является в высшей степени ошибочным. Похоже, что выбор переменных на основе AIC (или аналогичных) также считается ошибочным по некоторым причинам, хотя это кажется немного неясным (например, см....

13
Как проверить, изменилась ли ковариационная матрица за два момента времени?

Моя задача - проверить, есть ли изменение ковариационной матрицы из 6 переменных. Значения 6 переменных измеряются дважды от одного и того же субъекта (3 года между измерениями). Как я могу это сделать? Я делал большую часть своей работы, используя...

13
Тест на значимость разности коэффициента корреляции Спирмена

(Большое спасибо за быстрые ответы! Я плохо задал вопрос, поэтому позвольте мне повторить.) Я не знаю, как выяснить, является ли разница между двумя корреляциями Спирмена статистически значимой. Я хотел бы знать, как это выяснить. Причина, которую я хотел выяснить, заключается в том, что в...

13
Использование теста статистической значимости для проверки результатов кластерного анализа

Я изучаю использование статистической значимости (SST) для проверки результатов кластерного анализа. Я нашел несколько статей по этой теме, таких как « Статистическая значимость кластеризации для данных большого размера с малым размером выборки », Liu, Yufeng et al. (2008) « О некоторых тестах...

13
Как проверить, соответствует ли выборка данных гамма-распределению?

У меня есть выборка данных, которые были сгенерированы из непрерывной случайной величины X. И из гистограммы, которую я рисую с использованием R, я предполагаю, что, возможно, распределение X подчиняется определенному гамма-распределению. Но я не знаю точных параметров этого гамма-распределения....

13
Как проверить, следует ли распределение степенному закону?

У меня есть данные о том, сколько пользователей публикуют сколько вопросов. Например, [UserCount, QuestionCount] [2, 100] [9, 10] [3, 80] ... ... Это означает, что 2 пользователя разместили по 100 вопросов, 9 пользователей - по 10 вопросов и т. Д. Итак, как я могу определить, UserCount,...

13
Разница между односторонним и двусторонним тестированием?

Во время учебы по курсу статистики я пытался понять разницу между односторонними и двусторонними проверками гипотез. В частности, почему односторонний тест отклоняет нулевое значение, а двусторонний - нет? Пример:...

13
Правильно ли называть результаты «почти» или «несколько» значительными?

Общий консенсус по аналогичному вопросу. Неправильно ли называть результаты «очень значимыми»? заключается в том, что «очень значительный» является допустимым, хотя и неспецифическим, способом описания силы ассоциации, у которой значение p намного ниже предварительно установленного порога...

13
В чем разница между wilcox.test и coin :: wilcox_test в R?

Эти две функции существуют в R, но я не знаю их различий. Кажется, что они возвращают одинаковые p-значения только при вызове wilcox.testс correct=FALSE, и wilcox_test(в пакете для монет) с distribution="aymptotic". Для других значений они возвращают разные p-значения. Также wilcox.testвсегда...

13
Что делать, если значения двух образцов существенно различаются, но разница кажется слишком маленькой, чтобы иметь значение

У меня есть два образца ( в обоих случаях). Средство отличается примерно вдвое от объединенного стандартного. девиация Результирующее значение T составляет приблизительно 10. Хотя приятно знать, что я убедительно показал, что средние значения не одинаковы, мне кажется, это обусловлено большим n....

13
Выбор статистического теста на основе результатов другого (например, нормальность)

Итак, я слышал, что было сказано, что не стоит выбирать один статистический тест на основе результатов другого. Это кажется странным для меня, хотя. Например, люди часто предпочитают использовать непараметрический тест, когда какой-то другой тест предполагает, что остатки обычно не распределяются....

13
Насколько меньшими могут быть значения

Вступление: отметив внимание, которое получил сегодня этот вопрос: « Может ли ANOVA быть значимым, если ни один из парных t-тестов не является? », Я подумал, что смогу перефразировать его интересным способом, который заслуживает своего собственного набора ответов. , Различные несоответствующие...

13
Как проверить, отличаются ли два (ненормальных) распределения?

Я читал о t-тесте Стьюдента, но он работает, когда мы можем предположить, что исходные дистрибутивы обычно распространяются. В моем случае их точно нет. Кроме того, если у меня есть 13 дистрибутивов, нужно ли мне делать 13^2тесты?...

13
Вы наблюдаете k голов из n бросков. Честная ли монета?

Мне задали этот вопрос с в интервью. Есть ли «правильный» ответ?(n,k)=(400,220)(n,k)=(400,220)(n, k) = (400, 220) Предположим, что броски одинаковы, а вероятность голов составляет p=0.5p=0.5p=0.5 . Распределение числа голов в 400 бросках должно быть близко к нормальному (200, 10 ^ 2), так что 220...

12
Почему это распределение равномерно?

Мы изучаем байесовское статистическое тестирование и сталкиваемся со странным (по крайней мере, мне) явлением. Рассмотрим следующий случай: мы заинтересованы в измерении того, какая популяция, A или B, имеет более высокий коэффициент конверсии. Для проверки мы устанавливаем , то есть вероятность...