Я хочу сравнить 2 типовых средства для 1-минутного возврата. Я предполагаю, что они распределены по Лапласу (уже проверены), и я разделил результаты на 2 группы. Как я могу проверить, значительно ли они отличаются?
Я думаю, что не могу относиться к ним как к нормальному распределению, потому что, хотя они имеют более 300 значений, график QQ показывает, что существует огромная разница с нормальным распределением
r
confidence-interval
laplace-distribution
обкрадывать
источник
источник
Ответы:
Предполагая, что оба распределения Лапласа имеют одинаковую дисперсию,
а) проверка отношения правдоподобия будет включать в себя статистику теста, такую как:
Взятие логов, отмена / упрощение и умножение на .−2
где - среднее абсолютное отклонение от медианы в объединенной выборке, а - среднее абсолютное отклонение от медианы в выборке . τ я=тяяτ^=m τ^i=mi i
Согласно Уилксу теорема этой асимптотически распределена под нулем, поэтому для испытания на 5% вы бы отклонять , если что превысило . 3,84χ21 3.84
Имитационные эксперименты предполагают, что тест является антиконсервативным при небольших размерах выборки (вероятность отклонения несколько выше номинальной), но примерно при n = 100 это кажется по меньшей мере разумным (вы получаете порядка 5,3% - 5,4% например, показатель отклонения при нулевом значении для номинального теста 5%; для он кажется ближе к 5,25%).n1,n2>300
б) Мы также ожидаем, что будет хорошей тестовой статистикой (где представляет выборка медианы и ); если бы я не допустил ошибку там, в больших выборках, таких как ваша, она будет приблизительно нормально распределена под нулем, со средним значением 0 и дисперсией 1, где может основываться на квадрате среднее абсолютное отклонение от среднего значения в объединенной выборке, , хотя я ожидаю, что на практике оно будет работать лучше, основываясь на средневзвешенной выборке из двух выборок 's . ~μv=2τ2(1μ~1−μ~2v√ μ~ τ 2м2м 2 я †v=2τ^2(1n1+1n2) τ^2 m2 m2i †
c) Другой альтернативой будет выполнение теста перестановки на основе любой из приведенных выше статистических данных. (Один из ответов здесь дает представление о том, как реализовать тест на перестановку для определения разницы в медиане.)
г) Вы всегда можете пройти тест Уилкоксона / Манна-Уитни; это будет значительно эффективнее, чем пытаться использовать t-критерий Лапласа.
e) лучше, чем (d) для данных Лапласа, был бы медианный тест Муда; Хотя это часто рекомендуется в книгах, при работе с данными Лапласа он покажет хорошую силу. Я ожидаю, что он будет иметь такую же мощность, что и перестановочная версия асимптотического теста разницы в медиане (один из тестов, упомянутых в (с)).
Вопрос здесь дает реализацию R, которая использует тест Фишера, но этот код может быть адаптирован для использования вместо этого критерия хи-квадрат (который я рекомендовал бы даже в умеренных выборках); в качестве альтернативы есть пример код для него (не как функции) здесь .
Медианный тест обсуждается здесь , в Википедии , но не очень подробно (в связанном немецком переводе есть немного больше информации). Некоторые книги по непараметрике обсуждают это.
источник