Как я могу сравнить 2 средства, которые распределены по Лапласу?

10

Я хочу сравнить 2 типовых средства для 1-минутного возврата. Я предполагаю, что они распределены по Лапласу (уже проверены), и я разделил результаты на 2 группы. Как я могу проверить, значительно ли они отличаются?

Я думаю, что не могу относиться к ним как к нормальному распределению, потому что, хотя они имеют более 300 значений, график QQ показывает, что существует огромная разница с нормальным распределением

обкрадывать
источник
Запрашивать код / ​​пакеты здесь не по теме, но здесь у вас есть настоящий статистический вопрос. Вы можете отредактировать свой вопрос, чтобы прояснить основную статистическую проблему. Вы можете обнаружить, что, когда вы понимаете соответствующие статистические концепции, элементы программного обеспечения самоочевидны или, по крайней мере, их легко получить из документации.
gung - Восстановить Монику
Когда вы говорите «по-другому», вас интересует только разница в средствах, и если да, то вы предполагаете, что спреды идентичны?
Glen_b
Да, я просто хочу знать, значительно ли отличаются средства, и я предполагаю, что распределение идентично. Я не уверен, что стандартное отклонение одинаково, но я думаю, что это тоже будет хорошо
Роб
2
Пожалуйста, предоставьте более подробную информацию о возврате акций за 1 минуту. Хотите сравнить средства временных данных?
Майкл М,
2
Также обратите внимание, что количество проверяемых вами значений не меняет распределение; Вы можете подумать о распределении выборочных средних , которое при для Лапласа будет очень близко к нормальному. n=300
Glen_b

Ответы:

12

Предполагая, что оба распределения Лапласа имеют одинаковую дисперсию,

а) проверка отношения правдоподобия будет включать в себя статистику теста, такую ​​как:

L=i=1n12τ^exp(|xiμ^|τ^)i=1n112τ^1exp(|xiμ^1|τ^1)i=n1+1n12τ^2exp(|xiμ^2|τ^2)

Взятие логов, отмена / упрощение и умножение на .2

2l=2(nlog(τ^)n1log(τ^1)n2log(τ^2)) (где )l=log(L)

где - среднее абсолютное отклонение от медианы в объединенной выборке, а - среднее абсолютное отклонение от медианы в выборке . τ я=тяяτ^=mτ^i=mii

Согласно Уилксу теорема этой асимптотически распределена под нулем, поэтому для испытания на 5% вы бы отклонять , если что превысило . 3,84χ123.84

Имитационные эксперименты предполагают, что тест является антиконсервативным при небольших размерах выборки (вероятность отклонения несколько выше номинальной), но примерно при n = 100 это кажется по меньшей мере разумным (вы получаете порядка 5,3% - 5,4% например, показатель отклонения при нулевом значении для номинального теста 5%; для он кажется ближе к 5,25%).n1,n2>300

б) Мы также ожидаем, что будет хорошей тестовой статистикой (где представляет выборка медианы и ); если бы я не допустил ошибку там, в больших выборках, таких как ваша, она будет приблизительно нормально распределена под нулем, со средним значением 0 и дисперсией 1, где может основываться на квадрате среднее абсолютное отклонение от среднего значения в объединенной выборке, , хотя я ожидаю, что на практике оно будет работать лучше, основываясь на средневзвешенной выборке из двух выборок 's . ~μv=2τ2(1μ~1μ~2vμ~ τ 2м2м 2 яv=2τ^2(1n1+1n2)τ^2m2mi2

(Правка: симуляция предполагает, что нормальное приближение в порядке, но вычисление отклонений выше не верно; я вижу, в чем проблема сейчас, но мне все еще нужно ее исправить. Версия этого теста с перестановкой (см. пункт (с)) все равно должно быть в порядке).

c) Другой альтернативой будет выполнение теста перестановки на основе любой из приведенных выше статистических данных. (Один из ответов здесь дает представление о том, как реализовать тест на перестановку для определения разницы в медиане.)

г) Вы всегда можете пройти тест Уилкоксона / Манна-Уитни; это будет значительно эффективнее, чем пытаться использовать t-критерий Лапласа.

e) лучше, чем (d) для данных Лапласа, был бы медианный тест Муда; Хотя это часто рекомендуется в книгах, при работе с данными Лапласа он покажет хорошую силу. Я ожидаю, что он будет иметь такую ​​же мощность, что и перестановочная версия асимптотического теста разницы в медиане (один из тестов, упомянутых в (с)).

Вопрос здесь дает реализацию R, которая использует тест Фишера, но этот код может быть адаптирован для использования вместо этого критерия хи-квадрат (который я рекомендовал бы даже в умеренных выборках); в качестве альтернативы есть пример код для него (не как функции) здесь .

Медианный тест обсуждается здесь , в Википедии , но не очень подробно (в связанном немецком переводе есть немного больше информации). Некоторые книги по непараметрике обсуждают это.

Glen_b - Восстановить Монику
источник
Большое спасибо! Могу ли я тогда использовать статистику теста, которую вы использовали, и отклонить ее, если квантиль Лапласа для среднего значения = 0 и стандартного отклонения = 1 превышен, как я сделал бы с тестом нормального распределения?
Роб
Извините, правда, я не знаю, о чем вы там спрашиваете, поэтому вам нужно подробно объяснить, что вы имеете в виду. К какой статистике теста вы обращаетесь? [Вы должны придерживаться тестов, упомянутых в (a), (c) или (d), так как что-то не так с моей вычисленной дисперсией во второй, асимптотической, помеченной (b), так как мое редактирование помечено как " ") ясно говорится. Я все еще должен исправить это дело, но, возможно, я не смогу быстро его
решить
@Glen_b. Полезный ответ, спасибо (+1), но у нулевой модели есть 2 параметра ( и ), тогда как у альтернативы - 4. Значит, это должно быть ? (хотя для случая с небольшим и средним размером выборки, который я смотрю, я в любом случае т х 2 2μ^τ^χ22
суммирую
Или, может быть, вы использовали одну оценку для шкалы в альтернативной модели?
П.Уиндридж
@ P.Windridge Это отличный момент. Да, поскольку у меня есть алгебраическое выражение, которое сокращает 2 свободных параметра при переходе от альтернативы к нулю (но на самом деле я думал о том же масштабе, когда писал ). Мне нужно исправить это, чтобы все было согласованно (и пока я на этом, я должен заново проработать его, чтобы исправить любую другую проблему, о которой я упоминал в редактировании)χ12
Glen_b -Reinstate Monica