Я пытаюсь проверить нулевое значение сравнении с локальной альтернативой E [ X ] > 0 для случайной величины X , подверженной небольшому или среднему перекосу и эксцессу случайной величины. Следуя предложениям Уилкокса в «Введении в робастную оценку и проверку гипотез», я рассмотрел тесты, основанные на усеченном среднем, медиане, а также М-оценке местоположения («одношаговая» процедура Уилкокса). Эти надежные тесты превосходят стандартные t-тесты по мощности при тестировании с дистрибутивом, не подверженным перекосу, но лептокуртотическим.
Однако при тестировании с искаженным дистрибутивом эти односторонние тесты либо слишком либеральны, либо слишком консервативны при нулевой гипотезе, в зависимости от того, искажено ли распределение влево или вправо соответственно. Например, при 1000 наблюдениях тест, основанный на медиане, фактически отклонит ~ 40% времени при номинальном уровне 5%. Причина этого очевидна: для искаженных распределений медиана и среднее довольно разные. Однако в моем приложении мне действительно нужно проверить среднее значение, а не среднее значение, а не усеченное среднее значение.
Существует ли более надежная версия t-критерия, которая фактически проверяет среднее значение, но не подвержена перекосам и эксцессам?
В идеале процедура будет хорошо работать и в случае отсутствия перекоса и высокого куртоза. «Одностадийный» тест почти достаточно хорош, с параметром «изгиб», установленным относительно высоким, но он менее мощный, чем тесты с усеченным средним, когда нет перекоса, и имеет некоторые проблемы с поддержанием номинального уровня отклонений при перекосе. ,
Предыстория: причина, по которой я действительно беспокоюсь о среднем, а не о медиане, заключается в том, что тест будет использоваться в финансовой заявке. Например, если вы хотите проверить, имел ли портфель положительные ожидаемые журнальные доходы, среднее значение действительно подходит, потому что если вы инвестируете в портфель, вы получите все доходы (то есть среднее число раз выборок) вместо дубликатов медианы. То есть, я на самом деле волнует сумма п черпает из RV X .
источник
Ответы:
Почему вы смотрите на непараметрические тесты? Нарушены ли предположения t-критерия? А именно, порядковые или ненормальные данные и непостоянные отклонения? Конечно, если ваша выборка достаточно велика, вы можете обосновать параметрический t-тест его большей мощностью, несмотря на отсутствие нормальности в выборке. Аналогичным образом, если вас беспокоит неравное отклонение, в параметрическом тесте есть поправки, которые дают точные значения p (поправка Уэлча).
В противном случае сравнение ваших результатов с t-тестом не является хорошим способом для этого, потому что результаты t-теста смещаются, когда предположения не выполняются. Mann-Whitney U - подходящая непараметрическая альтернатива, если это то, что вам действительно нужно. Вы теряете силу только в том случае, если используете непараметрический критерий, когда можете обоснованно использовать критерий Стьюдента (поскольку предположения выполнены).
И, просто для дополнительной информации, иди сюда ...
http://www.jerrydallal.com/LHSP/STUDENT.HTM
источник
Я согласен, что если вы хотите на самом деле проверить, отличаются ли средние значения группы (в отличие от проверки различий между медианами группы или усредненными значениями и т. Д.), То вы не хотите использовать непараметрический критерий, который проверяет другую гипотезу.
В целом значения р из t-критерия имеют тенденцию быть достаточно точными, учитывая умеренные отклонения от предположения о нормальности остатков. Проверьте этот апплет, чтобы получить интуицию об этой надежности: http://onlinestatbook.com/stat_sim/robustness/index.html
Если вы по-прежнему обеспокоены нарушением предположения о нормальности, вы можете захотеть начать . например, http://biostat.mc.vanderbilt.edu/wiki/pub/Main/JenniferThompson/ms_mtg_18oct07.pdf
Вы также можете преобразовать перекос зависимой переменной, чтобы решить проблемы с отклонениями от нормального.
источник
trimpb
иtrimcibt
, но они слишком медленные, чтобы проводить мои силовые тесты, по крайней мере, на мой вкус. В отношении: 3, я думал об этом методе, но меня интересует среднее значение нетрансформированных данных (т. е. я не сравниваю 2 RV с t-тестом, и в этом случае монотонное преобразование подойдет для сравнение на основе рангов, как отмечает @JoFrhwld.)«Последнее и самое великое» принадлежит Огасваре со ссылками в нем на Холла и других.
источник
У меня недостаточно репутации для комментария, поэтому я отвечаю: посмотрите на этот расчет. Я думаю, что это дает отличный ответ. Вкратце:
источник