Существуют ли «эзотерические» статистические тесты с очень низкой мощностью?

11

Фон

В информатике, математике, а иногда и в других областях «эзотерические» примеры могут быть не только занимательными, но и полезными для иллюстрации некоторых понятий, например:

  • Bogosort и Slowsort являются очень неэффективными алгоритмами сортировки, которые можно использовать для понимания свойств алгоритмов, в частности, по сравнению с другими алгоритмами сортировки.

  • Эзотерические языки программирования демонстрируют, насколько далеко заходит концепция языка программирования, и помогают оценить хорошие языки программирования.

  • Функции Вейерштрассы и функция Дирихле , прежде всего , находят применение , чтобы проиллюстрировать некоторые неверные представления о концепции непрерывности.

В настоящее время я готовлю некоторые учения по использованию тестов гипотез и думаю, что наличие теста с очень низкой мощностью (но без других недостатков) поможет проиллюстрировать концепцию статистической мощности. (Конечно, я все еще должен решить сам, является ли данный пример дидактически полезным для моей аудитории или просто сбивает с толку.)

Актуальный вопрос

Существуют ли какие-либо статистические тесты с преднамеренно низкой мощностью, а именно:

  • Тест вписывается в общую структуру проверки гипотез, то есть он работает с нулевой гипотезой, имеет требования и возвращает (правильное)  значение p .
  • Это не предназначено / предложено для серьезного применения.
  • Он имеет очень низкую мощность (из-за преднамеренного недостатка конструкции, а не из-за низкой выборки или размера эффекта).

Если вы в принципе можете утверждать, что такой тест не может существовать, я также считаю это правильным ответом на мой вопрос. С другой стороны, если существует множество таких тестов, меня интересует наиболее дидактически эффективный, то есть он должен быть легко доступным и иметь поразительный эффект.

Обратите внимание, что я не прошу общий выбор статистических ошибок (сбор вишни и т. Д.) Или аналогичных.

Что я нашел до сих пор

Поиски в интернете мне ничего не дали.

Каждая попытка создать нечто подобное заканчивалось либо каким-либо (полезным) существующим тестом, либо форматом не является обычный тест. Например, я подумал о проверке, имеет ли популяция положительную медиану, которая возвращает только да, если все выборки положительны; но этот тест не возвращает  значение p и, следовательно, не вписывается в обычную структуру теста. Если я просто посчитаю положительные и отрицательные знаки как статистику теста (и вычислю  значения p соответственно), я получу тест знака , который является разумным тестом.

Wrzlprmft
источник
2
Будучи более математическими, «эзотерические» примеры (которых предостаточно) имеют тенденцию быть конкретными контрпримерами к распространенным недоразумениям; ряд учебников содержат такие примеры. В своем нынешнем виде ваш вопрос по сути является вопросом типа «большой список» и поэтому он слишком широкий (хотя вы должны заметить, что несколько пользователей пришли к выводу, что вопрос неясен); если вы можете уточнить свой вопрос и сузить сферу его применения, он может лучше соответствовать сайту.
Glen_b
1
Низкая мощность по сравнению с чем? Леманн привел пример обобщенного теста отношения правдоподобия, который имел меньшую мощность при любой альтернативной гипотезе, чем при нулевой.
Scortchi - Восстановить Монику
2
t
1
Я выкопаю газету Лемана, когда буду за компьютером. Мощность теста при нулевом значении - это просто размер теста.
Scortchi - Восстановить Монику
3
Пример теста, использовавшегося в классе, в котором я учился (много лет назад), был «бросить честный 20-гранный кубик и отказаться, если вы бросили 1» (как часть обсуждения кривых мощности). Это, конечно, полностью игнорирует данные, но является «действительным» тестом в том смысле, что он не имеет более высокий, чем желаемый уровень ошибок типа I (который составлял 5% в контексте, в котором был приведен пример).
Glen_b

Ответы:

7

Eϕ(X)=α
ϕ(x)={0 when f0(x)<kf1(x)1 when f0(x)>kf1(x)
αϕH0:f0H1:f1x

Из этого результата вы можете получить одинаково наименее мощные, локально наименее мощные, равномерно наименее мощные аналогичные и наименее мощные «полностью предвзятые» тесты (я имею в виду тесты с меньшей мощностью при любой альтернативе, чем при нулевом). Если у вас уже есть самый мощный, и т.д. test, просто умножьте свою статистику теста на -1, чтобы сохранить разбиение пробного пространства, которое оно вызывает, изменяя порядок секционирования.


Возможно, как предполагает @ user54038, «сбой общего метода построения теста» может быть более интересным. Lehmann (1950), "Некоторые принципы теории проверки статистических гипотез", Ann. Математика Statist. , 21 , 1, приписывает следующий пример Штейну:

X0,±1,±2

22110Hypothesis H:α2α212α12ααAlternatives:pC(1p)C1C1α(12α)1C1α(12α)α1c1α
αC0<α12α2α<C<αp[0,1]

HαX=±2CC<ααX

pX=2X=2p^=1p^=02CαX1C1α

скортчи
источник
5

(Связано с комментарием @Scortchi)

XN(μ,1)

H0:μ=0H1:μ0

ZBernoulli(p)pαp[α,1]

R={(X,Z) | z=1 |x|>Φ1(α2p)}

α

P(XR | μ=0)=P(Z=1 , |X|>Φ1(α2p))=P(Z=1)P(|X|>Φ1(α2p))=pαp=α

p(x,z)=(1000000,0)p=αXα

Z

оборота кнрумси
источник
2
SZ=1(S<FS1(p))FS()S