Что значит сделать размер выборки случайной величиной?

18

Фрэнк Харрелл завел блог ( статистическое мышление) . В своем главном посту он перечисляет некоторые ключевые особенности своей статистической философии. Среди прочих предметов в него входят:

  • Сделайте размер выборки случайной величиной, если это возможно
  1. Что значит «сделать размер выборки случайной величиной»?
  2. Каковы преимущества этого? Почему это может быть предпочтительнее?
Gung - Восстановить Монику
источник
В последовательном анализе время возникновения события рассматривается как случайная величина. Это также верно для размера выборки.
Майкл Р. Черник
@RichardHardy, это следует обсудить на кросс- валидированной мета-версии . Я создал тег b / c, которого у нас не было 1, и есть много вопросов о ACF и т. Д. Мы всегда можем сделать его синонимом.
gung - Восстановить Монику

Ответы:

13

Я не имею в виду использовать модели, близкие к процессу сбора данных, а скорее делаю непрерывный байесовский мониторинг апостериорных вероятностей, который не требует наказания за множественность. Вместо того, чтобы вычислять произвольный целевой размер выборки, я бы предпочел вычислить максимально возможный размер выборки (для утверждения бюджета) и в противном случае останавливать «когда мы получим ответ», как это обычно делается с хорошим эффектом в физике. Я расскажу об этом больше в моем блоге http://fharrell.com в скором времени.

Фрэнк Харрелл
источник
1
Что конкретно означает «когда мы получим ответ»? Я думаю, что проведение исследования до тех пор, пока вы не получите результат, который вам нравится (например, 95% вероятный интервал не включает 0), будет столь же разрушительным в байесовском контексте, как и в частом.
gung - Восстановить Монику
1
@ вовсе нет. Байесовский вывод совершенно не зависит от правила остановки. Легко смоделировать калибровку апостериорных вероятностей во время ранней остановки, показывая, что они в точности верны. Это одно из удивительных различий с миром частых. Как правило, прямые вероятности не зависят от контекста, а обратные вероятности зависят от того, как вы туда попали. Поэтому я бы остановился, когда апостериорная вероятность того, что эффект> 0 превышает некоторое число, например 0,95, или когда вероятный интервал имеет ширину <некоторое указанное число.
Фрэнк Харрелл
1
Мне кажется, что ваш ответ на комментарий @ gung заставляет усомниться в том, что некоторые читатели вполне могут почувствовать, что если байесовский вывод действительно допускает «выборку до предрешенного заключения», тем хуже для байесовского вывода. (Я бы сослался на ссылки в третьем абзаце здесь .) Ждем вашего следующего поста в блоге!
Scortchi - Восстановить Монику
Выборка из предрешенного неверного заключения происходит только в том случае, если ранее использованное статистиком противоречит ранее использованному рецензентом. Например, если рецензент ставит массу вероятности на ноль (т. Е. Предыдущий имеет поглощающее состояние), а используемая модель не делает особого акцента на нуле, анализ может указывать на остановку для получения положительного эффекта, но рецензент говорит, что есть недостаточно доказательств для эффекта. Если вы моделируете исследования с определенным априором и анализируете с использованием того же априора, задние щупы идеально откалиброваны, а задние средства также идеальны.
Фрэнк Харрелл