Параметрический расчет размера выборки и непараметрический анализ

12

Мне любопытно узнать, есть ли у кого-нибудь конкретная ссылка (текстовая или журнальная статья), чтобы поддержать общепринятую в медицинской литературе практику расчета размера выборки с использованием параметрических методов (т. Е. Предполагающих нормальное распределение и определенную дисперсию измерений) когда анализ результатов первичного испытания будет сделан с использованием непараметрических методов.

Пример: первичным результатом является время до рвоты после введения определенного лекарства, которое, как известно, имеет среднее значение 20 минут (SD 6 минут), но имеет заметно искаженное распределение. Расчет размера выборки производится с допущениями, перечисленными выше, по формуле

n(per-group)=f(α,β)×(2σ2/(μ1μ2)2) ,

где изменяется в зависимости от желаемых ошибок и .α βf(α,β)αβ

Однако из-за асимметрии распределения анализ первичного результата будет основан на рангах (непараметрический метод, такой как U-критерий Манна-Уитни).

Поддерживается ли эта схема авторами в статистической литературе, или должны быть выполнены непараметрические оценки размера выборки (и как это будет сделано)?

Я думаю, что для простоты расчета приемлемо выполнять вышеуказанную практику. В конце концов, оценки размера выборки - это просто оценки, которые уже делают несколько предположений, и все они, вероятно, немного (или очень!) Неточны. Тем не менее, мне любопытно узнать, что думают другие, и, в частности, узнать, есть ли ссылки, подтверждающие эту линию рассуждений.

Большое спасибо за любую помощь.

pmgjones
источник

Ответы:

4

Это звучит глупо для меня. Непараметрические методы почти всегда включают больше степеней свободы, чем параметрические, и поэтому требуют больше данных. В вашем конкретном примере тест Манна-Уитни имеет меньшую мощность, чем критерий Стьюдента, и поэтому требуется больше данных для той же заданной мощности и размера.

Простой способ выполнить расчет размера выборки для любого метода (непараметрического или иного) - это использовать метод начальной загрузки.

Роб Хиндман
источник
5
Я согласен с вами, хотя большинство расчетов размера выборки, которые проводятся при разработке РКИ, основаны на параметрических моделях. Мне нравится подход начальной загрузки, но, похоже, что очень немногие исследования полагаются на него. Я только что нашел те документы, которые могут быть интересны: bit.ly/djzzeS , bit.ly/atCWz3 , и эта идет в противоположном направлении bit.ly/cwjTHe для шкал измерения здоровья.
ЧЛ
6
Я согласен с подходом начальной загрузки. Но власть не является функцией степеней свободы. Во многих случаях, включая этот, тест Манна-Уитни часто имеет большую мощность, чем критерий Стьюдента. См. Tbf.coe.wayne.edu/jmasm/sawilowsky_misconceptions.pdf . В целом, сила параметрического теста хороша, когда параметрические предположения верны, но может быть ниже - иногда даже резко - когда эти предположения нарушаются, тогда как хорошие непараметрические тесты сохраняют свою силу.
whuber
@RobHyndman - извините, что выкопал старую ветку 6 лет назад, но мне интересно, можете ли вы дать ссылку на свое последнее предложение. Как я могу использовать метод начальной загрузки для расчета размера выборки? Здесь я предполагаю, что я еще не собрал данные (потому что я пытаюсь выяснить, сколько нужно собрать), но я знаю, какую мощность я хочу, уровень значимости и величину эффекта, который я хочу обнаружить. Благодарность!
Дэвид Уайт
Хорошо, я думаю, это может сработать, только если у вас есть предварительное исследование для повторной выборки. Для первого исследования без предварительного знания, кажется, лучше всего рассчитать величину эффекта из нормального распределения (или из другого распределения, если теория предполагает, что данные должны быть распределены таким образом) и добавить немного, чтобы учесть возможную ненормальность. После того, как у вас будет одно исследование, вы можете использовать ускорение для вычисления размеров выборки, чтобы определить различные величины эффекта в последующих исследованиях. Вы можете даже подобрать кривую величины эффекта против n на основе начальной загрузки нескольких значений n.
Дэвид Уайт
4

Некоторые люди, похоже, используют концепцию асимптотической относительной эффективности Питмана (ARE), чтобы раздуть размер выборки, полученный с помощью формулы размера выборки для параметрического теста. По иронии судьбы, чтобы его вычислить, нужно снова предположить распределение ... см., Например, размер выборки для U-критерия Манна-Уитни. В конце статьи есть несколько ссылок, которые предоставляют указатели для дальнейшего чтения.

PSJ
источник