Какие ссылки следует привести, чтобы использовать 30 как достаточно большой размер выборки?

43

Я много раз читал / слышал, что размер выборки, по крайней мере, 30 единиц, считается «большой выборкой» (предположения о нормальности средств обычно приблизительно соответствуют CLT, ...). Поэтому в своих экспериментах я обычно генерирую образцы по 30 единиц. Можете ли вы дать мне некоторые ссылки, которые должны быть указаны при использовании выборки размером 30?

ЛВС
источник
2
Без учета количества параметров, которые вы пытаетесь оценить, или, эквивалентно, типа модели, с которой вы работаете, довольно сложно дать вам четкий ответ.
ЧЛ
2
Принятие n = 30 в качестве границы малых и больших выборок не подтверждается никакими статистическими методами.
Джибол

Ответы:

37

Выбор n = 30 для границы между малыми и большими выборками является практическим правилом. Существует большое количество книг, в которых указывается (около) это значение, например, « Вероятность и статистический вывод» Хогга и Таниса (7e) гласит «больше 25 или 30».

Тем не менее , история , рассказанная мне в том , что единственная причина , по 30 была расценена как хорошая граница потому , что он сделал для хорошенького Стьюдента т таблиц в задней части учебников хорошо помещаются на одной странице. Это и критические значения (между t и нормальным Стьюдентом ) отключаются только примерно до 0,25, в любом случае, от df = 30 до df = бесконечность. Для ручного вычисления разница не имела большого значения.

В настоящее время легко вычислить критические значения для всех видов вещей до 15 знаков после запятой. Кроме того, у нас есть методы передискретизации и перестановки, для которых мы даже не ограничены параметрическим распределением населения.

На практике я никогда не полагаюсь на n = 30. График данных. Наложите нормальное распределение, если хотите. Визуально оцените, подходит ли нормальное приближение (и спросите, действительно ли приближение действительно необходимо). Если генерация выборок для исследования и аппроксимация обязательна, сгенерируйте достаточно размера выборки, чтобы аппроксимация была как можно ближе (или настолько близка, насколько это возможно в вычислительном отношении).


источник
13
Вот страница о том, насколько хорошо нормальное приближение распределения t для n = 30. johndcook.com/normal_approx_to_t.html
Джон Д. Кук,
41

На самом деле, «магическое число» 30 - заблуждение. См. Восхитительную статью Джейкоба Коэна « Вещи , которые я узнал (до сих пор)» (Am. Psych. December 1990 45 # 12, стр. 1304-1312) . Этот миф - его первый пример того, как «некоторые вещи, которые вы изучаете, не таковы».

[O] Ни один из моих соискателей докторских диссертаций не защитил диссертацию [с] выборкой из 20 случаев на группу. ... [L] после того, как я обнаружил ... что при сравнении среднего значения по двум независимым группам с Nзнак равно30 на группу на освященном +0,05 уровне .05 вероятность того, что эффект среднего размера будет помечен как значительный ... т- тест был только0,47

Карлос Аккиоли
источник
2
Красивая ссылка - и место по теме. Спасибо.
whuber
1
@whuber Вы помните, что это была за бумага? Ссылка сейчас не работает. Может быть, это psych.colorado.edu/~willcutt/pdfs/Cohen_1990.pdf , «Что я узнал ( пока )»? Год совпадает с указанным в URL неработающей ссылки.
говорит амеба: восстанови Монику
1
@Amoeba Я сохранил эту статью, когда прочитал ее, поэтому я могу подтвердить, что вы нашли именно то, что вам нужно. Я обновил этот ответ, чтобы добавить ссылку вместе с вашей ссылкой.
whuber
@Carlos Accioly Я обновил его новой ссылкой, так как предыдущая была сломана.
Акшай Бансал
9

ИМО, все зависит от того, для чего вы хотите использовать свой образец. Два «глупых» примера для иллюстрации того, что я имею в виду: если вам нужно оценить среднее значение, 30 наблюдений более чем достаточно. Если вам необходимо оценить линейную регрессию с помощью 100 предикторов, 30 наблюдений не будет достаточно близко.

BHM
источник
9

μ¯(N)

В более общем смысле, CLT нужно, по существу, два столпа для удержания:

  1. Что случайные величины независимы: вы можете изменить порядок своих наблюдений, не теряя никакой информации *.
  2. Что rv происходят из распределения с конечными вторыми моментами: это означает, что классические оценки среднего и sd имеют тенденцию сходиться с увеличением размера выборки.

(Оба эти условия могут быть несколько ослаблены, но различия носят в основном теоретический характер)

user603
источник
6
Ваш пример иллюстрирует ценность надежной статистики. Образца медианный оценивает показатель распределения Коши местоположения хорошо. Можно утверждать, что самым слабым звеном в использовании t-теста с 30 образцами является t-критерий, а не 30 образцов.
Джон Д. Кук
1
Джон:> «Можно утверждать, что самым слабым звеном в использовании t-теста с 30 образцами является t-тест, а не 30 образцов». Очень верно, а также предположение, что данные являются iid . Кроме того, медиана MLE для распределенных случайных величин Коши (и, следовательно, эффективная), но в целом вам может потребоваться более 30 наблюдений.
user603
1
Не все версии CLT полагаются на одинаковое распределение и даже независимость. Базовые, которые преподаются старшекурсникам, часто делают, но есть версии, которые не делают обоих предположений, например, CLT Ляпунова предполагает независимость, но не идентичные распределения, и условие независимости также может быть ослаблено, например, см. Здесь . Эта «переупорядоченность» тоже не то же самое, что независимость. Некоторые формы зависимости не зависят от порядка.
Glen_b
2
Размер выборки 50000 недостаточен для того, чтобы CLT работал достаточно хорошо, чтобы вычислить доверительный интервал для среднего логарифмического нормального распределения.
Фрэнк Харрелл