Как распределение выборки означает, что выборка приближается к средней численности населения?

16

Я пытаюсь изучать статистику, потому что я нахожу, что она настолько распространена, что запрещает мне изучать некоторые вещи, если я не понимаю ее должным образом. У меня возникли проблемы с пониманием этого понятия выборочного распределения средних значений. Я не могу понять, как некоторые книги и сайты объясняют это. Я думаю, что у меня есть понимание, но я не уверен, правильно ли это. Ниже моя попытка понять это.

Когда мы говорим о каком-то явлении, имеющем нормальное распределение, оно обычно (не всегда) касается населения.

Мы хотим использовать логическую статистику, чтобы предсказать некоторые данные о населении, но не располагаем всеми данными. Мы используем случайную выборку, и каждая выборка размера n одинаково вероятна для выбора.

Итак, мы берем много выборок, скажем, 100, и тогда распределение средних значений этих выборок будет приблизительно нормальным согласно центральной предельной теореме. Среднее значение выборочных средних будет приблизительно соответствовать среднему значению для населения.

Что я не понимаю, так это то, что вы часто видите «выборку из 100 человек…». Разве нам не нужны 10 или 100 выборок из 100 человек для приблизительной оценки среднего значения? Или это тот случай, когда мы можем взять одну достаточно большую выборку, скажем 1000, а затем сказать, что среднее будет приблизительно соответствовать среднему значению для населения? ИЛИ мы берем выборку из 1000 человек, а затем отбираем 100 случайных выборок по 100 человек в каждой выборке из той исходной 1000 человек, которую мы взяли, и затем используем это как наше приближение?

Всегда ли достаточно большой выборки, чтобы приблизить среднее значение (почти)? Должно ли население быть нормальным, чтобы это работало?

Сортировка слиянием
источник

Ответы:

9

Я думаю, вы, возможно, путаете ожидаемое распределение выборки среднего значения (которое мы рассчитываем на основе одной выборки) с (обычно гипотетическим) процессом моделирования того, что произойдет, если мы неоднократно делали выборку из одной и той же популяции несколько раз.

Для любого данного размера выборки (даже n = 2) мы бы сказали, что среднее по выборке (из двух человек) оценивает среднее значение по совокупности. Но точность оценки - то есть, насколько хорошо мы проделали работу по оценке среднего значения на основе наших выборочных данных, что отражено в стандартной ошибке среднего значения - будет хуже, чем если бы у нас было 20 или 200 люди в нашем образце. Это относительно интуитивно понятно (большие выборки дают лучшую точность оценки).

Затем мы использовали бы стандартную ошибку для вычисления доверительного интервала, который (в данном случае) основан на нормальном распределении (мы, вероятно, использовали бы t-распределение в небольших выборках, поскольку стандартное отклонение популяции часто недооценивается в небольшая выборка, приводящая к чрезмерно оптимистичным стандартным ошибкам.)

В ответ на ваш последний вопрос, нет, мы не всегда нуждаемся в нормально распределенной совокупности, чтобы применять эти методы оценки - центральная предельная теорема указывает, что выборочное распределение среднего значения (оцененного, опять же, из одной выборки) будет иметь тенденцию к следовать нормальному распределению, даже если базовое население имеет ненормальное распределение. Это обычно подходит для «больших» размеров выборки.

Сказав, что, когда у вас есть ненормальная популяция, из которой вы отбираете, среднее значение может не быть подходящей сводной статистикой, даже если распределение выборки для этого среднего можно считать надежным.

Джеймс Стэнли
источник
так что я просто слишком одержим пониманием этой теоретической основы того, как работает этот материал? Действительно ли интересная вещь здесь доверительный интервал? Другими словами, если я хочу опубликовать исследование, скажем, количества часов, которое спит средний взрослый в США, и я беру выборку 5000, и мой доверительный интервал составляет 99,9%, среднее значение находится между 6,46 и 6,54, тогда я могу пойти вперед и опубликую мое исследование, говоря "уверенно", что средний взрослый в США спит 6,5 часов?
mergesort
2
Где вы сказали: « говорите« уверенно », что средний взрослый в США спит 6,5 часов ». Ну, нет, вы можете быть уверены, что в среднем это не 6,5 часов. Вы можете быть уверены, что это довольно близко к 6,5 часам, или можете быть уверены, что это «6,5 часов до ближайших 5 минут», или что-то подобное. Только диапазоны будут иметь определенный уровень достоверности, связанный с ними.
Glen_b
1
@Glen_b доходит до сути вопроса - мы никогда не можем сказать, что мы уверены, что мы правильно оценили численность населения, а скорее что у нас есть некоторое представление о точности нашего процесса оценки.
Джеймс Стэнли
@angrymonkey Я думаю, что все еще полезно получить концепции, лежащие в основе (смоделированного) подхода повторной выборки. Кроме того, для оценки средних значений не нужны «огромные» размеры выборки - формула для стандартной ошибки среднего значения sample std deviation / square root(n)- квадратный корень из n-части говорит нам, что мы получаем уменьшающуюся отдачу от точности оценки для фиксированных приращений в качестве размера выборки. становится больше (например, перемещение от 10 до 20 человек в выборке повышает точность оценки больше, чем переход от 210 до 220 человек.)
Джеймс Стэнли
здорово ... большое спасибо за помощь. поэтому КИ просто позволяет нам сказать, что я на 95% уверен, что средний человек спит между 6,45 и 6,56 часами в ночь? тогда почему некоторые статьи приводят эти категорические утверждения, как то, что средний человек смотрит телевизор по 4,5 часа в день? безусловно, доверительный интервал составляет примерно 95%, 4,43 и 4,56
mergesort
10
  • σ2/NNN
  • Если вы берете несколько независимых выборок, каждое среднее значение выборки будет нормальным, а среднее значение будет нормальным и будет стремиться к истинному среднему значению.
  • Если ваши сэмплы действительно из одного и того же распределения (например, 100 сэмплов по 10 на каждый), вы сделаете те же выводы, как если бы вы взяли один большой сэмпл из 1000. (Но в реальном мире отдельные сэмплы, вероятно, отличаются друг от друга так, что не может игнорировать; см. «рандомизированный блочный дизайн».)
  • N
  • Если вы возьмете 100 выборок по 10 в каждой, средство выборки будет иметь распределение, которое выглядит более нормальным, чем исходные данные, но менее нормальным, чем распределение общего среднего.
  • Взятие большого образца также приблизит вас к нормальной жизни.
  • Если вы хотите оценить среднее значение популяции, то нет никакой разницы (теоретически), если вы берете большую выборку из 1000 или 100 выборок из 10.
  • Но на практике в теории выборки люди могут разделить выборку по причинам кластеризации, стратификации и других проблем. Затем они принимают во внимание схему выборки при оценке. Но это действительно важно для другого вопроса.
Placidia
источник
в большинстве учебников они дают вам представление о распределении выборки средних значений выборки. Это, по сути, говорит вам: «Послушайте, если вы возьмете много образцов, оно будет нормальным и приблизит среднее значение популяции». Затем они говорят вам, что если вы берете достаточно большие образцы, вы можете выбрать только один. Предполагается ли, что распределение выборки по среднему значению заставит вас поверить, что вы можете взять одну большую выборку? Другими словами, какова цель понимания этого? Это просто, чтобы помочь вам понять интуицию за большой образец? игнорируя идею выборки тео
mergesort
Я думаю, что @ "Джеймс Стэнли" отвечает на это очень хорошо. В любом случае из реальной жизни вы берете выборку, вычисляете среднее значение выборки, и это ваша оценка.
Плацидия
1

Распределением выборки среднего значения является распределение ВСЕХ выборок заданного размера. Среднее значение dist выборки равно среднему значению для населения. Когда мы говорим о выборке из среднего значения для выборок данного размера, мы говорим не об одной выборке или даже о тысяче выборок, а о всех выборках.

Аллен Мозер
источник
0

Выборка dist среднего значения не имеет ничего общего с доверительными интервалами. Это другая концепция. Для dist выборки население может быть нормальным или ненормальным a) Если pop является нормальным, тогда выборочное значение среднего будет нормальным для любого размера выборки. b) Если pop не является нормальным, то 1) диапазон выборки среднего значения НЕ МОЖЕТ считаться нормальным, если размер выборки не превышает 30 или более. Тогда Центральная предельная теорема говорит нам, что выборка dist может считаться нормальной.

Вы говорите о прогнозировании. Прогнозирование тоже не имеет к этому никакого отношения. Вы вставляете слишком много в семпл дист. Дистанция выборки - это просто Все выборки, а затем берется среднее значение. И среднее значение всех этих выборок, mu sub x bar, равно среднему значению популяции, mu и стандартному размеру выборки dist, sigma sub x bar = sigma, деленное на квадратный корень из n. (Мы не будем говорить о конечном поп-поправочном коэффициенте. Примите вашу статистику за номинал. Не читайте слишком много в концепции. Кулак понимает основную концепцию.

PS Сэмпл dist of mean не имеет ничего общего с

Аллен Мозер
источник
Интересно, можно ли этот ответ объединить с вашим первым ответом, а не вводить в качестве другого ответа. Мы обычно предпочитаем, чтобы у вас был 1 ответ на тему. (Однако есть исключения.) Вы можете добавить материал к существующему ответу или внести изменения, щелкнув по серому значку «изменить» в левом нижнем углу.
gung - Восстановить Монику
0

Я думал о проблемах с большими данными и просматривал некоторые из этих сообщений сегодня утром. Я не думаю, что это вообще тривиальная проблема, различие между анализом 1000 данных в одном наборе и анализом 10 наборов из 100. Теоретически , если нулевая гипотеза верна, что данные являются iid, это не делает разница. Тем не менее, кластеризация и шаблоны в данных вообще не рассматриваются, если просто взять среднее из 1000 данных и указать предполагаемое среднее и связанную стандартную ошибку.

Я пришел к выводу, что, просматривая некоторые страницы на stackexchange и wikipedia, я пришел к выводу, что большие данные позволяют увидеть очевидное . Если в популяции есть какие-либо интересные особенности, большой набор данных покажет их как день. Поэтому, если бы у меня был очень большой набор данных, на который я мог бы смотреть визуально, я бы не стал прыгать и принимать краткие итоговые меры без предварительного поиска очень очевидных особенностей. Из моих первых уроков в области статистического вывода меня учили смотреть на графики и визуализации данных как на первый проход. Я не могу подчеркнуть это достаточно. Если набор данных слишком велик для того, чтобы человек мог видеть его на экране, то он должен быть подвергнут дополнительной выборке с разрешением, которое может быть воспринято человеком.

Оливия Григг
источник
Пожалуйста, не подписывайте свои сообщения - это то, для чего предназначено имя пользователя в правом нижнем углу вашего сообщения.
Glen_b