Стратегии обучения распределению выборки

30

Версия tl; dr Какие успешные стратегии вы используете для обучения распределению выборки (например, среднего значения выборки) на начальном уровне бакалавриата?

Фон

В сентябре я буду преподавать вводный курс статистики для студентов второго курса по общественным наукам (в основном, по политологии и социологии), используя «Основную практику статистики » Дэвида Мура. Это будет пятый раз, когда я преподаю этот курс, и одна проблема, с которой я постоянно сталкиваюсь, заключается в том, что студенты действительно боролись с понятием распределения выборки . Он рассматривается в качестве фона для вывода и следует базовому введению в вероятность, с которой у них, похоже, не возникает проблем после некоторых первоначальных отклонений (и под базовым я имею в виду базовые.- в конце концов, многие из этих студентов были отобраны самостоятельно в конкретный поток курса, потому что они пытались избежать чего-либо даже с неопределенным намеком на «математику»). Я предполагаю, что, вероятно, 60% покидают курс без минимального понимания, около 25% понимают принцип, но не связи с другими концепциями, а остальные 15% полностью понимают.

Основная проблема

Кажется, что проблема студентов в приложении. Трудно объяснить, в чем конкретная проблема, кроме как сказать, что они просто не понимают. Из опроса, который я провел в прошлом семестре, и из ответов на экзамены, я думаю, что часть трудностей заключается в путанице между двумя похожими и похожими звучащими фразами (распределение выборки и распределение выборки), поэтому я не использую фразу «распределение выборки» больше, но, конечно, это то, что, хотя поначалу сбивает с толку, легко понять с небольшим усилием, и в любом случае оно не может объяснить общую путаницу концепции распределения выборки.

(Я понимаю, что это может быть я и мое учение, которое здесь под вопросом! Однако я думаю, что игнорировать эту неудобную возможность разумно, так как некоторые студенты, кажется, понимают это, и в целом все, кажется, делают хорошо ...)

Что я пробовал

Мне пришлось поспорить с администратором бакалавриата в нашем отделе, чтобы ввести обязательные занятия в компьютерном классе, думая, что повторные демонстрации могут быть полезны (до того, как я начал преподавать этот курс, не было никаких вычислений). Хотя я думаю, что это помогает в общем понимании материала курса в целом, я не думаю, что это помогло с этой конкретной темой.

У меня была одна идея - просто не учить этому вообще или не придавать ей особого значения - позиция, отстаиваемая некоторыми (например, Эндрю Гельманом ). Я не нахожу это особенно удовлетворяющим, так как он обладает слабым обучением наименьшему общему знаменателю и, что более важно, отрицает сильных и мотивированных студентов, которые хотят узнать больше о статистическом применении, из реального понимания того, как работают важные концепции (не только распределения выборки! ). С другой стороны, средний ученик, кажется, действительно понимает р-значения, например, поэтому, возможно, им все равно не нужно понимать распределение выборки.

Вопрос

Какие стратегии вы используете для обучения распределению выборки? Я знаю, что есть материалы и обсуждения (например, здесь и здесь, и в этом документе, который открывает файл PDF ), но мне просто интересно, могу ли я получить некоторые конкретные примеры того, что работает для людей (или я думаю, что даже не работает так что я буду знать, чтобы не попробовать!). Мой план сейчас, так как я планирую свой курс на сентябрь, состоит в том, чтобы последовать совету Гельмана и «преуменьшить» распределение выборки. Я буду преподавать это, но я заверяю студентов, что это своего рода тема, предназначенная только для вашего сведения, и не будет отображаться на экзамене (за исключением, возможно, дополнительного вопроса ?!). Тем не менее, мне действительно интересно услышать другие подходы, которые люди использовали.

smillig
источник
Вы также можете сделать это с ненормальным распределением населения, чтобы показать центральную предельную теорему
user41270
извините, это должен был быть комментарий к моему ответу ниже.
user41270

Ответы:

23

По моему мнению, выборочные распределения являются ключевой идеей статистики 101. Вы можете также пропустить курс или пропустить этот вопрос. Тем не менее, я очень хорошо знаком с тем фактом, что ученики просто не понимают, что бы вы ни делали. У меня есть ряд стратегий. Это может занять много времени, но я рекомендую пропустить / сократить другие темы, чтобы убедиться, что они получают представление о распределении выборки. Вот несколько советов:

  • Скажем однозначно : сначала я прямо упомяну, что есть 3 различных распределения, которые нас интересуют: распределение населения, распределение выборки и распределение выборки. Я говорю это снова и снова на протяжении урока, а затем снова и снова на протяжении всего курса. Каждый раз , когда я говорю эти термины я подчеркиваю отличительное окончание: образцы на PLE , samp- лин . (Да, студентам это надоедает; они тоже понимают это.)
  • Используйте рисунки (рисунки): у меня есть набор стандартных рисунков, которые я использую каждый раз, когда говорю об этом. У этого есть три распределения, изображенные отчетливо и обычно маркированные. (Метки, обозначенные этим рисунком, находятся на слайде PowerPoint и содержат краткие описания, поэтому они здесь не отображаются, но, очевидно, это: население сверху, затем выборки, затем выборочное распределение.)
    введите описание изображения здесь
  • Дайте студент мероприятие: Первый раз , когда вы представить эту концепцию, либо принести в рулоне Nickles (некоторые кварталы могут исчезнуть) или связку из 6-кубика. Попросите учеников объединиться в небольшие группы, составить набор из 10 значений и усреднить их. Затем вы можете сделать гистограмму на доске или с помощью Excel.
  • Используйте анимацию (симуляции): я пишу некоторый (комично неэффективный) код в R для генерации данных и отображения их в действии. Эта часть особенно полезна при переходе к объяснению центральной предельной теоремы. (Обратите внимание на Sys.sleep()утверждения, эти паузы дают мне время, чтобы объяснить, что происходит на каждом этапе.)
N = 10
number_of_samples = 1000


iterations  = c(3, 7, number_of_samples)  
breakpoints = seq(10, 91, 3)  
meanVect    = vector()  
x           = seq(10, 90)  
height      = 30/dnorm(50, mean=50, sd=10)  
y           = height*dnorm(x, mean=50, sd=10)  

windows(height=7, width=5)  
par(mfrow=c(3,1), omi=c(0.5,0,0,0), mai=c(0.1, 0.1, 0.2, 0.1))  

for(i in 1:iterations[3]) {  
  plot(x,y, type="l", col="blue", axes=F, xlab="", ylab="")  
  segments(x0=20, y0=0, x1=20, y1=y[11], col="lightgray")  
  segments(x0=30, y0=0, x1=30, y1=y[21], col="gray")  
  segments(x0=40, y0=0, x1=40, y1=y[31], col="darkgray")  
  segments(x0=50, y0=0, x1=50, y1=y[41])  
  segments(x0=60, y0=0, x1=60, y1=y[51], col="darkgray")  
  segments(x0=70, y0=0, x1=70, y1=y[61], col="gray")  
  segments(x0=80, y0=0, x1=80, y1=y[71], col="lightgray")  
  abline(h=0)  

  if(i==1) {  
    Sys.sleep(2)  
  }  
  sample = rnorm(N, mean=50, sd=10)  
  points(x=sample, y=rep(1,N), col="green", pch="*")  

  if(i<=iterations[1]) {  
    Sys.sleep(2)  
  }  
  xhist1 = hist(sample, breaks=breakpoints, plot=F)  
  hist(sample, breaks=breakpoints, axes=F, col="green", xlim=c(10,90),  
       ylim=c(0,N), main="", xlab="", ylab="")  
  if(i==iterations[3]) {  
    abline(v=50)  
  }  

  if(i<=iterations[2]) {  
    Sys.sleep(2)  
  }  
  sampleMean = mean(sample)  
  segments(x0=sampleMean, y0=0, x1=sampleMean,   
           y1=max(xhist1$counts)+1, col="red", lwd=3)  

  if(i<=iterations[1]) {  
    Sys.sleep(2)  
  }  
  meanVect = c(meanVect, sampleMean)  
  hist(meanVect, breaks=x, axes=F, col="red", main="",   
       xlab="", ylab="", ylim=c(0,((N/3)+(0.2*i))))  
  if(i<=iterations[2]) {  
    Sys.sleep(2)  
  }  
}  

Sys.sleep(2)  
xhist2 = hist(meanVect, breaks=x, plot=F)  
xMean  = round(mean(meanVect), digits=3)  
xSD    = round(sd(meanVect), digits=3)  
histHeight = (max(xhist2$counts)/dnorm(xMean, mean=xMean, sd=xSD))  
lines(x=x, y=(histHeight*dnorm(x, mean=xMean, sd=xSD)),   
      col="yellow", lwd=2)  
abline(v=50)  

txt1 = paste("population mean = 50     sampling distribution mean = ",  
             xMean, sep="")  
txt2 = paste("SD = 10     10/sqrt(", N,") = 3.162     SE = ", xSD,  
            sep="")  
mtext(txt1, side=1, outer=T)  
mtext(txt2, side=1, line=1.5, outer=T)  
  • Повторяйте эти концепции на протяжении всего семестра: я поднимаю идею распределения выборки снова каждый раз, когда мы говорим о следующем предмете (хотя, как правило, только очень кратко). Самое важное для этого - когда вы учите ANOVA, поскольку в качестве случая с нулевой гипотезой действительно существует ситуация, в которой вы отбирали выборку из одного и того же распределения популяции несколько раз, и ваш набор групповых средств действительно является эмпирическим распределением выборки. (Пример этого см. В моем ответе здесь: Как работает стандартная ошибка?. )
Gung - Восстановить Монику
источник
1
Это хороший ответ (+1). Я особенно думаю, что упражнения и симуляции очень полезны для преподавания этого предмета. Во вводном курсе, который я преподавал несколько раз, мы использовали веб-апплет, который позволял студентам визуализировать, как рассчитывается статистика из выборки и как гистограмма распределения выборки начинает формироваться, когда вы повторяете это много раз. Я думаю, что это занятие помогло намного больше, чем все, что я когда-либо говорил студентам, когда дело дошло до понимания распределения выборки :)
Макрос
+1 Спасибо Гунг, это отличный ответ! Спасибо за то, что «отправили мне код» (пользователи Mac заменили windows(...)на quartz(...)). Ваше мнение об укреплении концепции в течение семестра особенно полезно. Я думаю, что следование этим рекомендациям действительно будет полезно.
Смиллиг
(+1) для мантры «3-распределения» и для реляционной картины. Никто не может понять концепцию, не поняв сначала, что это действительно отдельная концепция.
Алекос Пападопулос
Я нашел для этого очень полезной страницу « онлайновой статистики » Университета Райса в разделе выборки. В оригинальной версии, которой много лет, был Java-апплет, но я рад, что они недавно переделали его в Javascript. То, как это работает, по сути идентично вашей диаграмме.
Серебряная рыба
8

Мне посчастливилось напомнить студентам, что распределение выборки - это распределение статистики теста на основе случайной выборки . У меня есть студенты, которые думают о том, что произойдет в процессе выборки, был предвзятым - сосредоточив внимание на крайних случаях. Например, как будет выглядеть «распределение выборки», если наш процесс выборки всегда выбирает одно и то же (специальное) подмножество. Затем я бы рассмотрел, как будет выглядеть «распределение выборки», если наш процесс выборки выберет только два конкретных (специальных) подмножества (каждое с вероятностью 1/2). Они довольно просты для работы со средним значением выборки (особенно для определенных вариантов «специальных» для основной популяции).

Я думаю, что для некоторых (явно не всех) студентов это, кажется, помогает им понять, что распределение выборки может сильно отличаться от распределения населения. Я также использовал пример центральной предельной теоремы, который Майкл Черник упомянул с некоторым успехом - особенно с распределениями, которые явно не являются нормальными (симуляции действительно помогают).

shoda
источник
У Грэма Куксона есть хорошее классное упражнение, которое опубликовано в ответе «Какое объяснение вашего любимого непрофессионала для сложной статистической концепции?» - сообщество вики.
Shoda
+1, хорошая идея - говорить о том, каким будет выборочное распределение неслучайных выборок.
gung - Восстановить Монику
+1 Отличная идея о выборе подмножества! Я думаю, что это ссылка, которую вы ссылаетесь на @shoda: stats.stackexchange.com/a/554/9249
smillig
7

Я начну с учения о вероятности. Я не вхожу во многие формальные определения и правила (просто не хватает времени), но показываю вероятность с помощью симуляции. Задача Монти Холла - отличный пример для использования. Я показываю через симуляцию (а затем следую логике), что стратегия переключения дает более высокую вероятность выигрыша. Я подчеркиваю, что с помощью симуляции мы смогли много раз сыграть в игру (без риска и вознаграждения), чтобы оценить стратегии, и это позволяет нам выбирать лучшую стратегию (если мы когда-либо окажемся в такой ситуации). Выбор лучшей стратегии не гарантирует победу, но дает нам больше шансов и помогает выбирать между стратегиями. Затем я укажу, что это применимо к остальной части курса: это поможет нам выбрать стратегии, в которых есть случайный компонент,

Затем, когда я представляю распределение выборки, я снова начинаю с симуляции и говорю, что мы хотим разработать стратегии. Как и в случае с проблемой Монти Холла, в реальной жизни мы сможем взять только 1 образец, но мы можем смоделировать несколько образцов, чтобы помочь нам разработать стратегию. Затем я показываю моделирование многих выборок из одной и той же совокупности (в данном случае известной совокупности) и показываю отношения, которые мы узнаем из моделирования (гистограмма средних значений выборки), то есть средние значения выборки сгруппированы вокруг истинного среднего значения (среднее значение означает среднее) меньшее стандартное отклонение распределения выборки для больших выборок, более нормальное для больших выборок. Все время я говорю о том, чтобы повторять идеи симуляции для выбора стратегий, точно такую ​​же идею, что и проблема Монти Холла, применяемая сейчас к образцам средств вместо игровых шоу. Затем я показываю официальные правила и говорю, что в дополнение к симуляциям они могут быть доказаны математически, но я не буду приводить доказательства всему классу. Я предлагаю, чтобы, если они действительно хотят увидеть математические доказательства, они могут прийти в рабочее время, и я покажу им математику (никто из вступительных классов еще не занимался этим).

Затем, когда мы дойдем до логического вывода, я скажу, что мы сможем взять только 1 сэмпл в реальном мире, точно так же, как мы можем играть в игру только 1 раз (максимум), но мы можем использовать стратегии, которые мы узнали из симуляции множество образцов для разработки стратегии (z-тест, t-тест или формула CI), которая даст нам выбранные свойства (шанс быть правильным). Как и в случае с игрой, мы не знаем, прежде чем начать, будет ли наш окончательный вывод верным (и, как правило, мы до сих пор не знаем), но мы знаем из моделирования и распределения выборки, что использует долгосрочная вероятность эта стратегия.

У 100% студентов есть идеальное понимание? нет, но я думаю, что многие из них получают общее представление о том, что мы можем использовать симуляцию и математические правила (которые они рады, что им не нужно смотреть, просто доверяют книге / инструктору), чтобы выбрать стратегию / формулу, которая имеет желаемые свойства.

Грег Сноу
источник
+1 Спасибо, что поделились этим советом. Я думаю, что вы прибили это к проблеме, заключающейся в связи между тем, что мы можем рассказать о том, что такое распределение выборки, и тем, как это можно экстраполировать на вывод из одной выборки. Как вы (и другие здесь) предложили, важно повторять концепцию снова и снова на протяжении всего курса, но это не часто делается (по крайней мере, не мной, вероятно, потому что я уже нахожу это достаточно трудным, чтобы вписаться во все, что я хочу, не говоря уже о возвращении к понятиям, уже охваченным!).
Смиллиг
3

Это очень важный и продуманный вопрос с вашей стороны. Я действительно думаю, что концепция распределения выборки является базовой для понимания умозаключений и, безусловно, должна преподаваться.

Я преподавал много вводных курсов статистики, особенно в области биостатистики. Я преподаю концепцию распределения выборки и у меня есть подходы, которые я считаю хорошими, но на самом деле у меня нет хороших отзывов, чтобы определить, насколько успешно я с ними работал. В любом случае, вот что я делаю.

Сначала я попытаюсь дать простое определение. Распределение выборки - это распределение, которое будет иметь статистика теста, если процесс выборки будет повторяться много раз. Это зависит от распределения населения, из которого предполагается, что данные будут получены.

Хотя я думаю, что это определение настолько простое, насколько я могу дать, я понимаю, что оно не очень простое, и понимание концепции не придет сразу в большинстве случаев. Так что следуйте этому базовому примеру, который подкрепляет сказанное определением.

22

Затем я хотел бы дополнить это важным приложением, центральной предельной теоремой. В самых простых терминах центральная предельная теорема говорит, что для многих ненормальных распределений распределение выборки для среднего значения выборки будет близко к нормальному распределению, когда размер выборки n большой. Чтобы проиллюстрировать это, возьмем такие распределения, как равномерное (бимодальное распределение также было бы неплохо посмотреть) и покажем, как выглядит распределение выборки для среднего значения для размеров выборки 3, 4, 5, 10 и 100. Учащийся может увидеть, как форма распределения изменяется от чего-то, что совсем не выглядит нормальным для малых n, до чего-то, что очень похоже на нормальное распределение для больших n.

Чтобы убедить учащегося в том, что в этих распределениях выборки действительно есть эти формы, пусть учащиеся проводят моделирование, генерирующее множество выборок различных размеров, и вычисляют средние значения выборки. Затем попросите их сгенерировать гистограммы для этих оценок среднего значения. Я также предложил бы применить физическую демонстрацию, показывающую, как это работает, используя доску quincunx. При этом вы указываете, как устройство генерирует выборки из суммы независимых испытаний Бернулли, где вероятность перехода влево или вправо на каждом уровне равна 1/2. Результирующие стопки внизу представляют гистограмму для этого распределения выборки (биномиального), и его форма может выглядеть примерно нормальной после того, как большое количество шаров приземлится на дне квинкунса,

Майкл Р. Черник
источник
Спасибо за ценные предложения. Мне действительно нравится идея реальной физической демонстрации, и я обязательно попробую реализовать что-то вроде этого (если предположить, что смогу отвлечь их от Facebook достаточно долго ...), хотя связь с суммой независимых испытаний Бернулли, вероятно, немного превышает их головы! Спасибо.
Смиллиг
1
Но наблюдение формы нормального распределения из эксперимента действительно открывает глаза. Я впервые увидел один из них в Музее науки в Чикаго, когда я был ребенком (около 10 лет). Тогда ничего не знал о статистике, но никогда не забывал кривую.
Майкл Р. Черник
1

Я думаю, что было бы хорошо положить «мешок» чисел в сумку (например, от 1 до 10). Вы можете делать свои собственные плитки, или использовать монеты, игральные карты и т. Д.

Попросите студентов сидеть в группах (5 или более), и каждый выберет номер из сумки. Затем каждая группа вычисляет среднее значение для своей группы. Скажите им, что ранее вы определили среднее значение для населения, нанесите его на гистограмму и попросите прийти члена каждой группы и нарисуйте свое среднее значение на исторической диаграмме вокруг этого. Попросите их сделать это несколько раз, чтобы «построить гистограмму».

После этого вы сможете графически отобразить изменение средних значений выборки по среднему значению для населения. Рассчитайте изменение средних значений выборки по сравнению со средним значением для населения. Я думаю, что ученик отчетливо помнит выполнение такого практического упражнения, и в результате концепция вариаций выборки вернется к ним легче. Это может звучать немного по-детски, но студентам иногда просто нравится делать что-то активное ... нет много возможностей сделать это в статистике.

user41270
источник