Версия tl; dr Какие успешные стратегии вы используете для обучения распределению выборки (например, среднего значения выборки) на начальном уровне бакалавриата?
Фон
В сентябре я буду преподавать вводный курс статистики для студентов второго курса по общественным наукам (в основном, по политологии и социологии), используя «Основную практику статистики » Дэвида Мура. Это будет пятый раз, когда я преподаю этот курс, и одна проблема, с которой я постоянно сталкиваюсь, заключается в том, что студенты действительно боролись с понятием распределения выборки . Он рассматривается в качестве фона для вывода и следует базовому введению в вероятность, с которой у них, похоже, не возникает проблем после некоторых первоначальных отклонений (и под базовым я имею в виду базовые.- в конце концов, многие из этих студентов были отобраны самостоятельно в конкретный поток курса, потому что они пытались избежать чего-либо даже с неопределенным намеком на «математику»). Я предполагаю, что, вероятно, 60% покидают курс без минимального понимания, около 25% понимают принцип, но не связи с другими концепциями, а остальные 15% полностью понимают.
Основная проблема
Кажется, что проблема студентов в приложении. Трудно объяснить, в чем конкретная проблема, кроме как сказать, что они просто не понимают. Из опроса, который я провел в прошлом семестре, и из ответов на экзамены, я думаю, что часть трудностей заключается в путанице между двумя похожими и похожими звучащими фразами (распределение выборки и распределение выборки), поэтому я не использую фразу «распределение выборки» больше, но, конечно, это то, что, хотя поначалу сбивает с толку, легко понять с небольшим усилием, и в любом случае оно не может объяснить общую путаницу концепции распределения выборки.
(Я понимаю, что это может быть я и мое учение, которое здесь под вопросом! Однако я думаю, что игнорировать эту неудобную возможность разумно, так как некоторые студенты, кажется, понимают это, и в целом все, кажется, делают хорошо ...)
Что я пробовал
Мне пришлось поспорить с администратором бакалавриата в нашем отделе, чтобы ввести обязательные занятия в компьютерном классе, думая, что повторные демонстрации могут быть полезны (до того, как я начал преподавать этот курс, не было никаких вычислений). Хотя я думаю, что это помогает в общем понимании материала курса в целом, я не думаю, что это помогло с этой конкретной темой.
У меня была одна идея - просто не учить этому вообще или не придавать ей особого значения - позиция, отстаиваемая некоторыми (например, Эндрю Гельманом ). Я не нахожу это особенно удовлетворяющим, так как он обладает слабым обучением наименьшему общему знаменателю и, что более важно, отрицает сильных и мотивированных студентов, которые хотят узнать больше о статистическом применении, из реального понимания того, как работают важные концепции (не только распределения выборки! ). С другой стороны, средний ученик, кажется, действительно понимает р-значения, например, поэтому, возможно, им все равно не нужно понимать распределение выборки.
Вопрос
Какие стратегии вы используете для обучения распределению выборки? Я знаю, что есть материалы и обсуждения (например, здесь и здесь, и в этом документе, который открывает файл PDF ), но мне просто интересно, могу ли я получить некоторые конкретные примеры того, что работает для людей (или я думаю, что даже не работает так что я буду знать, чтобы не попробовать!). Мой план сейчас, так как я планирую свой курс на сентябрь, состоит в том, чтобы последовать совету Гельмана и «преуменьшить» распределение выборки. Я буду преподавать это, но я заверяю студентов, что это своего рода тема, предназначенная только для вашего сведения, и не будет отображаться на экзамене (за исключением, возможно, дополнительного вопроса ?!). Тем не менее, мне действительно интересно услышать другие подходы, которые люди использовали.
источник
Ответы:
По моему мнению, выборочные распределения являются ключевой идеей статистики 101. Вы можете также пропустить курс или пропустить этот вопрос. Тем не менее, я очень хорошо знаком с тем фактом, что ученики просто не понимают, что бы вы ни делали. У меня есть ряд стратегий. Это может занять много времени, но я рекомендую пропустить / сократить другие темы, чтобы убедиться, что они получают представление о распределении выборки. Вот несколько советов:
Sys.sleep()
утверждения, эти паузы дают мне время, чтобы объяснить, что происходит на каждом этапе.)источник
windows(...)
наquartz(...)
). Ваше мнение об укреплении концепции в течение семестра особенно полезно. Я думаю, что следование этим рекомендациям действительно будет полезно.Мне посчастливилось напомнить студентам, что распределение выборки - это распределение статистики теста на основе случайной выборки . У меня есть студенты, которые думают о том, что произойдет в процессе выборки, был предвзятым - сосредоточив внимание на крайних случаях. Например, как будет выглядеть «распределение выборки», если наш процесс выборки всегда выбирает одно и то же (специальное) подмножество. Затем я бы рассмотрел, как будет выглядеть «распределение выборки», если наш процесс выборки выберет только два конкретных (специальных) подмножества (каждое с вероятностью 1/2). Они довольно просты для работы со средним значением выборки (особенно для определенных вариантов «специальных» для основной популяции).
Я думаю, что для некоторых (явно не всех) студентов это, кажется, помогает им понять, что распределение выборки может сильно отличаться от распределения населения. Я также использовал пример центральной предельной теоремы, который Майкл Черник упомянул с некоторым успехом - особенно с распределениями, которые явно не являются нормальными (симуляции действительно помогают).
источник
Я начну с учения о вероятности. Я не вхожу во многие формальные определения и правила (просто не хватает времени), но показываю вероятность с помощью симуляции. Задача Монти Холла - отличный пример для использования. Я показываю через симуляцию (а затем следую логике), что стратегия переключения дает более высокую вероятность выигрыша. Я подчеркиваю, что с помощью симуляции мы смогли много раз сыграть в игру (без риска и вознаграждения), чтобы оценить стратегии, и это позволяет нам выбирать лучшую стратегию (если мы когда-либо окажемся в такой ситуации). Выбор лучшей стратегии не гарантирует победу, но дает нам больше шансов и помогает выбирать между стратегиями. Затем я укажу, что это применимо к остальной части курса: это поможет нам выбрать стратегии, в которых есть случайный компонент,
Затем, когда я представляю распределение выборки, я снова начинаю с симуляции и говорю, что мы хотим разработать стратегии. Как и в случае с проблемой Монти Холла, в реальной жизни мы сможем взять только 1 образец, но мы можем смоделировать несколько образцов, чтобы помочь нам разработать стратегию. Затем я показываю моделирование многих выборок из одной и той же совокупности (в данном случае известной совокупности) и показываю отношения, которые мы узнаем из моделирования (гистограмма средних значений выборки), то есть средние значения выборки сгруппированы вокруг истинного среднего значения (среднее значение означает среднее) меньшее стандартное отклонение распределения выборки для больших выборок, более нормальное для больших выборок. Все время я говорю о том, чтобы повторять идеи симуляции для выбора стратегий, точно такую же идею, что и проблема Монти Холла, применяемая сейчас к образцам средств вместо игровых шоу. Затем я показываю официальные правила и говорю, что в дополнение к симуляциям они могут быть доказаны математически, но я не буду приводить доказательства всему классу. Я предлагаю, чтобы, если они действительно хотят увидеть математические доказательства, они могут прийти в рабочее время, и я покажу им математику (никто из вступительных классов еще не занимался этим).
Затем, когда мы дойдем до логического вывода, я скажу, что мы сможем взять только 1 сэмпл в реальном мире, точно так же, как мы можем играть в игру только 1 раз (максимум), но мы можем использовать стратегии, которые мы узнали из симуляции множество образцов для разработки стратегии (z-тест, t-тест или формула CI), которая даст нам выбранные свойства (шанс быть правильным). Как и в случае с игрой, мы не знаем, прежде чем начать, будет ли наш окончательный вывод верным (и, как правило, мы до сих пор не знаем), но мы знаем из моделирования и распределения выборки, что использует долгосрочная вероятность эта стратегия.
У 100% студентов есть идеальное понимание? нет, но я думаю, что многие из них получают общее представление о том, что мы можем использовать симуляцию и математические правила (которые они рады, что им не нужно смотреть, просто доверяют книге / инструктору), чтобы выбрать стратегию / формулу, которая имеет желаемые свойства.
источник
Это очень важный и продуманный вопрос с вашей стороны. Я действительно думаю, что концепция распределения выборки является базовой для понимания умозаключений и, безусловно, должна преподаваться.
Я преподавал много вводных курсов статистики, особенно в области биостатистики. Я преподаю концепцию распределения выборки и у меня есть подходы, которые я считаю хорошими, но на самом деле у меня нет хороших отзывов, чтобы определить, насколько успешно я с ними работал. В любом случае, вот что я делаю.
Сначала я попытаюсь дать простое определение. Распределение выборки - это распределение, которое будет иметь статистика теста, если процесс выборки будет повторяться много раз. Это зависит от распределения населения, из которого предполагается, что данные будут получены.
Хотя я думаю, что это определение настолько простое, насколько я могу дать, я понимаю, что оно не очень простое, и понимание концепции не придет сразу в большинстве случаев. Так что следуйте этому базовому примеру, который подкрепляет сказанное определением.
Затем я хотел бы дополнить это важным приложением, центральной предельной теоремой. В самых простых терминах центральная предельная теорема говорит, что для многих ненормальных распределений распределение выборки для среднего значения выборки будет близко к нормальному распределению, когда размер выборки n большой. Чтобы проиллюстрировать это, возьмем такие распределения, как равномерное (бимодальное распределение также было бы неплохо посмотреть) и покажем, как выглядит распределение выборки для среднего значения для размеров выборки 3, 4, 5, 10 и 100. Учащийся может увидеть, как форма распределения изменяется от чего-то, что совсем не выглядит нормальным для малых n, до чего-то, что очень похоже на нормальное распределение для больших n.
Чтобы убедить учащегося в том, что в этих распределениях выборки действительно есть эти формы, пусть учащиеся проводят моделирование, генерирующее множество выборок различных размеров, и вычисляют средние значения выборки. Затем попросите их сгенерировать гистограммы для этих оценок среднего значения. Я также предложил бы применить физическую демонстрацию, показывающую, как это работает, используя доску quincunx. При этом вы указываете, как устройство генерирует выборки из суммы независимых испытаний Бернулли, где вероятность перехода влево или вправо на каждом уровне равна 1/2. Результирующие стопки внизу представляют гистограмму для этого распределения выборки (биномиального), и его форма может выглядеть примерно нормальной после того, как большое количество шаров приземлится на дне квинкунса,
источник
Я думаю, что было бы хорошо положить «мешок» чисел в сумку (например, от 1 до 10). Вы можете делать свои собственные плитки, или использовать монеты, игральные карты и т. Д.
Попросите студентов сидеть в группах (5 или более), и каждый выберет номер из сумки. Затем каждая группа вычисляет среднее значение для своей группы. Скажите им, что ранее вы определили среднее значение для населения, нанесите его на гистограмму и попросите прийти члена каждой группы и нарисуйте свое среднее значение на исторической диаграмме вокруг этого. Попросите их сделать это несколько раз, чтобы «построить гистограмму».
После этого вы сможете графически отобразить изменение средних значений выборки по среднему значению для населения. Рассчитайте изменение средних значений выборки по сравнению со средним значением для населения. Я думаю, что ученик отчетливо помнит выполнение такого практического упражнения, и в результате концепция вариаций выборки вернется к ним легче. Это может звучать немного по-детски, но студентам иногда просто нравится делать что-то активное ... нет много возможностей сделать это в статистике.
источник