Как объяснить проверку гипотез для подростков менее чем за 10 минут?

18

Уже больше года я провожу один час урока "вкус к статистике". Каждый раз, когда ко мне приходит другая группа детей, я даю им урок.

Тема занятия заключается в том, что мы проводим эксперимент, в котором 10 детей (которые любят пить кока-колу) получают две (без маркировки) чашки, одну с кока-колой и одну с пепси. Детей просят определить, по вкусу и запаху, в какой чашке содержится напиток кока-кола.

Затем мне нужно объяснить им, как решить, угадывают ли дети или действительно ли они (или, по крайней мере, их достаточно) способны почувствовать разницу. Достаточно ли хороши 10 из 10 успехов? как насчет 7 из 10?

Даже после того, как я дал этот класс десятки раз (в разных вариациях), я все еще не чувствую, что знаю, как донести концепцию таким образом, чтобы большинство класса ее поняли.

Если у вас есть какие-либо идеи относительно того, как концепция проверки гипотез, нулевой гипотезы, альтернативной гипотезы, областей отклонения и т. Д. Может быть объяснена простым (!) И интуитивно понятным способом - мне бы хотелось узнать, как это сделать.

Таль Галили
источник
1
Иногда размышления о «почему» помогают лучше понять «как», поэтому вы можете проверить stats.stackexchange.com/questions/6966/…
Тим
5
(+1) Я думаю, это зависит от того, каково ваше определение 10 минут !
кардинал
1
Несколько недель назад я попытался ответить на этот вопрос - или, по крайней мере, один из них очень понравился - на stats.stackexchange.com/a/130772 . Разве этот поток не является дубликатом этого?
whuber
1
@ Cardinal - буквально 10 минут. Для этого типа темы, а также для людей без фона - это ОЧЕНЬ короткое время. --------------- Уважаемый whuber - мне понравился твой ответ, но было бы здорово, если бы ученики знали, какова вероятность и какова связь между плотностью и площадью. Это концепции, которые преподаются студентам, но не учащимся старших классов. Я не хочу, чтобы они в полной мере понимали проверку гипотез, но чтобы их было достаточно, чтобы они могли почувствовать это при принятии решения о том, что означает каждая область отклонения.
Тал Галили
4
Спасибо за разъяснения, Тал. Вы по-прежнему указываете, что другая ветка является дубликатом вашего вопроса, но вы просто не нашли адекватного ответа там. Хороший способ отличить ваш вопрос от этого - предоставить конкретные требования об уровне экспозиции и о том, что, как мы можем предположить, знает аудитория, так же, как вы начали делать в своем комментарии.
whuber

Ответы:

10

Я думаю, что вы должны начать с того, чтобы спросить их, что, по их мнению, действительно означает сказать о человеке, который способен определить разницу между кока-колой и пепси. Что может сделать такой человек, чего не могут другие?

Большинство из них не будут иметь такого определения и не смогут его дать, если их попросят. Однако смысл этой фразы в том, что нам дает статистика, и это то, что вы можете привнести в свой класс «вкус к статистике».

Один из пунктов статистики - дать точный ответ на вопрос: «что значит сказать о ком-то, что он или она способен определить разницу между кока-колой и пепси»

Ответ таков: он или она лучше, чем машина для гадания, чтобы классифицировать чашки в слепом тесте. Гадалка не может отличить, она просто угадывает все время. Угадайка - полезное изобретение для нас, потому что мы знаем, что она не обладает способностью. Результаты гадания полезны, потому что они показывают, чего нам следует ожидать от человека, которому не хватает способности, которую мы проверяем.

Чтобы проверить, способен ли человек определить разницу между кока-колой и пепси, нужно сравнить его или ее классификацию чашек в слепом тесте с классификацией, которую может сделать машина для гадания. Только если он / она лучше, чем машина гадания, он / она может определить разницу.

Как тогда вы определяете, является ли один результат лучше другого? Что если они почти одинаковые?

Если два человека классифицируют небольшое количество чашек, несправедливо будет говорить, что одно лучше другого, если результаты почти одинаковы. Возможно, победителю сегодня просто повезло, и результаты были бы противоположными, если бы соревнование повторилось завтра?

Если мы хотим получить достоверный результат, он не может быть основан на крошечном количестве классификаций, потому что тогда случайность может решить результат. Помните, вам не нужно быть идеальным, чтобы обладать способностями, вы просто должны быть лучше, чем догадываясь. На самом деле, если количество классификаций слишком мало, даже человек, который всегда правильно идентифицирует кока-колу, не сможет показать, что он / она лучше, чем машина гадания. Например, если нужно классифицировать только одну чашку, даже у угадывающего автомата будет 50-процентная вероятность полностью правильной классификации. Это нехорошо, потому что это означает, что в 50 процентах испытаний мы бы ошибочно заключили, что хороший идентификатор кока-колы не лучше, чем машина гадания. Очень несправедливо

Чем больше чашек будет классифицировано, тем больше будет возможностей раскрыть неспособность угадывающего устройства и тем больше будет возможностей показать хороший идентификатор кока-колы.

10 чашек может быть хорошим местом для начала. Сколько правильных ответов должен человек, чтобы показать, что он или она лучше машины?

Спросите их, что они догадаются.

Затем пусть они используют машину и выясняют, насколько она хороша, т.е. пусть все ученики генерируют серию из десяти догадок, например. используя кости или генератор случайных чисел на смартфоне. Чтобы быть педагогическим, вы должны подготовить серию из десяти правильных ответов, с которыми должны быть оценены предположения.

Запишите все результаты на доске. Распечатайте отсортированные результаты на доске. Объясните, что человек должен быть лучше, чем 95 процентов этих результатов, прежде чем статистик признает свою способность определять разницу между кока-колой и пепси. Нарисуйте линию, которая отделяет 95% худших результатов от лучших 5% результатов.

Затем пусть несколько учеников попробуют классифицировать 10 чашек. К настоящему времени ученики должны знать, сколько им нужно права, чтобы доказать, что они могут различить.

Все это не совсем выполнимо за 10 минут.

Ханс Экбранд
источник
2
Спасибо, Ганс. Мне нравится ваш ответ по нескольким причинам. 1) Потому что вы привносите новую идею в таблицу «чтобы дети соревновались с машиной для гадания». Я признаю, что мысль пришла мне в голову, но ваш ответ укрепляет мое мнение, что это может сработать лучше, чем заставить их конкурировать с теоретическим распределением нулевой гипотезы p = .5. 2) Потому что вы понимаете, что не все, что вы предлагаете, выполнимо за 10 минут :)
Тал Галили
2
Спасибо Тал. а) Я думаю, что машина гадания намного более интуитивна, чем теоретическое распределение. б) Я надеюсь, что вы можете потратить больше 10 минут на проверку гипотез.
Ханс Экбранд
Почему 95%, ха-ха?
Марк Л. Стоун
2

Работа с газировкой звучит забавно, и проверка того, могут ли подростки действительно определить разницу между газировками, имеет смысл, если у вас есть достаточные знания о проверке гипотез. Проблема может заключаться в том, что этот вопрос: «Можете ли вы сказать разницу между газированными напитками?» это осложняется множеством других вещей в умах подростков, таких как «кто хорош, а кто плох в тестировании газированных напитков?», «есть ли какая-то разница между газированными напитками?»

Я никогда не учил статистику подростков, но я всегда мечтал об использовании загруженного кубика или смещенной монеты. Умереть интереснее, но статистически сложнее. В примере с монетой монета является или не является честной. Нет ничего хорошего в подбрасывании монет. Там не решить, будь то головы или хвосты.

Если мы подбрасываем монету для того, кто выигрывает 100 долларов, а она выпадает из головы (вы выигрываете!), Я могу сказать: «Эй. Откуда я знаю, честна ли эта монета? Держу пари, что вы фальсифицировали конкурентов!». Вы говорите: «О да? Докажите это». Довольно очевидное решение состоит в том, чтобы перевернуть монету снова и снова, чтобы увидеть, поднимается ли она больше голов, чем хвостов. Мы переворачиваем это, и оно приходит в голову. "Ахха! Я говорю. Видишь! Это смещено к головам!" И так далее.

Хороших пристрастных монет не существует, но пристрастные кости есть - их можно купить на Amazon. Вы можете предложить студентам приз, если они могут выиграть некоторое количество бросков. Но вы знаете, что победите. Они будут сердиться. Вы говорите, хорошо, я дам вам приз, если вы сможете доказать, что этот кубик предвзят, с 95% уверенностью.

Тогда переходите к содовой. Призом может быть даже газированная вечеринка! «Эй, интересно, вы, ребята, можете сказать разницу между коксом и пепси ...»

tim.farkas
источник
6
« Нет ничего хорошего в том, чтобы подбрасывать монеты », - я думаю, что, наблюдая за переворотом Перси Диакониса, я думаю, что это возможно.
Glen_b
га. теперь я собираюсь пойти попытаться получить хорошее в этом!
tim.farkas
1
Диаконис - это статистика и маг. Есть видео о том, как он демонстрирует это (переворачивает головы, когда хочет) на YouTube.
Glen_b
Привет Тим. Вы приносите хорошие очки, но они не касаются моего вопроса напрямую. Учитывая, что ваши учащиеся правильно выполнили x из 10 тестов (тест выбирает правильную марку на основе вкуса) - как вы можете объяснить, почему вы решили, что они хороши / плохи при принятии этого решения?
Тал Галили
Снова вы можете использовать подбрасывание монет. Если они делают один вкус и получают его правильно, это не очень убедительно, так как если вы подбрасываете монету, она должна быть «правильной» в 50% случаев! если вы сделаете это правильно дважды, вероятность получить это случайно будет такой же, как если бы вы взяли две головы = .5 * .5 = .25. 3 раза подряд -. 125, 4 - .0625, 5 - .0313. Вы должны выбрать уровень доверия, который вы хотите. на 50% достаточно? как насчет 25%? Р. Фишер говорит, что 95% уверены, что это достаточно хорошо, и это то, что используют многие ученые. Технически это называется знаковым тестом. См. ниже.
tim.farkas
2

Рассмотрим кого-то, кто выполняет целевую практику с дробовиком, который стреляет очередями из гранул в направлении ствола.

Нулевая гипотеза: я хороший стрелок, и мой ствол точно в цель. Не слева, не справа, а прямо на это. Моя ошибка 0.

Альтернативная гипотеза: я плохой стрелок, и мой ствол не попадает в цель. Просто влево или вправо от цели. Моя ошибка: e> 0 или e <0.

Так как любое измерение имеет определенную среднюю ошибку (то есть стандартную ошибку), измерение, которое говорит «вне цели», возможно, даже если я стреляю прямо. Мне нужно не «поражать» мою цель (вообще, даже если каждый выстрел является взрывом / распространением) определенное количество раз, прежде чем вы сможете назвать меня плохим стрелком и выбрать альтернативную гипотезу.

Морис
источник
1
Добро пожаловать в резюме. Не могли бы вы связать свои объяснения с нулевым и альтернативным? Возможно, некоторые дополнительные обсуждения могут помочь мотивировать их. Есть также некоторые нули и альтернативы, для которых это объяснение не подходит, возможно, вам необходимо указать, для каких типов гипотез это подходящее объяснение (например, точка-
ноль,
1

Предположим, что дети не могут сказать разницу и решить случайно. Тогда у каждого ребенка есть 50% -ый шанс угадать это правильно. Таким образом, вы ожидаете (ожидаемое значение), что в этом случае 5 детей делают это правильно, а 5 детей ошибаются. Конечно, как это случайно, также возможно, что 6 детей ошибаются, а 4 - правильно, и так далее. С другой стороны, даже если дети могут заметить разницу, вполне возможно, что один из них случайно ошибается.

Интуитивно понятно, что если дети догадаются случайно, то маловероятно, что все дети дадут правильный ответ. В этом случае можно скорее поверить, что дети действительно могут почувствовать разницу между двумя напитками. Другими словами, мы не ожидаем, что будут наблюдаться невероятные события. Таким образом, если мы наблюдали событие, которое маловероятно при 50-50 сканарио, мы скорее верим, что этот сценарий неверен, и дети могут различить кока-колу и пепси.

αα0,00098ααзнак равно0,05

п(все дети угадывают это правильно)знак равно0,00098п(только один ребенок путает колу с пепси)знак равно0,01074п(только двое детей путают)знак равно0,05468

Это момент, когда вы проводите эксперимент. Сделайте это тщательно со всеми 10 учениками, даже если вы только что подсчитали, что можете остановиться после второй ошибки. Затем запишите результаты и сохраните их. Вам понадобятся результаты, если вы хотите объяснить им метаанализ.

(Между прочим, исторический пример касается дегустации, если молоко или чай сначала налили в чашку. Дама с дегустацией чая.)

Хорст Грюнбуш
источник
0

Покажите это видео, которое является наиболее интуитивным объяснением проверки гипотез, которое я когда-либо видел - https://www.youtube.com/watch?v=UApFKiK4Hi8

Лондонский парень
источник
0

Детский эксперимент с дегустацией кокса является хорошим примером для введения проверки гипотезы, как это показал эксперимент с дегустацией женского чая. Однако оценка этих экспериментов не очень интуитивна, потому что нулевая гипотеза предполагает биномиальное распределение с p = 0,5 и не является простой.

В моем обычном введении в проверку гипотез я пытаюсь преодолеть этот недостаток, используя только случай всех успехов в биномиальном распределении, вероятность которого может быть вычислена как p ^ n даже людьми, которые не знают о биномиальной вероятности.

В моем любимом примере мне нравятся жареные каштаны, и я покупаю их у уличного продавца. Я получаю их по сниженной цене, потому что они приходят из большой сумки, в которой у 10% каштанов есть червоточина - здесь я пытаюсь прояснить, что сумка была хорошо перемешана, так что моя горсть каштанов - это случайный образец каштанов в сумке и утверждении продавца означает, что каждый каштан имеет независимую вероятность 10% наличия червоточины.

Когда я начинаю наслаждаться моими жареными каштанами, я беру их один за другим и проверяю их на наличие червоточин перед тем, как есть их.

Когда я проверяю первый каштан, я вижу червоточину, и мне интересно, соврал ли продавец мне - я объясняю здесь, что интересно, что устанавливает мою нулевую гипотезу p = 10% и мою альтернативную гипотезу p> 10%, и я ставлю их в доске. Есть ли у меня основания сомневаться в том, что p = 10%, когда я получил один плохой каштан из одного? Ну, 10% людей, выполняющих тот же эксперимент, получили бы тот же результат, так что я думаю, что мне просто не повезло.

Затем я беру второй каштан, и у него тоже есть червоточина. У двух из двух вероятность всего 1%, если продавец не соврал мне. Мне бы очень не повезло, но я очень подозрительно отношусь к продавцу.

Третий каштан тоже имеет червоточину. Получить три каштана с червями из трех было бы невозможно, если бы поставщик был честным и p = 10%, но это было бы очень маловероятно (вероятность = 0,1%). Поэтому сейчас у меня есть веские основания сомневаться в работе продавца, и я подаю жалобу и прошу вернуть деньги.

Конечно, у такого рода последовательных тестов есть некоторые теоретические проблемы, но это не имеет большого значения, чтобы показать идею проверки гипотезы. На самом деле, самая важная идея, которая не рассматривается в этом примере, заключается в том, что в тестах на гипотезы мы вычисляем вероятность результатов, которые мы получаем, или что-то еще хуже - в моем примере этого удалось избежать, просто получив наихудший возможный результат.

Я несколько раз использовал этот пример с первокурсниками в университете, которые по-прежнему являются технически подростками, но я думаю, что он может хорошо работать и с младшими подростками.

Pere
источник