Я помогаю своим мальчикам, которые в настоящее время учатся в старших классах, разбираться в статистике, и я собираюсь начать с нескольких простых примеров, не забывая о проблесках теории.
Моя цель состояла бы в том, чтобы дать им наиболее интуитивный, но в то же время инструментальный подход к изучению статистики с нуля, чтобы стимулировать их интерес к дальнейшему изучению статистики и количественного обучения.
Прежде чем начать, у меня есть конкретный вопрос с очень общими последствиями:
Должны ли мы начать преподавать статистику, используя байесовские или частые рамки?
Исследуя вокруг, я увидел, что общий подход начинается с краткого введения в статистику частых случаев, за которым следует углубленное обсуждение статистики Байеса (например, Stangl ).
Ответы:
И байесовская статистика, и статистика частых основаны на теории вероятностей, но я бы сказал, что первая с самого начала в большей степени опирается на теорию. С другой стороны, концепция достоверного интервала, несомненно, является более интуитивной, чем концепция доверительного интервала, если студент хорошо понимает концепцию вероятности. Итак, что бы вы ни выбрали, я в первую очередь отстаиваю их понимание концепций вероятности, причем все эти примеры основаны на игре в кости, карточках, рулетке, парадоксе Монти Холла и т. Д.
Я бы выбрал тот или иной подход, основанный на чисто утилитарном подходе: с большей ли вероятностью они изучают статистику по частоте или байесовской школе? В моей стране, они определенно изучали бы основы для частых (в первую очередь: никогда не слышали о том, чтобы учащиеся старших классов преподавали байесовскую статистику, единственный шанс - либо в университете, либо после, путем самостоятельного обучения). Может быть, у вас все по-другому. Имейте в виду, что если им нужно иметь дело с NHST (тестирование значимости нулевой гипотезы), то это более естественно возникает в контексте статистики частых случаев, IMO. Конечно, вы можете проверить гипотезы также в байесовской структуре, но есть много ведущих байесовских статистиков, которые выступают за то, чтобы вообще не использовать NHST, ни в рамках частых, ни в байесовских рамках (например, Эндрю Гельман из Колумбийского университета).
Наконец, я не знаю об уровне старшеклассников в вашей стране, но для меня было бы очень трудно успешно усвоить (основы) теории вероятностей и интегрального исчисления одновременно. Итак, если вы решите использовать байесовскую статистику, я бы действительно избегал случая с непрерывной случайной величиной и придерживался дискретных случайных величин.
источник
Байесовский и частый задают разные вопросы. Байесовский спрашивает, какие значения параметров заслуживают доверия, учитывая наблюдаемые данные. Частый участник спрашивает о вероятности воображаемых смоделированных данных, если некоторые гипотетические значения параметров были истинными. Частые решения мотивируются контролем ошибок, байесовские решения мотивированы неопределенностью в описаниях моделей.
Итак, чему вы должны учить в первую очередь? Что ж, если вы хотите задать один или другой из этих вопросов, это ваш ответ. Но с точки зрения доступности и педагогики, я думаю, что байесовский гораздо проще для понимания и гораздо более интуитивно понятен. Основная идея байесовского анализа - это перераспределение правдоподобия между возможностями, как, как сказал Шерлок Холмс, и которое миллионы читателей интуитивно поняли. Но основная идея частого анализа очень сложна: пространство всех возможных наборов данных, которые могли бы произойти, если бы конкретная гипотеза была верной, и доля тех мнимых наборов данных, которые имеют сводную статистику как экстремальную статистику или более статистика, которая действительно наблюдалась.
Бесплатная вводная глава о байесовских идеях находится здесь . Статья , которая устанавливает и байесовская частотную концепции рядом находится здесь . В статье объясняются частый и байесовский подходы к проверке гипотез и оценке (и многое другое). Рамки статьи могут быть особенно полезны для начинающих, пытающихся получить представление о ландшафте.
источник
Этот вопрос может быть основан на мнении, поэтому я постараюсь быть очень кратким с моим мнением, а затем предложу вам книгу. Иногда стоит придерживаться определенного подхода, потому что это подход, который использует особенно хорошая книга.
Я согласен, что байесовская статистика более интуитивна. Различие между доверительным интервалом и доверительным интервалом в значительной степени подводит итог: люди, естественно, думают в терминах «какова вероятность того, что ...», а не как подход с доверительным интервалом. Подход доверительного интервала звучит так, как будто он говорит то же самое, что и доверительный интервал, за исключением того, что по общему принципу вы не можете сделать последний шаг от «95% времени» до «95% шансов», что кажется очень частым, но вы не могу сделать это Это не противоречиво, просто не интуитивно понятно.
Уравновешивание этого факта - то, что большинство курсов колледжа, которые они выберут, будет использовать менее интуитивный частый подход.
Тем не менее, мне очень нравится книга « Статистическое переосмысление: байесовский курс с примерами на R и Stan » Ричарда МакЭлрита. Это не дешево, поэтому, пожалуйста, прочитайте об этом и покопайтесь в нем на Amazon, прежде чем купить. Я считаю это особенно интуитивным подходом, который использует преимущества байесовского подхода и очень практичен. (А поскольку R и Stan являются отличными инструментами для байесовской статистики, и они бесплатны, это практическое обучение.)
РЕДАКТИРОВАТЬ: В нескольких комментариях упоминается, что книга, вероятно, выходит за рамки High Schooler, даже с опытным преподавателем . Поэтому мне придется разместить еще большую оговорку: вначале у нее простой подход, но он быстро нарастает. Это удивительная книга, но вам действительно, действительно, придется просмотреть ее на Amazon, чтобы понять ее первоначальные предположения и то, как быстро она набирает обороты. Прекрасные аналогии, отличная практическая работа в R, невероятный поток и организация, но, возможно, бесполезный для вас.
Он предполагает базовые знания в области программирования и R (бесплатный статистический пакет), а также некоторые знания основ вероятности и статистики. Это не произвольный доступ, и каждая глава основана на предыдущих главах. Он начинается очень просто, хотя сложность нарастает посередине - он заканчивается многоуровневой регрессией. Так что вы можете просмотреть некоторые из них на Amazon и решить, сможете ли вы легко охватить основы или они слишком далеко зашли в будущем.
РЕДАКТИРОВАТЬ 2: Суть моего вклада в этом и попытка превратить его из чистого мнения в том, что хороший учебник может решить, какой подход вы выберете. Я бы предпочел байесовский подход, и эта книга делает это хорошо, но, возможно, в слишком быстром темпе.
источник
Сначала меня научили частому подходу, а затем байесовскому. Я не профессиональный статистик.
Я должен признать, что мои предыдущие знания о подходе, основанном на частоте, не были столь полезными для понимания байесовского подхода.
Я бы осмелился сказать, что это зависит от того, какие конкретные приложения вы будете показывать своим ученикам дальше, и сколько времени и усилий вы на них потратите.
Сказав это, я бы начал с Байеса.
источник
Байесовская структура тесно связана с общими навыками критического мышления. Это то, что вам нужно в следующих ситуациях:
Кроме того, это гораздо интереснее, чем запоминание формулы для t-критерия из двух примеров: p. Что увеличивает вероятность того, что студенты будут оставаться заинтересованными достаточно долго, чтобы заниматься все более и более техническими материалами.
источник
Никто не упомянул вероятность, которая является фундаментальной для байесовской статистики. Во-первых, аргумент в пользу преподавания Байеса заключается в том, что путь от вероятности к вероятности к Байесу довольно плавный. Байес может быть мотивирован от вероятности, отмечая, что (i) функция правдоподобия выглядит (и действует) как функция распределения вероятностей, но не потому, что площадь под кривой не равна 1,0, и (ii) грубый, обычно используемый Вальд интервалы предполагают функцию правдоподобия, которая пропорциональна нормальному распределению, но байесовские методы легко преодолевают это ограничение.
Еще один аргумент в пользу байесовского подхода заключается в том, что обеспокоенность P (A | B) и P (B | A) в отношении p-значений можно объяснить более легко, как уже упоминалось другими.
Еще один аргумент в пользу «Байеса прежде всего» заключается в том, что он заставляет студентов более тщательно продумывать модели условной вероятности, что полезно в других местах, например, в регрессионном анализе.
Извините за саморекламу, но, поскольку она полностью посвящена теме, я не против заявить, что именно такой подход мы и Кевен Хеннинг использовали в нашей книге «Понимание передовых статистических методов» ( https: // peterwestfall. wixsite.com/book-1 ), чья целевая аудитория не является статистикой.
источник
Вы учите для развлечения и понимания или для практического использования? Если бы речь шла об обучении и понимании, я бы пошел в Байес. Если бы в практических целях я бы определенно пошел на частую работу.
Во многих областях - и я предполагаю, что в большинстве областей - естественных наук люди используют для публикации своих работ с p-значением. Вашим «мальчикам» придется читать чужие газеты, прежде чем они начнут писать свои собственные. Чтобы читать статьи других людей, по крайней мере, в моей области, им нужно понимать нулевые гипотезы p-значений, какими бы глупыми они ни казались после байесовских исследований. И даже когда они будут готовы опубликовать свою первую статью, у них, вероятно, будет какой-то старший научный сотрудник, возглавляющий команду, и, скорее всего, они предпочитают частоту.
При этом я хотел бы согласиться с @Wayne, в котором статистическое переосмысление показывает очень четкий путь к байесовской статистике в качестве первого подхода, а не на основе существующих знаний о частотности. Прекрасно, что эта книга не пытается убедить вас в борьбе с лучшей или худшей статистикой. Заявленный аргумент автора для Байеса (IIRC) состоит в том, что он учил обоим видам, и Байесу было легче учить.
источник
Я бы держался подальше от Байеса, следовал за гигантами.
У Советов была отличная серия книг для учеников средней школы, примерно переведенная на английский как «Квант», маленькая библиотека ». Колмогоров подарил книгу с соавторами под названием «Введение в теорию вероятностей». Я не уверен, что он когда-либо был переведен на английский, но вот ссылка на его русский оригинал.
Они подходят к объяснению вероятностей с помощью комбинаторики, и я думаю, это отличный способ начать. Книга очень доступна для старшеклассников с приличной математикой. Заметьте, что Советы преподавали математику довольно широко, поэтому средние ученики старших классов западной школы, возможно, не так хорошо подготовлены, но с достаточным интересом и силой воли все еще могут справиться с содержанием, на мой взгляд.
Контент очень интересен для студентов, он имеет случайные прогулки, ограниченное распределение, процессы выживания, закон больших чисел и т. Д. Если вы объедините этот подход с компьютерным моделированием, он станет еще более увлекательным.
источник