Чему следует учить в первую очередь: вероятность или статистика?

19

Я недавно присоединился как преподаватель в математическом отделе. известного учреждения. Я буду преподавать курс вероятности и статистики на уровне бакалавриата. В этом учебном заведении уже есть учебная программа, которая меня не очень устраивает. В этом учебном плане сначала рассматривается статистика, а также отсутствует часть оценки. Я всегда считал, что основы вероятности нужно учить, прежде чем учить статистику. Может кто-нибудь высказать свое мнение по этому поводу? Также высоко ценится предложение по темам, которые должны быть освещены в таком курсе.

Ashok
источник
3
Мне кажется, что базовое понимание (не обязательно слишком математических понятий) вероятности необходимо для того, чтобы получить логику и интуицию за статистическими методами, о чем свидетельствует тот факт, что большинство книг по элементарным уровням начинаются с вероятности. В моем классе бизнес-старшекурсников нас сначала учили вероятности, а затем статистике.
RSL
4
Это теоретическая или прикладная статистика ..? Большая часть применяемой статистики может быть продумана без подробного ознакомления с вероятностью. Это также может быть хорошим аппетитом для вероятности и теоретической статистики позже. Так что это не должно быть такой плохой идеей.
Тим
3
По какой программе обучения обучаются студенты? Являются ли они специальностями по математике или модуль предлагается в основном студентам других факультетов, например, социологии или бизнеса?
Роберт Лонг
@RobertLong: Говорят, что механический англ. студенты и наши собственные студенты по математике будут посещать курс. Другие из экономики электрических англ. и студенты информатики могут также присутствовать.
Ашок

Ответы:

22

Кажется, это уже не вопрос мнения: мир, похоже, вышел далеко за рамки традиционного «учить вероятности, а затем учить статистику как ее применение». Чтобы понять, куда идет преподавание статистики, посмотрите на список названий статей в специальном выпуске «Американской статистики» за прошлый год (воспроизводится ниже): ни один из них не относится к вероятности.

Они обсуждают учение о вероятности и его роль в учебной программе. Хорошим примером является статья Джорджа Кобба и ее ответы . Вот некоторые соответствующие цитаты:

Современная статистическая практика намного шире, чем признается в наших традиционных учебных планах, основанных на вероятностном выводе.

То, чему мы учим, отстает от того, что мы практикуем, на десятилетия. Наша учебная парадигма подчеркивает формальный вывод из ориентации на частоту, основанный либо на центральной предельной теореме на начальном уровне, либо, в курсе математических специальностей, на небольшом наборе параметрических вероятностных моделей, которые поддаются решениям замкнутой формы, полученным с использованием исчисления , Разрыв между нашей полувековой учебной программой и нашей современной статистической практикой продолжает увеличиваться.

Мой тезис ... в том, что как профессия мы только начали изучать возможности. История нашего предмета также поддерживает этот тезис: в отличие от вероятности, математика, статистика возникла de novo из почвы науки.

Вероятность - общеизвестно скользкая концепция. Разрыв между интуицией и формальным обращением может быть шире, чем в любой другой области прикладной математики. Если мы настаиваем на том, что статистическое мышление обязательно должно основываться на вероятностной модели, как мы можем согласовать это требование с целями создания центральных идей «простыми и доступными» и минимизации «предпосылок для исследования»?

В качестве мысленного эксперимента рассмотрим основные понятия и теорию оценки. Обратите внимание, как почти все они могут быть объяснены и проиллюстрированы с использованием только исчисления первого семестра, с вероятностью, представленной на этом пути.

Конечно, мы хотим, чтобы студенты изучали исчисление и вероятность, но было бы хорошо, если бы мы могли присоединиться ко всем другим наукам в обучении основополагающих понятий нашего предмета студентам первого курса.

Там гораздо больше, как это. Вы можете прочитать это самостоятельно; Материал находится в свободном доступе.

Ссылки

Специальный выпуск американского статистика «Статистика и учебная программа для студентов» (ноябрь 2015 г.) доступен по адресу http://amstat.tandfonline.com/toc/utas20/69/4 .

Обучение студентов следующего поколения статистиков «думать с помощью данных»: специальный выпуск по статистике и учебной программе для студентов Николас Дж. Хортон и Джоанна С. Хардин DOI: 10.1080 / 00031305.2015.1094283

Просто ремонт слишком маленький, слишком поздний: нам нужно пересмотреть нашу программу бакалавриата с нуля Джордж Кобб DOI: 10.1080 / 00031305.2015.1093029

Статистика преподавания в Google Scale Николас Чаманди, Омкар Муралидхаран и Стефан Вейджер 283-291 DOI: 10.1080 / 00031305.2015.1089790

Исследования в области статистических исследований: подход к выявлению магистрантов для аутентичного анализа данных Дебора Нолан и Дункан Темпл Ланг DOI: 10.1080 / 00031305.2015.1073624

Вне нормы: подготовка магистрантов для рабочей силы в статистическом консалтинге Capstone Byran J. Smucker & A. John Bailer DOI: 10.1080 / 00031305.2015.1077731

Основы для внедрения аутентичных данных в курсы статистики Скотт Д. Гримшоу DOI: 10.1080 / 00031305.2015.1081106

Поощрение концептуального понимания в математической статистике Дженнифер Л. Грин и Эрин Э. Бланкеншип DOI: 10.1080 / 00031305.2015.1069759

Второй курс по статистике: разработка и анализ экспериментов? Натали Дж. Блейдс, Г. Брюс Шаалье и Уильям Ф. Кристенсен DOI: 10.1080 / 00031305.2015.1086437

Курс Data Science для магистрантов: мышление с использованием данных Ben Baumer DOI: 10.1080 / 00031305.2015.1081105

Наука о данных в учебных программах по статистике: подготовка учащихся к «мышлению с помощью данных» Дж. Хардин, Р. Хёрл, Николас Дж. Хортон, Д. Нолан, Б. Баумер, О. Холл-Холт, П. Муррелл, Р. Пенг, П. Roback, D. Temple Lang & MD Ward DOI: 10.1080 / 00031305.2015.1077729

Использование онлайн-симуляций на основе игр для улучшения понимания студентами практических статистических вопросов при анализе данных в реальном мире Shonda Kuiper & Rodney X. Sturdivant DOI: 10.1080 / 00031305.2015.1075421

Борьба с антистатистическим мышлением с использованием методов на основе моделирования в учебной программе для студентов бакалавриата Натан Тинтл, Бет Чанс, Джордж Кобб, Сома Рой, Тодд Свансон и Джилл ВандерСтоп DOI: 10.1080 / 00031305.2015.1081619

Что учителя должны знать о начальной загрузке: повторная выборка в учебной программе по статистике студентов Тим С. Хестерберг DOI: 10.1080 / 00031305.2015.1089789

Включение тематических исследований в области статистического консультирования во вводные временные ряды. Давид Хачатрян DOI: 10.1080 / 00031305.2015.1026611

Разработка новой программы бакалавриата по междисциплинарной вычислительной аналитике: качественно-количественно-качественный подход Шотландия Леман, Leanna House & Andrew Hoegh DOI: 10.1080 / 00031305.2015.1090337

От руководства к учебному плану до результатов обучения: оценка на уровне программы Beth Chance & Roxy Peck DOI: 10.1080 / 00031305.2015.1077730

Оценка программы для студенческой статистики майор Аллисон Аманда Мур и Дженнифер Дж. Каплан DOI: 10.1080 / 00031305.2015.1087331

Whuber
источник
3
(+1) Я думаю, что это отличный ответ. Проблема с обучением теории вероятностей в первую очередь заключается в том, что создается впечатление, что статистика связана со спецификацией, подбором и диагностикой вероятностных моделей. Это не только небольшая часть статистики, но она пропускает некоторые из самых основных вопросов при рассмотрении данных: как их визуализировать и как их обобщать. Каковы относительные достоинства среднего или медианного значения для определения местоположения набора данных? Как мы должны кросс-таблицы наших результатов? Какие графики являются подходящими, и что они говорят нам о данных?
Серебряная рыба
@ Silverfish, это так сильно отличается от того, как парни вроде Бернулли подошли к статистике. Взгляните на эту прекрасную статью его «Попытка нового анализа смертности от оспы и преимуществ прививки для ее предотвращения» . Он в основном начал современную эпидемиологию с этим. Если бы он был зациклен на вещах, о которых вы упоминаете, таких как визуализация и т. Д., Он бы не смог понять понимание основного процесса.
Аксакал
2π
Для ранних прорывов в эпидемиологии я приведу вам исследование Джона Сноу о вспышке холеры на Брод-стрит в 1854 году - то, что можно найти во многих хороших книгах , посвященных визуализации данных, и мыслительные процессы, которые, несомненно, должны лежать в основе Stats 101.
Silverfish
1
@Aksakal Я ценю твоё упоминание о Бернулли. Однако то, как пионеры и великие математики подходят и решают проблемы, - это совсем не то, как нужно учить решениям. Я хочу подчеркнуть, что никто (афаик) не выступает за то, чтобы не учить вероятности: вопрос касается того, когда такие идеи должны быть введены во вводный (колледж) учебный план и в какой степени они должны реализовываться. Существуют веские педагогические причины (основанные как на психологии, так и на опыте преподавания), для того, чтобы сначала представить множество статистических идей.
whuber
7

Множественное число анекдота не является данными, но почти в любом курсе, который я видел, по крайней мере основы вероятности предшествуют статистике.

С другой стороны, исторически, обычные наименьшие квадраты были разработаны до того, как было обнаружено нормальное распределение! Первым стал статистический метод, на втором месте было более строгое обоснование вероятности того, почему он работает.

История статистики Стивена Стиглера : измерение неопределенности До 1900 года рассказывает читателю об историческом развитии:

  • Математики, астрономы понимали основы механики и закон гравитации. Они могли бы описать движение небесных тел как функцию нескольких параметров.
  • У них также были сотни наблюдений за небесными телами, но как объединить наблюдения, чтобы восстановить параметры?
    • Сотня наблюдений дает вам сто уравнений, но если нужно решить только три неизвестных, это переопределенная система ...
  • Лежандр первым разработал метод минимизации суммы квадратов ошибок. Позднее это было связано с работой по вероятности Гаусса и Лапласа, что обычные наименьшие квадраты были в некотором смысле оптимальными с учетом нормально распределенных ошибок.

Почему я поднимаю это?

Существует определенная логическая элегантность, чтобы сначала создать математический механизм, необходимый для выработки, понимания какого-либо метода, чтобы заложить фундамент, прежде чем строить дом.

В реальности науки дом часто на первом месте, а основание на втором: P.

Я хотел бы видеть результаты из учебной литературы. Что более эффективно для обучения? Что тогда почему? Или почему тогда что?

(Я мог бы быть извращенцем, но я нашел историю о том, как наименьшие квадраты были разработаны, чтобы быть захватывающим переворотом! Истории могут сделать иначе скучные, абстрактные вещи оживают ...)

Мэтью Ганн
источник
2
Статистическая литература по образованию, по-видимому, последовательна и недвусмысленна в этом вопросе: вероятность - это не статистика, статистика - это гораздо больше, чем вероятность, и статистику (по крайней мере, на уровнях K-12 и колледж) следует представлять как мышление с данными, а не приложение вероятности. В дополнение к ссылкам, которые я предоставил в своем ответе, ознакомьтесь с некоторыми другими свободно доступными ресурсами, такими как CauseWeb , GAISE и J. Statistics Education .
whuber
4

Я думаю, что для большинства людей это должен быть итеративный процесс: вы изучаете небольшую вероятность, затем немного статистики, затем немного больше вероятности и немного больше статистики и т. Д.

Например, посмотрите на требования PhD Stat в GWU. Курс вероятности PhD 8257 имеет следующее краткое описание:

STAT 8257. Probability. 3 Credits.
Probabilistic foundations of statistics, probability distributions, random variables, moments, characteristic functions, modes of convergence, limit theorems, probability bounds. Prerequisite: STAT 6201– STAT 6202, knowledge of calculus through functions of several variables and series.

Обратите внимание, как он имеет курсы статистики уровня магистра 6201 и 6202 в предварительных условиях. Если вы перейдете к низкоуровневому статистическому или вероятностному курсу в GWU, вы попадете на Введение в бизнес и экономическую статистику 1051 или Введение в статистику в социальных науках 1053 . Вот описание к одному из них:

STAT 1051. Introduction to Business and Economic Statistics. 3 Credits.
Lecture (3 hours), laboratory (1 hour). Frequency distributions, descriptive measures, probability, probability distributions, sampling, estimation, tests of hypotheses, regression and correlation, with applications to business.

Обратите внимание, что у курса есть название «Статистика», но оно учитывает вероятность внутри него. Для многих это первое знакомство с теорией вероятностей после курса средней школы "Stats".

Это несколько похоже на то, как это преподавалось в мои дни: курсы и учебники обычно назывались «Теория вероятностей и математическая статистика», например, текст Гмурмана .

Я не могу себе представить изучение теории вероятностей без какой-либо статистики. Уровень PhD выше 8257 предполагает, что вы уже знаете статистику. Таким образом, даже если вы сначала учите вероятности, вам придется учиться статистике. Это просто для первого курса, возможно, имеет смысл немного взвесить статистику и использовать ее для введения теории вероятностей.

В конце концов, это итеративный процесс, как я описал в начале. И, как в любом хорошем итеративном процессе, первый шаг не важен, независимо от того, была ли самая первая концепция на основе статистики или вероятности, не будет иметь значения после нескольких итераций: вы попадете в одно и то же место независимо от этого.

Последнее замечание: подход к обучению зависит от вашей области. Если вы изучаете физику, вы получите такие вещи, как статистическая механика, статистика Ферми-Дирака, с которыми вы не будете иметь дело в социальных науках. Кроме того, в физике подходы, основанные на частоте, естественны, и фактически они лежат в основе некоторых фундаментальных теорий. Следовательно, имеет смысл иметь на раннем этапе самостоятельную теорию вероятностей, в отличие от социальных наук, где может не иметь смысла тратить на нее время и вместо этого больше весить на статистику.

Аксакал
источник
2
Учебная программа PhD, по всей видимости, дает мало рекомендаций относительно того, как преподавать предмет для студентов. Цели и аудитория совершенно разные. Я добавлю личное примечание: в моих взаимодействиях с некоторыми авторитетными статистическими отделами я видел, что учебный план отражает 30-летние идеи педагогики и развития и будет продолжаться до тех пор, пока новое поколение профессоров не вступит во владение. Возможно, нам следует позаботиться об использовании таких учебных программ в качестве нормативных моделей того, что должно быть сделано.
whuber
1
@whuber И тогда учебная программа будет отражать идеи 30-летних ... но, по крайней мере, они не будут 60-летними. Во всяком случае, как говорится, наука продвигается, похороны за похоронами.
Марк Л. Стоун