Использование компьютерного моделирования для лучшего понимания статистических концепций на уровне выпускника

11

Привет, я прохожу аспирантуру по статистике, и мы освещали тестовую статистику и другие концепции.

Тем не менее, я часто могу применять формулы и развивать своего рода интуицию о том, как все работает, но у меня часто возникает ощущение, что, возможно, если я подкреплю свое исследование симуляцией экспериментов, я разовью лучшую интуицию в рассматриваемых проблемах. ,

Итак, я думал о написании простых симуляций, чтобы лучше понять некоторые из концепций, которые мы обсуждаем в классе. Теперь я мог бы использовать, скажем, Java для:

  1. Произведите случайную популяцию с нормальным средним и стандартным отклонением.
  2. Затем возьмите небольшую выборку и попытайтесь эмпирически рассчитать ошибки типа I и типа II.

Теперь у меня есть следующие вопросы:

  1. Это законный подход к развитию интуиции?
  2. Есть ли программное обеспечение для этого ( SAS?, R?)
  3. Является ли эта дисциплина в статистике, которая занимается таким программированием: экспериментальная статистика ?, вычислительная статистика? моделирование?
user1172468
источник
1
Я все время использую симуляцию, чтобы попытаться лучше понять, что происходит. Вы можете использовать практически любой язык программирования или статистическую программу для проведения подобных экспериментов (даже в Excel).
Джон
1
+1, симуляции и фигуры - это 2 самых полезных метода построения интуиции. Я обычно использовал их, чтобы помочь другим и самому понять вещи. Есть много ответов на вопросы CV, в которых для иллюстрации используются симы. Если вам нужны ссылки, я мог бы легко перечислить некоторые из моих собственных ответов, которые использовали симов таким образом. Вы также можете задать вопрос здесь на резюме в этом ключе; например: «Я пытаюсь понять _____, но у меня возникли трудности, может ли кто-нибудь дать объяснение с симом, которое прояснит ситуацию?» или «Я сделал эту симку, и это говорит о том, что она работает таким образом, верно?»
gung - Восстановить Монику
4
Стремясь соответствовать высоким стандартам и ожиданиям этого сайта, я использую симуляцию (а также теоретические выводы и иллюстрации) в каждом ответе, который выиграл бы от этого. Большая часть моих недавних ответов будет включать некоторую форму симуляции, особенно почти любой ответ на вопрос с тегом r . Например, вы можете просмотреть их со страницы поиска, если вам интересно.
whuber
2
Вы найдете много хороших, просматривая ответы @ whuber. Поскольку мои ответы (и навыки программирования), как правило, менее сложны, они могут сделать хороший первый шаг. Я использую сим, чтобы показать, что трудно использовать подбор модели, чтобы выбрать лучшую ссылку в GLiM: различие между logit-and-probit-models . Здесь я использую сим, чтобы показать, как падает мощность, поскольку размеры групп становятся неравными в t-тесте: как следует интерпретировать сравнение средних значений для разных размеров выборки .
gung - Восстановить Монику
2
Этот вопрос CV: объяснение статистического моделирования , также может быть интересен читателям этой темы.
gung - Восстановить Монику

Ответы:

7

Мне нравится ваш вопрос, но нет конкретных ответов на 2 и 3? Я полагаю, что программные пакеты, такие как SAS (в общих чертах о продуктах SAS, а не только SAS / STAT), могут иметь инструменты, облегчающие моделирование, но я не могу сказать наверняка. Я не думаю, что такие вещи подходят как раздел математики или статистики.

Теперь вопрос 1 - это то, на чем я хотел бы сосредоточиться. Моделирование может помочь в изучении статистики на всех уровнях и может помочь в статистических исследованиях в целом. Действительно, есть журналы, посвященные симуляции и вычислениям. Даже FDA признает важность симуляции при разработке клинических испытаний и помогает прогнозировать результаты.

В 1960-х годах Джулиан Саймон преподавал вводную статистику, используя симуляцию в качестве мотиватора. Хотя он и был спорным, он позже утверждал, что делал передэмплинг (перестановку и начальную загрузку) до Эфрона. Он опубликовал книгу с использованием этих идей в 1969 году. В ней определенно отсутствовала теория, и она была лишь учебным пособием, а не новым подходом к статистической оценке. Он не разработал ни одного из математических свойств, которые пришли с и после Эфрона.

Я думаю, что для вводной статистики полезно провести симуляцию, чтобы продемонстрировать распределения выборки, показать, как возникает центральная предельная теорема, а физическое моделирование через квинкункс демонстрирует версию центральной предельной теоремы Демуа-Лапласа.

Иногда это повышает интуицию. Я думаю, что проблема Монти Холла озадачивает и кажется парадоксальной даже для таких математиков, как Пол Эрдос. Но симуляция игры часто очень убедительна. Есть много проблем в вероятности, которые противоречат друг другу, и симуляция может, я думаю, помочь.

В 1978 году, когда я работал над докторской диссертацией по теории экстремальных значений, у меня появилась интуитивная идея предельной теоремы, которую я пытался доказать. Я боролся с математикой. Тогда я решил смоделировать случайный процесс, и симуляция «подтвердила» мой результат. Это дало мне уверенность, чтобы подтолкнуть доказать это.

Таким образом, даже на уровне выпускника и за его пределами симуляция может быть полезна двумя способами.

  1. Чтобы помочь развить интуицию, как вы предлагаете в вопросе 1, но и

  2. Чтобы подтвердить интуицию, как я сделал в моей диссертации

Майкл Р. Черник
источник
Я нашел кого-то, кто решал проблему Монти Холла в SAS и R здесь sas-and-r.blogspot.com/2010/01/… - наслаждайтесь
user1172468
Сьюзен Холмс из Стэнфордского университета разместила симулятор игры Монти Холл на своем сайте несколько лет назад. Спасибо, что напомнили нам @ user1172468, что многие люди могут и, вероятно, размещают симуляции на своих сайтах.
Майкл Р. Черник
Проблема Монти Холла с R (очень легко проследить): bodowinter.com/tutorial/bw_doodling_monty_hall.pdf
vasili111
8
  1. Да. Ведь речь идет о вашей интуиции.
  2. R подойдет вам хорошо. Кодирование будет довольно простым для вас, если вы уже знаете Java (или любой другой «стандартный язык программирования»).
  3. Вычислительная статистика имеет дело с разработкой алгоритмов для реализации статистических методов, вероятно, это наиболее близко к тому, что вы пытаетесь описать здесь.

Получайте удовольствие от вашего курса!

usεr11852
источник
Я думаю, что ваш ответ дополняет мой. Я дал подробный ответ на 1, а вы дали более точный ответ на 2 и 3. Похоже, вы отвечаете на вопрос в течение нескольких минут. Мы, вероятно, пересекались. В любом случае, вы дали 2 хороших ответа, а я дал вам за них!
Майкл Р. Черник
Спасибо за большие пальцы! Кажется, вы на шаг впереди меня в ответе. :)
usεr11852
Продолжайте отвечать. Я собираюсь отдохнуть. Я уже почти достиг своего дневного лимита повторений.
Майкл Р. Черник
Ребята, я думал, что оба ответа были хорошими. Я выбрал ответ @ Michael, потому что я могу выбрать только один правильный ответ, и я почувствовал, что решил некоторые из наиболее фундаментальных проблем.
user1172468
1
@ user1172468 Тебе действительно не нужно объяснять, но хорошо, что ты это сделал.
Майкл Р. Черник
4

Пакет TeachingDemos для R был основан на том же мыслительном процессе, что и вы, пытаясь визуализировать и понимать концепции по-разному. В пакете есть функции, которые используют симуляцию для понимания некоторых ключевых понятий. Версия для разработки (R-forge, но еще не в CRAN) включает функцию «simfun», которую можно использовать для создания функций симуляции для дальнейшей помощи в симуляции.

Грег Сноу
источник
1
Уже в CRAN: cran.r-project.org/package=TeachingDemos
vasili111
1
Также список других ссылок для преподавания и обучения для статистики с R: cran.r-project.org/web/views/TeachingStatistics.html
vasili111