Мой отец - энтузиаст математики, но не очень интересуется статистикой. Было бы неплохо попытаться проиллюстрировать некоторые замечательные статистические данные, и CLT является главным кандидатом. Как бы вы передали не статистику математическую красоту и влияние центральной предельной теоремы?
33
Ответы:
Что мне больше всего понравилось в CLT, так это случаи, когда он неприменим - это дает мне надежду, что жизнь немного интереснее, чем предполагает кривая Гаусса. Так покажите ему распределение Коши.
источник
Чтобы в полной мере оценить CLT, это должно быть видно.
Отсюда и понятие бобовой машины и множество видео на YouTube для иллюстрации.
источник
Часто, когда математики говорят о вероятности, они начинают с известного распределения вероятностей, а затем говорят о вероятности событий. Истинное значение центральной предельной теоремы состоит в том, что она позволяет нам использовать нормальное распределение в качестве приближения в случаях, когда мы не знаем истинного распределения. Вы могли бы задать своему отцу стандартный статистический вопрос (но сформулированный как математический) о том, какова вероятность того, что среднее значение выборки будет больше заданного значения, если данные поступают из распределения со средним значением mu и sd sigma, а затем посмотрите, он предполагает распространение (о котором вы потом говорите, что мы не знаем) или говорит, что ему нужно знать распределение. Затем вы можете показать, что мы можем приблизить ответ с помощью CLT во многих случаях.
Для сравнения математики со статистикой мне нравится использовать теорему интегрирования среднего значения (которая говорит, что для интеграла от a до b существует прямоугольник от a до b с той же площадью, а высота прямоугольника является средним значением для кривая). Математик смотрит на эту теорему и говорит: «круто, я могу использовать интеграцию для вычисления среднего», в то время как статистик смотрит на ту же теорему и говорит: «круто, я могу использовать среднее для вычисления интеграла».
У меня на самом деле есть настенные вешалки с крестиком в моем кабинете теоремы о среднем значении и CLT (вместе с теоремой Байеса).
источник
Мне нравится демонстрировать вариацию выборки и, по существу, центральную предельную теорему в упражнении «в классе». Все в классе, скажем, 100 учеников записывают свой возраст на листе бумаги. Все листы бумаги одинакового размера и сложены одинаковым образом после того, как я вычислил среднее значение. Это население, и я рассчитываю средний возраст. Затем каждый ученик случайным образом выбирает 10 листов бумаги, записывает возраст и возвращает их в сумку. (S) он вычисляет среднее значение и передает сумку следующему студенту. В конце концов у нас есть 100 выборок из 10 студентов, каждая из которых оценивает среднее значение численности населения, которое мы можем описать с помощью гистограммы и некоторой описательной статистики.
Затем мы повторим демонстрацию на этот раз, используя набор из 100 «мнений», которые повторяют некоторые вопросы «да / нет» из недавних опросов, например, если бы выборы в (британский генерал) были назначены завтра, вы бы подумали голосовать за Британскую национальную партию. Студенты их образец 10 из этих мнений.
В конце мы продемонстрировали вариацию выборки, центральную предельную теорему и т. Д. Как с непрерывными, так и с двоичными данными.
источник
Игра с приведенным ниже кодом, изменение значения
M
и выбор дистрибутивов, отличных от униформы, может быть забавной иллюстрацией.источник
Если вы используете Stata, вы можете использовать команду -clt-, которая создает графики распределений выборки, см.
http://www.ats.ucla.edu/stat/stata/ado/teach/clt.htm
источник
По моему опыту, CLT менее полезен, чем кажется. В середине проекта никто не знает, достаточно ли n достаточно, чтобы приближение было адекватным задаче. Что касается статистического тестирования, CLT помогает защитить ошибку типа I, но мало помогает предотвратить ошибку типа II. Например, t-критерий может иметь произвольно низкую мощность для больших n, когда распределение данных сильно искажено.
источник