Мне действительно нравится слушать простые объяснения сложных проблем. Какая ваша любимая аналогия или анекдот, объясняющий сложную статистическую концепцию?
Мое любимое объяснение Мюррея коинтеграции с использованием пьяницы и ее собаки. Мюррей объясняет, как два случайных процесса (странствующий пьяница и ее собака Оливер) могут иметь единичные корни, но все же быть родственными (объединенными), поскольку их совместные первые различия являются стационарными.
Пьяный выходит из бара, собираясь бесцельно бродить в случайном порядке. Но она периодически произносит «Оливер, где ты?», И Оливер прерывает его бесцельное блуждание лаять. Он слышит ее; она слышит его. Он думает: «О, я не могу позволить ей уйти слишком далеко; она меня заблокирует». Она думает: «О, я не могу позволить ему уйти слишком далеко; он разбудит меня посреди ночи своим лаем». Каждый оценивает, насколько далеко находится другой, и движется, чтобы частично закрыть этот разрыв.
источник
Я использовал прогулку пьяницы раньше для случайной прогулки, а пьяницу и ее собаку для коинтеграции; они очень полезны (частично потому что они забавны).
Один из моих любимых распространенных примеров - парадокс дня рождения ( статья в Википедии ), который иллюстрирует некоторые важные понятия вероятности. Вы можете смоделировать это с комнатой, полной людей.
Кстати, я настоятельно рекомендую «Учебную статистику: мешок с уловками» Эндрю Гельмана для некоторых примеров креативных способов преподавания статистических концепций (см. Оглавление ). Также посмотрите на его статью о курсе, который он преподаёт по преподаванию статистики: «Курс по обучению статистике на уровне университета» . И на "Обучении Байеса аспирантам в Политологии, Социологии, Общественном здравоохранении, Образовании, Экономике, ..." .
Для описания байесовских методов использование недобросовестной монеты и многократное ее переворачивание является довольно распространенным / эффективным подходом.
источник
Мне нравится демонстрировать вариацию выборки и, по существу, центральную предельную теорему в упражнении «в классе». Все в классе, скажем, 100 учеников записывают свой возраст на листе бумаги. Все листы бумаги одинакового размера и сложены одинаковым образом после того, как я вычислил среднее значение. Это население, и я рассчитываю средний возраст. Затем каждый ученик случайным образом выбирает 10 листов бумаги, записывает возраст и возвращает их в сумку. (S) он вычисляет среднее значение и передает сумку следующему студенту. В конце концов у нас есть 100 выборок из 10 студентов, каждая из которых оценивает среднее значение численности населения, которое мы можем описать с помощью гистограммы и некоторой описательной статистики.
Затем мы повторим демонстрацию на этот раз, используя набор из 100 «мнений», которые повторяют некоторые вопросы «да / нет» из недавних опросов, например, если бы выборы в (британский генерал) были назначены завтра, вы бы подумали голосовать за Британскую национальную партию. Студенты их образец 10 из этих мнений.
В конце мы продемонстрировали вариацию выборки, центральную предельную теорему и т. Д. Как с непрерывными, так и с двоичными данными.
источник
Определенно проблема Монти Холла. http://en.wikipedia.org/wiki/Monty_Hall_problem
источник
1) Хорошая демонстрация того, как «случайное» необходимо определить для определения вероятности определенных событий:
Какова вероятность того, что случайная линия, проведенная по кругу, будет длиннее радиуса?
Вопрос полностью зависит от того, как вы рисуете свою линию. Возможности, которые вы можете описать в реальном мире для круга, нарисованного на земле, могут включать:
Нарисуйте две случайные точки внутри круга и проведите линию через них. (Смотрите, где падают две мухи / камни ...)
Выберите фиксированную точку на окружности, затем случайную точку в другом месте круга и присоединитесь к ней. (По сути это кладка палки по кругу под переменным углом через заданную точку и случайную, например, где падает камень.)
Нарисуйте диаметр. Случайно выберите точку вдоль нее и проведите через нее перпендикуляр. (Катите палку по прямой линии, чтобы она лежала по кругу.)
Относительно легко показать кого-то, кто может сделать некоторую геометрию (но не обязательно статистику), ответ на вопрос может варьироваться довольно широко (от 2/3 до 0,866 или около того).
3) Объяснение, почему медицинский диагноз может показаться неверным. Тест на болезнь foo, который на 99,9% точен при выявлении тех, у кого он есть, но 0,1% ложно-положительного диагноза тех, у кого его нет, может показаться неправильным действительно так часто, когда распространенность заболевания действительно низкая ( например, 1 на 1000), но многие пациенты проверяются на это.
Это тот, который лучше всего объяснить действительными числами - представьте, что 1 миллион человек проходят тестирование, поэтому у 1000 человек заболевание, 999 правильно идентифицированы, но 0,1% из 999 000 - это 999, которым говорят, что они есть, но нет. Таким образом, половина тех, кому говорят, что у них это есть, на самом деле нет, несмотря на высокий уровень точности (99,9%) и низкий уровень ложных срабатываний (0,1%). Второй (в идеале другой) тест затем выделит эти группы.
[Между прочим, я выбрал числа, потому что с ними легко работать, конечно, они не должны прибавлять до 100%, поскольку показатели точности / ложных срабатываний являются независимыми факторами в тесте.]
источник
Книга Сэма Сэвиджа « Порок средних» полна хороших непонятных объяснений статистических концепций. В частности, у него есть хорошее объяснение неравенства Дженсена. Если график вашего дохода от инвестиций выпуклый, т.е. он «улыбается вам», то случайность в вашу пользу: ваш средний доход больше, чем ваш средний доход.
источник
По линии среднего значения как точки равновесия мне нравится такой взгляд на медиану как точку баланса:
источник
Бехар и др. Имеют коллекцию из 25 аналогий для преподавания статистики. Вот два примера:
Другие примеры включают
Ссылки
источник
Веселый вопрос.
Кто-то узнал, что я работаю в области биостатистики, и они спросили меня (в основном): «Разве статистика не является способом лжи?»
(Что возвращает цитату Марка Твена о лжи, проклятой лжи и статистике.)
Я пытался объяснить, что статистика позволяет нам со 100-процентной точностью сказать, что, учитывая предположения и данные, что вероятность такого-то была именно такой-то.
Она не была впечатлена.
источник