На форумах, посвященных именам детей, потенциальные родители все время повторяют какую-то версию своего «Страха перед Дженифер»: «Я не хочу, чтобы мой ребенок был одним из пяти в своем классе с его именем». Дело в том, что ни одно имя даже близко не подходит к такой популярности, и даже в разгар увлечения Дженнифер вы не получили пять из них в классе. Я хотел бы получить какой-то ответ для этих родителей о том, насколько маловероятным будет такое совпадение повторения имен.
Используя обширные данные Администрации социального обеспечения по именам детей ( https://www.ssa.gov/oact/babynames/limits.html ), кто-нибудь может подсказать мне, как выяснить шансы того, что в начальной школе в США будет пять дети с таким же именем? (Для простоты под «тем же именем» я имею в виду одинаковое написание, а под «школьным классом» я подразумеваю, что все дети родились в одном году.) Я не указываю размер класса, но он определенно должен быть больше 4 . :-)
источник
Ответы:
Все данные можно найти здесь . Каждое значение в таблице представляет вероятность того, что с учетом выборки на 25 человек из этого места и года рождения 5 из них будут иметь имя.
Метод : я использовал Биномиальный PDF на каждом имени, чтобы найти вероятность того, что в любом классе из 25 человек будет 5 человек, которые имеют общее имя:
Обновление: как отмечали многие, существует значительная разница во времени и между штатами. Таким образом, я запустил одну и ту же программу, на основе ГОСУДАРСТВА ПО ГОСУДАРСТВУ и со временем Вот результаты (общенациональная вероятность - красная, отдельные штаты - черная):
Интересно, что Вермонт (мой родной штат) неизменно является одним из наиболее вероятных мест, где это может происходить в течение последних нескольких десятилетий.
источник
пожалуйста, смотрите следующий Python-скрипт для Python2.
Ответ вдохновлен ответом Дэвида С.
Мой окончательный ответ: вероятность найти по крайней мере пять Джейкобов в одном классе, при этом Джейкоб будет наиболее вероятным именем согласно данным из https://www.ssa.gov/oact/babynames/limits.html «Национальных данных». с 2006 г.
Вероятность рассчитывается в соответствии с биномиальным распределением с вероятностью успеха по Джейкобу.
Максимум. вероятность не менее пяти детей с таким же именем из 25: 4.7e-07 для имени Джейкоб
Максимум. вероятность, по крайней мере, пяти детей с таким же именем из 50: 1.6e-05 для имени Джейкоб, конечно.
Максимум. вероятность, по крайней мере, пяти детей с таким же именем из 100: 0,00045 для имени Джейкоб, конечно.
В 10 раз тот же результат, что и у Дэвида С. Спасибо. (Мой ответ не суммирует все имена, должен обсуждаться)
источник