Изменит ли факт, что мой итальянский сын пойдет в начальную школу, ожидаемое количество итальянских детей, которые будут присутствовать в его классе?

37

Это вопрос, проистекающий из реальной ситуации, для которой я был искренне озадачен ее ответом.

Мой сын должен начать начальную школу в Лондоне. Поскольку мы итальянцы, мне было любопытно узнать, сколько итальянских детей уже посещают школу. Я попросил об этом сотрудника приемной комиссии при подаче заявления, и она сказала мне, что в среднем у них по 2 итальянских ребенка в классе (из 30).

Сейчас я нахожусь в момент, когда я знаю, что мой ребенок был принят, но у меня нет никакой другой информации о других детях. Критерии приема основаны на расстоянии, но для целей этого вопроса, я полагаю, мы могли бы предположить, что он основан на случайном распределении из большой выборки кандидатов.

Сколько итальянских детей ожидается в классе моего сына? Это будет ближе к 2 или 3?

user90213
источник
39
Это напоминает мне старую шутку: «Я всегда ношу с собой бомбу, когда путешествую, потому что какова вероятность того, что два человека будут иметь бомбу в одном самолете?»
Билл Ящерица
2
То, что сотрудник приемной комиссии сказал вам, что у них в среднем 2 итальянских ребенка в классе, делает эти данные «недостоверными» для меня. Если бы оно было получено в результате реальных вычислений, вы ожидали бы не округленное число. Так что вполне возможно, что истинное значение, скажем, 1,51 или 2,49. Кроме того, поскольку сотрудник приемной комиссии с большей вероятностью попытается «порадовать вас» своим ответом, они, возможно, округлили его, а не округлили (если они думали, что вам будет приятно иметь своего ребенка среди других итальянцев), предполагая, что вероятность распределение по значениям около 2 будет несимметричным. Ответы ниже могут быть адаптированы.
PatrickT
4
@PatrickT "Режим" является допустимым типом среднего.
Ян Рингроз
1
Большое спасибо, ребята, за ответ. Теперь я также опубликовал аналогичный вопрос, но с другим обрамлением ( stats.stackexchange.com/questions/173969/… ), который был вызван некоторыми вашими входными данными / ответами.
user90213
1
@PatrickT Я думаю, что намного меньше плохо образованных людей, которые были бы смущены 1,5 («Как у тебя половина ребенка?»), Чем статисты, раздраженные чрезмерным округлением, мне кажутся более вероятными. (Предполагая, что более точное число в действительности не равно 1,9 или 2,1.)
Дэн Нили,

Ответы:

27

Как всегда, вам нужно рассмотреть вероятностную модель, которая описывает, как школа распределяет детей по классам. Возможности:

  1. Школа заботится о том, чтобы во всех классах было одинаковое количество иностранных граждан.
  2. Школа даже пытается удостовериться, что каждая национальность представлена ​​примерно одинаково в каждом классе.
  3. Школа вообще не учитывает национальность, а просто распределяет ее случайно или по другим критериям.

Все это разумно. Учитывая стратегию 2, ответ на ваш вопрос - нет. Когда они используют стратегию 3, ожидание будет близко к 3, но немного меньше. Это потому, что ваш сын занимает «место», и у вас есть еще один шанс для случайного итальянца.

Когда школа использует стратегию 1, ожидания также возрастают; сколько зависит от количества иностранных граждан в классе.

Не зная вашей школы, невозможно ответить на этот вопрос более идеально. Если у вас есть только один урок в год и критерии приема такие же, как описано, ответ будет таким же, как и для 3 выше.

Расчет на 3 в деталях:

E(X)=1+E(B(29,2/30))=1+1.9333=2.9333.

X - количество итальянских детей в классе. 1 - от известного ребенка, 29 - остальные ученики, а 2/30 - вероятность того, что неизвестный ребенок будет итальянцем, учитывая то, что говорит школа. B - биномиальное распределение.

Обратите внимание, что начало с не дает правильного ответа, поскольку знание того, что конкретный ребенок итальянец, нарушает взаимозаменяемость, предполагаемую биномиальным распределением. Сравните это с парадоксом мальчика или девочки , где важно, знаете ли вы, что один ребенок - девочка, а не то, что старший ребенок - девочка.E(X|X1)

Erik
источник
2
Давайте сделаем биномиальное предположение и пусть . Представляется , что выбор между E ( X ~ B ( 30 , 2 / 30 ) | Х 1 ) и Е ( Б ( 29 , 2 / 30 ) )Nзнак равно30Е(Икс~В(30,2/30)|Икс1)E(B(29,2/30))может зависеть от предположений. Например, если я предполагаю, что любой итальянский отец в Лондоне, скорее всего, будет озадачен @ user90213 и затем собирается опубликовать здесь вопрос, то просмотр этого вопроса не сильно изменит мои ожидания. Я только узнал, что один ребенок итальянец и вычислит . Это то, что вы назвали "обменом"? С другой стороны, если user90213 - мой близкий друг, и я знаю его сына, то я приду к вашему ответу. E(X|X1)
говорит амеба, восстановите Монику
2
@amoeba Зная, что в конкретной школе и в определенном классе есть ребенок user90213, достаточно отличить его от остальных, это не зависит от того, насколько особенными являются ваши отношения с пользователем90213. Но это сложно, потому что важно, как вы изучаете информацию. Например, если вы по электронной почте попросите, чтобы старший итальянский ребенок в классе связался с вами по имени, и вы получили ответ, вы бы выбрали подход даже если впоследствии вы сможете различить ребенка. Попробуйте прибегнуть к поиску парадокса девочка-мальчик или даже задайте более общий вопрос. Об этом много говорят. Е(Икс|Икс>1)
Эрик
Это верно, спасибо Эрик. То, что я имел в виду в предыдущем комментарии, похоже на ваш пример с электронной почтой. Если я предполагаю, что все итальянские родители в классе зададут здесь вопрос, то видеть этот вопрос - все равно, что связаться со старшим итальянским ребенком. Кажется, что мы в целом согласны, +1. Ссылка на вики действительно интересна.
говорит амеба, восстанови Монику
(+1) Но озадачен, почему вы говорите: «Если у вас только один урок в год [...]».
Scortchi - Восстановить Монику
@ Scortchi Если в школе есть только один класс в год, то он может использовать две стратегии, обозначенные 1 и 2, поскольку каждый ребенок, принятый в школу в этом году, попадает в один класс.
Эрик
13

Еще один способ взглянуть на это на уровне отдельных детей. Если предположить , что 30 детей нарисованных случайным образом из популяции (которые вы указали , мы можем), мы можем работать в обратном направлении к грубой вероятности итальянского ребенка втягивается из этой группы населения: = 1 / 15 .2/301/15

Учитывая, что мы знаем, что один из 30 - итальянский, нам нужно только вычислить вероятность для оставшихся детей:

291/15=29/15=1.933

Таким образом, знание того, что ваш ребенок итальянец, меняет ожидаемое число итальянских детей в классе примерно до 2,933, что намного ближе к 3, чем к 2.

Томас Клеберг
источник
5

Вот мои мысли о том, как подойти к этому:

Пусть случайная величина обозначает количество итальянских детей в классе, который в настоящее время имеет размер n . Пусть X будет показателем того, что новый ребенок - итальянец. Предположим, что мы добавили дочерний элемент X в этот класс. Тогда ожидаемое число итальянских детей в этом расширенном классе размера n + 1 будет E ( S n + X ) = E ( S n ) + E ( X ) = E ( S n ) + P (SnnXXn+1 . Обратите внимание, что независимость здесь не имеет значения, поскольку мы используем только линейность ожидания. Если известно, что ребенок X итальянский, то X = 1 с вероятностью 1, поэтому мы увеличили ожидаемое значение на 1.E(Sn+X)=E(Sn)+E(X)=E(Sn)+P(X=1)XX=1

JLD
источник
1
То есть в этом классе будет детей после добавления итальянского ребенка? n+1
Scortchi - Восстановить Монику
Да. Есть что-то, что я пропускаю, связанное с этим?
15:47
1
Зависит от того, как вы читаете вопрос. Предположим, что в классе ровно 30 детей.
Scortchi - Восстановить Монику
1
Может быть, я неправильно понял вопрос. Я думал, что это спрашивает о том, как добавление известного итальянского ребенка меняет ожидания.
15:49
1
Это очень хороший момент , о классе размеров , возможно , будучи ограничен
JLD
1

На основании информации Admission офиса, число итальянских детей следует биномиальному , предполагающей независимость. Теперь вы знаете, что в вашем классе есть по крайней мере один итальянский ребенок, поэтому ожидание становится E ( X | X 1 ) . Для X ~ B я п о м ( 30 , 2 / 30 ) , это имеет значение 2,28 (если я получу расчет право).Binom(30,2/30)E(X|X1)XBinom(30,2/30)2.28


E[X|X1]=i=030iP(X=i|X1)=030iP(X=i,X1)P(X1)=130iP(i)1P(0)

(обратите внимание на изменение нижней границы суммирования на последнем шаге)

jf328
источник
1
Можете ли вы уточнить условное ожидание?
Антони Пареллада
3
Ваш ответ неверный. Правильный способ вычислить это было бы как 1 (известный ребенок) + E (B (29, 2/30)), который получается как 2.9333. И предположение о биномиальном распределении сомнительно.
Эрик
Еще одна вещь, на которую я хотел бы обратить внимание: а) ваш расчет условного ожидания неверен. Но б) что более важно, начинать с условного ожидания неверно. Знание того, что конкретный ребенок - это итальянцы, нарушает взаимозаменяемость, предполагаемую бинормальным распределением. Это очень похоже на парадокс мальчик-девочка ( en.wikipedia.org/wiki/Boy_or_Girl_paradox ), где важно, знаете ли вы, что старший ребенок - девочка, или знаете, что один из двух детей - девочка.
Эрик
Скретч комментарий а) сверху. Но б) все равно серьезнее;)
Эрик,
Я согласен. Для OP распределение больше не является биномиальным (30, 2/30), но действительно 1 + биномиальное (29, 2/30)
jf328
-3

Нет. Ваше знание о предстоящих событиях ничего не меняет в типичном опыте школы.

рынок
источник
2
-1. Это неверно, как подробно объясняется в других ответах и ​​комментариях здесь.
говорит амеба, восстанови Монику
простите, что у меня нет продвинутой математики, но что делает ребенка этого джентльмена НЕ одним из «типично 2» детей? .. таким, что мы приближаемся к 3.
Март
См. Stats.stackexchange.com/questions/173844/#comment328621_173844
амеба говорит восстановить Монику
Март: Представьте, что я подбрасываю монету десять раз и считаю головы; ничего странного в монете или в том, как я ее подбрасываю. Я повторяю этот эксперимент много раз, и в среднем я вижу почти ровно 5 голов в десяти бросках; какие результаты вы видите (всего 1000 бросков, из которых 50,3% были головами, что находится в пределах ожидаемого отклонения для справедливой процедуры подбрасывания монеты; мы решили согласиться с тем, что процесс кажется по меньшей мере практически справедливым). Теперь я провожу эксперимент с вами еще раз, и вы видите, что первые 4 броска - это головы. Каково ожидаемое количество голов в комплектации из десяти бросков? 5? Больше?
Glen_b
Обратите внимание, что согласно вашему более раннему аргументу, первые четыре «могли быть четырьмя из ожидаемых пяти». Но тогда вы бы сказали, что на следующих шести бросках вероятность составляет менее 50% (на самом деле вы говорите, что вероятность составляет всего 1/6 в среднем). Как монета узнает, что она реже поднимается?
Glen_b