Имеет ли значение, как вы выбираете популяцию?

9

У меня есть хорошо перемешанный чан с бесконечным количеством мрамора. В чане есть бесконечное количество мрамора, но они бывают только неизвестного, но конечного числа разновидностей : неизвестно, и для рисование мрамора типа может быть более вероятным, чем рисование мрамора типа .k i j v i v j

V={v1,v2,v3,...,vk}
kijvivj

В эксперименте машина отбирает чан, используя неизвестную процедуру. Машина сообщает набор описывающий разновидностей мрамора из своего образца: q k X V ;Xqk

XV;|X|=q

Испытания этого эксперимента повторяются ( фиксируется во время испытаний), и мы получаем последовательность подмножеств , .V ( X 1 , X 2 , )qV(X1,X2,)

Единственное, что мы знаем:

  • испытания независимы и идентичны
  • машина сообщает верхний наиболее часто встречающиеся разновидности в образцеq

Мы не знаем точно, как машина обрабатывает мрамор. Он может выбрать большое количество шариков, то отчет об наиболее часто. В качестве альтернативы, он может продолжать собирать шарики, пока не появится разновидностей. Есть и другие вещи, которые он мог бы сделать.qqq

Повлияет ли на процесс отбора проб машина распределение наших испытаний ?(X1,X2,)

Кристиан Чепмен
источник
3
+1 Это большой вопрос, потому что он понимает, что случайная выборка - это нечто большее, чем некая расплывчатая форма произвола или недостаток знаний о процедуре выборки.
whuber
Правило выборки, безусловно, будет иметь значение. В противном случае рассмотрим эту процедуру: машина при каждом испытании всегда выбирает один мрамор типа 1 (первый сорт). Каждый розыгрыш будет независимым и будет иметь одинаковое распределение (тривиально), и вы получите q = 1, совершенно бесполезный результат.
АляскаRon

Ответы:

9

Простой способ проверить, что метод имеет значение, состоит в том, чтобы выбрать определенные вероятности для типов мрамора и вычислить вероятность каждого подмножества согласно некоторым методам. Это не может доказать, что метод не имеет значения, однако.

Предположим, есть типа, и шансы каждого типа равны , и соответственно. Предположим, вы выбираете типа мрамора.31/21/41/42

Предположим, выбрав мрамор, вы игнорируете все остальное. получения составляет .{v2,v3}21/41/3=1/6

Предположим, вы отклоняете пары с повторяющимися типами. Шанс является{v2,v3}

21/41/421/41/4+21/21/4+21/21/4=1/81/8+1/4+1/4=1/5.

Так как они разные, метод, используемый машиной, имеет значение. Отклонение пар с повторяющимися типами имеет тенденцию меньше весить пары с распространенными типами.

Два из упомянутых вами методов эквивалентны. Игнорирование остальных в своем роде после выбора мрамора - это то же самое, что и сбор, пока у вас не будет различных типов.q

Дуглас Заре
источник