Преподаватель в моем университете задал такой вопрос (не для домашней работы, так как урок закончился, а меня там не было). Я не могу понять, как подойти к нему.
Речь идет о 2 пакетиках, каждый из которых содержит ассортимент разных видов фруктов:
Первая сумка содержит следующие случайно выбранные фрукты:
+ ------------- + -------- + --------- + | диаметр см | масса г | гнилой? | + ------------- + -------- + --------- + | 17.28 | 139,08 | 0 | | 6.57 | 91,48 | 1 | | 7.12 | 74,23 | 1 | | 16,52 | 129,8 | 0 | | 14,58 | 169,22 | 0 | | 6.99 | 123,43 | 0 | | 6,63 | 104,93 | 1 | | 6,75 | 103,27 | 1 | | 15,38 | 169.01 | 1 | | 7,45 | 83.29 | 1 | | 13.06 | 157,57 | 0 | | 6,61 | 117,72 | 0 | | 7.19 | 128,63 | 0 | + ------------- + -------- + --------- +
Вторая сумка содержит 6 случайно выбранных фруктов из того же магазина, что и первая сумка. Сумма их диаметров составляет 64,2 см, а 4 - гнилые.
Дайте оценку для массы второй сумки.
Я вижу, что есть два разных вида фруктов с нормально распределенными диаметрами и массами, но я теряюсь в том, как поступить.
regression
estimation
rutilusk
источник
источник
Ответы:
Давайте начнем с построения данных и посмотрим на них. Это очень ограниченный объем данных, поэтому он будет несколько случайным с большим количеством предположений.
Итак, вот данные, красные точки обозначают гнилые фрукты:
Вы правы, полагая, что есть два вида фруктов. Я делаю следующие предположения:
Поскольку считается, что сумма диаметров составляет 64,2 см, то, скорее всего, два плода большие, а четыре маленькие. Теперь есть 3 случая для веса. Есть 2, 3 или 4 маленьких гнилых плода ( большие гнилые плоды не влияют на массу по предположению ). Так что теперь вы можете получить оценку вашей массы, рассчитав эти значения.
Мы можем эмпирически оценить вероятность количества гнилых мелких плодов. Мы используем вероятности для взвешивания наших оценок массы в зависимости от количества гнилых плодов:
Дает нам окончательную оценку 691,5183г . Я думаю, что вы должны сделать большинство допущений, которые я сделал, чтобы прийти к выводу, но я думаю, что было бы возможно сделать это более разумным способом. Также я пробую эмпирически, чтобы получить вероятность количества гнилых маленьких плодов, то есть просто лень и это можно сделать «аналитически».
источник
Я бы предложил следующий подход:
Все это осуществляется простым скриптом.
источник
Несколько подходов включают в себя, от самых простых до сложных,
, , ,
комбинаторные методы
Подходы расположены в порядке простоты расчета, а не в порядке, когда какой-либо подход лучше или вообще не годится. Выбор того, какой подход использовать, зависит от того, какие характеристики населения известны или предполагаются. Например, если массы фруктов в популяции магазина обычно распределяются и не зависят от диаметров и состояния гнили, можно использовать первый, самый простой подход без каких-либо преимуществ (или даже недостатков ошибки выборки из нескольких переменных) использования более сложных подходов. , Если не независимые одинаково распределенные случайные величины, то может быть лучше более сложный выбор в зависимости от известной или предполагаемой информации о населении.
источник