Я изучаю оценку максимального правдоподобия и читаю, что функция правдоподобия является произведением вероятностей каждой переменной. Почему это продукт? Почему не сумма? Я пытался найти в Google, но не могу найти сколько-нибудь значимых ответов.
maximum-likelihood
Ruiqi
источник
источник
80% + 75% = 155%
? как насчет80% * 75% = 60%
?Ответы:
Это очень простой вопрос, и вместо использования формального языка и математических обозначений я постараюсь ответить на него на уровне, на котором каждый, кто может понять вопрос, также может понять ответ.
Представь, что у нас гонка кошек. У них 75% вероятность родиться белым и 25% вероятность родиться серым, других цветов нет. Кроме того, они имеют 50% вероятности наличия зеленых глаз и 50% вероятности наличия голубых глаз, а цвет шерсти и цвет глаз являются независимыми.
Теперь давайте посмотрим на помет из восьми котят:
Вы увидите, что 1 из 4, или 25%, серого цвета. Кроме того, у 1 из 2, или 50%, есть голубые глаза. Теперь вопрос в том,
Вы можете сосчитать их, ответ один. То есть или 12,5% от 8 котят.14× 12= 18
Почему это происходит? Потому что у любого кота есть вероятность 1 из 4 быть серым. Итак, выберите четыре кошки, и вы можете ожидать, что одна из них будет серой. Но если вы выберете только четырех кошек из многих (и получите ожидаемое значение 1 серого кота), то у серого есть вероятность 1 к 2 иметь голубые глаза. Это означает, что из общего количества выбранных вами кошек вы сначала умножаете общее количество на 25%, чтобы получить серых кошек, а затем умножаете выбранные 25% всех кошек на 50%, чтобы получить тех из них, у которых голубые глаза. Это дает вам шанс получить голубоглазых серых кошек.
Суммирование их даст вам , что составляет314+ 12 или 6 из 8. На нашей картинке это соответствует суммированию кошек с голубыми глазами с кошками с серым мехом и подсчету одного серого голубоглазого котенка дважды! Такой расчет может иметь место, но он довольно необычен в вычислениях вероятности, и это, конечно, не тот вопрос, о котором вы спрашиваете.34
источник
По всей вероятности, мы предполагаем, что существует выборкаИкс1, х2, … , ХN N е( х1, х2, . , , , хN| θ)= ∏я = ня = 1е( хя| θ)
источник
Таким образом, если вы предполагаете, что все ваши наблюдения независимы, то вероятность наблюдения всех значений, которые вы видели, равна произведению отдельных вероятностей.
источник
Почему бы не добавить?
Потому что это явно не имеет смысла. Предположим, у вас есть четверть и никель, и вы хотите перевернуть их обоих. Вероятность того, что квартал поднимется вверх, составляет 50%, а вероятность того, что никель поднимется, - 50%. Если бы вероятность появления обоих хедз-апов была суммой, это составляло бы 100% -ную вероятность, что, очевидно, неправильно, поскольку не оставляет шансов для HT, TH и TT.
Зачем умножать?
Потому что это имеет смысл. Когда вы умножаете 50% -ную вероятность выпадения голов четверти на 50% вероятности выпадения никеля, вы получаете 0,5 x 0,5 = 0,25 = 25% вероятности того, что обе монеты являются головами. Учитывая, что существует четыре возможных комбинации (HH, HT, TH, HT), и каждая одинаково вероятна, это идеально подходит. Оценивая вероятность возникновения двух независимых событий, мы умножаем их индивидуальные вероятности.
источник
Я читаю эти посты, потому что, как и в случае с Первичным постером, мне нужно понять, почему « Вероятность » fn - это « Продукт » плотности каждого значения выборки - « х ». Читаемая и логичная причина приводится под заголовком « Принцип максимального правдоподобия». Ссылка: [ http://www-structmed.cimr.cam.ac.uk/Course/Likelihood/likelihood.html]. Еще одна цитата Математически, вероятность определяется как вероятность выполнения набора измерений (те же ссылки.) Короче говоря, вероятность того, что вы пришли к образцу, который у вас есть под рукой.
источник
Цель метода максимального правдоподобия состоит в том, чтобы найти оценщик, который максимизирует вероятность наблюдения определенных значений переменной (эндогенной переменной). Вот почему мы должны умножать вероятности возникновения.
Например: представьте, что номера телефонных звонков, на которые секретарь может ответить через час, соответствуют распределению Пуассона. Затем вы извлекаете 2 значения образца (5 телефонных звонков и 8 телефонных звонков в час). Теперь вы должны ответить на этот вопрос. Какое значение имеет параметр, который максимизирует вероятность одновременного наблюдения 5 и 8 телефонных звонков? После, попробуйте ответить с вероятностью соблюдения всех значений СЭМ.
Из-за независимых случайных величин,
f (y1 = 5 телефонных звонков) * f (y2 = 8 телефонных звонков) = ∏if (y, θ) = L (θ, y1, y2)
Наконец, постарайтесь ответить на вероятность соблюдения всех значений выборки.
источник