Что подразумевается под термином «предыдущий» в машинном обучении

12

Я новичок в машинном обучении. Я прочитал несколько статей, в которых они использовали глубокое обучение для различных применений и использовали термин «предшествующий» в большинстве случаев проектирования модели, скажем, предварительный при оценке позы человеческого тела. Может кто-нибудь объяснить, что это на самом деле означает. Я мог только найти математическую формулировку предшествующего и последующего в уроках.

Эми
источник
5
Это математическая концепция, так что да, она сформулирована математически. Тем не менее, страница Википедии, кажется, дает много интуиции. Вы это проверяли? Если да, не могли бы вы рассказать больше о том, чего вы не поняли и что вы ищете в ответе?
Дэвид Ричерби
@ Дэвид Ричерби . Благодарю за ваш ответ. Да, я проверил эту страницу википедии и смог собрать смутное представление о том, что это что-то о знаниях или информации о переменной. Я читал статьи об оценке позы тела, где упоминались априоры позы тела, алименты тела, моделирование априоров по трехмерной позе человека, изучение приоров до оценки трехмерной позы человека. Я не мог четко понять, что на самом деле означает термин «предыдущий» в этом контексте.
Эми

Ответы:

13

Проще говоря, без каких-либо математических символов, предшествующий означает первоначальные представления о событии с точки зрения распределения вероятностей . Затем вы настраиваете эксперимент и получаете некоторые данные, а затем «обновляете» свои убеждения (и, следовательно, распределение вероятностей) в соответствии с результатами эксперимента (апостериорное распределение вероятностей).

Пример: Предположим, нам дали две монеты. Но мы не знаем, какая монета подделка. Монета 1 является беспристрастной (HEADS и TAILS имеют 50% вероятности), а Coin 2 является предвзятой, скажем, мы знаем, что она дает HEADS с вероятностью 60%. Математически:

Учитывая, что у нас есть ГОЛОВЫ, вероятность того, что это Монета 1, равна 0,4 а вероятность того, что это Монета 2, составляет 0,6 p ( H | C o i n 2 ) = 0,6

п(ЧАС|СояN1)знак равно0,4
п(ЧАС|СояN2)знак равно0.6

Итак, это все, что мы знаем, прежде чем приступить к эксперименту.

Теперь мы собираемся выбрать монетку, чтобы бросить ее, и на основе информации о том, что у нас есть (H или T), мы будем угадывать, какую монету мы выбрали (Coin 1 или Coin 2).

п(СояN1)знак равноп(СояN2)знак равно0,5

п(СояN1|ЧАС)знак равноп(ЧАС|СояN1)п(СояN1)п(ЧАС|СояN1)п(СояN1)+п(ЧАС|СояN2)п(СояN2)знак равно0,4×0,50,4×0,5+0.6×0,5знак равно0,4

п(СояN2|ЧАС)знак равноп(ЧАС|СояN2)п(СояN2)п(ЧАС|СояN1)п(СояN1)+п(ЧАС|СояN2)п(СояN2)знак равно0.6×0,50,4×0,5+0.6×0,5знак равно0.6

0,5

Это основной принцип байесовского вывода и статистики, используемых в машинном обучении.

fade2black
источник
2
Вам нужно исправить пример выше. Этот расчет показывает, что обе монеты смещены (первая с вероятностью головы 40%, а вторая с вероятностью головы 60%). Если первая смещена, это все еще распределение Бернулли, но с вероятностями P (Coin1 | H) = 5/11 и P (Coin2 | H) =
6/11
1
Следует ли «учитывая, что у нас есть ГОЛОВЫ, вероятность того, что это Монета 1, равна 0,4» переписать как «Учитывая, что у нас есть Монета 1, вероятность того, что это Монета 1, равна 0,4» ?
Матин Улхак
Объяснение не объясняет с точки зрения машинного обучения.
user3023715