Я читаю из книги, которая представляет распределение Dirchilet, а затем представил цифры о нем. Но я не был в состоянии понять эти цифры. Я прикрепил рисунок здесь внизу. Чего я не понимаю, так это значения треугольников.
Обычно, когда кто-то хочет построить функцию от 2 переменных, вы берете значение var1 и va2, а затем наносите на график значение функции этих двух переменных ... что дает визуализацию в трехмерном измерении. Но здесь есть 3 измерения и одно другое значение для значения функции, поэтому оно визуализируется в 4D пространстве. Я не могу понять эти цифры!
Я надеюсь, что кто-то может уточнить их, пожалуйста!
РЕДАКТИРОВАТЬ: вот что я не понимаю из рисунка 2.14a. Итак, мы взяли из K = 3 dirichlet образец тэты (который в основном является вектором), а именно: тета = [theta1, theta2, theta3]. График треугольника [theta1, theta2, theta3]. Расстояние от начала координат до каждого theta_i является значением theta_i. Затем для каждого theta_i он поместил вершину, соединил все три вершины и сделал треугольник. Я знаю, что если я подключу [theta1, theta2, theta3] к dir (theta | a), я получу одно число, которое является общей вероятностью вектора theta. Я также понимаю, что вероятность непрерывных случайных величин является мерой площади. Но здесь у нас есть 3 измерения, поэтому совместная вероятность будет мерой объема пространства от розовой плоскости и под ... т.е. пирамидой. Теперь я не понимаю, какова роль треугольника здесь.
Ответы:
Все точки в треугольнике должны удовлетворять двум ограничениям: от нуля до единицы в каждом измерении ( ), и все суммы до одного ( ).θ 0 + θ 1 + θ 2 = 10≤θ≤1 θ0+θ1+θ2=1
То, как я наконец понял это следующее:
Так (а) показывает трехмерное пространство с качестве координат. Они варьируются только от 0 до 1.θ1,2,3
В (б) показан треугольник, это наш симплекс.
(c) показывает две примерные точки, которые «лежат» на симплексе, которые также соответствуют вторым критериям (суммы до одного).
(d) показывает другую примерную точку на симплексе, те же самые ограничения
В (д) я попытался показать проекцию симплекса на двумерный треугольник со всеми примерами точек, показанных ранее.
Надеюсь, теперь это имеет больше смысла :)
источник
График 2.14 (а) показывает плоскость, образованную тремя вершинами на каждой оси. Расстояние вершины от начала координат соответствует одному из классов. Область, ограниченная розовой плоскостью и плоскостями осей, является вероятностью (вектор) k = 3 θθi k=3 θ , Теперь предположим, что вы наклоняете эту плоскость так, чтобы у вас была пирамида с розовой плоскостью, лицом, ближайшим к читателю, расположенной плоско на странице. Затем подавьте «выкатывание» третьего измерения страницы и закрасьте треугольник так, чтобы область с более высокой плотностью, с большим расстоянием от основания до поверхности, была более красной. Это то, что показывают графики 2.14 (б) и 2.14 (в). Чем больше красный сосредоточен возле вершины, тем более вероятен класс, связанный с этой вершиной. Аналогично, если красная область не очень близка к какой-либо вершине, маловероятно, что событие имеет более высокую вероятность членства в каком-либо из классов.
Эта пирамида, тем не менее, имеет смысл только как единственная реализация распределения Дирихле. Повторное рисование из того же распределения может привести к разной пирамиде с разными длинами для каждой из вершин. Ключевое различие между (a) и (b) / (c) состоит в том, что (a) графически отображает вероятность одной ничьей вектора . Графики (b) и (c) показывают плотность вероятности для значений в симплексе , то есть они пытаются представить функцию плотности вероятности для всех значенийθ θ k = 3 θ θ ∼ Dir ( α )θ θ θ k=3 θ в поддержку. Один из способов думать о (b) и (c) - это точка, имеющая дополнительный красный цвет в соответствии со средней высотой между плоской розовой плоскостью и поверхностью пирамиды, усредненной по многим чертежам .θ∼Dir(α)
источник