Я не знаю ни одного мультимодального дистрибутива.
Почему все известные дистрибутивы унимодальны? Есть ли какой-нибудь "знаменитый" дистрибутив с более чем одним режимом?
Конечно, смеси распределений часто являются мультимодальными, но я хотел бы знать, существуют ли какие-либо «несмешанные» распределения, которые имеют более одной моды.
distributions
mode
Мирослав Сабо
источник
источник
Ответы:
Ответы на первую часть вопроса даны в комментариях к вопросу: множество дистрибутивов «фирменных» являются мультимодальными, например, любой дистрибутив Beta с a < 1 и b < 1 . Давайте теперь обратимся ко второй части вопроса.(a,b) a<1 b<1
Все дискретные распределения представляют собой явно смеси (атомов, которые унимодальны).
Я покажу, что большинство непрерывных распределений также представляют собой смеси унимодальных распределений. Интуиция за этим проста: мы можем «отшлифовать» неровности на ухабистом графике PDF, один за другим, пока график не станет горизонтальным. Удары становятся компонентами смеси, каждый из которых явно унимодален.
Следовательно, за исключением, возможно, некоторых необычных распределений, чьи PDF-файлы являются очень прерывистыми, ответ на вопрос «нет»: все мультимодальные распределения, которые являются абсолютно непрерывными, дискретными или комбинацией этих двух, представляют собой смеси унимодальных распределений.
Рассмотрим непрерывные распределения , PDF-файлы которых f непрерывны (это «абсолютно непрерывные» распределения). (Непрерывность не является ограничением; ее можно еще больше ослабить с помощью более тщательного анализа, предполагая лишь, что точки разрыва дискретны.)F f
Чтобы справиться с «плато» постоянных значений, которые могут возникнуть, определите «режим» как интервал (который может быть одной точкой, где x l = x u ), такой, чтоm=[xl,xu] xl=xu
имеет постоянное значение на m , скажем, y .f m, y
не является постоянным на любом интервале, который строго содержит m .f m
Существует такое положительное число , что максимальное значение f, достигаемое на [ x l - ϵ , x u + ϵ ], равно y .ϵ f [xl−ϵ,xu+ϵ] y
Пусть - любая мода f . Поскольку f непрерывна, существуют интервалы [ x ′ l , x ′ u ], содержащие m, для которых f не уменьшается в [ x ′ l , x l ] (что является правильным интервалом, а не просто точкой) и не увеличивается в [ x u , x ′ u ]m=[xl,xu] f f [x′l,x′u] m f [x′l,xl] [xu,x′u] (что также является правильным интервалом). Пусть - бесконечный минимум всех таких значений, а x ′ u - супремум всех таких значений.x′l x′u
Эта конструкция определила один «горб» на графике , проходящие от Купить ' л до й ' ц . Пусть y будет больше из f ( x ′ l ) и f ( x ′ u ) . По построению множество точек x в [ x ′ l , x ′ u ], для которых f ( x ) ≥ y, является собственным интервалом m ′f x′l x′u y f(x′l) f(x′u) x [x′l,x′u] f(x)≥y m′ строго содержащий (потому что он содержит либо целое из [ x ′ l , x l ], либо [ x u , x ′ u ] ).m [x′l,xl] [xu,x′u]
На этой иллюстрации мультимодального PDF режим обозначен красной точкой на горизонтальной оси. Горизонтальная протяженность красной части заливки - это интервал m ′ : это основание горба, определяемого модой m . Основание этого горба находится на высоте y ≈ 0,16 . Оригинальный PDF - это сумма красной и синей заливок. Обратите внимание, что у синей заливки только один режим около 2 ; оригинальный режим в [ 0 , 0 ] был удален.m=[0,0] m′ m y≈0.16 2 [0,0]
Написание для длины m ′ определите|m′| m′
и
когда и е м ( х ) = 0 в противном случае. (Это делает f m непрерывной функцией, между прочим.) Числитель - это величина, на которую f поднимается выше y, а знаменатель p m - это площадь между графиком f и y . Таким образом, f m неотрицательна и имеет общую площадь 1 : это PDF распределения вероятностей. По построению он имеет уникальный режим m .x∈m′ fm(x)=0 fm f y pm f y fm 1 m
Также по конструкции, функция
это PDF при условии . (Очевидно, что если p m = 1, то от f ничего не останется , что должно было быть унимодальным для начала.) Более того, у него нет мод в интервале m ′ (где он постоянен, поэтому предыдущее тщательное определение a Режим как интервал был необходим). Более того,pm<1 pm=1 f, m′
является смесью унимодального PDF и PDF f ′ m .fm f′m
Повторите эту процедуру с (которая как линейная комбинация непрерывных функций все еще является непрерывной функцией, позволяющей нам действовать как и прежде), создавая последовательность режимов m = m 1 , m 2 , … ; соответствующие последовательности весов p 1 = p m , p 2 = p m 2 , … ; и PDF-файлы f 1 = f m , f 2 = f m 2 , … .f′m m=m1,m2,… p1=pm,p2=pm2,… f1=fm,f2=fm2,…. Ограничивающий результат существует потому, что (а) интервал, в котором сглаживается, включает в себя надлежащий интервал, который не был сглажен в предыдущих операциях i - 1, и (b) действительные числа не могут быть разложены более чем на счетное число таких интервалов , Предел не может иметь никаких мод и поэтому является постоянным, который должен быть нулевым (иначе его интеграл расходился бы). Следовательно, f было выражено (возможно, не однозначно, потому что порядок, в котором были выбраны моды, будет иметь значение) как смесьfi i−1 f
унимодальных распределений, QED.
источник
Под унимодалом я думаю, что OP явно означает, что существует только один внутренний режим (т.е. исключая угловые решения). Таким образом, вопрос действительно задает ...
то есть почему большинство дистрибутивов брендов выглядят примерно так:
... плюс или минус некоторая асимметрия или некоторые разрывы? Когда вопрос ставится таким образом, бета-распределение не будет действительным контрпримером.
Похоже, гипотеза ФП имеет определенную силу: большинство распространенных брендов не допускают использования более одного внутреннего режима. Там могут быть теоретические причины для этого. Например, любой дистрибутив, являющийся членом семейства Пирсонов (который включает в себя бета-версию), обязательно будет (внутренним) унимодальным, как следствие родительского дифференциального уравнения, определяющего всю семью. И семья Пирсонов гнездится в большинстве известных брендов.
Тем не менее, вот несколько примеров встреч с торговыми марками ...
Контрпример
Одним из контрпримеров фирменного дистрибутив Sinc 2 с pdf:Sinc2
Возможно, мы могли бы также добавить семейство cardiod и дистрибутивов, связанных с этим классом ... с pdf-графиками, такими как:
Семейство отраженных брендовых дистрибутивов также может быть возможным претендентом на имя бренда (хотя их можно рассматривать как «обманное решение» ... но они все еще являются торговыми марками), например, «Отраженный Вейбулл», показанный здесь:
источник
То, что вы не можете думать ни о чем, не означает, что их нет.
Я могу назвать «известные» дистрибутивы, которые не являются унимодальными.
Например, бета-версия сα и β и то и другое < 1 ,
http://en.wikipedia.org/wiki/Beta_distribution
также см
http://en.wikipedia.org/wiki/U-quadratic_distribution
(Это не особый случай бета-распределения, несмотря на комментарий, в котором говорится, что это так. Однако у двух семейств есть некоторые совпадения.)
Распределения смесей, безусловно, известны, и многие из них являются мультимодальными.
источник
Альфа-косо-нормальное распределение (Elal-Olivero 2010) имеет PDF:
гдеφ PDF стандартного гауссова
За| α | >1,34 распределение бимодальное. Примерный сюжет дляμ = 1 , σ= 0,5 , а = 2 :
источник