Под смесь двух нормальных распределений:
https://en.wikipedia.org/wiki/Multimodal_distribution#Mixture_of_two_normal_distributions
«Смесь из двух нормальных распределений имеет пять параметров для оценки: два средних, две дисперсии и параметр смешивания. Смесь из двух нормальных распределений с равными стандартными отклонениями является бимодальной, только если их средние значения отличаются, по меньшей мере, в два раза от общего стандартного отклонения «.
Я ищу вывод или интуитивное объяснение того, почему это правда. Я полагаю, что это может быть объяснено в форме t-теста из двух примеров:
где - стандартное отклонение в пуле.
Ответы:
Этот рисунок из статьи, ссылки на которую есть в этой вики-статье, представляет собой хорошую иллюстрацию
Доказательство, которое они предоставляют, основано на том факте, что нормальные распределения являются вогнутыми в пределах одного SD их среднего значения (SD является точкой перегиба нормального pdf, где оно переходит от вогнутого к выпуклому). Таким образом, если вы добавляете два нормальных PDF-файла вместе (в равных пропорциях), то, пока их средние значения отличаются менее чем на два SD, сумма-PDF (то есть смесь) будет вогнутой в области между этими двумя средними, и, следовательно, глобальный максимум должен находиться точно в точке между двумя средними.
Ссылка: Schilling, MF, Уоткинс, AE & Уоткинс, W. (2002). Является ли рост человека бимодальным? Американский статистик, 56 (3), 223–229. DOI: 10,1198 / 00031300265
источник
Это тот случай, когда изображения могут быть обманчивыми, потому что этот результат является особой характеристикой нормальных смесей: аналог не обязательно имеет место для других смесей, даже если компоненты имеют симметричные унимодальные распределения! Например, равная смесь из двух распределений Стьюдента, разделенных чуть менее чем в два раза их общим стандартным отклонением, будет бимодальной. Тогда для реального понимания мы должны сделать некоторую математику или обратиться к особым свойствам нормальных распределений.
Выберите единицы измерения (от центрирования и перемасштабирования по мере необходимости) для размещения средств составных распределений на±μ, μ≥0, и сделать их общую дисперсию единства. Пусть p, 0<p<1, будет количеством среднего компонента в смеси. Это позволяет нам выразить плотность смеси в полной общности как
Поскольку обе плотности компонентов увеличиваются там, гдеx<−μ и уменьшаются там, где x>μ, единственные возможные моды возникают там, где −μ≤x≤μ. Найдите их, дифференцируя f относительно x и устанавливая его в ноль. Очистка любых положительных коэффициентов, которые мы получаем
Выполнение аналогичных операций со второй производной отf и замена e2xμ на значение, определенное в предыдущем уравнении, говорит нам, что знак второй производной в любой критической точке является знаком
Так как знаменатель является отрицательным , когда−μ<x<μ, знак f′′ является то , что −(1−μ2+x2). Ясно, что когда μ≤1, знак должен быть отрицательным. Однако в мультимодальном распределении (поскольку плотность непрерывна), между любыми двумя модами должен быть антимод , где знак неотрицателен. Таким образом, когда μ меньше 1 (SD), распределение должно быть унимодальным.
Поскольку разделение средств составляет2μ, заключение этого анализа
Это логически эквивалентно утверждению в вопросе.
источник
Комментарий сверху вставлен сюда для преемственности:
Комментарий продолжен:
R код для рисунка:
источник