Какое распределение имеет максимальную энтропию для известного среднего абсолютного отклонения?

10

Я читал дискуссию в Hacker News об использовании стандартного отклонения в отличие от других показателей, таких как среднее абсолютное отклонение. Итак, если бы мы следовали принципу максимальной энтропии, с каким распределением мы бы использовали, если бы знали только среднее значение распределения и среднее абсолютное отклонение?

Или имеет смысл использовать медиану и среднее абсолютное отклонение от медианы?

Я нашел документ « Принцип максимальной энтропии с мерами общего отклонения » Гречука, Молибохи и Забаранкина, в котором, похоже, есть информация, которая мне интересна, но мне требуется время, чтобы ее расшифровать.

Дитрих Эпп
источник
Интересный вопрос; добро пожаловать в Cross Validated!
Ник Стаунер

Ответы:

13

Эти мудрые господа, Kotz, S., Kozubowski, TJ, & Podgorski, K. (2001). Распределение Лапласа и обобщения: пересмотр с приложениями к связи, экономике, технике и финансам (№ 183). Springer.

бросьте нам вызов с помощью упражнения:

введите описание изображения здесь

Доказательство может следовать теоретико-информационному доказательству того, что нормаль является максимальной энтропией для данного среднего значения и дисперсии. В частности: пусть будет вышеупомянутой плотностью Лапласа, и пусть будет любой другой плотностью, но с тем же средним и средним абсолютным отклонением. Это означает, что выполняется следующее равенство:f(x)g(x)

Eg(|Xc1|)=g(x)|xc1|dx=c2=f(x)|xc1|dx=Ef(|Xc1|)[1]
Теперь рассмотрим расхождение Кульбака-Лейблера двух плотностей:

0DKL(g||f)=g(x)ln(g(x)f(x))dx=g(x)lng(x)dxg(x)lnf(x)dx[2]

Первый интеграл является отрицательным от (дифференциальной) энтропии , обозначим ее . Второй интеграл (записывающий явно лапласианский pdf)gh(g)

g(x)ln[f(x)]dx=g(x)ln[12c2exp{1c2|xc1|}]dx
=ln[12c2]g(x)dx1c2g(x)|xc1|dx
Первый интеграл интегрируется в единицу, используя также уравнение получаем[1]

g(x)ln[f(x)]dx=ln[2c2]1c2f(x)|xc1|dx=(ln[2c2]+1)
Но это отрицание дифференциальной энтропии лапласиана, обозначим его .h(f)

Вставка этих результатов в уравнение. имеем Так как была произвольной, это доказывает, что Плотность выше лапласиана является максимальной энтропией среди всех распределений с вышеуказанными рецептами.[2]

0D(g||f)=h(g)(h(f))h(g)h(f)
g
Алекос Пападопулос
источник
Такой простой дистрибутив, а также хорошая статья! Я подозревал, что распределение будет плавным, кроме 0.
Дитрих Эпп
Спасибо. Иногда «то же самое происходит с тем же» - так как распределение Лапласа включает в себя абсолютное значение, это было главным подозрением.
Алекос Пападопулос