Можно ли применить расхождение KL между дискретным и непрерывным распределением?

12

Я не математик. Я искал в Интернете о KL Divergence. Я узнал, что дивергенция KL измеряет потерянную информацию, когда мы приближаемся к распределению модели относительно входного распределения. Я видел это между любыми двумя непрерывными или дискретными распределениями. Можем ли мы сделать это между непрерывным и дискретным или наоборот?

Пракаш
источник
Связанный: stats.stackexchange.com/q/6907/2970
кардинал

Ответы:

4

Нет: Дивергенция KL определяется только для распределений по общему пространству. Он спрашивает о плотности вероятности точки при двух различных распределениях, p ( x ) и q ( x ) . Если p распределение на R 3 и q распределение на Z , то q ( x ) не имеет смысла для точек p Иксп(Икс)Q(Икс)пр3QZQ(Икс) аp(z)не имеет смысла для точекz Zпр3п(Z)ZZ, На самом деле, мы даже не можем сделать это для двух непрерывных распределений в пространствах разных измерений (или дискретных, или в любом случае, когда базовые вероятностные пространства не совпадают).

Если вы имеете в виду конкретный случай, может быть возможно придумать какой-то подобный дух меру различия между распределениями. Например, может иметь смысл кодировать непрерывное распределение под кодом для дискретного (очевидно, с потерянной информацией), например, округляя до ближайшей точки в дискретном случае.

Дугал
источник
Отметим, что дивергенция KL между дискретным и абсолютно непрерывным распределениями хорошо определена.
Оливье
@ Оливье Обычное определение требует общей доминирующей меры, не так ли?
Дугал
1
Вы правы, когда P и Q определены в разных пространствах. Но в общем измеримом пространстве такая мера всегда существует (например, P + Q), и дивергенция KL не зависит от конкретного выбора доминирующей меры.
Оливье
8

Да, дивергенция KL между непрерывными и дискретными случайными переменными хорошо определена. Если и Q - распределения в некотором пространстве X , то и P, и Q имеют плотности f , g относительно μ = P + Q и D K L ( P , Q ) = X f log fпQИкспQегμзнак равноп+Q

DКL(п,Q)знак равноИксежурналегdμ,

Например, если , P - мера Лебега, а Q = δ 0 - точечная масса в 0 , то f ( x ) = 1 - 1 x = 0 , g ( x ) = 1 x = 0 и D K L ( P , Q ) = .Иксзнак равно[0,1]пQзнак равноδ00е(Икс)знак равно1-1Иксзнак равно0г(Икс)знак равно1Иксзнак равно0

DКL(п,Q)знак равно,
Оливье
источник
Как доказать, что не зависит от доминирующей меры? Иксежурналегdμ
Габриэль Ромон
Теорема об изменении меры.
Оливье
1

Не в общем. Дивергенция КЛ

DКL(п || Q)знак равноИксжурнал(dпdQ)dп

пQпQσdпdQ

σ

jtobin
источник