Я читал (например, здесь ), что ядро Епанечникова является оптимальным, по крайней мере в теоретическом смысле, при оценке плотности ядра. Если это правда, то почему гауссиан появляется так часто, как ядро по умолчанию, или во многих случаях единственное ядро, в библиотеках оценки плотности?
nonparametric
kernel-smoothing
Джон Раузер
источник
источник
kdensity
.Ответы:
Причиной, по которой ядро Епанечникова не используется повсеместно для его теоретической оптимальности, вполне может быть то, что ядро Епанечникова на самом деле не является теоретически оптимальным . Цыбаков открыто критикует аргумент о том, что ядро Епанечникова «теоретически оптимально» в с. 16–19 « Введение в непараметрическую оценку» (раздел 1.2.4).
Пытаясь суммировать, при некоторых предположениях о ядреK и фиксированной плотности p получаем, что средняя интегрированная квадратная ошибка имеет вид
Основная критика Цыбакова, кажется, сводится к минимуму по отношению к неотрицательным ядрам, поскольку часто можно получить более эффективные оценки, которые даже неотрицательны, не ограничиваясь неотрицательными ядрами.
Первый шаг аргумента для ядра Епанечникова начинается с минимизации(1) по h и всем неотрицательным ядрам (а не всем ядрам более широкого класса), чтобы получить «оптимальную» полосу пропускания для K
и "оптимальное" ядро (Епанечников)
, средний интегрированный квадрат ошибки:
Это, однако, неосуществимый выбор, поскольку они зависят от знания (черезp′′ ) неизвестной плотности p - поэтому они являются «оракуловыми» величинами.
Предложение Цыбакова подразумевает, что асимптотический MISE для оракула Епанечникова:
Цыбаков говорит, что (2) часто утверждается, что он является наилучшим достижимым MISE, но затем показывает, что можно использовать ядра порядка 2 (для которыхSK=0 ) для построения оценок ядра для каждого ε>0 , такого, что
Даже если р п не обязательно неотрицательное, все еще имеет один и тот же результат для положительной части оценки, р + п : = тах ( 0 , р п ) (который гарантированно быть неотрицательным , даже если К нет):p^n p+n:=max(0,p^n) K
Поэтому дляε достаточно мало, существует истинные оценщики , которые имеют меньший асимптотический Mise чем Епанечников оракул , даже используя то же предположение о неизвестной плотности p .
В частности, в результате получается, что инфимум асимптотической MISE для фиксированногоp по всем оценкам ядра (или положительным частям оценок ядра) равен 0 . Так что оракул Епанечникова даже близко не является оптимальным, даже если сравнивать с истинными оценщиками.
Причина, по которой люди выдвигают аргумент в пользу оракула Епанечникова, заключается в том, что часто утверждают, что само ядро должно быть неотрицательным, поскольку сама плотность неотрицательна. Но, как указывает Цыбаков, не нужно предполагать, что ядро неотрицательно, чтобы получить неотрицательные оценки плотности, и, допуская другие ядра, можно оценивать неотрицательные плотности, которые (1) не являются оракулами. и (2) выполнять произвольно лучше, чем оракула Епанечникова для фиксированногоp . Цыбаков использует это несоответствие, чтобы утверждать, что не имеет смысла спорить об оптимальности в терминах фиксированного p , а только о свойствах оптимальности, которые равномерны по классуплотностей. Он также указывает, что аргумент все еще работает при использовании MSE вместо MISE.
РЕДАКТИРОВАТЬ: см. Также следствие 1.1. на стр.25, где показано, что ядро Епанечникова недопустимо по другому критерию. Цыбакову действительно не нравится ядро Епанечникова.
источник
Ядро Гаусса используется, например, при оценке плотности через производные:
Это связано с тем, что ядро Епанечникова имеет 3 производные до того, как оно тождественно равно нулю, в отличие от гауссовского, которое имеет бесконечно много (ненулевых) производных. Смотрите раздел 2.10 в вашей ссылке для большего количества примеров.
источник