«Оценка плотности ядра» - это свертка чего?

25

Я пытаюсь получить лучшее понимание оценки плотности ядра.

Использование определения из Википедии: https://en.wikipedia.org/wiki/Kernel_density_esvaluation#Definition

ечас^(Икс)знак равно1NΣязнак равно1NКчас(Икс-Икся)знак равно1NчасΣязнак равно1NК(Икс-Иксячас)

Давайте возьмем в качестве прямоугольной функции, которая дает если находится в от до и противном случае, а (размер окна) равен 1.К()1Икс-0,50,50час

Я понимаю, что плотность - это свертка двух функций, но я не уверен, что знаю, как определить эти две функции. Одна из них должна (вероятно) быть функцией данных, которая для каждой точки в R сообщает нам, сколько точек данных у нас в этом месте (в основном ). А другой функцией, вероятно, должна быть какая-то модификация функции ядра в сочетании с размером окна. Но я не уверен, как это определить.0

Какие-либо предложения?

Ниже приведен пример кода R, который (я подозреваю) копирует настройки, которые я определил выше (со смесью из двух гауссианов и ), на которых я надеюсь увидеть «доказательство» того, что функции, которые должны быть свернуты, являются, как мы подозреваем, ,Nзнак равно100

# example code:
set.seed(2346639)
x <- c(rnorm(50), rnorm(50,2))
plot(density(x, kernel='rectangular', width=1, n = 10**4))
rug(x)

введите описание изображения здесь

Таль Галили
источник
3
Ваш коврик внизу дает грубую интуицию. Представьте, что каждое значение от до является шипом со связанным весом . Теперь намажьте каждый шип, используя форму и ширину ядра, чтобы шип трансформировался, чтобы принять ту же форму и ширину, с высотой, чтобы область ниже составляла . Добавьте результаты, и вы получите оценку плотности ядра. xii=1n1/n1/N
Ник Кокс
Привет, Ник, спасибо за комментарий. Это далеко в той интуиции, которую я уже получил, это превращение ее формально в форму свертки, которую мне было любопытно увидеть :) (Я с нетерпением жду, чтобы пройти через ответ Уубера!)
Таль Галили

Ответы:

27

Любой пакет данных его "эмпирической функции плотности"X=(x1,x2,,xn)

fX(x)=1ni=1nδ(xxi).

Здесь является «обобщенной функцией». Несмотря на это название, это вовсе не функция: это новый математический объект, который можно использовать только внутри интегралов. Его определяющим свойством является то, что для любой функции компактного носителя, непрерывной в окрестности ,δg0

Rδ(x)g(x)dx=g(0).

(Имена для включают «атомарную» или «точечную» меру и « дельта-функцию Дирака» . В следующем расчете эта концепция расширена и включает функции которые являются непрерывными только с одной стороны.)δгg

Обоснование этой характеристики заключается в том, чтоfИкс

xfX(y)dy=x1ni=1nδ(yxi)dy=1ni=1nxδ(yxi)dy=1ni=1nRI(yx)δ(yxi)dy=1ni=1nI(xix)=FX(x)

где - обычный эмпирический CDF, а - обычная характеристическая функция (равная где ее аргумент равен true, и противном случае). (Я пропускаю элементарный ограничивающий аргумент, необходимый для перехода от функций компактной поддержки к функциям, определенным через ; поскольку нужно определять только значения в диапазоне , который компактен, это не проблема.)FXI10RIX

Свертка с любой другой функции дается, по определению, посколькуfX(x)k

(fXk)(x)=RfX(xy)k(y)dy=R1ni=1nδ(xyxi)k(y)dy=1ni=1nRδ(xyxi)k(y)dy=1ni=1nk(xix).

Полагая (что совпадает с для симметричных ядер - и большинство ядер симметричны), мы получаем заявленный результат: формула Википедии является сверткой.k(x)=Kh(x)Kh(x)

Whuber
источник
1
Ситуация в двух измерениях объясняется (в более разговорной форме) и иллюстрируется на сайте ГИС по адресу gis.stackexchange.com/questions/14374/… .
whuber
1
Уважаемый Whuber, я только что прошел и прочитал ваш ответ с восторгом! Большое спасибо за объяснение и детали, ваши ответы (этот и ваши другие в целом) действительно вдохновляют. С уважением, Тал
Тал Галили
1
δg,xig(xi).
1
@whuber Спасибо. Предложение Обобщенная функция δ вовсе не является функцией: это новый математический объект, который можно использовать только внутри интегралов. сделал это понятнее. как всегда. ;)
Ян Вайнер
1
@ Ян Спасибо за вашу помощь: я включил эту идею в этот ответ.
uber