Я пытаюсь получить лучшее понимание оценки плотности ядра.
Использование определения из Википедии: https://en.wikipedia.org/wiki/Kernel_density_esvaluation#Definition
Давайте возьмем в качестве прямоугольной функции, которая дает если находится в от до и противном случае, а (размер окна) равен 1.
Я понимаю, что плотность - это свертка двух функций, но я не уверен, что знаю, как определить эти две функции. Одна из них должна (вероятно) быть функцией данных, которая для каждой точки в R сообщает нам, сколько точек данных у нас в этом месте (в основном ). А другой функцией, вероятно, должна быть какая-то модификация функции ядра в сочетании с размером окна. Но я не уверен, как это определить.
Какие-либо предложения?
Ниже приведен пример кода R, который (я подозреваю) копирует настройки, которые я определил выше (со смесью из двух гауссианов и ), на которых я надеюсь увидеть «доказательство» того, что функции, которые должны быть свернуты, являются, как мы подозреваем, ,
# example code:
set.seed(2346639)
x <- c(rnorm(50), rnorm(50,2))
plot(density(x, kernel='rectangular', width=1, n = 10**4))
rug(x)
источник
Ответы:
Любой пакет данных его "эмпирической функции плотности"X=(x1,x2,…,xn)
Здесь является «обобщенной функцией». Несмотря на это название, это вовсе не функция: это новый математический объект, который можно использовать только внутри интегралов. Его определяющим свойством является то, что для любой функции компактного носителя, непрерывной в окрестности ,δ g 0
(Имена для включают «атомарную» или «точечную» меру и « дельта-функцию Дирака» . В следующем расчете эта концепция расширена и включает функции которые являются непрерывными только с одной стороны.)δ гg
Обоснование этой характеристики заключается в том, чтоfX
где - обычный эмпирический CDF, а - обычная характеристическая функция (равная где ее аргумент равен true, и противном случае). (Я пропускаю элементарный ограничивающий аргумент, необходимый для перехода от функций компактной поддержки к функциям, определенным через ; поскольку нужно определять только значения в диапазоне , который компактен, это не проблема.)FX I 1 0 R I X
Свертка с любой другой функции дается, по определению, посколькуfX(x) k
Полагая (что совпадает с для симметричных ядер - и большинство ядер симметричны), мы получаем заявленный результат: формула Википедии является сверткой.k(x)=Kh(−x) Kh(x)
источник