Я делаю некоторую оценку плотности ядра с установленными весовыми точками (т. Е. Каждый образец имеет вес, который не является необходимым) в N измерениях. Кроме того, эти образцы находятся только в метрическом пространстве (то есть мы можем определить расстояние между ними), но не более того. Например, мы не можем определить среднее значение точек выборки, ни стандартное отклонение, ни масштабировать одну переменную по сравнению с другой. Ядро просто зависит от этого расстояния и веса каждого образца:
В этом контексте я пытаюсь найти надежную оценку для пропускной способности ядра , возможно, пространственно изменяющуюся и, предпочтительно, которая дает точную реконструкцию обучающего набора данных . При необходимости можно предположить, что функция относительно гладкая.
Я пытался использовать расстояние до первого или второго ближайшего соседа, но это дает довольно плохие результаты. Я пробовал с оптимизацией без участия, но у меня возникают трудности с поиском подходящей меры для оптимизации в этом контексте в Nd, поэтому он находит очень плохие оценки, особенно для самих обучающих выборок. Я не могу использовать жадную оценку, основанную на нормальном допущении, поскольку не могу вычислить стандартное отклонение. Я нашел ссылки, использующие ковариационные матрицы для получения анизотропных ядер, но опять же, это не будет иметь места в этом пространстве ...
У кого-то есть идея или ссылка?
источник
Ответы:
Начнем с оценки соседа Сильвермана , но как-то прибавим вес. (Я не уверен, для чего именно ваши веса здесь.) Метод ближайшего соседа, очевидно, может быть сформулирован в терминах расстояний. Я считаю, что ваш первый и второй метод ближайшего соседа являются версиями метода ближайшего соседа, но без функции ядра и с небольшим значением .К
источник
На Matlab File Exchange существует функция kde, которая обеспечивает оптимальную полосу пропускания в предположении, что используется ядро Гаусса: Оценщик плотности ядра .
Даже если вы не используете Matlab, вы можете проанализировать этот код для его метода расчета оптимальной пропускной способности. Это высоко оцененная функция при обмене файлами, и я использовал ее много раз.
источник