Когда вы запутались, позвольте мне начать с изложения проблемы и поочередно отвечать на ваши вопросы. У вас есть размер выборки 10000, и каждая выборка описывается вектором признаков . Если вы хотите выполнить регрессии с использованием гауссовских радиальных базисных функций , то ищем функцию вида F ( х ) = Σ J ш J * г J ( х , μ J , σ J ) , J = 1 .. м где г яx ∈ R31
е( х ) = ∑JвесJ∗ гJ( х ; μJ, σJ) , j = 1 .. м
граммяваши основные функции. В частности, вам нужно найти
веса
ж J так , что для заданных параметров
М J и
сг J минимизировать ошибку между
у и соответствующим предсказанием
у =
ф ( х ) - как правило , вы будете минимизировать ошибку наименьших квадратов.
мвесJμJσJYY^е( х^)
Что именно является параметром j индекса Mu?
Вам нужно найти базисных функций g j . (Вам все еще нужно определить число m ) Каждая базисная функция будет иметь µ j и a σ j (также неизвестно). Индекс j колеблется от 1 до m .мграммJмμJσJJ1м
Является ли вектором?μJ
Да, это точка в . Другими словами, это точка где-то в вашем пространстве признаков, и для каждой из m базовых функций должно быть определено µ .р31μм
Я читал, что это определяет расположение основных функций. Так это не значит что-то?
базисной функции центрирована в ц J . Вам нужно будет решить, где находятся эти места. Так что нет, это не обязательно означает что-либо (но посмотрите, как это определить, ниже)Jт чμJ
Теперь о сигме, которая «управляет пространственным масштабом». Что именно это?
легче понять, если мы обратимся к самим базисным функциям.σ
Это помогает думать о гауссовых радиальных базисных функциях в более низких размерностях, скажем, или R 2 . В R 1 радиальная базисная функция Гаусса является просто известной кривой колокола. Колокол, конечно, может быть узким или широким. Ширина определяется σ - чем больше σ , тем уже форма колокола. Другими словами, σ масштабирует ширину формы колокола. Таким образом, для σ = 1 у нас нет масштабирования. Для больших σ мы имеем существенное масштабирование.р1р2р1σσσσσ
Вы можете спросить, какова цель этого. Если вы думаете о колоколе, покрывающем некоторую часть пространства (линия в ) - узкий колокол будет покрывать только небольшую часть линии *. Точки x, расположенные ближе к центру колокола, будут иметь большее значение g j ( x ) . Точки, удаленные от центра, будут иметь меньшее значение g j ( x ) . Масштабирование приводит к выталкиванию точек дальше от центра - по мере того, как колокол сужается, точки будут располагаться дальше от центра - уменьшая значение g j ( x )р1ИксграммJ( х )граммJ( х )gj(x)
Каждая базовая функция преобразует входной вектор x в скалярное значение
x∈R31
exp(−∥x−μj∥222∗σ2j)
xμj∥x−μj∥σj
Я видел некоторые реализации, которые пробуют такие значения, как .1, .5, 2.5 для этого параметра. Как рассчитываются эти значения?
Это, конечно, один из интересных и сложных аспектов использования радиальных базисных функций Гаусса. если вы будете искать в Интернете, вы найдете много предложений относительно того, как определяются эти параметры. Я в общих чертах изложу одну возможность, основанную на кластеризации. Вы можете найти это и несколько других предложений онлайн.
mmgjμjσj
∞∞
источник
источник