Что такое «ядро» в простом английском?

73

Есть несколько отличных способов использования:

  • оценка плотности ядра
  • трюк с ядром
  • сглаживание ядра

Пожалуйста, объясните, что «ядро» в них означает, простым языком, своими словами.

Нил Макгиган
источник
3
Не хамить, но разве это не тот вопрос, на который уже ответили до тошноты в Википедии и тому подобное? Google дал мне ответ в течение 15 секунд ...
Джорис Мейс
46
Я абсолютно ненавижу ответы Википедии за статистику. Есть бессвязные, символические беспорядки. Я ищу жемчужину ответа, которая может объяснить ответ на простом английском языке, так как я считаю, что это показывает более глубокий уровень понимания, чем математическое уравнение. Здесь есть много популярных «простых английских» вопросов, и на то есть веские причины.
Нил Макгиган

Ответы:

39

Как в статистике (оценка плотности ядра или сглаживание ядра), так и в литературе по машинному обучению (методы ядра) ядро ​​используется как мера сходства. В частности, функция ядра Определяет распределение сходств точек вокруг заданной точки . обозначает сходство точки с другой данной точкой .k(x,.)xk(x,y)xy

ebony1
источник
Это хороший способ выразить это. Мне интересно, можете ли вы обобщить это описание, чтобы оно также относилось к ядру «оценки плотности ядра».
Шаббычеф
2
В некотором смысле, да. Один из способов понять оценку плотности ядра состоит в том, что вы аппроксимируете плотность точки из некоторого распределения как средневзвешенное значение ее сходств с набором точек из распределения. Таким образом, понятие сходства играет здесь важную роль.
ebony1
1
Я понимаю, что «ядро» в статистике изначально заимствовано из жаргона, используемого при обсуждении интегральных уравнений.
Ник Кокс,
42

По-видимому, существует два разных значения «ядра»: одно чаще используется в статистике; другой в машинном обучении.

В статистике «ядро» наиболее часто используются для обозначения ядра оценки плотности и ядро сглаживания .

Прямое объяснение ядер в оценке плотности может быть найдено ( здесь ).

В машинном обучении «ядро» обычно используется для обозначения трюка ядра , метода использования линейного классификатора для решения нелинейной задачи «путем отображения исходных нелинейных наблюдений в многомерное пространство».

Простая визуализация могла бы состоять в том, чтобы представить, что весь класс находится в радиусе от начала координат в плоскости x, y (класс : ); и все класс находятся вне радиуса в этой плоскости (класс : ). Линейный разделитель невозможен, но, очевидно, круг с радиусом будет идеально разделять данные. Мы можем преобразовать данные в трехмерное пространство, вычислив три новые переменные , и0r0x2+y2<r21r1x2+y2>r2rx2y22xy, Два класса теперь будут разделяться плоскостью в этом трехмерном пространстве. Уравнение этой оптимально разделяющей гиперплоскости, где и равно , и в этом случае опускается . (Если окружность относительно начала координат, оптимальная разделяющая гиперплоскость также будет изменяться в .) Ядро - это функция отображения, которая вычисляет значение 2-мерных данных в 3-мерном пространстве.z1=x2,z2=y2z3=2xyz1+z2=1z3z3

В математике есть и другие применения «ядер» , но они, кажется, являются основными в статистике.

Thylacoleo
источник
1
Очень хорошо! Я собираюсь использовать ваш пример с кружком для объяснения методов ядра, так как это лучшая визуализация, которую я встречал до сих пор. Спасибо!
Йорис Мейс
1
Следуя примеру Тилаколео, используя круг для объяснения трюка с ядром (у меня недостаточно репутации, чтобы добавить комментарий непосредственно к его ответу) Была ли в уравнении простая опечатка для разделяющей гиперплоскости? и это должно быть z1 + z2 = r ^ 2, а не z1 + z2 = 1? Или я неправильно понимаю? Я согласен, это хороший простой пример для иллюстрации концепции. Благодарю. Хотя определение z3 все еще кажется загадкой, но, очевидно, это не имеет значения для примера с центром в начале координат.
Алекс Блейкмор
Да, была опечатка. Спасибо за это Алекс. Я не всегда корректирую :-)
Thylacoleo
1
Следующее видео было предложено анонимным потенциальным редактором как «отличная визуализация того, что объяснил Тилаколео:» youtube.com/watch?v=3liCbRZPrZA
gung - Восстановить Монику
Используем ли мы внутренние продукты для отображения двумерных данных в трехмерные?
SmallChess