Почему название «ядро» в статистике и ML?

21

Это было задано на других сайтах SE в контексте операционных систем и линейной алгебры, но тот же вопрос вызывает у меня сомнения относительно методов ядра, используемых в статистике и машинном обучении.

Часто говорят, что ядра, например, в оценке плотности ядра или SVM, представляют какое-то сходство, но я не понимаю, откуда происходит название «ядро» и каков его символизм.

Итак, какова этимология ядер в контексте статистики и машинного обучения?

Чтобы быть ясным, я хорошо знаю, что такое ядро ​​и его основные свойства, мне просто любопытно название, так как я не вижу, что оно имеет отношение к семени или ядру, так как оно в основном определено в словари. Или, по крайней мере, я не вижу более глубокого значения, чем «основная часть метода».

Blaza
источник

Ответы:

13

Вы можете найти некоторую информацию по этому вопросу, проверив на сайте самые ранние из известных употреблений некоторых слов математики, поддерживаемых математиком Джеффом Миллером. Вы также можете найти информацию об этимологии слова «ядро» в стандартных словарных источниках.

При написании на французском языке Фредгольм (1903) использовал слово «noyau» (ядро), а Гильберт (1904) принял этот термин, но написал по-немецки, получив немецкое слово «керн» (ядро). Эти термины использовались в контексте написания об интегральных уравнениях в функциональном анализе. Вскоре после этого Бочер (1909), пишущий на английском языке, использует термин «ядро» для обозначения тех же объектов. Затем этот термин распространяется по англоязычной литературе по функциональному анализу, анализу Фурье, а затем - по вероятности и статистике.

Согласно приведенному выше словарю, это слово происходит от древнеанглийского и протогерманского языков. Это может относиться либо к семени, либо к ядру, центру или сущности объекта. Лингвистическое сходство между немецким «керн» и «ядром», по-видимому, связано с похожими историческими корнями. Предполагается, что слово «ядро» произошло от предполагаемого (реконструированного) протогерманского слова «kurną» (кукуруза). Итак, исходя из этой истории, кажется, что этимологически слово «ядро» относится к семени, ядру или сущности и основано на англицизации старого немецкого слова «кукуруза».

ОБНОВЛЕНИЕ: Этот ответ был отредактирован, чтобы отразить новую информацию, которая была доведена до моего сведения пользователями cbeleites и RM . Сначала я думал, что это, возможно, недавняя англицизация слова «керн», но источники в словаре предполагают, что слово «ядро» в английском языке очень старое. Я не лингвист, поэтому просто излагаю информацию из вышеперечисленных источников.

Восстановить Монику
источник
Никогда не слышал о Максиме Бочере. Во-первых, я подумал, что, возможно, это опечатка для Саломона Бохнера, который несколько лет спустя был очень большим (гигантским) в интегральных ядрах, среди прочего.
Марк Л. Стоун
Это моя вина - я не уверен, как набрать ударение o. Как ты сделал это?
Восстановить Монику
1
Я скопировал и вставил из списка Википедии.
Марк Л. Стоун
1
Моя настоящая точка зрения заключалась в том, что я знал, что Бохнер был гигантом по ядрам, но никогда не слышал о Бохере. Бохнер был научным руководителем Самуэля Карлина, у которого я прошел курс по общей позитивности (абсолютно позитивные ядра, вызывающие изменения, уменьшающие вариации, и все такое джаз).
Марк Л. Стоун
1
Я не уверен, является ли ядро ​​англицированной версией Kern, по крайней мере, не в смысле того, что произошло чуть более 100 лет назад. Я всегда воспринимал это как перевод: merriam-webster.com/dictionary/kernel определение 1 называется «Kern» на немецком языке. Например, для яблока семена = Kerne, тогда как ядро ​​= Kerngehäuse (буквально корпус ядра).
cbeleites поддерживает Монику
13

Ядро много раз используется в машинном обучении и статистике. Вот несколько примеров:

  1. В опорных векторов ядро является функцией , которая отображает данные в многомерном пространстве , где проблема становится линейно разрешима (смотреть это ).

  2. Оценка плотности ядра

    Оценка плотности ядра - это непараметрический способ оценки функции плотности вероятности случайной величины.

В этом контексте ядро - это просто весовая функция, используемая для оценки плотности ядра. Последняя ссылка также имеет несколько больше использования слова ядра в статистике.

  1. В сверточных нейронных сетях ядро представляет собой небольшую матрицу, которая используется для выполнения свертки между изображением и самим собой. Смотрите здесь .

Во всех этих примерах ядро ​​- это математическая функция, которая используется для некоторого преобразования ваших данных. Ядро, по сути, является постоянной частью этого преобразования. В зависимости от выбора ядра, которое мы используем для каждого преобразования, мы можем получить другой эффект от него.

Djib2011
источник
5
βе-βИксе-βИкс
7
ОП ищет этимологию ядер.
Франк Дернонкур
2
Имеет ли использование «кернал» для ссылки на нуль-пространство в линейной алгебре какое-либо отношение к любому из этих применений в машинном обучении?
syntonicC