Как называется оператор, который берет категориальный вектор и преобразует его в двоичное представление, используя горячее кодирование? Я задаюсь вопросом, так как я пишу научную статью и нужное имя для этого.
terminology
categorical-encoding
квантиль
источник
источник
Ответы:
Статистики называют одноразовое кодирование фиктивным . Как и предполагали другие (включая Scortchi в комментариях), это не точный синоним, но это термин, который обычно используется для закодированных 0-1 категориальных переменных.
См. Также: «фиктивная переменная» против «индикаторной переменной» для номинальных / категориальных данных
источник
Это зависит от вашей целевой аудитории.
Как сказал Тим , статистики называют это фиктивным кодированием, и это то, что я ожидаю увидеть при описании чего-то вроде регрессионной модели. «Фиктивные переменные были включены, чтобы отрегулировать местоположение магазина». Я думаю, что назвать это горячим кодированием будет немного странно.
Однако, как сказал другой Тим , горячая кодировка довольно распространена в литературе по машинному обучению. Это слабо подразумевает существование узлов (как в нейронной сети), физических проводов (в устройстве) или что-то в этом роде, по крайней мере для меня.
Формально, я полагаю, вы применяете набор индикаторных функций , но это, вероятно, слишком формально вне доказательства.IX
источник
Термин происходит от электроники. Подумать только, кто бы назвал 1 "горячим" Только те, кто работает с электричеством, где «горячий» или «живой» означает, что на проводе есть электрический потенциал . «Один горячий» относится к конструкции схемы, в которой дискретный уровень электрического сигнала на одном проводе будет декодирован как горячий / холодный на множестве проводов. Я полагаю, что некоторые люди, обучающиеся машинному обучению с опытом в области ЭЭ, нашли аналогию убедительной.
В эконометрике и статистике вы можете встретить
dummy
илиindicator
переменные, которые очень похожи, потому что они используются для представления отдельных категорий с их различными показателями. Хотя есть небольшая разница. Например, вы делаете манекены K-1 для K категорий, потому что базовая категория соответствует всем манекенам, установленным на 0. В отличие от этого, я думаю, что в одном горячем кодировании у вас есть K проводов, где у базовой категории будет свой собственный провод ( переменная).источник
Я статистически обучен, и недавно слышал о «горячем кодировании» в машинном обучении / компьютерной науке. Я обычно упоминал однонаправленную матрицу как матрицу проекта / матрицу данных / структуру кадра.
источник
В физических науках и технике это называется (обобщенная) дельта Кронекера .
В простейшей форме, дельта Кронекера это определяется как хотя это тривиально обобщается на б [ состояние ] ≡ { 1 , если [ состояние ] 0 остальное .
Таким образом, « » будет иметь тенденцию восприниматься как δ i ∈ категория ≡ { 1, если i ∈ категория 0 иначе , что большинство авторов будет стремиться усечь до « δ i », если категория очевидна из контекста.δi∈category
Дельта Кронекера действительно полезна в Sigma / Pi / Einstein / etc. обозначения, так как это позволяет условия быть определены условно.
Просто чтобы связать это с общими структурами программирования, дельтой Кронекера
condition?1:0
, где?:
находится условный оператор .источник
Вот цитата из книги,
источник