Я новичок в ML, и это мой первый вопрос здесь, так что извините, если мой вопрос глупый.
Я пытаюсь прочитать и понять статью. Внимание - это все, что вам нужно, и в нем есть картинка:
Я не знаю, что такое позиционное кодирование . Слушая некоторые видеоролики на YouTube, я обнаружил, что это вложение, имеющее как значение, так и положение слова в нем и имеющее отношение к или
но я не мог понять, что это такое и как именно это происходит. так что я здесь за помощью. заранее спасибо.
Позиционное кодирование - это повторное представление значений слова и его позиции в предложении (учитывая, что это не то же самое, что в начале, в конце или в середине).
Но вы должны принять во внимание, что предложения могут быть любой длины, поэтому говорить «X» слово является третьим в предложении »не имеет смысла, если есть предложения различной длины: 3-е в 3-словосочетании полностью отличается от 3-го в предложении из 20 слов.
Что позиционный кодировщик делает, чтобы получить помощь циклического характерас я н ( х ) а также c o s ( x ) функции для возврата информации о положении слова в предложении.
источник
Чтобы добавить к другим ответам, реализация ref OpenAI вычисляет это в естественном пространстве журнала (я думаю, чтобы улучшить точность. Не уверен, что они могли использовать журнал в базе 2). Они не придумали кодировку. Вот генерация таблицы поиска PE, переписанная в C как цикл for-for:
источник