Я прохожу курс Эндрю Нг по машинному обучению через Coursera . Для уравнений вместо индексов используются верхние индексы. Например, в следующем уравнении используется вместо : х я
Видимо, это обычная практика. Мой вопрос: зачем использовать верхние индексы вместо подписных? Верхние индексы уже используются для возведения в степень. Конечно, мне кажется, что я могу различать случаи использования верхнего индекса и возведения в степень, обращая внимание на наличие круглых скобок, но это по-прежнему сбивает с толку.
machine-learning
notation
entpnerd
источник
источник
i
Индексируется ли размер набора данных или элементы вектораx
? Если первое, это совершенно стандартно. Если последнее, то это совершенно нестандартно. И причина, по которой используется верхний индекс, заключается в том, что иногда вы хотите сослаться на элемент вектора, используя нижний индекс.Ответы:
Если обозначает вектор то является стандартным обозначением координаты , то естьх ∈ R м х я я х х = ( х 1 , х 2 , ... , х м ) ∈ R м .Икс x ∈ Rм Икся я Икс
Если у вас есть набор из таких векторов, как бы вы обозначили вектор? Вы не можете написать , это имеет другое стандартное значение. Поэтому иногда люди пишут и именно поэтому я верю, почему Эндрю Нг делает это.i x i x ( i )N я Икся Икс( я )
Т.е.
источник
Я считаю, что использование супер-сценариев не очень распространено в литературе по машинному обучению. Я должен был бы просмотреть примечания к курсу Нга, чтобы подтвердить, но если бы он использовал это там, я бы сказал, что он будет источником распространения этой записи. Это возможность. В любом случае, чтобы не быть слишком недобрым, но я не думаю, что многие студенты онлайн курса публикуют литературу по машинному обучению, поэтому эта запись не очень распространена в реальной литературе. В конце концов, это вводные курсы по машинному обучению, а не курсы PhD.
Что характерно для суперскриптов, так это для обозначения итерации алгоритма с использованием суперскриптов. Например, вы можете написать итерацию метода Ньютона как
где - гессиан, а ∇ θ ( t ) - градиент.H(θ(t)) ∇θ(t)
(... да, это не совсем лучший способ реализации метода Ньютона из-за обращения матрицы Гессе ...)
Здесь представляет значение θ в итерации t t h . Это наиболее распространенное (но, конечно, не только) использование суперскриптов, о которых я знаю.θ(t) θ tth
РЕДАКТИРОВАТЬ: Чтобы уточнить, в первоначальном вопросе, казалось, предположить, что в нотации ML, было эквивалентно нотации статистики x i . В своем ответе я утверждаю, что это не очень распространено в литературе по ОД. Это верно. Однако, как указывает @amoeba, есть много верхним индексом записи в литературе ML для данных, но в этих случаях х ( я ) обычно не означает я т ч наблюдение одного вектора х .x(i) xi x(i) ith x
источник
=
==
В математике верхние индексы используются слева и справа в зависимости от области. Выбор всегда историческое наследие, не более того. Тот, кто первым попал в поле, установил соглашение об использовании под- или надстрочных знаков.
Следовательно, выбор верхних индексов по Ng тоже чисто исторический. Нет никакой реальной причины использовать или не использовать их, или предпочесть их подписчикам. На самом деле, я считаю, что здесь люди ML используют тензорную запись. Они определенно хорошо разбираются в теме, например, см. Эту статью.
источник