выпуклость
Функция е( х ) с является выпуклой, если для любого , и для любого ,
x ∈ XИкс1∈ XИкс2∈ X0 ≤ λ ≤ 1е( λ x1+ ( 1 - λ ) x2) ≤ λ f( х1) + ( 1 - λ ) f( х2) .
Можно доказать, что такой выпуклый имеет один глобальный минимум. Уникальный глобальный минимум устраняет ловушки, создаваемые локальными минимумами, которые могут возникать в алгоритмах, которые пытаются достичь сходимости по глобальному минимуму, например, минимизации функции ошибки.е( х )
Хотя функция ошибок может быть на 100% надежной во всех непрерывных, линейных контекстах и во многих нелинейных контекстах, она не означает сходимости по глобальному минимуму для всех возможных нелинейных контекстов.
Средняя квадратическая ошибка
Дана функция описывающая поведение идеальной системы, и модель системы (где - вектор параметров, матрица, куб или гиперкуб и ), созданная рационально или путем сходимости (как в обучении нейронной сети), функция среднеквадратичной ошибки (MSE) может быть представлена следующим образом.с ( х )а ( х , р )п1 ≤ n ≤ N
е ( β ) : = N- 1ΣN[a(xN) - s ( xN) ]2
Материал, который вы читаете, вероятно, не утверждает, что или являются выпуклыми относительно , но что является выпуклым относительно и независимо от того, что они есть. Это более позднее утверждение может быть доказано для любых непрерывных и . а ( х , р )с ( х )Иксе ( β )а ( х , р )с ( х )а ( х , р )с ( х )
Смешанный алгоритм сходимости
Если вопрос заключается в том, могут ли быть смешаны конкретные и метод достижения который аппроксимирует пределах разумного запаса сходимости MSE, ответ - «Да». Вот почему MSE не единственная модель ошибок.а ( х , р )с ( х )а ( х , р )
Резюме
Лучше всего подытожить, что следует определять или выбирать из набора моделей выпуклых погрешностей запаса, основанных на следующих знаниях.е ( β )
- Известные свойства системыс ( х )
- Определение аппроксимационной моделиа ( х , р )
- Тензор используется для генерации следующего состояния в сходящейся последовательности
Набор стандартных выпуклых моделей ошибок, безусловно, включает модель MSE из-за ее простоты и вычислительного подхода.