Является ли среднеквадратическая ошибка всегда выпуклой в контексте нейронных сетей?

Множество ресурсов, о которых я упоминал, упоминают, что MSE великолепен, потому что он выпуклый. Но я не понимаю, как, особенно в контексте нейронных сетей. Допустим, у нас есть следующее: ИксИксX : учебный набор данных YYY : цели ΘΘ\Thetaf Θ : набор параметров модели (модель нейронной сети с...