Это довольно общий вопрос (т.е. не обязательно специфический для статистики), но я заметил тенденцию в машинном обучении и статистической литературе, где авторы предпочитают придерживаться следующего подхода:
Подход 1 : Получить решение практической проблемы, сформулировав функцию стоимости, для которой можно (например, с вычислительной точки зрения) найти глобально оптимальное решение (например, путем формулировки выпуклой функции стоимости).
скорее, чем:
Подход 2 : Получить решение той же проблемы, сформулировав функцию стоимости, для которой мы, возможно, не сможем получить глобально оптимальное решение (например, мы можем получить только локально оптимальное решение для нее).
Обратите внимание, что строго говоря, две проблемы разные; Предполагается, что мы можем найти глобально оптимальное решение для первого, но не для второго.
Помимо других соображений (например, скорость, простота реализации и т. Д.), Я ищу:
- Объяснение этой тенденции (например , математические или исторические аргументы)
- Преимущества (практические и / или теоретические) для следования подходу 1 вместо 2 при решении практической задачи.
источник
@NRH дал ответ на этот вопрос (более 5 лет назад), поэтому я просто предложу подход 3, который объединяет подходы 1 и 2.
Подход 3 :
источник