Я просматриваю статью, в которой используется неравенство оракула, чтобы что-то доказать, но я не могу понять, что он даже пытается сделать. Когда я искал в Интернете информацию о «Неравенстве Oracle», некоторые источники указали мне на статью «Кандес, Эммануэль Дж.« Современная статистическая оценка через неравенства оракула ». "который можно найти здесь https://statweb.stanford.edu/~candes/papers/NonlinearEstima.pdf . Но эта книга кажется мне слишком тяжелой, и я считаю, что у меня нет некоторых предпосылок.
Мой вопрос: как бы вы объяснили, что такое неравенство оракула для не математического специалиста (включая инженеров)? Во-вторых, как бы вы порекомендовали им пройти предварительные условия / темы, прежде чем пытаться изучать что-то вроде вышеупомянутой книги.
Я настоятельно рекомендую ответить на этот вопрос тому, кто обладает конкретным пониманием и большим опытом работы в области статистики высокого уровня.
Ответы:
Я постараюсь объяснить это в линейном случае. Рассмотрим линейную модель Когда (число независимых переменных меньше или равно количеству наблюдений) и расчетная матрица имеет полный ранг, наименьший квадрат оценки равен и ошибка прогноза из которого мы можем вывести Это означает, что каждый параметр оценивается с квадратом точностиТаким образом, ваша общая точность
Что теперь, если число наблюдений меньше числа независимых переменных ? Мы «верим», что не все наши независимые переменные играют роль в объяснении , поэтому только некоторые, скажем, , отличны от нуля. Если бы мы знали, какие переменные отличны от нуля, мы могли бы пренебречь всеми остальными переменными, и с помощью приведенного выше аргумента общая квадратичная точность была бы(p>n) Y k (σ2/n)k.
Поскольку набор ненулевых переменных неизвестен, нам нужно некоторое наказание за регуляризацию (например, ) с параметром регуляризации (который контролирует количество переменных). Теперь вы хотите получить результаты, аналогичные рассмотренным выше, вы хотите оценить квадратичную точность. Проблема в том, что ваша оптимальная оценка теперь зависит от . Но важным фактом является то, что при правильном выборе вы можете получить верхнюю границу ошибки предсказания с высокой вероятностью, то есть «неравенство оракула» Обратите внимание на дополнительный факторl1 λ β^ λ λ
источник