Вопросы с тегом «proofs»

12
Почему Q-обучение не сходится при использовании приближения функций?

Алгоритм табличного Q-обучения гарантированно найдет оптимальную QQQ функцию, Q∗Q∗Q^* , при условии, что выполнены следующие условия (условия Роббинса-Монро ) относительно скорости обучения ∑tαt(s,a)=∞∑tαt(s,a)=∞\sum_{t} \alpha_t(s, a) = \infty ∑tα2t(s,a)<∞∑tαt2(s,a)<∞\sum_{t} \alpha_t^2(s,...

11
Доказательство того, что искусственный общий интеллект возможен

В информатике предполагается, что человеческий разум можно воспроизвести с помощью машины Тьюринга, поэтому возможен искусственный общий интеллект (AGI). Предполагать иначе - значит верить во что-то мистическое, а мистические убеждения ложны. Я не знаю ни одного другого аргумента о том, что АГИ...

10
Какое значение имеет теорема «Нет бесплатного обеда» для машинного обучения?

Теорема об отсутствии бесплатного обеда (НФЛ) (см. Статью «Коэволюционные бесплатные обеды » Дэвида Х. Вольперта и Уильяма Дж. Макриди) любые два алгоритма эквивалентны, когда их производительность усредняется по всем возможным проблемам Действительно ли теорема «Нет бесплатного обеда» верна? Что...