Программирование линии следования робота с обучением подкрепления
Я рассматриваю программирование линии следования робота с использованием алгоритмов обучения подкрепления. Вопрос, над которым я размышляю, состоит в том, как я могу получить алгоритм обучения навигации по любому произвольному пути? Перейдя по Sutton & Барто книгу для обучения с подкреплением,...