ИИ-2022, Лекция 13, часть 4/6

#ии #reinforcementlearning #actorcritic Курс “Общий Искусственный Интеллект“, читается на Факультете свободных искусств и наук Санкт-Петербургского Государственного Университета, весенний семестр 2022 года. Лекция 13, Глубокое обучение с подкреплением, часть 1 из 6 Слайды к лекции: 00:00 Actor-Critic 05:53 Advantage 11:48 Actor-Critic для V-функции 12:30 Bootstrap vs Монте-Карло для ценности состояния 16:20 Проблемы bootstrapped estimate для ценности состояния
Back to Top