DRL Course | Value Function Approximation. Deep Q-Networks (DQN)

Курс Deep Reinforcement Learning: Сезон курсов: В пятой лекции: Рассматриваются MDP с бесконечным пространством состояний; Обсуждаются аппроксимации Q-функции с помощью линейной комбинации и нейронных сетей; Выводится алгоритм Deep Q-Networks (DQN); Обсуждаются его различные модификации Наши соц.сети: Telegram: Вконтакте:

10 views

158