DRL Course | Introduction to Reinforcement Learning. Cross-Entropy Method
Курс Deep Reinforcement Learning:
Сезон курсов:
В первой лекции:
Раскрывается содержательная идея принципа обучения с подкреплением.
Описывается математически строгая постановка задачи обучения с подкреплением в терминах марковских процессов принятия решений.
Рассматриваются примеры задач, которые могут быть формализованы в рамках этой постановки.
Обсуждается понятие политики агента.
При дополнительных ограничениях, исследуется взгляд на задачу обучения с подкреплением как на задачу конечномерно математической оптимизации. Опираясь на это, приводится эволюционный алгоритм Кросс-энтропии, должным образом модифицированный в соответствии с особенностями задачи обучения с подкреплением.
Обсуждаются недостатки этого алгоритма и способы их преодоления.
Наши соц.сети:
Telegram:
Вконтакте: