Введение в обучение с подкреплением: происхождение и отличительные особенности

Погрузимся в историю RL для понимание того, чем это семейство алгоритмов отличается от основного машинного обучения. Рассмотрим RL не только с точки зрения вычислений, но и взглянем на него через призму поведенческих и когнитивных наук. Разберем классический пример многорукого бандита — автомата для казино — чтобы продемонстрировать возможности примитивного алгоритма RL в упрощенной среде. Поговорим о самых знаковых приложениях RL нашего времени. «Reinforcement Learning» - Преподаватель: Андрей Маргерт - исследователь Машинного Обучения в Wageningen Research, работает над технологиями для улучшения качества, безопасности и доступности продуктов Пройдите опрос по итогам мероприятия - Следите за новостями проекта: - Telegram: - ВКонтакте: - LinkedIn: - Хабр:
Back to Top