Обучение с подкреплением. Лекция 1. Введение в обучение с подкреплением. Многорукие бандиты.

Это первая лекция вводного курса по обучению с подкреплением, посвященному обучению рациональных агентов. А рамках лекции рассмотрены приложения обучения с подкреплением, основные понятия. Также рассмотрен метод многоруких бандитов: - Эпсилон-жадная стратегия - Оптимистичная инициализация - Инкрементальная реализация - Работа алгоритма в нестационарном окружении. Евгений Разинков -- к.ф.-м.н., руководитель отдела машинного обучения и компьютерного зрения Группы компаний FIX, ассистент кафедры системного ан
Back to Top