DeepHack RL Сергеи Овчаренко (WPLFF)

Недавно в Москве проходил очередной хакатон DeepHack по обучению с подкреплением, в котором надо было написать универсального агента для игр Atari. Сергей Овчаренко рассказал решение своей команды WPLFF, с которым они выиграли хакатон. Из видео вы сможете узнать: - В каком формате проходит DeepHack и что он в себя включает - В чём заключается обучение с подкреплением - Как происходит взаимодействие со средой со стороны дата сайентиста - Какие основных подходы используются - Как решалась проблема настройки универсального алгоритма под конкретную игру - Что из подходов сработало, а что нет - И, конечно, увидеть как на практике действует алгоритм и какого уровня хитрости он достиг DeepHack RL: Слайды: Код: Узнать о текущих соревнованиях можно на сайте Узнать о новых тренировках и видео можно из групп: ВКонтакте Facebook

1 view