Недавно в Москве проходил очередной хакатон DeepHack по обучению с подкреплением, в котором надо было написать универсального агента для игр Atari. Сергей Овчаренко рассказал решение своей команды WPLFF, с которым они выиграли хакатон. Из видео вы сможете узнать:
- В каком формате проходит DeepHack и что он в себя включает
- В чём заключается обучение с подкреплением
- Как происходит взаимодействие со средой со стороны дата сайентиста
- Какие основных подходы используются
- Как решалась проблема настройки универсального алгоритма под конкретную игру
- Что из подходов сработало, а что нет
- И, конечно, увидеть как на практике действует алгоритм и какого уровня хитрости он достиг
DeepHack RL:
Слайды:
Код:
Узнать о текущих соревнованиях можно на сайте
Узнать о новых тренировках и видео можно из групп:
ВКонтакте
Facebook
1 view
93
25
2 months ago 00:44:01 1
DeepHack RL — Сергей Овчаренко (WPLFF)
2 months ago 00:47:50 1
DeepHack RL — Михаил Павлов (5vision)
2 months ago 00:21:57 1
Январь 2017 | Дайджест соревнований по анализу данных
3 years ago 00:51:52 61
Maksim Kretov - Applications of RL techniques in NLP_ An overvi
3 years ago 01:15:55 2
Anton Lokhmotov - Cross-platform performance optimisation of deep learning
3 years ago 00:01:17 1
FINAL GAME
3 years ago 00:41:31 2
Witali Dunin-Barkowski - Neural roots of deep mind
3 years ago 01:24:45 1
Andrew Barto - Intrinsically motivated reinforcement learning
3 years ago 01:11:35 1
Alexander Gasnikov - Безградиентные двухточечные методы для стохастической оптимизации
3 years ago 01:08:44 1
Andrey Raigorodskiy - Перспективные исследовательские задачи
3 years ago 00:57:10 1
Gabriel Synnaeve - E2D2_ Episodic exploration for deep deterministi
3 years ago 00:51:30 1
Marc Bellemare - The role of density models in reinforcement learni
3 years ago 00:52:25 1
Tejas Kulkarni - Revisiting successor representations
3 years ago 00:59:27 1
Andrey Lavrentyev - Neural networks for сyber-security of industrial objects
3 years ago 01:04:25 7
Doina Precup - Temporal abstraction in reinforcement learning
3 years ago 01:44:35 2
Yulia Sandamirskaya - Neuronal dynamics and autonomous learning in robotics
3 years ago 01:06:51 2
Andrey Chertok - Reinforcement learning for market-making application in trading
3 years ago 01:44:25 1
Alexey Dosovitskiy - Visuomotor control in 3D environments
3 years ago 01:11:54 1
Konstantin Vorontsov - Регуляризация матричных разложений
3 years ago 00:54:34 1
Mikhail Burtsev - Model-based reinforcement learning for alternating environments
7 years ago 00:59:28 1
: Andrey Lavrentyev - Neural networks for сyber-security of industrial objects
7 years ago 00:52:02 42
: Maksim Kretov - Applications of RL techniques in NLP: An overview
8 years ago 00:41:32 47
: Witali Dunin-Barkowski - Neural roots of deep mind
8 years ago 01:24:46 29
: Andrew Barto - Intrinsically motivated reinforcement learning