Недавно в Москве проходил очередной хакатон DeepHack по обучению с подкреплением, в котором надо было написать универсального агента для игр Atari. Михаил Павлов рассказал решение своей команды 5vision, с которым они заняли второе место. Из видео вы сможете узнать:
- Как задача обучения с подкреплением может быть превращена в задачу обучения с учителем
- Откуда набирать обучающую выборку
- Как решается проблема наличия случайности в среде
- Какой подход применять на этапе обучения модели по готовой выборке
- Какие существуют проблемы в обучении с учителем и как их можно решать
- Как можно улучшить использованный подход
DeepHack RL:
Слайды:
Код: и
Узнать о текущих соревнованиях можно на сайте
Узнать о новых тренировках и видео можно из групп:
ВКонтакте
Facebook
1 view
150
34
2 months ago 00:44:01 1
DeepHack RL — Сергей Овчаренко (WPLFF)
2 months ago 00:47:50 1
DeepHack RL — Михаил Павлов (5vision)
2 months ago 00:21:57 1
Январь 2017 | Дайджест соревнований по анализу данных
3 years ago 00:51:52 61
Maksim Kretov - Applications of RL techniques in NLP_ An overvi
3 years ago 01:15:55 2
Anton Lokhmotov - Cross-platform performance optimisation of deep learning
3 years ago 00:01:17 1
FINAL GAME
3 years ago 00:41:31 2
Witali Dunin-Barkowski - Neural roots of deep mind
3 years ago 01:24:45 1
Andrew Barto - Intrinsically motivated reinforcement learning
3 years ago 01:11:35 1
Alexander Gasnikov - Безградиентные двухточечные методы для стохастической оптимизации
3 years ago 01:08:44 1
Andrey Raigorodskiy - Перспективные исследовательские задачи
3 years ago 00:57:10 1
Gabriel Synnaeve - E2D2_ Episodic exploration for deep deterministi
3 years ago 00:51:30 1
Marc Bellemare - The role of density models in reinforcement learni
3 years ago 00:52:25 1
Tejas Kulkarni - Revisiting successor representations
3 years ago 00:59:27 1
Andrey Lavrentyev - Neural networks for сyber-security of industrial objects
3 years ago 01:04:25 7
Doina Precup - Temporal abstraction in reinforcement learning
3 years ago 01:44:35 2
Yulia Sandamirskaya - Neuronal dynamics and autonomous learning in robotics
3 years ago 01:06:51 2
Andrey Chertok - Reinforcement learning for market-making application in trading
3 years ago 01:44:25 1
Alexey Dosovitskiy - Visuomotor control in 3D environments
3 years ago 01:11:54 1
Konstantin Vorontsov - Регуляризация матричных разложений
3 years ago 00:54:34 1
Mikhail Burtsev - Model-based reinforcement learning for alternating environments
7 years ago 00:59:28 1
: Andrey Lavrentyev - Neural networks for сyber-security of industrial objects
7 years ago 00:52:02 42
: Maksim Kretov - Applications of RL techniques in NLP: An overview
8 years ago 00:41:32 47
: Witali Dunin-Barkowski - Neural roots of deep mind
8 years ago 01:24:46 29
: Andrew Barto - Intrinsically motivated reinforcement learning