Обзор Reinforcement Learning с ICML | Дмитрий Бабаев, Яндекс

Это Дмитрий Бабаев, руководитель ML R&D в Яндекс Картах. Дмитрий рассказал о самых запоминающихся статьях про обучение с подкреплением с ICML этого года. Например, Дмитрий поговорил о работе Stop Regressing: Training Value Functions via Classification for Scalable Deep RL от DeepMind, которая посвящена нестандартному подходу к регрессиям. Подписывайтесь на телеграм-канал «Яндекс для ML-инженеров»:
Back to Top