Self-Tuning Deep Reinforcement Learning

Алгоритм машинного обучения с подкреплением может требовать различные гиперпараметры в зависимости от специфики задачи, которую он решает. Эти параметры следует настраивать таким образом, чтобы алгоритм мог оптимально решить задачу обучения. Но подобрать такие значения параметров иногда бывает проблематично. На семинаре будут рассмотрены некоторые подходы решения данной проблемы, представленные в статье “Self-Tuning Deep Reinforcement Learning”. Разберем алгоритмы STAC и STACX, которые подбирают гиперпарам
Back to Top