В последнее время все большую популярность набирает model-based подход в обучении с подкреплением, который заключается в использовании обучаемой модели мира для обучения агента или планирования. Как оказалось, алгоритмы, получаемые при таком подходе, требуют значительно меньшего количества взаимодействий с окружением, чем model-free методы, а также могут быть использованы для offline обучения с подкреплением. Однако несмотря на то, что model-based подход уже сейчас демонстрирует хорошие результаты в решении большого количества задач, направление все еще активно развивается.
На семинаре мы разберем алгоритм Dreamer, который является одним из самых популярных model-based алгоритмов на данный момент, обсудим недостатки этого метода и то, как сейчас исследователи подходят к их устранению.
Докладчик: Олег Свидченко.
4 views
26
5
2 months ago 00:03:32 12
Robot Motion Diffusion Model: Motion Generation for Robotic Characters
3 months ago 00:05:27 10
3D boxes to your dimensions v 2 0
4 months ago 00:02:37 1
SuperPADL: Scaling Language-Directed Physics-Based Control with Progressive Supervised Distillation
4 months ago 01:27:40 2
When Mechanics Lose Their Minds - Supercharged 1969 Dodge Charger Hellcat SRT8 HEMI 738HP Build
4 months ago 00:02:09 7
Pedigree - Adoptable (case study)
5 months ago 00:02:45 2
The Opener - Gary Willis GWB 25th Anniversary Ibanez Signature Bass
5 months ago 00:15:26 1
2024 Ram TRX Final Edition - The Wildest Truck Ever!
5 months ago 00:05:20 1
Unleashing the Beast: 2024 NZXT H7 Flow Review - The Ultimate PC Case!
6 months ago 00:02:20 1
An interactive and collaborative augmented reality environment for civil engineering education
6 months ago 00:06:34 1
Volvo Begins EX90 Electric SUV Production in Charleston
7 months ago 00:29:59 1
FX1 Formula Cockpit - Unboxing, Assembly, Adjustments and Demo by Extreme Simracing
7 months ago 00:16:32 1
Conduction Thermal Analysis of Plate using ANSYS
8 months ago 00:13:13 1
The Spectacular Rise (and Imminent Collapse) of Private Equity
8 months ago 00:02:54 2
2024 Lamborghini URUS Performante V8 Monster SUV - Interior, Exterior and Drive
8 months ago 00:00:23 2
Eureka! Extreme Robot Dexterity with LLMs | NVIDIA Research Paper
9 months ago 00:03:13 6
The Industrial Revolution - 5 things you should know - History for children
9 months ago 00:08:14 17
OpenAI Eve Humanoid Robot: The Most Versatile and Autonomous Humanoid Robot Ever Created
9 months ago 00:05:43 1
𝔥𝔢𝔵𝔬𝔯𝔠𝔦𝔰𝔪𝔬𝔰 & El Irreal Veintiuno, ꜱᴇᴍɪʟʟᴀ ᴀ ɪ _ Interferencias_
9 months ago 00:25:15 1
Hell Let Loose Gameplay (PC UHD) [4K60FPS]
9 months ago 00:06:46 1
DTC: Deep Tracking Control
9 months ago 00:18:41 4
Solution & Load Combination in ANSYS
10 months ago 00:02:09 4
AI breaks physical boundaries: CyberRunner, the superhuman AI robot
10 months ago 00:45:27 1
Programmer’s Apprentice Season 2: Future Directions in AI-assisted Coding • Erik Meijer • YOW! 2023