Пятнадцатое занятие на курсе «Нейронные сети и их применение в научных исследованиях» для группы НС213.
Преподаватель: Илья Дюгай
0:00 Обучение с учителем
2:13 Терминология: агент, функция награды, состояние среды
9:55 Отличие от supervised learning
10:58 Классические примеры задач RL
12:08 Особенности и сложности RL.
26:38 Состояние среды (State)
29:00 Markov property
31:01 Markov process
33:51 Награда (Reward)
36:00 Суммарная награда (Return)
39:33 Марковский процесс принятия решений
50:11 Уравнение Беллмана
58:13 Gym
1:02:24 Нахождение лучшей последовательности переходов
1:04:55 Нахождение оптимальной политики Беллмана
1:16:04 Q - Learning
1:28:22 Exploration vs exploitation
1:36:15 Deep Q-Learning
1:39:08 Loss
1:40:39 Алгоритм обучения
1:55:22 TD-Loss
1:56:59 Пример c CartPole DQN
2:09:08 Дальнейшие идеи
Официальный сайт:
Инстаграм:
17 views
14
4
10 years ago 00:07:46 69
Бодифлекс -Занятие 15 минут (2 часть)
10 years ago 00:06:24 79
Бодифлекс - Занятие 15 минут (1 часть)
9 years ago 00:52:01 85
Иконоведение, занятие 15
5 years ago 00:01:56 23
Тренировочное занятие №15
7 years ago 00:48:30 28
Марафон - Бешеная прокачка - 15 занятие
10 years ago 00:59:37 124
Тестирование, занятие №15
3 years ago 02:12:08 17
Занятие №15 «Обучение с подкреплением»
10 months ago 00:43:48 18
01 Занятие Единое начало 15
2 years ago 00:24:04 18
Занятие “Утренняя разминка за 15 минут“, 15 апреля
4 years ago 01:24:16 10
Wezom Python курс. Занятие 15.
8 years ago 00:05:09 11
Занятие 15. Про грибы
5 years ago 01:20:00 78
Литургика, занятие 15
4 years ago 00:03:53 322
Тренировочное занятие
5 years ago 00:07:44 17
Музейная продленка. Занятие № 15.
7 years ago 01:11:58 14
занятие № 15 тренинг Дети -помощники
6 years ago 00:39:09 375
Логопедический курс “Свистеть/Шипеть подано“. 15 занятие.