Параллельные и распределенные вычисления 4. Скорость и синхронизация GPU-вычислений
Дата лекции: г.
Лектор: Ахтямов Павел Ибрагимович
00:00:00 — как замерять время работы в CUDA
00:11:05 — разбор примера
00:14:00 — подсчет кол-ва операций
00:21:00 — расчет пропускной способности
00:29:15 — способы ускорить вычисления
00:31:55 — иерархия памяти
00:44:45 — иерархия памяти ЦПУ
00:47:25 — сравнение иерархии CPU и GPU
00:48:00 — типы памяти
00:50:50 — разделяемая (shared) память
00:56:00 — необходимость синхронизации
00:56:55 — примитив синхронизации
00:58:45 — доступ к данным
01:02:10 — поток управления
01:06:05 — особенности синхронизации
01:10:45 — информация по регистрам
01:12:30 — итоги
Плейлист:
Съёмка: Вашкевич Егор
Монтаж: Стешенко Александр