Параллельные и распределенные вычисления 4. Скорость и синхронизация GPU-вычислений

Дата лекции: г. Лектор: Ахтямов Павел Ибрагимович 00:00:00 — как замерять время работы в CUDA 00:11:05 — разбор примера 00:14:00 — подсчет кол-ва операций 00:21:00 — расчет пропускной способности 00:29:15 — способы ускорить вычисления 00:31:55 — иерархия памяти 00:44:45 — иерархия памяти ЦПУ 00:47:25 — сравнение иерархии CPU и GPU 00:48:00 — типы памяти 00:50:50 — разделяемая (shared) память 00:56:00 — необходимость синхронизации 00:56:55 — примитив синхронизации 00:58:45 — доступ к данным 01:02:10 — поток управления 01:06:05 — особенности синхронизации 01:10:45 — информация по регистрам 01:12:30 — итоги Плейлист: Съёмка: Вашкевич Егор Монтаж: Стешенко Александр

8 views

307

102