О вопросах сходимости и генерализации нейронных сетей малой глубины // Александр Разборов
Объяснение причин сходимости и (в особенности) генерализации нейронных сетей при их обучении методом (возможно стохастического) градиентного спуска — одна из наиболее фундаментальных открытых проблем в области математических основ ИИ. Оба феномена вполне проявляются уже для простейшей возможной архитектуры: вполне связные ReLU схемы глубины 2, и уже для этого случая удовлетворительное объяснение в настоящий момент отсутствует. В докладе будет дан (заведомо неполный) обзор некоторых частичных результатов в этом направлении.
Презентация:
Разборов Александр Александрович — член-корреспондент РАН, доктор физико-математических наук.
Семинар «Математические основы искусственного интеллекта»
г. Москва, МИАН, 19 июня 2024 г.
3,205 views
18
6
14 seconds ago 00:00:11 1
Новый год в холоде рискуют встретить многие жители Челябинска и области. Люди жалуются на проблемы в сфере ЖКХ, которые достигаю
2 minutes ago 00:09:25 1
Как справиться с запинающим грехом? | “Библия говорит“ | 2088
8 minutes ago 00:24:18 1
Как сдать вступительные экзамены в МГУ по математике решить задания ДВИ 2025 год решение методом Султанова Репетитор СУНЦ Москвы