Как строить Low Latency-рекомендательный трансформер на миллион RPS / Всеволод Светлов (Яндекс)

Приглашаем на конференцию HighLoad 2024, которая пройдет 2 и 3 декабря в Москве! Программа, подробности и билеты по ссылке: -------- HighLoad Foundation 2022 Презентация и тезисы: Я хочу рассказать о нашей модели пользовательских рекомендаций в рекламной сети Яндекса и некоторых проблемах, которые могут возникнуть при внедрении тяжелых нейросетевых моделей в высоконагруженный продакшн. Примерный план доклада: * высокоуровневое описание модели, для чего она нужна и как она работает; * зачем мы разделили полноценный рекомендательный трансформер с early fusion-подходом на независимые части; ... Нашли ошибку в видео? Пишите нам на support@
Back to Top