Алексей Гончаров | Быстрый и экономичный инференс LLM в прикладных задачах
Спикер: Алексей Гончаров, основатель
Тема доклада: Поделится опытом оптимизации расходов на инференс LLM с применением квантования, дообучения моделей, LoRA адаптеров и низкоуровневых фреймворков инференса.
Data Fest 2024:
Презентацию к докладу Вы можете скачать в треке OptimalDL:
___
Наши соц.сети:
Telegram:
Вконтакте:
Канал с вакансиями в telegram:
Канал с апдейтами по курсам:
Как попасть в чат сообщества ODS Mattermost:
1 view
157
45
4 months ago 02:21:07 1
Первенство России по боксу среди юношей 13-14 лет. Ринг “Б“. Чехов. ФИНАЛЫ!