Файнтюнинг и квантизация Llama-3 70B

В этом видео я показываю процесс файнтюнинга Llama 3 70B и квантизации модели с конвертацией в формат GGUF. 💻 – широкий выбор карт для обучения и инференса нейронных сетей: Один из ведущих поставщиков услуг IaaS (Infrastructure as a Service) в России, специализирующийся на использовании графических процессоров (GPU). Сервис предлагает конкурентоспособные цены и интуитивно понятный интерфейс, который даже начинающие пользователи могут легко освоить и начать работу с необходимым программным обеспечением. 💻 gptchain – фреймворк для быстрого развертывания AI-ассистентов: Поддерживает интеграцию с Telegram-ботом, Retrieval Augmented Generation (RAG), деплой моделей на LLM сервер и файнтюнинг LLM на собственных данных. Телеграм-канал: Дискорд: 🤗 Веса моей модели:

1 view

748

213