️ Релиз . - это семейство из 6 LLM : 0,5, 1,5, 3, 7, 14, 32 млрд
️ Релиз .
- это семейство из 6 LLM : 0,5, 1,5, 3, 7, 14, 32 млрд. параметров, ориентированное на понимание и написание кода на 40 языках программирования.
По сравнению с предыдущим поколением моделей CodeQwen1.5, в значительно улучшена генерация, обоснование и исправление кода. При этом сохранились сильные навыки в математике и общих компетенциях.
Семейство основано на Qwen 2.5, количество обучающих лексем было увеличено до 5,5 трлн, в корпус данных вошли исходный код, текстовые кодовые основания, синтетические данные и т. д.
Способности в области программирования старшей модели, -32B соответствуют уровню GPT-4o.
Модели 0.5В, и 3В получили контекст в 32 тыс. токенов, а 7В, 14В и 32B - 128 тыс. токенов.
В открытый доступ на HuggingFace опубликованы 36 моделей семейства : базовые модели, instruct-версии и GGUF, AWQ, GPTQ-Int8, GPTQ-Int4 форматы инструктивных версий.
В ближайшее время (сроки не указаны), разработчики Qwen-Coder планируют запустить сервис real-time кода на сайте Tongyi . Сервис будет поддерживать генерацию веб-сайтов, создание мини-игр и диаграмм данных одним щелчком мыши.
Лицензирование:
Модели 0.5В, 1.5В, 7В, 14В и 32В - Apache 2.0 License.
Модель 3B - Qwen-Research license.
Страница проекта
Коллекция моделей на HF
Документация
Arxiv
Demo
Сообщество в Discord
Github