Если очень кратко, вчера я занимался доведением до ума проекта impruver, в частности в нём были проблемы с генератором датасета типа чат, с тем как хранить конфигурацию и с тем работают скрипты тренировки.
В генераторе датасетов типа чат удалось решить ряд проблем связанных с токенизацией и поправить интеграционные тесты.
-
-
Следом была реализованна базовая конфигурация, структура которой похожа на то, что реализовано в torchtune.
-
-
После чего был реализован скрипт предобработки датасета, вытягивающий данные из HuggingFace и преобразующий их.
-
После чего внесены правки в скрипт обучения через трансформеры, оригинальная версию которого была позаимствованна из проекта Saiga.
-
-
Градиенты спускаются...
Сделать пожертвование:
-
-
Ссылки:
-
-
-
13 views
1165
410
11 hours ago 00:28:04 219
Насилие и детские травмы. Как изменить свой сценарий
1 week ago 01:29:03 246
Разбор варианта №11 из сборника Ященко ОГЭ по математике
2 weeks ago 00:12:07 4.5K
FL Studio 2024.2 Whats New
2 weeks ago 00:14:06 78
🚀 Обзор нового Битрикс24. Гравитация. 28 ноября 2024
2 weeks ago 01:37:53 52
16.0 Computer Science в Seoul University | Бакалавриат GKS (kgsp) 2024 в Корее| Провал в 2023
2 weeks ago 00:36:20 1,000
ВСЕ про ГРАФИКИ ФУНКЦИЙ для ОГЭ по математике
3 weeks ago 01:33:58 463
Разбор варианта №1 из сборника Ященко ОГЭ по математике
1 month ago 00:44:24 156
РАЗБОР первой части варианта №3 из сборника Ященко ОГЭ по математике
2 months ago 00:40:15 43
ВСЕ про уравнения на ОГЭ по математике
2 months ago 01:21:06 173
JavaScript для начинающих. Урок 2: Функции, циклы, объекты, массивы. 2024
2 months ago 05:19:31 1
HTML верстка сайта каталога интернет магазина на Gulp сборке. Моб. адаптация. GitHub pages. Часть 2