Адвокатский софт выпуск от . Экспресс тест БЯМок в юридической задаче.
Сегодня, 4 августа 2024, провёл экспресс-тест трёх больших языковых моделей (БЯМ они же LLM), результаты тестирования в порядке убывания:
I. YandexGPT Experimental (1060 очков )
II. ChatGPT 4o (1100 очков) в редакции А2Чацкого () (т.е. дополненного нашей базой с платформы Coze)
III. GigaChat-Pro 4. 0. 26. 8 (951 очков)
Очки рейтинга Эло представлены российской чат-бот ареной LLM Arena ().
Как у судьи у меня есть пристрастие - А2Чацкий наш проект. И всё же объективно выступил хуже экспериментальной БЯМ от Яндекса.
Использованный для теста промт: “Напиши пример искового заявления за нарушение прав потребителя в связи с некачественным оказанием юридических услуг“.
Вывод такой: следует наблюдать за развитием моделей от Яндекса. В юридических задачах по российскому праву Яндекс может в скором времени превзойти ChatGPT 4o. Какого либо прорыва от команды Сбер я не ожидаю.
#правозащитные_ИИ #БЯМ #LLM_arena
215 views
2482
941
3 weeks ago 01:00:00 583
Комьюнити для юристов | Форум ПравоТех 2024
1 month ago 00:02:31 81
Адвокат о смерти и обществе
1 month ago 00:05:24 1
Зачем включаться в реестр российского ПО и с какими трудностями можно столкнуться в процессе?
2 months ago 00:11:53 204
Тестируем chatgpt o1 preview
2 months ago 00:16:26 1
5 золотых правил в любом бизнесе. Это нужно знать каждому предпринимателю!
3 months ago 00:15:14 1
5 ГЛАВНЫХ ВОПРОСОВ ДЛЯ ОБСУЖДЕНИЯ СО СВОИМ ПАРТНЕРОМ