Сравниваем доступные LLM на русском языке – От Gigachat Pro до Claude 3 Sonnet
В мире, где ИИ чат-боты становятся всё умнее, как выбрать того, который поймёт тебя лучше всех? Сегодня мы проведём уникальное сравнение доступных на русском языке больших языковых моделей, чтобы выявить, какая из них заслуживает звание лучшей.
Ссылку на табличку с тестами выложил в телеграм:
Таймкоды:
00:00 - Вступление
01:37 - Задача 1.1 – Генерируем идеи заголовков
08:21 - Задача 1.2 – Выдумываем названия для стартапа
14:09 - Задача 1.3 – Брейнштормим идеи подарка для девушки
21:03 - Задача 2 – Генерируем краткое содержание текста с помощью нейросети
27:42 - Задача 3.1 – Переводим с английского языка на русский
38:59 - Задача 3.2 – Получаем перевод с французского без знания языка
49:05 - Задача 3.3 – Делаем перевод с китайского простым копи-пастом, даже не понимая алфавита
54:48 - Задача 4.1 – Производим рерайт текста с помощью нейросети
01:06:55 - Задача 4.2 – Просим нейросеть написать пост для социальной сети
01:13:08 - Задача 5.1 – Выясняем, в наличии ли логика у LLM с помощью задачи на транзитивность
01:20:02 - Задача 5.2 – Задаём языковой модели задачу на бытовую логику, чтобы выявить наличие интеллекта
01:26:20 - Задача 6.1 – Пишем стихи с помощью нейросети
01:32:04 - Задача 6.2 – Выясняем, насколько интеллектуальны искуственно-интеллектуальные анекдоты
01:39:01 - Задача 7.1 – Просим нейросеть написать простейший код
01:45:07 - Задача 7.2 – Задаём LLM задачу написать код посложнее
01:51:08 - Подводим итоги. Если нет желания воочию убедиться в способностях различных чат-ботов и посмотреть видео целиком, например, пока делаете какую-то рутинную работу – тык прямо сюда.
1 view
101
24
4 weeks ago 00:11:46 1
Сравнение . 2: Сердце Чернобыля и STALCRAFT: X (2024) — Официальный Трейлер
2 months ago 01:17:00 2
Жареная картошка от Дениса. Сравниваем и выбираем лучшую из 4 сортов. Что могло пойти не так?
2 months ago 00:10:48 1
Недвижимость в Турции 2024: Как Купить Выгодно и Получить ВНЖ | Сравнение с Испанией и Грецией
2 months ago 00:02:55 1
Измерения. Сравнения. Оценки. #mdart_инфо
2 months ago 00:44:58 1
ПОЗНАВШИЙ СЕБЯ | Подкаст НЕМЫСЛИМОЕ с АРТУРОМ СИТА
2 months ago 00:24:17 1
[ОБЗОР] ВСЕ Покрышки 20x5.0 для Himoto | BlackWarrior | Walfisk
2 months ago 00:34:37 6
Stable Diffusion 3.5. Первопроходец снова в игре! Сравнение с Flux Pro 1.1. Установка на ComfyUI.
2 months ago 00:13:43 1
БОЛЬШОЕ СРАВНЕНИЕ ПАЛАТОК - HIKEBURGER YUANXING • 3F UL GEAR LANSHAN 2PRO • DECATHLON FORCLAZ MT900
2 months ago 00:05:48 1
Сравнение рабочих России, Италии и Германии. Новый список компаний на приватизацию. Новости
2 months ago 00:36:37 1
Что я советую купить в Минске/Самое востребованное и доступное
2 months ago 00:46:26 1
Кураев про Гундяева, религию Путина и проблему РПЦ 🎙 Честное слово с Андреем Кураевым
2 months ago 00:04:04 1
СТОИТ ЛИ ПОКУПАТЬ TEYES? Сравнение магнитолы с MEKEDE, Pioneer и RedPower?
2 months ago 00:16:23 3
MEKEDE или TEYES: что лучше? Сравнение магнитол
2 months ago 00:11:28 1
BMW или Mercedes? Кто истинный король премиума?
2 months ago 00:27:10 1
Методы энергетической и ментальной защиты. Сравнение
2 months ago 00:18:40 106
[СРАВНЕНИЕ ОЗВУЧЕК] СПИРАЛЬ / UZUMAKI
2 months ago 02:19:55 1
МАРКСИСТ атакует меня за ВИДЕО про ГОРМОНЫ @MarxistKritik
2 months ago 00:23:30 1
Лучшие рюкзаки для похода в лес. Сравнение прочности и удобства
2 months ago 00:15:48 1
Децл выступает против Путина. Последнее интервью Кирилла Толмацкого. Децла отравили новичком.
2 months ago 00:10:07 1
Пападжи ~ Нет сомнения, нет пути
2 months ago 00:31:33 1
Поселок? городок? или Питер: сравнение
3 months ago 00:30:35 1
⚡️ Обновление FLUX! Обзор, СРАВНЕНИЕ с Midjourney, FLUX PRO, FLUX DEV. Какая AI модель лучше?
3 months ago 00:29:16 1
Меднение своими руками. Три самых доступных способа
3 months ago 00:20:01 1
CPU на RISC-V в ПК (ноутбуке), тест и сравнение с другими процессорами.