Что-то все молчат, а тут такое... Хотшот: как команда из 4 человек замутила ответочку Sora

Что-то все молчат, а тут такое... Хотшот: как команда из 4 человек замутила ответочку Sora. За последние 13 месяцев мы обучили 3 разные видеомодели. Наша первая видеомодель, Hotshot-XL, генеририровала 1-секундные видео с частотой 8 кадров в секунду. Наша следующая видеомодель, Hotshot Act-One, создавала 3-секундные видео с частотой 8 кадров в секунду и была обучена за 5 месяцев. При создании этой модели мы смогли значительно расширить наш набор видеоданных до 200 млн плотно размеченных общедоступных видео. За последние 4 месяца мы обучили Hotshot — модель преобразования текста в видео, которая генерирует до 10 секунд видеоматериала с разрешением 720p. Вот тут прям подробный отчет, как они обучали и оптимизировали: release Пробуем и оцениваем тут: 3 генерации в день. За сто баксов в месяц можно как бы безлимит в день, но 200 в месяц (???). - 7 в день? Только нет image2video. В общем попытка защитана, но качество и ценообразование - нет. Ждем опенсора с ответочкой.
Back to Top