OCTAVE (Omni-Capable Text and Voice Engine) На полянке генерации голосов и вообще голосовых вводов\выводов становится довольно ж
OCTAVE (Omni-Capable Text and Voice Engine)
На полянке генерации голосов и вообще голосовых вводов\выводов становится довольно жарко и интересно.
Тут вот Hume AI разродился Октавой.
Это “speech-language model“ с интересными фишками типа создания голоса и личности “на лету“, генерацию голосов промптами и всяко-разно другое. Мне понравился сербский акцент и бруклинский таксист.
Можно сказать, что это ChatGPT Advanced Voice Mode, Elevenlabs Voice Design и Google NotebookLM в одном флаконе - просматривается некий будущий вижен, а не только голос в чатике.
Поглядите тут, сравнение с LLM тоже интересно:
На основе очень короткого аудиофрагмента (~5 с) OCTAVE не только имитирует голос говорящего, но и в значительной степени перенимает его эмоционально.
Аудиофейки на марше..
1 view
17
3
16 hours ago 00:01:25 2
OCTAVE (Omni-Capable Text and Voice Engine) На полянке генерации голосов и вообще голосовых вводов\выводов становится довольно ж