OCTAVE (Omni-Capable Text and Voice Engine) На полянке генерации голосов и вообще голосовых вводов\выводов становится довольно ж

OCTAVE (Omni-Capable Text and Voice Engine) На полянке генерации голосов и вообще голосовых вводов\выводов становится довольно жарко и интересно. Тут вот Hume AI разродился Октавой. Это “speech-language model“ с интересными фишками типа создания голоса и личности “на лету“, генерацию голосов промптами и всяко-разно другое. Мне понравился сербский акцент и бруклинский таксист. Можно сказать, что это ChatGPT Advanced Voice Mode, Elevenlabs Voice Design и Google NotebookLM в одном флаконе - просматривается некий будущий вижен, а не только голос в чатике. Поглядите тут, сравнение с LLM тоже интересно: На основе очень короткого аудиофрагмента (~5 с) OCTAVE не только имитирует голос говорящего, но и в значительной степени перенимает его эмоционально. Аудиофейки на марше..
Back to Top