Microsoft разработала искусственный интеллект VALL-E, имитирующий человеческий голос на основе 3-секундного оригинала
24.01.23
Microsoft представила новую модель искусственного интеллекта под названием Vall-E. Она базируется на технологии EnCodec, которую Meta анонсировала в октябре 2022 года.
Microsoft называет VALL-E «языковой моделью нейронного кодека». Этот искусственный интеллект способен имитировать любой человеческий голос, к тому же для этого ему нужно прослушать всего три секунды оригинального голоса.
ИИ разбивает информацию на компоненты и синтезирует вариации его звучания в разных фразах, в результате чего может точно воспроизводить тембр и эмоциональный тон говорящего.
Для обучения Vall-E компания Microsoft использовала записи 60 тысяч часов разговоров, записавших более 7 тысяч реальных людей. В основном для этого брали аудиокниги из библиотеки LibriVox.
Примеры имитации голосов Vall-E можно послушать на GitHub.
Microsoft говорит, что Vall-E можно использовать как инструмент преобразования текста в голос, способ редактирования языка и систему создания аудио, соединив его с другими генеративными ИИ.
вологість:
тиск:
вітер:
Вселенная Fallout в 2024 году: от игр к сериалу
Как вселенная игр Fallout получила через десятки лет свой сериал и вновь попала на пик популярности
Британское лазерное ППО DragonFire могут передать на вооружение Украине
война разработкаЛазер DragonFire способен достигать мощности, необходимой для превращения металла в плазму при температуре 3000 °C и моментально прожигать металлические поверхности.
AMD Ryzen PRO 8000 — новые процессоры для ноутбуков и десктопов
AMD процессор события в миреОфициальное пополнение модельного ряда AMD Ryzen 8000 включает две новые линейки: десктопные чипы Ryzen PRO 8000G и мобильные Ryzen PRO 8040, ориентированные на корпоративный сегмент