Microsoft разработала искусственный интеллект VALL-E, имитирующий человеческий голос на основе 3-секундного оригинала

a robot girl connected with metal cables

 

Microsoft представила новую модель искусственного интеллекта под названием Vall-E. Она базируется на технологии EnCodec, которую Meta анонсировала в октябре 2022 года.

 

Microsoft называет VALL-E «языковой моделью нейронного кодека». Этот искусственный интеллект способен имитировать любой человеческий голос, к тому же для этого ему нужно прослушать всего три секунды оригинального голоса.

 

ИИ разбивает информацию на компоненты и синтезирует вариации его звучания в разных фразах, в результате чего может точно воспроизводить тембр и эмоциональный тон говорящего.

 

Для обучения Vall-E компания Microsoft использовала записи 60 тысяч часов разговоров, записавших более 7 тысяч реальных людей. В основном для этого брали аудиокниги из библиотеки LibriVox.

 

microsoft vall-e

 

Примеры имитации голосов Vall-E можно послушать на GitHub.

 

Microsoft говорит, что Vall-E можно использовать как инструмент преобразования текста в голос, способ редактирования языка и систему создания аудио, соединив его с другими генеративными ИИ.


Не пропустите интересное!

Підписывайтесь на наши каналы и читайте анонсы хай-тек новостей, тестов и обзоров в удобном формате!

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *





Статьи & тестыArticles

Обзор смартфона Oppo A6 Pro: амбициозный Oppo A6 Pro (CPH2799)

Новый смартфон Oppo A6 Pro — телефон среднего уровня с функциональностью смартфонов премиум-класса. Производитель наделил его множеством характеристик, присущих более дорогим телефонам. Но не обошлось и без компромиссов. Как именно сбалансирован Oppo A6 Pro – расскажем в обзоре.


Лучшие Bluetooth колонки. Подборка моделей в разных ценовых сегментах Sony SRS-XP500

Портативная колонка давно перестала быть просто аксессуаром для смартфона или ноутбука. Она стала инструментом для создания атмосферы – от камерной встречи до масштабной вечеринки.


НовостиNews
| 09.34
Shoei GT-Air 3 Smart – первый мотошлем с дополненной реальностью  
Shoei GT-Air 3 Smart

Японская компания Shoei представила первый в мире мотоциклетный шлем с полностью интегрированной системой дополненной реальности

| 14.19
Игру DOOM запустили в проектировщике печатных плат  
Doom

Визуальный стиль KiDOOM выглядит непривычно и сразу вызывает ассоциации с эпохой аркадных автоматов, таких как Atari Battlezone, или с эстетикой Vectrex