Microsoft розробила штучний інтелект VALL-E, який імітує людський голос на основі 3-секундного оригіналу

a robot girl connected with metal cables

 

Microsoft представила нову модель штучного інтелекту під назвою Vall-E. Вона базується на технології EnCodec, яку Meta анонсувала в жовтні 2022 року.

 

Microsoft називає VALL-E “мовною моделлю нейронного кодека”. Цей штучний інтелект здатний імітувати будь-який людський голос, до того ж для цього йому треба прослухати всього 3 секунди оригінального голосу.

 

ШІ розбиває інформацію на компоненти та синтезує варіації його звучання в різних фразах, у результаті чого може точно відтворювати тембр та емоційний тон мовця.

 

Для навчання Vall-E компанія Microsoft використовувала записи 60 тисяч годин розмов, які записали понад 7 тисяч реальних людей. Здебільшого для цього брали аудіокниги з бібліотеки LibriVox.

 

microsoft vall-e

 

Приклади імітації голосів Vall-E можна послухати на GitHub.

 

Microsoft каже, що Vall-E можна буде використовувати як інструмент перетворення тексту на голос, спосіб редагування мови та систему створення аудіо, поєднавши його з іншими генеративними ШІ.


Не пропустіть цікаве!

Підписуйтесь на наші канали та читайте анонси хай-тек новин, тестів та оглядів у зручному форматі!

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *





Статті & тестиArticles

Огляд смартфона Oppo A6 Pro: амбітний Oppo A6 Pro (CPH2799)

Новий смартфон Oppo A6 Pro – середнячок з функціональністю смартфонів преміум-класу. Виробник наділив його кількома характеристиками, властивими більш дорожчим телефонам. Але не обійшлось і без компромісів. Як саме збалансований Oppo A6 Pro – розповімо в огляді.


Ігрове кермо Logitech G29: спорткар на столі Logitech G29 Driving Force Racing Wheel

Розповімо про ігрове кермо Logitech G29 для ПК та PlayStation, а також доповнення у вигляді 6-ступінчастого перемикача передач Driving Force Shifter.


НовиниNews
| 10.11
Програми Adobe з’являться прямо у ChatGPT   
Adobe Photoshop для Apple M1

Adobe розпочала інтеграцію додатків Photoshop, Acrobat та Express у ChatGPT, що дає користувачам можливість безкоштовно виконувати базові завдання прямо у вікні чату

| 08.50
Електростатичні навушники Stax SR-1 почали продаватися в Україні   
Stax SR-1

Зараз на українському ринку представлені актуальні моделі японського виробника Stax з фірмовою гарантією та офіційним супроводом.