Microsoft разработала искусственный интеллект VALL-E, имитирующий человеческий голос на основе 3-секундного оригинала
24.01.23
Microsoft представила новую модель искусственного интеллекта под названием Vall-E. Она базируется на технологии EnCodec, которую Meta анонсировала в октябре 2022 года.
Microsoft называет VALL-E «языковой моделью нейронного кодека». Этот искусственный интеллект способен имитировать любой человеческий голос, к тому же для этого ему нужно прослушать всего три секунды оригинального голоса.
ИИ разбивает информацию на компоненты и синтезирует вариации его звучания в разных фразах, в результате чего может точно воспроизводить тембр и эмоциональный тон говорящего.
Для обучения Vall-E компания Microsoft использовала записи 60 тысяч часов разговоров, записавших более 7 тысяч реальных людей. В основном для этого брали аудиокниги из библиотеки LibriVox.
Примеры имитации голосов Vall-E можно послушать на GitHub.
Microsoft говорит, что Vall-E можно использовать как инструмент преобразования текста в голос, способ редактирования языка и систему создания аудио, соединив его с другими генеративными ИИ.
Не пропустите интересное!
Підписывайтесь на наши каналы и читайте анонсы хай-тек новостей, тестов и обзоров в удобном формате!

Samsung Galaxy A36 и Galaxy A56 — доступные флагманские технологии



У Samsung Galaxy A36 и Galaxy A56 одинаково хорошие дисплеи, емкие аккумуляторы, есть поддержка обновлений софта в течение 6 лет. Расскажем подробнее чем еще они интересны

Первая квантовая система навигации оказалась в 50 раз точнее GPS навигация
Австралийская компания Q-CTRL впервые публично продемонстрировала собственную квантовую навигационную систему под названием Ironstone Opal, которая работает полностью автономно и не нуждается в GPS.
Audi A6 Sedan будет выпускаться в версии мягкого гибрида Audi автомобиль
Audi A6 Sedan с классическим для бизнес-класса кузовом дополнила представленную ранее в марте A6 Avant и, как и универсал, построена на платформе Premium Platform Combustion (PPC).