Нейросеть научили копировать голос при синтезе текста в речь
04.09.19
Группа разработчиков создала алгоритм для синтеза текста в речь на основе нейросетевых моделей Tacotron 2 и WaveNet. Алгоритмы могут создавать голос, имитирующий говорящего по фрагменту стороннего аудиофайла. Результаты работы опубликованы на arxiv.org в июне 2018 года, открытый исходный код размещён на площадке GitHub.
Для работы алгоритма нужно два аудиофайла: один с примером голоса, который необходимо скопировать, и второй с фразой, которую этим голосом нужно произнести. После этого алгоритм почти в реальном времени преобразует голос из второго аудиофайла. В итоге. получает голос похожий на тон говорящего из первого файла.
Не пропустите интересное!
Підписывайтесь на наши каналы и читайте анонсы хай-тек новостей, тестов и обзоров в удобном формате!
Обзор смартфона Oppo A6 Pro: амбициозный
Новый смартфон Oppo A6 Pro — телефон среднего уровня с функциональностью смартфонов премиум-класса. Производитель наделил его множеством характеристик, присущих более дорогим телефонам. Но не обошлось и без компромиссов. Как именно сбалансирован Oppo A6 Pro – расскажем в обзоре.
Выбор редакции 2025. Лучшие устройства года по версии hi-tech.ua
Лучшие игровые ноутбуки, мышки для работы, клавиатуры для игр, смартфоны и беспроводные наушники 2025 года. Среди них мы отметим самые интересные и те что можем рекомендовать купить.
Motorola представила бюджетный смартфон Moto G Power (2026) Motorola смартфон
Компания Motorola представила смартфон Moto G Power (2026), ориентированный на автономность, надежность и повседневную практичность
STALKER 2: Heart of Chornobyl получил большое бесплатное дополнение Stories Untold игры обновление
Украинская студия GSC Game World выпустила бесплатное сюжетное дополнение Stories Untold для S.T.A.L.K.E.R. 2: Heart of Chornobyl, уже доступный на PC, Xbox Series X/S и PlayStation 5.


