Нейросеть научили копировать голос при синтезе текста в речь
04.09.19
Группа разработчиков создала алгоритм для синтеза текста в речь на основе нейросетевых моделей Tacotron 2 и WaveNet. Алгоритмы могут создавать голос, имитирующий говорящего по фрагменту стороннего аудиофайла. Результаты работы опубликованы на arxiv.org в июне 2018 года, открытый исходный код размещён на площадке GitHub.
Для работы алгоритма нужно два аудиофайла: один с примером голоса, который необходимо скопировать, и второй с фразой, которую этим голосом нужно произнести. После этого алгоритм почти в реальном времени преобразует голос из второго аудиофайла. В итоге. получает голос похожий на тон говорящего из первого файла.
вологість:
тиск:
вітер:
Обзор смартфона Tecno Spark 20 Pro+: рестомод
Обновлённая серия смартфонов Tecno Spark 20 Pro+ состоит из трех моделей. Сегодня расскажем про топовою, которая к тому же, отличается по стилю от младших
Redmi Projector Lite проецирует Full HD-видео диагональю до 100 дюймов
Redmi проекторRedmi Projector Lite можно использовать для боковой, наклонной и возвышенной проекции. В устройстве предусмотрены порты HDMI (ARC), USB 2.0, DC IN и 3.5 мм
BMW Vision Neue Klasse X — концепт футуристичного внедорожника
BMW автомобиль концептХотя выпуск BMW Neue Klasse X на рынок запланирован на следующий год, компания уже представляет прототип, который открывает новые перспективы в области автомобильных технологий.