Microsoft представила Azure AI Speech text to speech avatar, який по факту дозволить створювати діпфейки і клонувати голос
23.11.23
Microsoft оголосила про випуск нового сервісу Azure AI Speech text to speech avatar, який дозволяє створювати фотореалістичних аватарів людей з можливістю анімації губ відповідно до поданого тексту.
Користувачі можуть завантажувати фотографії осіб і складати сценарії для аватарів, які в подальшому генерують відео з анімованим аватаром, який відтворює заданий текст.
Цифрові двійники можуть працювати з кількома мовами і використовувати моделі штучного інтелекту, наприклад, GPT-3.5 від OpenAI, для відповіді на запитання клієнтів.
Поєднання фотореалістичних аватарів із здатністю анімувати рухи губ відкриває широкі можливості в області інтерактивного взаємодії та змісту.
Додатково, у сервісі є функція Personal voice, яка може відтворювати голос користувача за дуже короткий час, потрібен лише однохвилинний аудіозапис.
Ця функція може бути використана для створення персоналізованих голосових помічників, дублювання контенту різними мовами та створення індивідуальних аудіотекстів для оповідань, аудіокниг і подкастів.
Не пропустіть цікаве!
Підписуйтесь на наші канали та читайте анонси хай-тек новин, тестів та оглядів у зручному форматі!
Ультратонкі ноутбуки 2025
Одними з найпомітніших представників цього класу стали Apple MacBook Air 13 M4, Dell XPS 13 9345 і Lenovo ThinkPad X1 Carbon Gen 12. Нижче — порівняння їхніх ключових характеристик, сильних і слабких сторін.
Китайці представили робо пса Rover X1 за $1000 Китай робот
“Перший у світі інтелектуальний домашній робопас” від Yuejiang Robotics оцінюється приблизно в $1000
Google дала доступ ШІ Gemini у всі свої сервіси для аналізу даних Google штучний інтелект
Механізм Deep Research працює на кілька кроків: спочатку система формує план запиту, потім виконує серію пошукових дій та поєднує отримані результати.


