Meta разработала Audiobox – еще один искусственный интеллект для генерации голоса и звуковых эффектов
15.12.23
Компания Meta представила новую платформу искусственного интеллекта под названием Audiobox, которая позволяет создавать персонализированные голоса и звуковые эффекты через голосовые команды.
Audiobox является усовершенствованной версией предварительной разработки Meta, известной как Voicebox, и отличается более высоким качеством звучания и расширенными возможностями. Новинка умеет не только генерировать, но и редактировать аудио, создавая вещание на разных языках, звуковые эффекты и атмосферные звуковые образы, такие как автомобильные гудки или грохот грома.
Audiobox также включает средства контроля над процессом генерации для детальной настройки результата. В целях предотвращения злоупотреблений в платформу была встроена система цифровых водяных знаков, автоматически маркирующая каждое созданное аудио, чтобы отследить его происхождение.
Разработчики утверждают, что скорость генерации аудио Audiobox в 25 раз выше, чем в предыдущих моделях искусственного интеллекта от Meta. Это достигнуто благодаря использованию персональных алгоритмов обработки данных для каждой конкретной задачи.
Однако технология пока ограничивается нехваткой качественно промаркированных данных для обучения искусственной интеллектуальной модели. Расширение базы данных должно улучшить возможности Audiobox в дальнейшем.
Не пропустите интересное!
Підписывайтесь на наши каналы и читайте анонсы хай-тек новостей, тестов и обзоров в удобном формате!
Планшет Samsung Galaxy Tab S10 Ultra (SM-X926B): многое
Новый планшет Samsung Galaxy Tab S10 Ultra получил большой 14,6”-экран, топовый процессор Mediatek Dimensity 9300 и стилус S Pen. Попробуем разобраться для чего такой девайс
Xiaomi в 2025 году представит свой 3-нм чип для конкуренции с Qualcomm и MediaTek процессор смартфон
Предполагается, что первый 3-нм чип Xiaomi дебютирует в одном из флагманских смартфонов, возможно, в Xiaomi 16
ИИ Google Gemini получил поддержку голосовых команд в Spotify для поиска и воспроизведения музыки Google Spotify искусственный интеллект
Google совершенствует возможности голосового помощника Gemini, добавляя поддержку Spotify. Теперь пользователи могут искать, воспроизводить и просматривать музыку с помощью голосовых команд