Nvidia разработала ИИ-модель Fugatto для создания реалистичных звуков
27.11.24
Nvidia представила новый экспериментальный генеративный ИИ под названием Foundational Generative Audio Transformer Opus 1 (Fugatto), который позиционируется как универсальный инструмент для работы со звуком. Эта модель способна как создавать новые аудиофайлы на основе текстовых подсказок, так и изменять существующие музыкальные, голосовые и звуковые записи.
Разработка Fugatto велась международной командой исследователей, что позволило сделать модель более адаптивной к разным акцентам и языкам. Рафаэль Валле, менеджер прикладных аудиоисследований Nvidia, подчеркнул, что главной целью было создать модель, которая понимает и генерирует звук так, как это делают люди.
Применения Fugatto:
- Музыкальная индустрия: создание прототипов песен с возможностью редактирования стиля, инструментов или голосов.
- Обучение языкам: генерация образовательных материалов с настройкой голоса по предпочтению пользователя.
- Видеоигры: создание динамических звуковых эффектов, которые адаптируются к выбору и действиям игроков.
- Сложные композиции: сочетание команд для генерации уникальных эффектов, например, сердитого голоса с акцентом или пения птиц на фоне грозы.
Fugatto может выполнять задачи, которым не обучалась напрямую, благодаря настройке. Например, создавать звуки, меняющиеся с течением времени, такие как нарастающий шум дождя.
Несмотря на инновации, Nvidia пока не раскрывает, станет ли Fugatto доступным для широкой аудитории. Это подчеркивает конкурентную борьбу в сфере генеративного аудио: похожие технологии уже представлены Meta (их инструмент генерирует звуки по текстовым описаниям) и Google с моделью MusicLM, которая преобразует текст в музыку.
Не пропустите интересное!
Підписывайтесь на наши каналы и читайте анонсы хай-тек новостей, тестов и обзоров в удобном формате!
Обзор смартфона Oppo A6 Pro: амбициозный
Новый смартфон Oppo A6 Pro — телефон среднего уровня с функциональностью смартфонов премиум-класса. Производитель наделил его множеством характеристик, присущих более дорогим телефонам. Но не обошлось и без компромиссов. Как именно сбалансирован Oppo A6 Pro – расскажем в обзоре.
One UI 8.5: новая жизнь старых смартфонов Samsung — что даёт обновление?
One UI 8.5 приносит старым Samsung Galaxy функции, которые ещё недавно были эксклюзивом новых флагманов. Но действительно ли обновление способно сделать Galaxy S22, S23 и S24 ближе к уровню Galaxy S26? Разбираемся, что меняется после установки прошивки.
Ложный арест по ошибке ИИ: житель США подал в суд из-за сбоя системы распознавания лиц
В США разгорается новый скандал вокруг несовершенства современных биометрических технологий — очередная критическая ошибка системы распознавания лиц привела к задержанию невиновного гражданина.
Мечта блогера: Insta360 Luna Ultra получила 8K, подвес и ИИ-оператора
Insta360 и Leica представили революционную гимбал-камеру Luna Ultra с 1-дюймовым сенсором, поддержкой Dolby Vision и продвинутым ИИ Deep Track 5.0.


