Nvidia разработала ИИ-модель Fugatto для создания реалистичных звуков
27.11.24
Nvidia представила новый экспериментальный генеративный ИИ под названием Foundational Generative Audio Transformer Opus 1 (Fugatto), который позиционируется как универсальный инструмент для работы со звуком. Эта модель способна как создавать новые аудиофайлы на основе текстовых подсказок, так и изменять существующие музыкальные, голосовые и звуковые записи.
Разработка Fugatto велась международной командой исследователей, что позволило сделать модель более адаптивной к разным акцентам и языкам. Рафаэль Валле, менеджер прикладных аудиоисследований Nvidia, подчеркнул, что главной целью было создать модель, которая понимает и генерирует звук так, как это делают люди.
Применения Fugatto:
- Музыкальная индустрия: создание прототипов песен с возможностью редактирования стиля, инструментов или голосов.
- Обучение языкам: генерация образовательных материалов с настройкой голоса по предпочтению пользователя.
- Видеоигры: создание динамических звуковых эффектов, которые адаптируются к выбору и действиям игроков.
- Сложные композиции: сочетание команд для генерации уникальных эффектов, например, сердитого голоса с акцентом или пения птиц на фоне грозы.
Fugatto может выполнять задачи, которым не обучалась напрямую, благодаря настройке. Например, создавать звуки, меняющиеся с течением времени, такие как нарастающий шум дождя.
Несмотря на инновации, Nvidia пока не раскрывает, станет ли Fugatto доступным для широкой аудитории. Это подчеркивает конкурентную борьбу в сфере генеративного аудио: похожие технологии уже представлены Meta (их инструмент генерирует звуки по текстовым описаниям) и Google с моделью MusicLM, которая преобразует текст в музыку.
Не пропустите интересное!
Підписывайтесь на наши каналы и читайте анонсы хай-тек новостей, тестов и обзоров в удобном формате!
Обзор смартфона Oppo A6 Pro: амбициозный
Новый смартфон Oppo A6 Pro — телефон среднего уровня с функциональностью смартфонов премиум-класса. Производитель наделил его множеством характеристик, присущих более дорогим телефонам. Но не обошлось и без компромиссов. Как именно сбалансирован Oppo A6 Pro – расскажем в обзоре.
Игровой руль Logitech G29: спорткар на столе
Расскажем про игровой руль Logitech G29 для ПК и PlayStation, а также дополнение в виде 6-ступенчатого переключателя передач Driving Force Shifter.
Исследование: люди начали копировать фразы чат ботов с ИИ искусственный интеллект исследования
После появления ChatGPT авторы видеороликов на YouTube стали заметно чаще употреблять слова, характерные для языка крупных языковых моделей
Операционной системе Windows исполнилось 40 лет Windows история
История Windows началась в конце семидесятых, когда Microsoft решила создать графическую оболочку для своего DOS


