Nvidia разработала ИИ-модель Fugatto для создания реалистичных звуков
27.11.24
Nvidia представила новый экспериментальный генеративный ИИ под названием Foundational Generative Audio Transformer Opus 1 (Fugatto), который позиционируется как универсальный инструмент для работы со звуком. Эта модель способна как создавать новые аудиофайлы на основе текстовых подсказок, так и изменять существующие музыкальные, голосовые и звуковые записи.
Разработка Fugatto велась международной командой исследователей, что позволило сделать модель более адаптивной к разным акцентам и языкам. Рафаэль Валле, менеджер прикладных аудиоисследований Nvidia, подчеркнул, что главной целью было создать модель, которая понимает и генерирует звук так, как это делают люди.
Применения Fugatto:
- Музыкальная индустрия: создание прототипов песен с возможностью редактирования стиля, инструментов или голосов.
- Обучение языкам: генерация образовательных материалов с настройкой голоса по предпочтению пользователя.
- Видеоигры: создание динамических звуковых эффектов, которые адаптируются к выбору и действиям игроков.
- Сложные композиции: сочетание команд для генерации уникальных эффектов, например, сердитого голоса с акцентом или пения птиц на фоне грозы.
Fugatto может выполнять задачи, которым не обучалась напрямую, благодаря настройке. Например, создавать звуки, меняющиеся с течением времени, такие как нарастающий шум дождя.
Несмотря на инновации, Nvidia пока не раскрывает, станет ли Fugatto доступным для широкой аудитории. Это подчеркивает конкурентную борьбу в сфере генеративного аудио: похожие технологии уже представлены Meta (их инструмент генерирует звуки по текстовым описаниям) и Google с моделью MusicLM, которая преобразует текст в музыку.
Не пропустите интересное!
Підписывайтесь на наши каналы и читайте анонсы хай-тек новостей, тестов и обзоров в удобном формате!
Обзор игрового ноутбука Acer Nitro V 14 ANV14-61 (N9.QTFWW.001): лед и мощность
Acer Nitro V 14 ANV14-61 выглядит элегантно несмотря на игровую принадлежность. Хороший экран, процессор и видеокарта достаточной производительности. Что еще в нем интересного?
Смартфон Realme Neo7 получил Mediatek Dimensity 9300+, экран 6000 нит и батарею 7000 мАч MediaTek Realme смартфон
Realme представила свой новый смартфон Realme Neo7, предлагающий хорошие характеристики по конкурентной цене
В YouTube добавили функцию озвучки видео на других языках YouTube видео
YouTube внедрил функцию автоматической озвучки видео на основе искусственного интеллекта, что позволяет создавать звуковые дорожки на нескольких языках