Nvidia разработала ИИ-модель Fugatto для создания реалистичных звуков
27.11.24
Nvidia представила новый экспериментальный генеративный ИИ под названием Foundational Generative Audio Transformer Opus 1 (Fugatto), который позиционируется как универсальный инструмент для работы со звуком. Эта модель способна как создавать новые аудиофайлы на основе текстовых подсказок, так и изменять существующие музыкальные, голосовые и звуковые записи.
Разработка Fugatto велась международной командой исследователей, что позволило сделать модель более адаптивной к разным акцентам и языкам. Рафаэль Валле, менеджер прикладных аудиоисследований Nvidia, подчеркнул, что главной целью было создать модель, которая понимает и генерирует звук так, как это делают люди.
Применения Fugatto:
- Музыкальная индустрия: создание прототипов песен с возможностью редактирования стиля, инструментов или голосов.
- Обучение языкам: генерация образовательных материалов с настройкой голоса по предпочтению пользователя.
- Видеоигры: создание динамических звуковых эффектов, которые адаптируются к выбору и действиям игроков.
- Сложные композиции: сочетание команд для генерации уникальных эффектов, например, сердитого голоса с акцентом или пения птиц на фоне грозы.
Fugatto может выполнять задачи, которым не обучалась напрямую, благодаря настройке. Например, создавать звуки, меняющиеся с течением времени, такие как нарастающий шум дождя.
Несмотря на инновации, Nvidia пока не раскрывает, станет ли Fugatto доступным для широкой аудитории. Это подчеркивает конкурентную борьбу в сфере генеративного аудио: похожие технологии уже представлены Meta (их инструмент генерирует звуки по текстовым описаниям) и Google с моделью MusicLM, которая преобразует текст в музыку.
Не пропустите интересное!
Підписывайтесь на наши каналы и читайте анонсы хай-тек новостей, тестов и обзоров в удобном формате!
Обзор смартфона Oppo A6 Pro: амбициозный
Новый смартфон Oppo A6 Pro — телефон среднего уровня с функциональностью смартфонов премиум-класса. Производитель наделил его множеством характеристик, присущих более дорогим телефонам. Но не обошлось и без компромиссов. Как именно сбалансирован Oppo A6 Pro – расскажем в обзоре.
Обзор наушников Logitech G G325: надежно и надолго
Logitech G выпустила новую игровую гарнитуру, предложившую хорошую эргономику, стабильное подключение и высокую автономность по вполне приемлемой цене. Расскажем о Logitech G G325 подробнее
WordPress.com добавил помощника на базе ИИ для редактирования дизайна и контента WordPress интернет искусственный интеллект
Платформа WordPress.com, принадлежащая компании Automattic, расширяет использование инструментов искусственного интеллекта
Новый смартфон Google Pixel 10a мало чем отличается от предшественника Google смартфон
Google Pixel 10a оснащен 6,3-дюймовым Plastic OLED-дисплеем с частотой обновления 120 Гц, разрешением 2424×1080 пикселей и пиковой яркостью до 2000 нит

