Nvidia розробила ШІ-модель Fugatto для створення реалістичних звуків

artificial robot human ai

 

Nvidia представила новий генеративний експериментальний ІІ під назвою Foundational Generative Audio Transformer Opus 1 (Fugatto), який позиціонується як універсальний інструмент для роботи зі звуком. Ця модель здатна як створювати нові аудіофайли на основі текстових підказок, так і змінювати існуючі музичні, голосові та звукові записи.

 

Розробка Fugatto велася міжнародною командою дослідників, що дозволило зробити модель адаптивнішою до різних акцентів та мов. Рафаель Валле, менеджер прикладних аудіодосліджень Nvidia, підкреслив, що головною метою було створити модель, яка розуміє та генерує звук так, як це роблять люди.

 

Застосування Fugatto:

 

  • Музична індустрія: створення прототипів пісень з можливістю редагування стилю, інструментів чи голосів.
  • Навчання мов: генерація освітніх матеріалів з налаштуванням голосу на перевагу користувача.
  • Відеоігри: створення динамічних звукових ефектів, які адаптуються до вибору та дій гравців.
  • Складні композиції: поєднання команд для генерації унікальних ефектів, наприклад, сердитий голос з акцентом або спів птахів на тлі грози.

 

Fugatto може виконувати завдання, яким не навчалася безпосередньо завдяки налаштуванню. Наприклад, створювати звуки, що змінюються з часом, такі як наростаючий шум дощу.

 

Незважаючи на інновації, Nvidia поки не розкриває, чи стане Fugatto доступним для широкої аудиторії. Це підкреслює конкурентну боротьбу у сфері генеративного аудіо: схожі технології вже представлені Meta (їхній інструмент генерує звуки за текстовими описами) та Google з моделлю MusicLM, яка перетворює текст на музику.


Не пропустіть цікаве!

Підписуйтесь на наші канали та читайте анонси хай-тек новин, тестів та оглядів у зручному форматі!

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *





Статті & тестиArticles

Огляд смартфона Oppo A6 Pro: амбітний Oppo A6 Pro (CPH2799)

Новий смартфон Oppo A6 Pro – середнячок з функціональністю смартфонів преміум-класу. Виробник наділив його кількома характеристиками, властивими більш дорожчим телефонам. Але не обійшлось і без компромісів. Як саме збалансований Oppo A6 Pro – розповімо в огляді.


Огляд навушників Logitech G G325: надійно та надовго Logitech G G325

Logitech G випустила нову ігрову гарнітуру, яка запропонує гарну ергономіку, стабільне підключення та високу автономність за цілком прийнятною ціною. Розкажемо про Logitech G G325 докладніше


НовостиNews
| 11.20
Ентузіасти знайшли спосіб використання YouTube як хмарного сховища для будь-яких файлів
YouTube minecraft

На платформі GitHub з’явився проект, що пропонує спосіб зберігати файли на YouTube у вигляді відео без втрати даних. Розробка під назвою yt-media-storage фактично перетворює відеохостинг на сховище, використовуючи особливості обробки та завантаження контенту на сервіс.

| 15.19
Норвезький магазин електроніки подарує GTA 6 тим, хто народить дитину в день виходу гри  
GTA 6

Норвезький ритейлер електроніки Komplett оголосив про незвичайну акцію, присвячену виходу Grand Theft Auto VI. Компанія пообіцяла безкоштовно видати копію гри всім сім’ям, у яких дитина з’явиться на світ у день офіційного релізу – 19 листопада 2026 року.