Nvidia розробила ШІ-модель Fugatto для створення реалістичних звуків

artificial robot human ai

 

Nvidia представила новий генеративний експериментальний ІІ під назвою Foundational Generative Audio Transformer Opus 1 (Fugatto), який позиціонується як універсальний інструмент для роботи зі звуком. Ця модель здатна як створювати нові аудіофайли на основі текстових підказок, так і змінювати існуючі музичні, голосові та звукові записи.

 

Розробка Fugatto велася міжнародною командою дослідників, що дозволило зробити модель адаптивнішою до різних акцентів та мов. Рафаель Валле, менеджер прикладних аудіодосліджень Nvidia, підкреслив, що головною метою було створити модель, яка розуміє та генерує звук так, як це роблять люди.

 

Застосування Fugatto:

 

  • Музична індустрія: створення прототипів пісень з можливістю редагування стилю, інструментів чи голосів.
  • Навчання мов: генерація освітніх матеріалів з налаштуванням голосу на перевагу користувача.
  • Відеоігри: створення динамічних звукових ефектів, які адаптуються до вибору та дій гравців.
  • Складні композиції: поєднання команд для генерації унікальних ефектів, наприклад, сердитий голос з акцентом або спів птахів на тлі грози.

 

Fugatto може виконувати завдання, яким не навчалася безпосередньо завдяки налаштуванню. Наприклад, створювати звуки, що змінюються з часом, такі як наростаючий шум дощу.

 

Незважаючи на інновації, Nvidia поки не розкриває, чи стане Fugatto доступним для широкої аудиторії. Це підкреслює конкурентну боротьбу у сфері генеративного аудіо: схожі технології вже представлені Meta (їхній інструмент генерує звуки за текстовими описами) та Google з моделлю MusicLM, яка перетворює текст на музику.


Не пропустіть цікаве!

Підписуйтесь на наші канали та читайте анонси хай-тек новин, тестів та оглядів у зручному форматі!

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *





Статті & тестиArticles

Огляд смартфона Oppo A6 Pro: амбітний Oppo A6 Pro (CPH2799)

Новий смартфон Oppo A6 Pro – середнячок з функціональністю смартфонів преміум-класу. Виробник наділив його кількома характеристиками, властивими більш дорожчим телефонам. Але не обійшлось і без компромісів. Як саме збалансований Oppo A6 Pro – розповімо в огляді.


Кращі Bluetooth колонки. Добірка моделей у різних цінових сегментах Sony SRS-XP500

Колонка давно перестала бути просто аксесуаром для смартфона. Вона стала інструментом для створення атмосфери — від камерної зустрічі до масштабної вечірки


НовиниNews
| 18.53
Netflix купує Warner Bros за $82,7 мільярда   
Netflix

Окрім самої Warner Bros. Netflix отримає контроль над телевізійними та кіностудіями, а також сервісами HBO та HBO Max

| 16.20
Microsoft змінить дизайн меню Виконати вперше за 30 років   
Windows 11 lifestyle

У тестових збірниках Windows 11 помітили оновлене діалогове вікно Run (“Виконати”) – один із найстаріших системних елементів, вперше з часів Windows 95 набув сучасного вигляду