Nvidia розробила ШІ-модель Fugatto для створення реалістичних звуків
27.11.24
Nvidia представила новий генеративний експериментальний ІІ під назвою Foundational Generative Audio Transformer Opus 1 (Fugatto), який позиціонується як універсальний інструмент для роботи зі звуком. Ця модель здатна як створювати нові аудіофайли на основі текстових підказок, так і змінювати існуючі музичні, голосові та звукові записи.
Розробка Fugatto велася міжнародною командою дослідників, що дозволило зробити модель адаптивнішою до різних акцентів та мов. Рафаель Валле, менеджер прикладних аудіодосліджень Nvidia, підкреслив, що головною метою було створити модель, яка розуміє та генерує звук так, як це роблять люди.
Застосування Fugatto:
- Музична індустрія: створення прототипів пісень з можливістю редагування стилю, інструментів чи голосів.
- Навчання мов: генерація освітніх матеріалів з налаштуванням голосу на перевагу користувача.
- Відеоігри: створення динамічних звукових ефектів, які адаптуються до вибору та дій гравців.
- Складні композиції: поєднання команд для генерації унікальних ефектів, наприклад, сердитий голос з акцентом або спів птахів на тлі грози.
Fugatto може виконувати завдання, яким не навчалася безпосередньо завдяки налаштуванню. Наприклад, створювати звуки, що змінюються з часом, такі як наростаючий шум дощу.
Незважаючи на інновації, Nvidia поки не розкриває, чи стане Fugatto доступним для широкої аудиторії. Це підкреслює конкурентну боротьбу у сфері генеративного аудіо: схожі технології вже представлені Meta (їхній інструмент генерує звуки за текстовими описами) та Google з моделлю MusicLM, яка перетворює текст на музику.
Не пропустіть цікаве!
Підписуйтесь на наші канали та читайте анонси хай-тек новин, тестів та оглядів у зручному форматі!
Головні технологічні події 2024 року
Редакція сайту hi-tech.ua продовжує висвітлювати всі значні технологічні події 2024 року – від нових ігор та технологій до чергових смартфонів та електрокарів. Ми вже звикли, що аудиторію цікавлять різні теми – бачимо тут як інтерес до чергового бюджетного смартфону, так і бронемашин від США
Навушники OnePlus Buds Ace 2 отримали ANC, 43 години автономності та підтримку двох пристроїв Bluetooth OnePlus навушники
OnePlus представила нові навушники Buds Ace 2. Навушники важать 4,2 г кожен і доступні в кольорах Submarine Black і Shadow Green.
Найкрасивіші ігри 2024 року за версією Digital Foundry графіка ігри рейтинг
Digital Foundry підбили підсумки року та назвали ігри з найкрасивішою та найтехнологічнішою графікою 2024 року. Перше місце зайняла Indiana Jones and the Great Circle