Google Gemini тепер може генерувати музику23.02.26
Компанія Google оголосила про запуск нової функції в програмі Gemini, яка дозволяє користувачам створювати музичні треки за допомогою штучного інтелекту. Для генерації використовується модель DeepMind Lyria 3, що знаходиться на стадії бета-тестування.
Генерація пісень за текстовим описом та медіафайлами
Новий інструмент працює за принципом текстового запиту. Користувач описує бажану композицію, після чого система формує трек із готовим текстом пісні. У компанії наводять приклад запиту про «комічний R&B-трек про носок, який знайшов собі пару» — у відповідь Gemini створює 30-секундну композицію і автоматично додає обкладинку, згенеровану інструментом Nano Banana.
Функція також підтримує завантаження зображень або відео. На основі переданого медіафайлу система аналізує настрій та пропонує музичну композицію, що відповідає візуальному контенту. Користувачі можуть додатково налаштовувати стиль, вокал та темп треку, змінюючи параметри після первинної генерації.
За твердженням Google, Lyria 3 забезпечує більш складне та реалістичне звучання порівняно з попередніми версіями музичних моделей компанії.
Інтеграція з YouTube та контроль оригінальності
Окрім інтеграції в Gemini, доступ до Lyria 3 отримали автори на платформі YouTube через інструмент Dream Track. Якщо раніше він був доступний лише у США, то тепер компанія оголосила про глобальне розширення функції.
У Google наголошують, що нова можливість призначена для створення оригінального контенту, а не для копіювання стилю конкретних виконавців. У випадках, коли у запиті згадується ім’я артиста, система орієнтується на схожий настрій чи жанрові особливості, уникаючи прямого відтворення індивідуального звучання.
Для перевірки унікальності та маркування контенту застосовується фільтрація результатів та цифровий водяний знак SynthID, яким позначаються всі композиції, створені за допомогою ІІ. Крім того, користувачі можуть завантажувати треки Gemini, щоб визначити, чи були вони згенеровані штучним інтелектом.
Функція поступово розгортається по всьому світу для користувачів Gemini віком від 18 років. Підтримуються англійська, німецька, іспанська, французька, хінді, японська, корейська та португальська мови.
