Google Gemini теперь может генерировать музыку23.02.26
Компания Google объявила о запуске новой функции в приложении Gemini, которая позволяет пользователям создавать музыкальные треки с помощью искусственного интеллекта. Для генерации используется модель DeepMind Lyria 3, находящаяся на стадии бета-тестирования.
Генерация песен по текстовому описанию и медиафайлам
Новый инструмент работает по принципу текстового запроса. Пользователь описывает желаемую композицию, после чего система формирует трек с готовым текстом песни. В компании приводят пример запроса о «комичном R&B-треке про носок, который нашёл себе пару» — в ответ Gemini создаёт 30-секундную композицию и автоматически добавляет обложку, сгенерированную инструментом Nano Banana.
Функция также поддерживает загрузку изображений или видеороликов. На основе переданного медиафайла система анализирует настроение и предлагает музыкальную композицию, соответствующую визуальному контенту. Пользователи могут дополнительно настраивать стиль, вокал и темп трека, изменяя параметры уже после первичной генерации.
По утверждению Google, Lyria 3 обеспечивает более сложное и реалистичное звучание по сравнению с предыдущими версиями музыкальных моделей компании.
Интеграция с YouTube и контроль оригинальности
Помимо интеграции в Gemini, доступ к Lyria 3 получили авторы на платформе YouTube через инструмент Dream Track. Если ранее он был доступен только в США, то теперь компания объявила о глобальном расширении функции.
В Google подчёркивают, что новая возможность предназначена для создания оригинального контента, а не для копирования стиля конкретных исполнителей. В случаях, когда в запросе упоминается имя артиста, система ориентируется на схожее настроение или жанровые особенности, избегая прямого воспроизведения индивидуального звучания.
Для проверки уникальности и маркировки контента применяется фильтрация результатов и цифровой водяной знак SynthID, которым помечаются все композиции, созданные с помощью ИИ. Кроме того, пользователи могут загружать треки в Gemini, чтобы определить, были ли они сгенерированы искусственным интеллектом.
Функция постепенно разворачивается по всему миру для пользователей Gemini старше 18 лет. Поддерживаются английский, немецкий, испанский, французский, хинди, японский, корейский и португальский языки.
