Google анонсировала ИИ Veo для создания видео и PaliGemma 2 для обработки изображений и текста

Google logo

Google представила новую модель генеративного искусственного интеллекта Veo, предназначенную для создания видеоконтента. Этот инструмент, доступный через платформу Vertex AI, позволяет пользователям генерировать видеоролики продолжительностью более одной минуты и разрешением 1080p.

 

Для работы с Veo не требуются специальные навыки — достаточно задать текстовый запрос или загрузить изображение. Искусственный интеллект преобразует введенные данные в видеоряд, учитывая выбранный пользователем визуальный стиль и кинематографические эффекты.

 

Полученные ролики можно редактировать, корректировать отдельные элементы и добавлять персонализированные детали, такие как логотипы. Veo ориентирован на креативных профессионалов, маркетологов и контент-мейкеров, помогая быстро создавать визуально привлекательные материалы.

 

Google Gemma

 

Google представила новую версию своей модели PaliGemma 2, которая стала развитием предыдущей версии и предназначена для работы с текстом и изображениями. Анонс был сделан после демонстрации возможностей Gemma 2 на конференции I/O 2024.

 

Модель PaliGemma 2 расширяет возможности своей предшественницы, которая была ориентирована на добавление подписей к изображениям и видео, распознавание текста, анализ объектов и ответы на визуальные запросы. Новая версия получила функцию «длинных подписей», которая позволяет генерировать более детализированные описания визуального контента, включая действия, эмоции и общий контекст сцены.

 

Улучшенные функции:

  • Генерация длинных описаний: учёт сложных деталей и атмосферы сцены.
  • Анализ сложных структур: улучшенное распознавание таблиц, химических формул и музыкальных партитур.
  • Пространственное мышление: более точный анализ рентгеновских снимков и других медицинских данных.

 

PaliGemma 2 доступна в нескольких вариантах с различным числом параметров (3B, 10B, 28B), что позволяет адаптировать её под разные задачи и объёмы данных. Производительность значительно улучшена, и новая модель совместима с предыдущей, что упрощает её интеграцию.

 

Для удобства пользователей модели и код PaliGemma 2 уже размещены на таких платформах, как Kaggle, Hugging Face и Ollama, что делает её доступной для разработчиков и исследователей.


Не пропустите интересное!

Підписывайтесь на наши каналы и читайте анонсы хай-тек новостей, тестов и обзоров в удобном формате!

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *





Статьи & тестыArticles

Обзор смартфона Oppo A6 Pro: амбициозный Oppo A6 Pro (CPH2799)

Новый смартфон Oppo A6 Pro — телефон среднего уровня с функциональностью смартфонов премиум-класса. Производитель наделил его множеством характеристик, присущих более дорогим телефонам. Но не обошлось и без компромиссов. Как именно сбалансирован Oppo A6 Pro – расскажем в обзоре.


Выбор редакции 2025. Лучшие устройства года по версии hi-tech.ua best devices 2025

Лучшие игровые ноутбуки, мышки для работы, клавиатуры для игр, смартфоны и беспроводные наушники 2025 года. Среди них мы отметим самые интересные и те что можем рекомендовать купить.  


НовостиNews
| 19.02
BYD показала сверхбыструю зарядку для электрокаров: 400 км за 5 минут   
electric car vehicle charger

BYD еще на шаг приблизилась к своей цели – сделать зарядку электромобилей сопоставимой по скорости с заправкой автомобилей с двигателем внутреннего сгорания

| 16.52
Лучшие игры 2025 года по версии Steam   
Steam

В течение 2025 года в Steam вышло почти 20 тысяч новых игр — на момент подготовки материала их число достигло 19 705.