Google анонсировала ИИ Veo для создания видео и PaliGemma 2 для обработки изображений и текста
10.12.24Google представила новую модель генеративного искусственного интеллекта Veo, предназначенную для создания видеоконтента. Этот инструмент, доступный через платформу Vertex AI, позволяет пользователям генерировать видеоролики продолжительностью более одной минуты и разрешением 1080p.
Для работы с Veo не требуются специальные навыки — достаточно задать текстовый запрос или загрузить изображение. Искусственный интеллект преобразует введенные данные в видеоряд, учитывая выбранный пользователем визуальный стиль и кинематографические эффекты.
Полученные ролики можно редактировать, корректировать отдельные элементы и добавлять персонализированные детали, такие как логотипы. Veo ориентирован на креативных профессионалов, маркетологов и контент-мейкеров, помогая быстро создавать визуально привлекательные материалы.
Google представила новую версию своей модели PaliGemma 2, которая стала развитием предыдущей версии и предназначена для работы с текстом и изображениями. Анонс был сделан после демонстрации возможностей Gemma 2 на конференции I/O 2024.
Модель PaliGemma 2 расширяет возможности своей предшественницы, которая была ориентирована на добавление подписей к изображениям и видео, распознавание текста, анализ объектов и ответы на визуальные запросы. Новая версия получила функцию «длинных подписей», которая позволяет генерировать более детализированные описания визуального контента, включая действия, эмоции и общий контекст сцены.
Улучшенные функции:
- Генерация длинных описаний: учёт сложных деталей и атмосферы сцены.
- Анализ сложных структур: улучшенное распознавание таблиц, химических формул и музыкальных партитур.
- Пространственное мышление: более точный анализ рентгеновских снимков и других медицинских данных.
PaliGemma 2 доступна в нескольких вариантах с различным числом параметров (3B, 10B, 28B), что позволяет адаптировать её под разные задачи и объёмы данных. Производительность значительно улучшена, и новая модель совместима с предыдущей, что упрощает её интеграцию.
Для удобства пользователей модели и код PaliGemma 2 уже размещены на таких платформах, как Kaggle, Hugging Face и Ollama, что делает её доступной для разработчиков и исследователей.
Не пропустите интересное!
Підписывайтесь на наши каналы и читайте анонсы хай-тек новостей, тестов и обзоров в удобном формате!
Обзор смартфона Oppo A40m (CPH2669): начало
Смартфон Oppo A40m приятно удивляет дизайном и набором некоторых компонентов, которые делают из него модель уверенного нижнего среднего класса. Разберемся в деталях
HMD OffGrid — карманный модем для спутниковой связи HMD мобильная связь
Компания Human Mobile Devices (HMD) представила новое устройство HMD OffGrid, которое обеспечивает спутниковую связь для смартфонов в местах, где отсутствуют мобильные сети
Платформа Phison E28 для NVMe-накопителей PCIe 5.0 обеспечивает скорость до 14,5 ГБ/с CES SSD накопитель
На выставке CES 2025 компания Phison представила новый SSD-контроллер PS5028-E28, который стал самой быстрой платформой для NVMe-накопителей с интерфейсом PCI Express 5.0 x4