Google анонсувала ШІ Veo для створення відео та PaliGemma 2 для обробки зображень та тексту

Google logo

Google представила нову модель генеративного штучного інтелекту Veo, призначену для створення відеоконтенту. Цей інструмент, доступний через платформу Vertex AI, дозволяє користувачам генерувати відео тривалістю більше однієї хвилини і роздільною здатністю 1080p.

 

Для роботи з Veo не потрібні спеціальні навички – достатньо задати текстовий запит або завантажити зображення. Штучний інтелект перетворює введені дані у відеоряд, враховуючи вибраний користувачем візуальний стиль та кінематографічні ефекти.

 

Отримані ролики можна редагувати, коригувати окремі елементи та додавати персоналізовані деталі, такі як логотипи. Veo орієнтований на креативних професіоналів, маркетологів та контент-мейкерів, допомагаючи швидко створювати візуально привабливі матеріали.
Google Gemma

 

Google представила нову версію моделі PaliGemma 2, яка стала розвитком попередньої версії і призначена для роботи з текстом і зображеннями. Анонс було зроблено після демонстрації можливостей Gemma 2 на конференції I/O 2024 року.

 

Модель PaliGemma 2 розширює можливості своєї попередниці, яка була орієнтована на додавання підписів до зображень та відео, розпізнавання тексту, аналіз об’єктів та відповіді на візуальні запити. Нова версія отримала функцію “довгих підписів”, яка дозволяє генерувати більш детальні описи візуального контенту, включаючи дії, емоції та загальний контекст сцени.

 

Покращені функції:

  • Генерація довгих описів: облік складних деталей та атмосфери сцени.
  • Аналіз складних структур: покращене розпізнавання таблиць, хімічних формул та музичних партитур.
  • Просторове мислення: точніший аналіз рентгенівських знімків та інших медичних даних.

 

PaliGemma 2 доступна в кількох варіантах з різним числом параметрів (3B, 10B, 28B), що дозволяє адаптувати її під різні завдання та обсяги даних. Продуктивність значно покращена, і нова модель сумісна з попередньою, що спрощує її інтеграцію.

 

Для зручності користувачів моделі та код PaliGemma 2 вже розміщені на таких платформах, як Kaggle, Hugging Face та Ollama, що робить її доступною для розробників та дослідників.


Не пропустіть цікаве!

Підписуйтесь на наші канали та читайте анонси хай-тек новин, тестів та оглядів у зручному форматі!

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *





Статті & тестиArticles

Огляд смартфона Oppo A6 Pro: амбітний Oppo A6 Pro (CPH2799)

Новий смартфон Oppo A6 Pro – середнячок з функціональністю смартфонів преміум-класу. Виробник наділив його кількома характеристиками, властивими більш дорожчим телефонам. Але не обійшлось і без компромісів. Як саме збалансований Oppo A6 Pro – розповімо в огляді.


Огляд смартфона Poco M8 Pro: можна дозволити більше Poco M8 Pro 5G

Poco M8 Pro 5G відразу впадає у вічі своїм розміром і прагненням виробника запропонувати більше, ніж зазвичай очікуєш від пристрою цієї цінової категорії. Він не зовсім черговий «середнячок»


НовостиNews
| 22.28
Ноутбук Dell у світі дедлайнів: чому автономність важлива  
Dell Latitude 7455

Dell у корпоративному та професійному сегменті – один із найпопулярніших брендів. Latitude, XPS, Precision, Inspiron у робочих конфігураціях – ці моделі масово використовуються в аутсорсі, продукті, стартапах і великих компаніях.

| 17.10
Усі дрони в Україні потрібно буде реєструвати   
Съемка колеса обозрения в парке развлечений Припять дроном DJI Mavic Air

Верховна Рада підтримала законопроект №13600, який деанонімізує використання дронів у цивільному повітряному просторі через обов’язкову реєстрацію, облік у поліції та ідентифікацію операторів