Google запускает Gemma 4 для серверов и Gemini Nano 4 для мобильных устройств

Google продолжает расширять возможности своих больших языковых моделей. После успеха Gemini 3 Pro компания представила новую серию Gemma 4, которая открывает доступ к высокопроизводительным LLM как для серверных систем, так и для мобильных устройств.

Разные версии под разные задачи

Gemma 4 выпускается в четырех вариантах:

  • для легких устройств — 2B и 4B “Effective”;
  • для мощных серверов — 26B “Mixture of Experts” и 31B “Dense”.

Количество параметров определяет способность модели обрабатывать сложные запросы: чем их больше, тем выше интеллектуальная производительность, но тем больше требований к железу.

Тесты Arena AI показали, что 31B Dense и 26B MoE занимают высокие позиции, опережая модели в 20 раз больше по размеру. Все версии поддерживают работу с изображениями и видео, младшие модели способны анализировать аудио и распознавать речь.

Офлайн-кодинг и лицензия Apache 2.0

Модели Gemma 4 могут генерировать код без подключения к интернету и обучены более чем на 140 языках. Выпуск под лицензией Apache 2.0 предоставляет разработчикам свободу адаптации и безопасного развертывания, без ограничений, которые были у предыдущих версий Gemma.

Модели Effective оптимизированы для смартфонов, Raspberry Pi и Jetson Nano, потребляют меньше ресурсов и демонстрируют минимальные задержки. Серверные варианты рассчитаны на запуск на GPU NVIDIA H100 с 80 ГБ видеопамяти.

Быстродействие и масштабируемость

26B MoE использует лишь часть параметров при генерации, что ускоряет обработку данных, тогда как 31B Dense ориентирована на высокое качество результатов и может дообучаться под конкретные задачи.

Gemma 4 поддерживает работу с агентами, вызов функций, структурированный JSON-вывод и контекстные окна до 256 тыс. токенов для крупных моделей, а облачные версии Gemini — до 1 млн токенов.

Gemini Nano 4 для смартфонов

Google представила Gemini Nano 4 для мобильных устройств. Версия Nano 4 Fast на базе Gemma 4 E2B оптимизирована для высокой скорости и низкой задержки, а Nano 4 Full на Gemma 4 E4B рассчитана на задачи с приоритетом качества.

Nano 4 работает до четырех раз быстрее предыдущих моделей и снижает расход батареи до 60%. Код, созданный для Gemma 4, полностью совместим с Nano 4.

В ближайшее время Google добавит поддержку инструментов, структурированного вывода, системных подсказок и режима “thinking” в Prompt API для разработчиков.


Не пропустите интересное!

Підписывайтесь на наши каналы и читайте анонсы хай-тек новостей, тестов и обзоров в удобном формате!

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *





Статьи & тестыArticles

Обзор смартфона Oppo A6 Pro: амбициозный Oppo A6 Pro (CPH2799)

Новый смартфон Oppo A6 Pro — телефон среднего уровня с функциональностью смартфонов премиум-класса. Производитель наделил его множеством характеристик, присущих более дорогим телефонам. Но не обошлось и без компромиссов. Как именно сбалансирован Oppo A6 Pro – расскажем в обзоре.


One UI 8.5: новая жизнь старых смартфонов Samsung — что даёт обновление?

One UI 8.5 приносит старым Samsung Galaxy функции, которые ещё недавно были эксклюзивом новых флагманов. Но действительно ли обновление способно сделать Galaxy S22, S23 и S24 ближе к уровню Galaxy S26? Разбираемся, что меняется после установки прошивки.


НовостиNews
| 13.08
Redmi впервые выпустит полноразмерные наушники: ставка на звук и комфорт

Бренд Redmi готовит к выпуску свои первые полноразмерные беспроводные наушники с активным шумоподавлением

| 11.02
Samsung Galaxy Watch Ultra 2: новые подробности дизайна

В сеть попали новые официальные рендеры будущих умных часов Samsung Galaxy Watch Ultra 2. Устройство сохраняет преемственность дизайна, но при этом обещает значительное увеличение автономности.