ChatGPT Agent сможет управлять компьютером

artificial robot human ai

 

Компания OpenAI сделала очередной шаг в развитии автономных ИИ-агентов, способных действовать практически как виртуальные ассистенты. Новый инструмент под названием ChatGPT Agent умеет выполнять задачи от имени пользователя, используя собственный «виртуальный компьютер».

 

Что умеет ChatGPT Agent

 

Агент работает на базе специально обученной модели, которая способна:

  • искать информацию на сайтах и фильтровать результаты;
  • запускать код и анализировать данные;
  • создавать таблицы, презентации и отчёты;
  • управлять календарём и планировать встречи;
  • бронировать рестораны, делать покупки и выполнять рутинные задачи.

 

Вся работа агента происходит с использованием встроенного виртуального компьютера — он может загружать и обрабатывать файлы, выполнять команды в терминале, просматривать результаты в визуальном браузере.

 

Технология и обучение

 

Модель ChatGPT Agent обучалась на сложных задачах, требующих одновременного использования множества инструментов: текстового и визуального браузеров, терминала, а также поддержки импорта пользовательских данных. Для обучения применялась методика обучения с подкреплением, похожая на ту, что используется для моделей с логическим мышлением.

 

ChatGPT Agent объединяет возможности двух предыдущих продуктов OpenAI — Operator и Deep Research. За проектом стоит команда из 20-35 человек, работающих как над исследовательской, так и над продуктовой частью.

 

Примеры применения

 

Во время демонстрации агент планировал свидание, самостоятельно проверяя свободное время в Google Calendar, подбирая ресторан через OpenTable и бронируя столик. Пользователь мог корректировать предпочтения в процессе. Другой пример — подготовка детального отчёта о популярности игрушек Labubus по сравнению с Beanie Babies.

 

Также агент подходит для онлайн-шопинга и регулярных мелких задач, например, подачи заявки на парковочное место по расписанию.

 

Особенности и безопасность

 

ChatGPT Agent не только имеет доступ к браузеру, но и работает на полноценном виртуальном компьютере, что значительно расширяет его возможности. При этом агент не слишком быстр — на выполнение сложных задач может уходить 15-30 минут, но это всё равно экономит время пользователя.

 

Для предотвращения нежелательных действий агент всегда запрашивает разрешение перед отправкой электронных писем или бронированием. При посещении финансовых сайтов включается режим наблюдения: агент действует только в текущей вкладке и останавливается при переключении пользователя.

 

Доступность

 

OpenAI начинает постепенное развертывание ChatGPT Agent для пользователей тарифов Pro, Plus и Team. Инструмент доступен в меню инструментов или вызывается командой /agent. Летом агент появится и для корпоративных и образовательных подписок. В странах Европейской экономической зоны и Швейцарии дата запуска пока не определена.


Не пропустите интересное!

Підписывайтесь на наши каналы и читайте анонсы хай-тек новостей, тестов и обзоров в удобном формате!

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *





Статьи & тестыArticles

Обзор смартфона Oppo A6 Pro: амбициозный Oppo A6 Pro (CPH2799)

Новый смартфон Oppo A6 Pro — телефон среднего уровня с функциональностью смартфонов премиум-класса. Производитель наделил его множеством характеристик, присущих более дорогим телефонам. Но не обошлось и без компромиссов. Как именно сбалансирован Oppo A6 Pro – расскажем в обзоре.


Лучшие Bluetooth колонки. Подборка моделей в разных ценовых сегментах Sony SRS-XP500

Портативная колонка давно перестала быть просто аксессуаром для смартфона или ноутбука. Она стала инструментом для создания атмосферы – от камерной встречи до масштабной вечеринки.


НовостиNews
| 18.53
Netflix покупает Warner Bros за $82,7 миллиарда   
Netflix

Кроме самой Warner Bros. Netflix получит контроль над телевизионными и киностудиями, а также сервисами HBO и HBO Max

| 16.20
Microsoft сменит дизайн меню Выполнить впервые за 30 лет   
Windows 11 lifestyle

В тестовых сборниках Windows 11 заметили обновленное диалоговое окно Run («Выполнить») — один из старейших системных элементов, впервые со времен Windows 95 получил современный вид