OpenAI разработала ИИ-помощника для управления компьютером и автоматизации браузера
30.01.25
OpenAI представила нового ИИ-агента Operator, разработанного для автоматизации действий в браузере. Этот инструмент может взаимодействовать с элементами интерфейса, такими как кнопки, текстовые поля и прокрутка, имитируя действия пользователя.
Основой работы Operator стала модель Computer-Using Agent (CUA), которая объединяет возможности GPT-4 для распознавания изображений с усовершенствованным механизмом анализа и принятия решений. Алгоритм работает поэтапно: сначала создается скриншот экрана, затем система анализирует его, определяет необходимые действия и симулирует их с помощью виртуальных мыши и клавиатуры. Пользователи могут наблюдать за процессом через небольшое окно в браузере.
На данный момент Operator показывает лучшие результаты в выполнении рутинных и повторяемых задач, таких как составление списков покупок или плейлистов. Однако агент сталкивается с трудностями при работе с незнакомыми интерфейсами, например, в таблицах, календарях или при редактировании сложных текстов.
Хотя технология находится на начальной стадии развития, она обещает стать мощным инструментом для автоматизации рутинных процессов и работы с браузером.
Не пропустите интересное!
Підписывайтесь на наши каналы и читайте анонсы хай-тек новостей, тестов и обзоров в удобном формате!

Samsung Galaxy A36 и Galaxy A56 — доступные флагманские технологии



У Samsung Galaxy A36 и Galaxy A56 одинаково хорошие дисплеи, емкие аккумуляторы, есть поддержка обновлений софта в течение 6 лет. Расскажем подробнее чем еще они интересны

США подняла пошлины на солнечные батареи из Азии до 3521% США
США усиливают тарифное давление на страны Юго-Восточной Азии, занимающие ключевое место в цепочке поставок солнечных панелей
Приложение Резерв+ предупредит о статусе «в розыске» война приложения события в Украине
Кроме того, у «Резерв+» появились новые категории запросов на исправление данных. Это позволяет избежать очередей в ТЦК