OpenAI разработала ИИ-помощника для управления компьютером и автоматизации браузера
30.01.25
OpenAI представила нового ИИ-агента Operator, разработанного для автоматизации действий в браузере. Этот инструмент может взаимодействовать с элементами интерфейса, такими как кнопки, текстовые поля и прокрутка, имитируя действия пользователя.
Основой работы Operator стала модель Computer-Using Agent (CUA), которая объединяет возможности GPT-4 для распознавания изображений с усовершенствованным механизмом анализа и принятия решений. Алгоритм работает поэтапно: сначала создается скриншот экрана, затем система анализирует его, определяет необходимые действия и симулирует их с помощью виртуальных мыши и клавиатуры. Пользователи могут наблюдать за процессом через небольшое окно в браузере.
На данный момент Operator показывает лучшие результаты в выполнении рутинных и повторяемых задач, таких как составление списков покупок или плейлистов. Однако агент сталкивается с трудностями при работе с незнакомыми интерфейсами, например, в таблицах, календарях или при редактировании сложных текстов.
Хотя технология находится на начальной стадии развития, она обещает стать мощным инструментом для автоматизации рутинных процессов и работы с браузером.
Не пропустите интересное!
Підписывайтесь на наши каналы и читайте анонсы хай-тек новостей, тестов и обзоров в удобном формате!
Обзор смартфона Oppo A6 Pro: амбициозный
Новый смартфон Oppo A6 Pro — телефон среднего уровня с функциональностью смартфонов премиум-класса. Производитель наделил его множеством характеристик, присущих более дорогим телефонам. Но не обошлось и без компромиссов. Как именно сбалансирован Oppo A6 Pro – расскажем в обзоре.
Игровой руль Logitech G29: спорткар на столе
Расскажем про игровой руль Logitech G29 для ПК и PlayStation, а также дополнение в виде 6-ступенчатого переключателя передач Driving Force Shifter.
Исследование: люди начали копировать фразы чат ботов с ИИ искусственный интеллект исследования
После появления ChatGPT авторы видеороликов на YouTube стали заметно чаще употреблять слова, характерные для языка крупных языковых моделей
Операционной системе Windows исполнилось 40 лет Windows история
История Windows началась в конце семидесятых, когда Microsoft решила создать графическую оболочку для своего DOS


