OpenAI розробила ШІ-помічника для керування комп’ютером та автоматизації браузера
30.01.25
OpenAI представила нового ІІ-агента Operator, розробленого для автоматизації дій у браузері. Цей інструмент може взаємодіяти з елементами інтерфейсу, такими як кнопки, текстові поля та прокручування, імітуючи дії користувача.
Основою роботи Operator стала модель Computer-Using Agent (CUA), яка поєднує можливості GPT-4 для розпізнавання зображень із удосконаленим механізмом аналізу та прийняття рішень. Алгоритм працює поетапно: спочатку створюється скріншот екрану, потім система аналізує його, визначає необхідні дії та симулює їх за допомогою віртуальних мишей та клавіатури. Користувачі можуть спостерігати процес через невелике вікно в браузері.
На даний момент Operator показує найкращі результати у виконанні рутинних та повторюваних завдань, таких як складання списків покупок або плейлистів. Однак агент стикається з труднощами при роботі з незнайомими інтерфейсами, наприклад, таблицях, календарях або при редагуванні складних текстів.
Хоча технологія знаходиться на початковій стадії розвитку, вона обіцяє стати потужним інструментом для автоматизації рутинних процесів та роботи з браузером.
Не пропустіть цікаве!
Підписуйтесь на наші канали та читайте анонси хай-тек новин, тестів та оглядів у зручному форматі!

Samsung Galaxy A36 та Galaxy A56 – доступні флагманські технології



У Samsung Galaxy A36 та Galaxy A56 однаково гарні дисплеї, великі акумулятори, є підтримка оновлень софту протягом 6 років. Розкажемо докладніше, чим ще вони цікаві.

Intel скоротить ще понад 20 тисяч співробітників Intel бізнес
Intel, за даними Bloomberg, готує масштабне скорочення штату – понад 20% персоналу, що може торкнутися понад 20 тисяч співробітників.
США підняли мита на сонячні батареї з Азії до 3521% США
США посилюють тарифний тиск на країни Південно-Східної Азії, які займають ключове місце в ланцюжку постачання сонячних панелей