OpenAI розробила ШІ-помічника для керування комп’ютером та автоматизації браузера
30.01.25
OpenAI представила нового ІІ-агента Operator, розробленого для автоматизації дій у браузері. Цей інструмент може взаємодіяти з елементами інтерфейсу, такими як кнопки, текстові поля та прокручування, імітуючи дії користувача.
Основою роботи Operator стала модель Computer-Using Agent (CUA), яка поєднує можливості GPT-4 для розпізнавання зображень із удосконаленим механізмом аналізу та прийняття рішень. Алгоритм працює поетапно: спочатку створюється скріншот екрану, потім система аналізує його, визначає необхідні дії та симулює їх за допомогою віртуальних мишей та клавіатури. Користувачі можуть спостерігати процес через невелике вікно в браузері.
На даний момент Operator показує найкращі результати у виконанні рутинних та повторюваних завдань, таких як складання списків покупок або плейлистів. Однак агент стикається з труднощами при роботі з незнайомими інтерфейсами, наприклад, таблицях, календарях або при редагуванні складних текстів.
Хоча технологія знаходиться на початковій стадії розвитку, вона обіцяє стати потужним інструментом для автоматизації рутинних процесів та роботи з браузером.
Не пропустіть цікаве!
Підписуйтесь на наші канали та читайте анонси хай-тек новин, тестів та оглядів у зручному форматі!

Samsung Galaxy A36 та Galaxy A56 – доступні флагманські технології



У Samsung Galaxy A36 та Galaxy A56 однаково гарні дисплеї, великі акумулятори, є підтримка оновлень софту протягом 6 років. Розкажемо докладніше, чим ще вони цікаві.

1-дюймовий датчик камери OmniVision підтримує запис HDR-відео до 8K камера розробка смартфон
OmniVision представила новий CMOS-сенсор OV50X з роздільною здатністю 50 мегапікселів, розроблений спеціально для використання у флагманських моделях смартфонів
Xiaomi A27Ui – 27-дюймовий IPS-монітор з роздільною здатністю 4K та підтримкою HDR10 4К Xiaomi монiтор
Xiaomi представила новий монітор A27Ui, який поповнив серію A27, до якої вже входять моделі A27i та A27Qi.