Новий ШІ OpenAI GPT-5.2 перевершив людей-експертів у 70% завдань: кінець людства близько?

ChatGPT Plus

 

OpenAI оголосила про запуск лінійки GPT-5.2, відзначивши її як найбільш помітне оновлення у напрямку універсального ШІ. Нове покоління моделей покращило роботу з кодом, розширило обсяг контексту та посилило агентні функції. Моделі представлені у версіях Instant, Thinking та Pro, і вже починають з’являтися у користувачів ChatGPT Plus, Enterprise, Business, а також API.

 

Головним акцентом релізу стали результати у GDPval — бенчмарку, який оцінює вміння виконувати чітко описані робочі завдання у кількох десятках спеціальностей. За даними OpenAI, модель GPT-5.2 Thinking вперше продемонструвала показники, які можна порівняти з рівнем експертів: у сліпих випробуваннях вона перевершила або повторила результати професіоналів у більш ніж 70% завдань. Тестові кейси включали підготовку складних таблиць, створення презентацій та роботу з техдокументацією. При цьому модель виконувала завдання істотно швидше за людину і з мінімальними витратами.

 

Бенчмарки ШІ

 

Для розробників важливим показником стала оцінка у SWE-Bench Pro, де GPT-5.2 Thinking досягла результату 55,6%, працюючи з реальними завданнями програмної інженерії та багатомовними кодовими базами.

 

Модель також отримала покращені візуальні можливості. В OpenAI зазначають, що кількість помилок при інтерпретації графіків, схем та інтерфейсних макетів скоротилася майже вдвічі. Заявлено та зниження кількості галюцинацій приблизно на третину порівняно з попередньою версією. Внутрішні тести з MRCRv2 показали майже стовідсоткову точність при аналізі документів обсягом до 256 тисяч токенів, що орієнтовано галузі, що працюють із великими масивами інформації.

 

Відомо, що такі компанії, як Notion, Zoom, Shopify та Databricks, вже впровадили нову модель та повідомляють про значне зростання ефективності в агентних сценаріях, де ШІ самостійно використовує інструменти для виконання складних завдань.

 

Незважаючи на запуск оновлення, OpenAI поки що не відключає моделі GPT-5.1 – вони залишаться доступними ще близько трьох місяців.


Не пропустіть цікаве!

Підписуйтесь на наші канали та читайте анонси хай-тек новин, тестів та оглядів у зручному форматі!

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *





Статті & тестиArticles

Огляд смартфона Oppo A6 Pro: амбітний Oppo A6 Pro (CPH2799)

Новий смартфон Oppo A6 Pro – середнячок з функціональністю смартфонів преміум-класу. Виробник наділив його кількома характеристиками, властивими більш дорожчим телефонам. Але не обійшлось і без компромісів. Як саме збалансований Oppo A6 Pro – розповімо в огляді.


Топ новин 2025 року сайту hi-tech.ua Top news 2025

Традиційно щороку наша редакція підбиває підсумки. Найкращі пристрої за версією редакції ми показали нещодавно. Тепер настав час розповісти про топу новин сайту hi-tech.ua у 2025 році.


НовостиNews
| 07.01
Активувати Windows через телефон онлайн більше не можна   
Windows 11 lifestyle

Телефонна активація більше не функціонує, незважаючи на те, що формально продовжує існувати в довідкових матеріалах Microsoft.

| 18.29
Samsung Galaxy S26 будуть коштувати як Galaxy S25. Компанія зафіксує ціну    
Samsung Galaxy S24 vs S25 Ultra

Samsung зіткнулася зі зростанням витрат і коливаннями валютних курсів, проте вважав за краще не переводити додаткові витрати на покупців