Новый ИИ OpenAI GPT-5.2 превзошел людей-экспертов в 70% задач: конец человечества близок?

ChatGPT Plus

 

OpenAI объявила о запуске линейки GPT-5.2, отметив ее как наиболее заметное обновление в направлении универсального ИИ. Новое поколение моделей улучшило работу с кодом, расширило объем контекста и усилило агентные функции. Модели представлены в версиях Instant, Thinking и Pro, и уже начинают появляться у пользователей ChatGPT Plus, Enterprise, Business, а также в API.

 

Главным акцентом релиза стали результаты в GDPval — бенчмарке, который оценивает умение выполнять четко описанные рабочие задачи в нескольких десятках специальностей. По данным OpenAI, модель GPT-5.2 Thinking впервые продемонстрировала показатели, сопоставимые с уровнем экспертов: в слепых испытаниях она превзошла или повторила результаты профессионалов в более чем 70% заданий. Тестовые кейсы включали подготовку сложных таблиц, создание презентаций и работу с техдокументацией. При этом модель выполняла задачи существенно быстрее человека и с минимальными затратами.

 

Бенчмарки ИИ

 

Для разработчиков важным показателем стала оценка в SWE-Bench Pro, где GPT-5.2 Thinking достигла результата 55,6%, работая с реальными задачами программной инженерии и многоязычными кодовыми базами.

 

Модель также получила улучшенные визуальные возможности. В OpenAI отмечают, что количество ошибок при интерпретации графиков, схем и интерфейсных макетов сократилось почти вдвое. Заявлено и снижение числа галлюцинаций примерно на треть по сравнению с предыдущей версией. Внутренние тесты по MRCRv2 показали почти стопроцентную точность при анализе документов в объеме до 256 тысяч токенов, что ориентировано на отрасли, работающие с большими массивами информации.

 

Известно, что такие компании, как Notion, Zoom, Shopify и Databricks, уже внедрили новую модель и сообщают о значительном росте эффективности в агентных сценариях, где ИИ самостоятельно использует инструменты для выполнения сложных задач.

 

Несмотря на запуск обновления, OpenAI пока не отключает модели GPT-5.1 – они останутся доступными еще около трех месяцев.


Не пропустите интересное!

Підписывайтесь на наши каналы и читайте анонсы хай-тек новостей, тестов и обзоров в удобном формате!

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *





Статьи & тестыArticles

Обзор смартфона Oppo A6 Pro: амбициозный Oppo A6 Pro (CPH2799)

Новый смартфон Oppo A6 Pro — телефон среднего уровня с функциональностью смартфонов премиум-класса. Производитель наделил его множеством характеристик, присущих более дорогим телефонам. Но не обошлось и без компромиссов. Как именно сбалансирован Oppo A6 Pro – расскажем в обзоре.


Игровой руль Logitech G29 с педалями и коробкой: спорткар на столе Logitech G29 Driving Force Racing Wheel

Расскажем про игровой руль Logitech G29 для ПК и PlayStation, а также дополнение в виде 6-ступенчатой коробки скоростей Driving Force Shifter.


НовостиNews
| 08.17
Новый ИИ OpenAI GPT-5.2 превзошел людей-экспертов в 70% задач: конец человечества близок?
ChatGPT Plus

OpenAI объявила о запуске линейки GPT-5.2, отметив ее как наиболее заметное обновление в направлении универсального ИИ

| 19.05
Культовая мышка Razer Boomslang получила новый дизайн и функции  
Razer Boomslang 2025

Razer отметила свое 20-летие переизданием Boomslang – модели, которая в 1999 году стала первой специализированной игровой мышью и фактически наметила старт эпохи киберспорта