Новый ИИ OpenAI GPT-5.2 превзошел людей-экспертов в 70% задач: конец человечества близок?

13.12.25

OpenAI объявила о запуске линейки GPT-5.2, отметив ее как наиболее заметное обновление в направлении универсального ИИ. Новое поколение моделей улучшило работу с кодом, расширило объем контекста и усилило агентные функции. Модели представлены в версиях Instant, Thinking и Pro, и уже начинают появляться у пользователей ChatGPT Plus, Enterprise, Business, а также в API.

Главным акцентом релиза стали результаты в GDPval — бенчмарке, который оценивает умение выполнять четко описанные рабочие задачи в нескольких десятках специальностей. По данным OpenAI, модель GPT-5.2 Thinking впервые продемонстрировала показатели, сопоставимые с уровнем экспертов: в слепых испытаниях она превзошла или повторила результаты профессионалов в более чем 70% заданий. Тестовые кейсы включали подготовку сложных таблиц, создание презентаций и работу с техдокументацией. При этом модель выполняла задачи существенно быстрее человека и с минимальными затратами.

Бенчмарки ИИ

Для разработчиков важным показателем стала оценка в SWE-Bench Pro, где GPT-5.2 Thinking достигла результата 55,6%, работая с реальными задачами программной инженерии и многоязычными кодовыми базами.

Модель также получила улучшенные визуальные возможности. В OpenAI отмечают, что количество ошибок при интерпретации графиков, схем и интерфейсных макетов сократилось почти вдвое. Заявлено и снижение числа галлюцинаций примерно на треть по сравнению с предыдущей версией. Внутренние тесты по MRCRv2 показали почти стопроцентную точность при анализе документов в объеме до 256 тысяч токенов, что ориентировано на отрасли, работающие с большими массивами информации.

Известно, что такие компании, как Notion, Zoom, Shopify и Databricks, уже внедрили новую модель и сообщают о значительном росте эффективности в агентных сценариях, где ИИ самостоятельно использует инструменты для выполнения сложных задач.

Несмотря на запуск обновления, OpenAI пока не отключает модели GPT-5.1 – они останутся доступными еще около трех месяцев.

Не пропустите интересное!

Підписывайтесь на наши каналы и читайте анонсы хай-тек новостей, тестов и обзоров в удобном формате!

Мы в Facebook Мы в Instagram Мы в Telegram

Добавить комментарий Отменить ответ

Статьи & тесты

03.11.25
Обзор смартфона Oppo A6 Pro: амбициозный

914

Новый смартфон Oppo A6 Pro — телефон среднего уровня с функциональностью смартфонов премиум-класса. Производитель наделил его множеством характеристик, присущих более дорогим телефонам. Но не обошлось и без компромиссов. Как именно сбалансирован Oppo A6 Pro – расскажем в обзоре.

23.02.26
Обзор смартфона Oppo Reno 15 5G: уверенный

Смартфон Oppo Reno15 делает ставку на дизайн, качественный дисплей, универсальные камеры и хорошую автономность. Расскажем подробнее

23.02.26 | 05.48
Обзор смартфона Oppo Reno 15 5G: уверенный

17.02.26 | 22.00
Обзор наушников Logitech G G325: надежно и надолго

02.02.26 | 05.04
Обзор смартфона Poco M8 Pro: можно позволить больше

26.01.26 | 05.05
Источники автономного питания для дома: инверторы, аккумуляторы, солнечные панели

29.12.25 | 05.30
Топ новостей 2025 года сайта hi-tech.ua

16.12.25 | 06.25
Выбор редакции 2025. Лучшие устройства года по версии hi-tech.ua

10.12.25 | 05.45
Игровой руль Logitech G29 с педалями и коробкой: спорткар на столе

25.11.25 | 05.02
Лучшие Bluetooth колонки. Подборка моделей в разных ценовых сегментах

24.11.25 | 05.25
Лучшие OLED мониторы в диагоналях 27-49 дюймов

23.11.25 | 06.17
Зарядные станции для любых задач — от смартфона до крупной бытовой техники

22.11.25 | 05.38
Черная пятница – как покупать и экономить

21.11.25 | 05.04
Топ-5 мощных повербанков от 20000 до 50000 mAh для блекаутов и не только!

20.11.25 | 05.10
Не ошибись! Какой смарт-телевизор купить в этом году

19.11.25 | 05.44
Обзор Bluetooth наушников OPPO Enco X3s: цепкие

18.11.25 | 05.35
Вместо iPhone и Samsung. Флагманы Vivo, OnePlus, Oppo 2025 года

РќРѕРІРѕСЃС‚Рё

Ключевая особенность Xiaomi Tag – одновременная совместимость с двумя глобальными сетями поиска Apple Find My и Google Find My Device

26.02.26 | 11.26
Представлены смартфоны Samsung Galaxy S26: много искусственного интеллекта, не слишком много прорывов Samsung смартфон события в мире

Презентация Samsung Galaxy S26-серии прошла в Сан-Франциско 25 февраля 2026 года. Компания не изменила базовую стратегию, но подошла к обновлению достаточно серьезно с точки зрения интеграции ИИ

26.02.26 | 13.22
Xiaomi Tag — более доступный трекер, который совместим с Apple и Google

26.02.26 | 11.26
Представлены смартфоны Samsung Galaxy S26: много искусственного интеллекта, не слишком много прорывов

26.02.26 | 10.07
Toyota RAV4 2026: 329 л.с. и 150 км запаса хода на электримоторе

26.02.26 | 07.10
Blizzard выпустит мобильную Overwatch

25.02.26 | 17.16
В MIT на 3D принтере напечатали электродвигатель за 50 центов

25.02.26 | 14.07
monobank будет бесплатно проводить платежи по IBAN

25.02.26 | 10.20
В WhatsApp появится отправка запланированных сообщений

25.02.26 | 07.33
Microsoft добавила в Блокнот поддержку изображений

24.02.26 | 19.40
ASUS и Acer прекратили продажу ноутбуков и работу сайтов в Германии из-за выигрыша Nokia в суде

24.02.26 | 17.30
Google отключит приложение прогноза погоды

24.02.26 | 13.18
Windows 11 получит встроенный тест скорости интернет подключения, но есть нюанс

24.02.26 | 10.21
Браузер Google Chrome сможет открывать 2 вкладки в одном окне

24.02.26 | 07.16
Глава Xbox Фил Спенсер покидает Microsoft после почти 40 лет работы

23.02.26 | 19.20
Google Gemini теперь может генерировать музыку

23.02.26 | 16.20
Amazfit T-Rex Ultra 2 – защищенные часы с титановым корпусом и батареей 870 мАч