Дослідження: ШІ стає невідмінним від людини

23.05.26

Тест Тьюринга довго залишався швидше теоретичним кордоном між людиною та машиною. Але нове дослідження вчених Каліфорнійського університету в Сан-Дієго показує, що сучасні мовні моделі вже перейшли в зону, де люди регулярно помиляються, намагаючись зрозуміти, хто перед ними – людина чи ШІ.

Головним учасником експерименту стала модель GPT-4.5. У серії текстових діалогів вона зуміла переконати учасників у своїй “людяності” у 73% випадків. По суті це означає, що чат-бот частіше сприймався як реальна людина, ніж справжні співрозмовники в тих же умовах.

Як проводився експеримент

Дослідники використали ускладнену версію класичного тесту Тьюринга. Учасникам одночасно показували два діалоги — з людиною та ШІ — не розкриваючи, хто є хто. Після короткого спілкування вони мали визначити, де реальна людина.

На відміну від ранніх поколінь чат-ботів, сучасні моделі не видають себе шаблонними відповідями. Вони підлаштовують мовний стиль, використовують інтернет-сленг, імітують емоції, додають гумор, паузи і навіть легку невпевненість — все те, що люди підсвідомо зчитують як “живе” спілкування.

Найкращий результат показала GPT-4.5 у режимі persona prompt – коли моделі задається певний характер. У цьому випадку вона імітувала молодого інтровертного користувача, знайомого з інтернет-культурою та сучасним стилем листування. Саме така подача виявилася найбільш переконливою.

Для порівняння, LLaMa-3.1-405B отримала 56% “людських” оцінок, GPT-4o – 21%, а класична ELIZA 1960-х років – 23%. Без спеціального настроювання поведінки GPT-4.5 показувала помітно скромніший результат — 36%.

Чому люди вважають ШІ за людину

Цікавий висновок дослідження у тому, що учасники оцінювали не інтелект співрозмовника, а стиль спілкування. На рішення впливали:

манера формулювати думки;
емоційність;
відчуття гумору;
природність діалогу;
соціальні сигнали та “людські” помилки.

Саме ці фактори виявилися важливішими за зміст відповідей. І сучасні моделі навчилися відтворювати їх особливо добре.

Важливо й те, що експеримент проводився виключно у текстовому форматі – без голосу, відео чи візуальних підказок. Це посилило значення саме мовної поведінки, де ШІ вже майже поступається людині.

Це не розум, а вже ризик

Автори підкреслюють: успішне проходження тесту Тьюринга означає наявність свідомості чи розуміння у моделі. GPT-4.5 не “думає” як людина – вона лише дуже точно відтворює людський стиль спілкування.

Проте практичні наслідки очевидні.

Якщо ШІ здатен переконливо імітувати людину в короткому діалозі, це може вплинути на безліч сфер:

служби підтримки;
соцмережі;
програми для знайомств;
освітні платформи;
політичні комунікації;
шахрайські схеми.

Проблема в тому, що люди часто формують довіру буквально за кілька повідомлень, і тепер цей процес може бути легко симітований алгоритмом.

Тест Тьюринга втрачає колишній сенс

Спочатку тест Тьюринга замислювався як перевірка здатності машини імітувати людське мислення. Сьогодні ситуація змінилася: питання все частіше звучить інакше — чи може людина відрізнити машину від іншої людини.

І якщо GPT-4.5 вже справляється з цим краще за людей, межа між “справжнім” та “штучним” у цифровому спілкуванні стає все менш помітною.

Не пропустіть цікаве!

Підписуйтесь на наші канали та читайте анонси хай-тек новин, тестів та оглядів у зручному форматі!

Ми у Facebook Ми у Instagram Ми у Telegram

Залишити відповідь Скасувати коментар

Статті & тести

03.11.25
Огляд смартфона Oppo A6 Pro: амбітний

315

Новий смартфон Oppo A6 Pro – середнячок з функціональністю смартфонів преміум-класу. Виробник наділив його кількома характеристиками, властивими більш дорожчим телефонам. Але не обійшлось і без компромісів. Як саме збалансований Oppo A6 Pro – розповімо в огляді.

06.07.26
Огляд навушників Sony WF-1000XM6: на всю потужність

Нові навушники Sony WF-1000XM6 дещо змінили форму в порівнянні з попередником, отримали новий процесор, покращену систему шумопоглинання, більше мікрофонів і загалом технічно здійснили помітний крок вперед

06.07.26 | 05.06
Огляд навушників Sony WF-1000XM6: на всю потужність

01.07.26 | 05.19
Огляд набору бездротових клавіатури та миші Logitech MX Keys S Combo

19.05.26 | 06.06
One UI 8.5: нове життя старих смартфонів Samsung — що дає оновлення?

11.05.26 | 05.00
Огляд клавіатури Logitech G512 X 75: максимізована витонченість

27.04.26 | 06.05
Infinix GT 50 Pro розпакування : ігровий монстр із рідинним охолодженням та тригерами

14.04.26 | 13.50
Samsung Galaxy A37 та A57— порівняння: за що переплачувати €100?

16.03.26 | 05.00
Тест ноутбука Acer Predator Helios 18 AI (PH18-73): рівень – бог

12.03.26 | 05.05
Огляд мишки Logitech G PRO X2 Superstrike Lightspeed: індивідуальне рішення

09.03.26 | 06.06
Захист сайту від фаззингу: Вас ламають, поки ви спите

02.03.26 | 05.23
Огляд ноутбука Acer Nitro Lite 16 (NL16-71G): універсальний та симпатичний

23.02.26 | 05.48
Огляд смартфона Oppo Reno 15 5G: впевнений

22.02.26 | 17.41
Як обрати IT курси у 2026 році: повний гайд для новачків

16.02.26 | 05.45
Огляд навушників Logitech G G325: надійно та надовго

02.02.26 | 05.04
Огляд смартфона Poco M8 Pro: можна дозволити більше

26.01.26 | 05.05
Джерела автономного живлення для дому: інвертори, акумулятори, сонячні панелі

Новини

19.07.26 | 18.05
Bonsai 27B: нова ШІ-модель працює прямо на iPhone 17 Pro Max без хмари

Стартап PrismML представив компактну мультимодальну модель Bonsai 27B, оптимізовану для запуску просто на смартфонах iPhone.

19.07.26 | 14.06
Кінець епохи: Valve згортає підтримку запчастин для оригінального Steam Deck

Valve фактично припиняє підтримку самостійного ремонту першої версії Steam Deck із LCD-екраном.

19.07.26 | 18.05
Bonsai 27B: нова ШІ-модель працює прямо на iPhone 17 Pro Max без хмари

19.07.26 | 14.06
Кінець епохи: Valve згортає підтримку запчастин для оригінального Steam Deck

19.07.26 | 10.24
Apple підвищує ціни на підписки Apple Music та Apple One: що змінилося

19.07.26 | 09.09
Samsung усунула плутанину навколо даних Samsung Health

19.07.26 | 07.36
Червоний екран на Galaxy S26 Ultra: що потрібно знати про інноваційний дефект Privacy Display

19.07.26 | 06.21
Google Pixel 11a — попередні характеристикі: потужний процесор, яскравий дисплей та багато іншого

18.07.26 | 18.01
Sony оновила каталог PlayStation Plus: нові ігри вже наступного тижня

18.07.26 | 14.07
ZTE G5 Max допоможе отримати стабільний 5G навіть за слабкого сигналу

18.07.26 | 12.49
Дитячий велік без мотора та педалей від Tesla

18.07.26 | 11.59
Смартфони Samsung отримають більше сміттєвих додатків, які неможливо видалити

18.07.26 | 10.03
Mangmi розкрила “залізо” ігрових консолей Air Y: знайомі процесори Snapdragon

18.07.26 | 09.03
FromSoftware анонсує мережевий тест The Duskbloods: ексклюзив для Nintendo Switch 2

18.07.26 | 08.20
Epic Games Store анонсував нову безкоштовну гру наступного тижня

18.07.26 | 06.52
Motorola Moto Pad 70 Groove: планшет з аудіосистемою JBL 7.2

17.07.26 | 21.55
Oppo K15: смартфон з акумулятором 8000 мАч та активним охолодженням виходить наступного тижня