Дослідження: ШІ стає невідмінним від людини

Тест Тьюринга довго залишався швидше теоретичним кордоном між людиною та машиною. Але нове дослідження вчених Каліфорнійського університету в Сан-Дієго показує, що сучасні мовні моделі вже перейшли в зону, де люди регулярно помиляються, намагаючись зрозуміти, хто перед ними – людина чи ШІ.

Головним учасником експерименту стала модель GPT-4.5. У серії текстових діалогів вона зуміла переконати учасників у своїй “людяності” у 73% випадків. По суті це означає, що чат-бот частіше сприймався як реальна людина, ніж справжні співрозмовники в тих же умовах.

Як проводився експеримент

Дослідники використали ускладнену версію класичного тесту Тьюринга. Учасникам одночасно показували два діалоги — з людиною та ШІ — не розкриваючи, хто є хто. Після короткого спілкування вони мали визначити, де реальна людина.

На відміну від ранніх поколінь чат-ботів, сучасні моделі не видають себе шаблонними відповідями. Вони підлаштовують мовний стиль, використовують інтернет-сленг, імітують емоції, додають гумор, паузи і навіть легку невпевненість — все те, що люди підсвідомо зчитують як “живе” спілкування.

Найкращий результат показала GPT-4.5 у режимі persona prompt – коли моделі задається певний характер. У цьому випадку вона імітувала молодого інтровертного користувача, знайомого з інтернет-культурою та сучасним стилем листування. Саме така подача виявилася найбільш переконливою.

Для порівняння, LLaMa-3.1-405B отримала 56% “людських” оцінок, GPT-4o – 21%, а класична ELIZA 1960-х років – 23%. Без спеціального настроювання поведінки GPT-4.5 показувала помітно скромніший результат — 36%.

Чому люди вважають ШІ за людину

Цікавий висновок дослідження у тому, що учасники оцінювали не інтелект співрозмовника, а стиль спілкування. На рішення впливали:

  • манера формулювати думки;
  • емоційність;
  • відчуття гумору;
  • природність діалогу;
  • соціальні сигнали та “людські” помилки.

Саме ці фактори виявилися важливішими за зміст відповідей. І сучасні моделі навчилися відтворювати їх особливо добре.

Важливо й те, що експеримент проводився виключно у текстовому форматі – без голосу, відео чи візуальних підказок. Це посилило значення саме мовної поведінки, де ШІ вже майже поступається людині.

Це не розум, а вже ризик

Автори підкреслюють: успішне проходження тесту Тьюринга означає наявність свідомості чи розуміння у моделі. GPT-4.5 не “думає” як людина – вона лише дуже точно відтворює людський стиль спілкування.

Проте практичні наслідки очевидні.

Якщо ШІ здатен переконливо імітувати людину в короткому діалозі, це може вплинути на безліч сфер:

  • служби підтримки;
  • соцмережі;
  • програми для знайомств;
  • освітні платформи;
  • політичні комунікації;
  • шахрайські схеми.

Проблема в тому, що люди часто формують довіру буквально за кілька повідомлень, і тепер цей процес може бути легко симітований алгоритмом.

Тест Тьюринга втрачає колишній сенс

Спочатку тест Тьюринга замислювався як перевірка здатності машини імітувати людське мислення. Сьогодні ситуація змінилася: питання все частіше звучить інакше — чи може людина відрізнити машину від іншої людини.

І якщо GPT-4.5 вже справляється з цим краще за людей, межа між “справжнім” та “штучним” у цифровому спілкуванні стає все менш помітною.


Не пропустіть цікаве!

Підписуйтесь на наші канали та читайте анонси хай-тек новин, тестів та оглядів у зручному форматі!

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *





Статті & тестиArticles

Огляд смартфона Oppo A6 Pro: амбітний Oppo A6 Pro (CPH2799)

Новий смартфон Oppo A6 Pro – середнячок з функціональністю смартфонів преміум-класу. Виробник наділив його кількома характеристиками, властивими більш дорожчим телефонам. Але не обійшлось і без компромісів. Як саме збалансований Oppo A6 Pro – розповімо в огляді.


One UI 8.5: нове життя старих смартфонів Samsung — що дає оновлення?

One UI 8.5 дає старим смартфонам Samsung Galaxy функції, які ще зовсім недавно були ексклюзивом тільки для нових флагманів. Але чи справді це оновлення здатне зробити Galaxy S22, S23 і S24 ближчими до рівня Galaxy S26? Розбираємося, що саме змінюється після встановлення нової прошивки.


НовиниNews
| 19.04
Xiaomi YU7 GT показала неможливе: машина без водія на легендарній трасі

Безпілотна версія кросовера Xiaomi YU7 GT поставила історичний рекорд автопілотування, здолавши Нюрбургрінг за 10 хвилин і 29 секунд без допомоги людини.

| 17.06
Phosgo Go 5 Ultra: Електробайк на сонячних батареях

Phosgo Go 5 Ultra став одним із найнезвичайніших електробайків року завдяки сонячним панелям в ободах коліс та запасу ходу до 193 км.