ШІ не може підробити токсичність – новий тест Тьюринга

15.11.25

angry robot

Дослідники з Цюріхського, Амстердамського, Дьюкського та Нью-Йоркського університетів встановили, що сучасні мовні моделі штучного інтелекту все ще можна легко відрізнити від людей — головним чином надмірно доброзичливим і «гладким» емоційним тоном.

Вчені протестували дев’ять популярних моделей з відкритим кодом – Llama 3.1 8B, Llama 3.1 8B Instruct, Llama 3.1 70B, Mistral 7B v0.1, Mistral 7B Instruct v0.2, Qwen 2.5 7B Instruct, Gemma 3 4B Instruct і Apertus-8B-2509 – на прикладах повідомлень із соцмереж X (Twitter), Bluesky та Reddit. Алгоритми-класифікатори, створені в рамках проекту, спромоглися розпізнати тексти, згенеровані ІІ, з точністю до 70–80%.

«Обчислювальний тест Тьюринга»

Дослідники представили новий варіант «комп’ютерного тесту Тьюринга» — метрику, яка оцінює, наскільки мова ІІ наближена до реальної інтернет-комунікації. Система використовує автоматичний лінгвістичний аналіз, щоб виявляти ознаки, за якими тексти нейромереж відрізняються від людських — насамперед у емоційному забарвленні.

«Навіть після ретельного калібрування результати LLM залишаються помітно відмінними від людських за емоційним тоном та вираженням емоцій», — зазначають автори.

Чому ШІ «занадто ввічливий»

Група під керівництвом Ніколо Пагана з Цюріхського університету з’ясувала, що навіть при застосуванні складних стратегій оптимізації (включаючи «тонке налаштування» та уточнюючі підказки) емоційні сигнали, властиві ІІ, не зникають. Коли моделі відповідали реальні пости із соцмереж, вони важко відтворювали неформальні висловлювання, сарказм і легкий негатив, характерні для людської промови. Їхній рівень токсичності залишався значно нижчим.

Спроби підвищити реалістичність – наприклад, додавання прикладів постів користувачів чи додаткового контексту – допомагали лише частково. Відмінності у довжині речень та структурі тексту згладжувалися, але емоційні відмінності зберігалися.

Несподівані висновки

Вчені виявили, що моделі з інструктивним навчанням (Instruct) імітують людину гірше, ніж їх базові версії. Так, Llama 3.1 8B та Mistral 7B v0.1 показали найкращі результати, досягаючи 75–85% точності в імітації людських відповідей. Крім того, масштабування моделей не дало переваг – версія Llama 3.1 з 70 млрд параметрів виявилася менш «людяною», ніж моделі з 8 млрд параметрів.

Спроби «маскувати» тексти під людські знижували їхню смислову близькість до реальних відповідей користувачів: оцінка семантичної подібності впала з 0,18–0,34 до 0,16–0,28 на різних платформах. Тобто що сильніше модель намагалася «здаватися людиною», то легше було розпізнати, що маємо ІІ.

Де ШІ ховається краще

Відмінності виявились і між платформами. На X (Twitter) нейромережі імітували людей найбільш успішно – детекція була найменш точною. На Bluesky результати були середніми, а на Reddit – найгірше: тексти ІІ відрізнялися сильніше. Дослідники вважають, що це пов’язано з різницею стилю спілкування користувачів та тим, наскільки дані конкретних платформ використовувалися під час навчання моделей.

Сучасні LLM залишаються вразливими у сфері спонтанного вираження емоцій та природної неоднозначності, характерної для людського спілкування. ІІ може імітувати граматику та лексику, але його емоційна «пригладженість» залишається помітним маркером штучного походження.

Не пропустіть цікаве!

Підписуйтесь на наші канали та читайте анонси хай-тек новин, тестів та оглядів у зручному форматі!

Ми у Facebook Ми у Instagram Ми у Telegram

Залишити відповідь Скасувати коментар

Статті & тести

03.11.25
Огляд смартфона Oppo A6 Pro: амбітний

323

Новий смартфон Oppo A6 Pro – середнячок з функціональністю смартфонів преміум-класу. Виробник наділив його кількома характеристиками, властивими більш дорожчим телефонам. Але не обійшлось і без компромісів. Як саме збалансований Oppo A6 Pro – розповімо в огляді.

29.07.26
Смарт-годинники Garmin: повний гід по вибору моделі

Garmin давно вийшов за рамки простої GPS-навігації. Сьогодні це ультимативні обчислювальні центри на зап’ясті, які конкурують як з класичною «розумною» носимою електронікою, так і зі спеціалізованими професійними приладами. Як обрати смарт годинник Гармін – розкажемо далі

29.07.26 | 06.09
Смарт-годинники Garmin: повний гід по вибору моделі

20.07.26 | 05.20
Logitech Signature Comfort Plus Combo MK880: пріоритет на комфорт

06.07.26 | 05.06
Огляд навушників Sony WF-1000XM6: на всю потужність

01.07.26 | 05.19
Огляд набору бездротових клавіатури та миші Logitech MX Keys S Combo

19.05.26 | 06.06
One UI 8.5: нове життя старих смартфонів Samsung — що дає оновлення?

11.05.26 | 05.00
Огляд клавіатури Logitech G512 X 75: максимізована витонченість

27.04.26 | 06.05
Infinix GT 50 Pro розпакування : ігровий монстр із рідинним охолодженням та тригерами

14.04.26 | 13.50
Samsung Galaxy A37 та A57— порівняння: за що переплачувати €100?

16.03.26 | 05.00
Тест ноутбука Acer Predator Helios 18 AI (PH18-73): рівень – бог

12.03.26 | 05.05
Огляд мишки Logitech G PRO X2 Superstrike Lightspeed: індивідуальне рішення

09.03.26 | 06.06
Захист сайту від фаззингу: Вас ламають, поки ви спите

02.03.26 | 05.23
Огляд ноутбука Acer Nitro Lite 16 (NL16-71G): універсальний та симпатичний

23.02.26 | 05.48
Огляд смартфона Oppo Reno 15 5G: впевнений

22.02.26 | 17.41
Як обрати IT курси у 2026 році: повний гайд для новачків

16.02.26 | 05.45
Огляд навушників Logitech G G325: надійно та надовго

Новини

29.07.26 | 20.30
Lenovo Legion C700: трансляція без інтернету та затримка 10 мс

Lenovo представила перші подробиці про портативну консоль Legion C700, орієнтовану на хмарний геймінг.

29.07.26 | 19.02
ШІ-компанії масово скуповують книги, які більше не перевидають

Поки розробники великих мовних моделей намагаються знайти якісні дані для навчання нових систем, одним із затребуваних ресурсів стали старі друковані видання.

29.07.26 | 20.30
Lenovo Legion C700: трансляція без інтернету та затримка 10 мс

29.07.26 | 19.02
ШІ-компанії масово скуповують книги, які більше не перевидають

29.07.26 | 17.07
HP Z1 Tower G1i: компактна потужність на базі Intel Core Ultra 5

29.07.26 | 13.08
AppleCare One виходить на міжнародний ринок: що потрібно знати про новий план захисту

29.07.26 | 10.07
S.T.A.L.K.E.R. 2: Cost of Hope вийде вже цього літа – названа дата релізу

29.07.26 | 07.08
Парадокс Ubisoft: рекордні продажі Assassin’s Creed Black Flag Resynced та нові звільнення

28.07.26 | 19.03
Крадіжка в eSports-готелях: У Китаї засудили викрадачів оперативної пам’яті

28.07.26 | 17.01
Honor Robot Phone: революційний смартфон з автономною камерою-роботом

28.07.26 | 15.37
Oppo A7 Pro Max: бюджетний смартфон з рекордною батареєю 10000 мАг

28.07.26 | 13.04
Unitree Super Athlete AS2-W: робот-собака з навичками брейкдансу

28.07.26 | 10.04
Resident Evil може стати щорічною франшизою завдяки ремейкам.

28.07.26 | 07.07
Фішингові атаки під виглядом ChatGPT набирають обертів

27.07.26 | 20.30
MSI Pro Max Edge AI+ з Ryzen AI Max та підтримкою 128 ГБ ОЗУ

27.07.26 | 19.07
Honor змінює позиціонування: компанія готується конкурувати не лише на ринку смартфонів

27.07.26 | 17.09
Lenovo ThinkCentre X AIO Aura Edition: моноблок із незвичайним квадратним екраном