ШІ не може підробити токсичність – новий тест Тьюринга

15.11.25

angry robot

Дослідники з Цюріхського, Амстердамського, Дьюкського та Нью-Йоркського університетів встановили, що сучасні мовні моделі штучного інтелекту все ще можна легко відрізнити від людей — головним чином надмірно доброзичливим і «гладким» емоційним тоном.

Вчені протестували дев’ять популярних моделей з відкритим кодом – Llama 3.1 8B, Llama 3.1 8B Instruct, Llama 3.1 70B, Mistral 7B v0.1, Mistral 7B Instruct v0.2, Qwen 2.5 7B Instruct, Gemma 3 4B Instruct і Apertus-8B-2509 – на прикладах повідомлень із соцмереж X (Twitter), Bluesky та Reddit. Алгоритми-класифікатори, створені в рамках проекту, спромоглися розпізнати тексти, згенеровані ІІ, з точністю до 70–80%.

«Обчислювальний тест Тьюринга»

Дослідники представили новий варіант «комп’ютерного тесту Тьюринга» — метрику, яка оцінює, наскільки мова ІІ наближена до реальної інтернет-комунікації. Система використовує автоматичний лінгвістичний аналіз, щоб виявляти ознаки, за якими тексти нейромереж відрізняються від людських — насамперед у емоційному забарвленні.

«Навіть після ретельного калібрування результати LLM залишаються помітно відмінними від людських за емоційним тоном та вираженням емоцій», — зазначають автори.

Чому ШІ «занадто ввічливий»

Група під керівництвом Ніколо Пагана з Цюріхського університету з’ясувала, що навіть при застосуванні складних стратегій оптимізації (включаючи «тонке налаштування» та уточнюючі підказки) емоційні сигнали, властиві ІІ, не зникають. Коли моделі відповідали реальні пости із соцмереж, вони важко відтворювали неформальні висловлювання, сарказм і легкий негатив, характерні для людської промови. Їхній рівень токсичності залишався значно нижчим.

Спроби підвищити реалістичність – наприклад, додавання прикладів постів користувачів чи додаткового контексту – допомагали лише частково. Відмінності у довжині речень та структурі тексту згладжувалися, але емоційні відмінності зберігалися.

Несподівані висновки

Вчені виявили, що моделі з інструктивним навчанням (Instruct) імітують людину гірше, ніж їх базові версії. Так, Llama 3.1 8B та Mistral 7B v0.1 показали найкращі результати, досягаючи 75–85% точності в імітації людських відповідей. Крім того, масштабування моделей не дало переваг – версія Llama 3.1 з 70 млрд параметрів виявилася менш «людяною», ніж моделі з 8 млрд параметрів.

Спроби «маскувати» тексти під людські знижували їхню смислову близькість до реальних відповідей користувачів: оцінка семантичної подібності впала з 0,18–0,34 до 0,16–0,28 на різних платформах. Тобто що сильніше модель намагалася «здаватися людиною», то легше було розпізнати, що маємо ІІ.

Де ШІ ховається краще

Відмінності виявились і між платформами. На X (Twitter) нейромережі імітували людей найбільш успішно – детекція була найменш точною. На Bluesky результати були середніми, а на Reddit – найгірше: тексти ІІ відрізнялися сильніше. Дослідники вважають, що це пов’язано з різницею стилю спілкування користувачів та тим, наскільки дані конкретних платформ використовувалися під час навчання моделей.

Сучасні LLM залишаються вразливими у сфері спонтанного вираження емоцій та природної неоднозначності, характерної для людського спілкування. ІІ може імітувати граматику та лексику, але його емоційна «пригладженість» залишається помітним маркером штучного походження.

Не пропустіть цікаве!

Підписуйтесь на наші канали та читайте анонси хай-тек новин, тестів та оглядів у зручному форматі!

Ми у Facebook Ми у Instagram Ми у Telegram

Залишити відповідь Скасувати коментар

Статті & тести

03.11.25
Огляд смартфона Oppo A6 Pro: амбітний

221

Новий смартфон Oppo A6 Pro – середнячок з функціональністю смартфонів преміум-класу. Виробник наділив його кількома характеристиками, властивими більш дорожчим телефонам. Але не обійшлось і без компромісів. Як саме збалансований Oppo A6 Pro – розповімо в огляді.

23.02.26
Огляд смартфона Oppo Reno 15 5G: впевнений

Смартфон Oppo Reno15 робить ставку на дизайн, якісний дисплей, універсальні камери та гарну автономність. Розкажемо докладніше

23.02.26 | 05.48
Огляд смартфона Oppo Reno 15 5G: впевнений

16.02.26 | 05.45
Огляд навушників Logitech G G325: надійно та надовго

02.02.26 | 05.04
Огляд смартфона Poco M8 Pro: можна дозволити більше

26.01.26 | 05.05
Джерела автономного живлення для дому: інвертори, акумулятори, сонячні панелі

29.12.25 | 05.30
Топ новин 2025 року сайту hi-tech.ua

16.12.25 | 06.25
Вибір редакції 2025. Найкращі пристрої року за версією hi-tech.ua

10.12.25 | 05.45
Ігрове кермо Logitech G29: спорткар на столі

25.11.25 | 05.02
Кращі Bluetooth колонки. Добірка моделей у різних цінових сегментах

24.11.25 | 05.25
Кращі OLED монітори в діагоналях 27-49 дюймів

23.11.25 | 06.17
Зарядні станції для будь-яких потреб — від смартфона до побутової техніки

22.11.25 | 05.38
Чорна п’ятниця – як купляти та економити

21.11.25 | 05.04
Топ-5 потужних повербанків від 20000 до 50000 mAh для блекаутів і не тільки!

20.11.25 | 05.10
Не помились! Який смарт-телевізор купити цього року

19.11.25 | 05.44
Огляд Bluetooth навушників OPPO Enco X3s: цупкі

18.11.25 | 05.35
Замість iPhone и Samsung. Флагмани Vivo, OnePlus, Oppo 2025 року

РќРѕРІРѕСЃС‚Рё

Oppo вивела на ринок нове покоління повністю бездротових навушників – Oppo Enco Air 5 Pro із захистом IP55

26.02.26 | 16.17
Hyundai додасть покемонів у свої авто Hyundai автомобіль

Користувачі зможуть змінювати графіку цифрової панелі приладів Hyundai і центрального дисплея, активувати тематичну навігацію, а також анімації.

26.02.26 | 18.50
Навушники Oppo Enco Air 5 Pro мають захист IP55 та ціну $50

26.02.26 | 16.17
Hyundai додасть покемонів у свої авто

26.02.26 | 13.22
Xiaomi Tag – більш доступний трекер, який сумісний з Apple та Google

26.02.26 | 11.26
Представлені смартфони Samsung Galaxy S26: багато штучного інтелекту, не надто багато проривів

26.02.26 | 10.07
Toyota RAV4 2026: 329 к.с. та 150 км запасу ходу на електромоторі

26.02.26 | 07.10
Blizzard випустить мобільну Overwatch

25.02.26 | 17.16
У MIT на 3D принтері надрукували електродвигун за 50 центів

25.02.26 | 14.07
monobank будет бесплатно проводить платежи по IBAN

25.02.26 | 10.20
У WhatsApp з’явиться надсилання запланованих повідомлень

25.02.26 | 07.33
Microsoft додала до Блокноту підтримку зображень

24.02.26 | 19.40
ASUS і Acer припинили продаж ноутбуків та роботу сайтів у Німеччині через виграш Nokia в суді

24.02.26 | 17.30
Google відключить програму прогнозу погоди

24.02.26 | 13.18
Windows 11 отримає вбудований тест швидкості інтернет-підключення, але є нюанс

24.02.26 | 10.21
Браузер Google Chrome зможе відкривати дві вкладки в одному вікні

24.02.26 | 07.16
Глава Xbox Філ Спенсер залишає Microsoft після майже 40 років роботи