ИИ не может подделать токсичность — новый тест Тьюринга

15.11.25

Исследователи из Цюрихского, Амстердамского, Дьюкского и Нью-Йоркского университетов установили, что современные языковые модели искусственного интеллекта всё ещё можно легко отличить от людей — главным образом по чрезмерно дружелюбному и «гладкому» эмоциональному тону.

Учёные протестировали девять популярных моделей с открытым кодом — Llama 3.1 8B, Llama 3.1 8B Instruct, Llama 3.1 70B, Mistral 7B v0.1, Mistral 7B Instruct v0.2, Qwen 2.5 7B Instruct, Gemma 3 4B Instruct, DeepSeek-R1-Distill-Llama-8B и Apertus-8B-2509 — на примерах сообщений из соцсетей X (Twitter), Bluesky и Reddit. Алгоритмы-классификаторы, созданные в рамках проекта, смогли распознать тексты, сгенерированные ИИ, с точностью до 70–80%.

«Вычислительный тест Тьюринга»

Исследователи представили новый вариант «компьютерного теста Тьюринга» — метрику, которая оценивает, насколько речь ИИ приближена к реальной интернет-коммуникации. Система использует автоматический лингвистический анализ, чтобы выявлять признаки, по которым тексты нейросетей отличаются от человеческих — прежде всего в эмоциональной окраске.

«Даже после тщательной калибровки результаты LLM остаются заметно отличными от человеческих по эмоциональному тону и выражению эмоций», — отмечают авторы.

Почему ИИ «слишком вежлив»

Группа под руководством Николо Пагана из Цюрихского университета выяснила, что даже при применении сложных стратегий оптимизации (включая «тонкую настройку» и уточняющие подсказки) эмоциональные сигналы, присущие ИИ, не исчезают. Когда модели отвечали на реальные посты из соцсетей, они с трудом воспроизводили неформальные выражения, сарказм и лёгкий негатив, характерные для человеческой речи. Их уровень токсичности оставался значительно ниже.

Попытки повысить реалистичность — например, добавление примеров постов пользователей или дополнительного контекста — помогали лишь частично. Различия в длине предложений и структуре текста сглаживались, но эмоциональные различия сохранялись.

Неожиданные выводы

Учёные обнаружили, что модели с инструктивным обучением (Instruct) имитируют человека хуже, чем их базовые версии. Так, Llama 3.1 8B и Mistral 7B v0.1 показали лучшие результаты, достигая 75–85% точности в имитации человеческих ответов. Кроме того, масштабирование моделей не дало преимуществ — версия Llama 3.1 с 70 млрд параметров оказалась менее «человечной», чем модели с 8 млрд параметров.

Попытки «маскировать» тексты под человеческие снижали их смысловую близость к реальным ответам пользователей: оценка семантического сходства упала с 0,18–0,34 до 0,16–0,28 на разных платформах. То есть чем сильнее модель старалась «казаться человеком», тем легче было распознать, что перед нами ИИ.

Где ИИ прячется лучше

Различия проявились и между платформами. На X (Twitter) нейросети имитировали людей наиболее успешно — детекция была наименее точной.
На Bluesky результаты были средними, а на Reddit — хуже всего: тексты ИИ отличались сильнее. Исследователи считают, что это связано с различием стиля общения пользователей и тем, насколько данные конкретных платформ использовались при обучении моделей.

Современные LLM остаются уязвимыми в области спонтанного выражения эмоций и естественной неоднозначности, характерной для человеческого общения. ИИ может имитировать грамматику и лексику, но его эмоциональная «приглаженность» остаётся заметным маркером искусственного происхождения.

Не пропустите интересное!

Підписывайтесь на наши каналы и читайте анонсы хай-тек новостей, тестов и обзоров в удобном формате!

Мы в Facebook Мы в Instagram Мы в Telegram

Добавить комментарий Отменить ответ

Статьи & тесты

03.11.25
Обзор смартфона Oppo A6 Pro: амбициозный

1 238

Новый смартфон Oppo A6 Pro — телефон среднего уровня с функциональностью смартфонов премиум-класса. Производитель наделил его множеством характеристик, присущих более дорогим телефонам. Но не обошлось и без компромиссов. Как именно сбалансирован Oppo A6 Pro – расскажем в обзоре.

29.07.26
Смарт-часы Garmin: полный гид по выбору модели

251

Garmin давно вышел за рамки простой GPS-навигации. Сегодня это ультимативные вычислительные центры на запястье, конкурирующие как с классической «умной» носимой электроникой, так и со специализированными профессиональными приборами. Как выбрать смарт часы Гармин — расскажем далее

29.07.26 | 09.09
Смарт-часы Garmin: полный гид по выбору модели

20.07.26 | 05.20
Logitech Signature Comfort Plus Combo MK880: приоритет на комфорт

06.07.26 | 05.06
Обзор наушников Sony WF-1000XM6: на всю мощность

01.07.26 | 05.19
Обзор набора беспроводных клавиатуры и мыши Logitech MX Keys S Combo

19.05.26 | 06.06
One UI 8.5: новая жизнь старых смартфонов Samsung — что даёт обновление?

11.05.26 | 05.00
Обзор клавиатуры Logitech G512 X 75: максимизированная утонченность

27.04.26 | 06.05
Infinix GT 50 Pro распаковка: игровой монстр с жидкостным охлаждением и триггерами

14.04.26 | 13.50
Samsung Galaxy A37 и A57 — сравнение: за что переплачивать €100?

16.03.26 | 05.00
Тест ноутбука Acer Predator Helios 18 AI (PH18-73): уровень — бог

12.03.26 | 05.05
Обзор мышки Logitech G PRO X2 Superstrike Lightspeed: индивидуальное решение

09.03.26 | 06.05
Защита сайта от фаззинга: Вас ломают, пока вы спите

02.03.26 | 05.23
Обзор ноутбука Acer Nitro Lite 16 (NL16-71G): универсальный и симпатичный

23.02.26 | 05.48
Обзор смартфона Oppo Reno 15 5G: уверенный

17.02.26 | 22.00
Обзор наушников Logitech G G325: надежно и надолго

02.02.26 | 05.04
Обзор смартфона Poco M8 Pro: можно позволить больше

Новости

29.07.26 | 20.30
Lenovo Legion C700: трансляция без интернета и задержка 10 мс

Lenovo представила первые подробности о портативной консоли Legion C700, ориентированной на облачный гейминг.

29.07.26 | 19.02
ИИ-компании массово скупают книги, которые больше не переиздают

Пока разработчики больших языковых моделей пытаются найти качественные данные для обучения новых систем, одним из самых востребованных ресурсов стали старые печатные издания.

29.07.26 | 20.30
Lenovo Legion C700: трансляция без интернета и задержка 10 мс

29.07.26 | 19.02
ИИ-компании массово скупают книги, которые больше не переиздают

29.07.26 | 17.07
HP Z1 Tower G1i: компактная мощь на базе Intel Core Ultra 5

29.07.26 | 13.08
AppleCare One выходит на международный рынок: что нужно знать о новом плане защиты

29.07.26 | 10.07
S.T.A.L.K.E.R. 2: Cost of Hope выйдет уже этим летом — названа дата релиза

29.07.26 | 07.08
Парадокс Ubisoft: рекордные продажи Assassin’s Creed Black Flag Resynced и новые увольнения

28.07.26 | 19.03
Кража в eSports-отелях: В Китае осудили похитителей оперативной памяти

28.07.26 | 17.01
Honor Robot Phone: революционный смартфон с автономной камерой-роботом

28.07.26 | 15.37
Oppo A7 Pro Max: бюджетный смартфон с рекордной батареей 10000 мАч

28.07.26 | 13.04
Unitree Super Athlete AS2-W: робот-собака с навыками брейкданса

28.07.26 | 10.04
Resident Evil может стать ежегодной франшизой благодаря ремейкам

28.07.26 | 07.07
Фишинговые атаки под видом ChatGPT набирают обороты

27.07.26 | 20.30
MSI Pro Max Edge AI+ с Ryzen AI Max и поддержкой 128 ГБ ОЗУ

27.07.26 | 19.07
Honor меняет позиционирование: компания готовится конкурировать не только на рынке смартфонов

27.07.26 | 17.09
Lenovo ThinkCentre X AIO Aura Edition: моноблок с необычным квадратным экраном