ИИ не может подделать токсичность — новый тест Тьюринга

15.11.25

Исследователи из Цюрихского, Амстердамского, Дьюкского и Нью-Йоркского университетов установили, что современные языковые модели искусственного интеллекта всё ещё можно легко отличить от людей — главным образом по чрезмерно дружелюбному и «гладкому» эмоциональному тону.

Учёные протестировали девять популярных моделей с открытым кодом — Llama 3.1 8B, Llama 3.1 8B Instruct, Llama 3.1 70B, Mistral 7B v0.1, Mistral 7B Instruct v0.2, Qwen 2.5 7B Instruct, Gemma 3 4B Instruct, DeepSeek-R1-Distill-Llama-8B и Apertus-8B-2509 — на примерах сообщений из соцсетей X (Twitter), Bluesky и Reddit. Алгоритмы-классификаторы, созданные в рамках проекта, смогли распознать тексты, сгенерированные ИИ, с точностью до 70–80%.

«Вычислительный тест Тьюринга»

Исследователи представили новый вариант «компьютерного теста Тьюринга» — метрику, которая оценивает, насколько речь ИИ приближена к реальной интернет-коммуникации. Система использует автоматический лингвистический анализ, чтобы выявлять признаки, по которым тексты нейросетей отличаются от человеческих — прежде всего в эмоциональной окраске.

«Даже после тщательной калибровки результаты LLM остаются заметно отличными от человеческих по эмоциональному тону и выражению эмоций», — отмечают авторы.

Почему ИИ «слишком вежлив»

Группа под руководством Николо Пагана из Цюрихского университета выяснила, что даже при применении сложных стратегий оптимизации (включая «тонкую настройку» и уточняющие подсказки) эмоциональные сигналы, присущие ИИ, не исчезают. Когда модели отвечали на реальные посты из соцсетей, они с трудом воспроизводили неформальные выражения, сарказм и лёгкий негатив, характерные для человеческой речи. Их уровень токсичности оставался значительно ниже.

Попытки повысить реалистичность — например, добавление примеров постов пользователей или дополнительного контекста — помогали лишь частично. Различия в длине предложений и структуре текста сглаживались, но эмоциональные различия сохранялись.

Неожиданные выводы

Учёные обнаружили, что модели с инструктивным обучением (Instruct) имитируют человека хуже, чем их базовые версии. Так, Llama 3.1 8B и Mistral 7B v0.1 показали лучшие результаты, достигая 75–85% точности в имитации человеческих ответов. Кроме того, масштабирование моделей не дало преимуществ — версия Llama 3.1 с 70 млрд параметров оказалась менее «человечной», чем модели с 8 млрд параметров.

Попытки «маскировать» тексты под человеческие снижали их смысловую близость к реальным ответам пользователей: оценка семантического сходства упала с 0,18–0,34 до 0,16–0,28 на разных платформах. То есть чем сильнее модель старалась «казаться человеком», тем легче было распознать, что перед нами ИИ.

Где ИИ прячется лучше

Различия проявились и между платформами. На X (Twitter) нейросети имитировали людей наиболее успешно — детекция была наименее точной.
На Bluesky результаты были средними, а на Reddit — хуже всего: тексты ИИ отличались сильнее. Исследователи считают, что это связано с различием стиля общения пользователей и тем, насколько данные конкретных платформ использовались при обучении моделей.

Современные LLM остаются уязвимыми в области спонтанного выражения эмоций и естественной неоднозначности, характерной для человеческого общения. ИИ может имитировать грамматику и лексику, но его эмоциональная «приглаженность» остаётся заметным маркером искусственного происхождения.

Не пропустите интересное!

Підписывайтесь на наши каналы и читайте анонсы хай-тек новостей, тестов и обзоров в удобном формате!

Мы в Facebook Мы в Instagram Мы в Telegram

Добавить комментарий Отменить ответ

Статьи & тесты

03.11.25
Обзор смартфона Oppo A6 Pro: амбициозный

915

Новый смартфон Oppo A6 Pro — телефон среднего уровня с функциональностью смартфонов премиум-класса. Производитель наделил его множеством характеристик, присущих более дорогим телефонам. Но не обошлось и без компромиссов. Как именно сбалансирован Oppo A6 Pro – расскажем в обзоре.

23.02.26
Обзор смартфона Oppo Reno 15 5G: уверенный

Смартфон Oppo Reno15 делает ставку на дизайн, качественный дисплей, универсальные камеры и хорошую автономность. Расскажем подробнее

23.02.26 | 05.48
Обзор смартфона Oppo Reno 15 5G: уверенный

17.02.26 | 22.00
Обзор наушников Logitech G G325: надежно и надолго

02.02.26 | 05.04
Обзор смартфона Poco M8 Pro: можно позволить больше

26.01.26 | 05.05
Источники автономного питания для дома: инверторы, аккумуляторы, солнечные панели

29.12.25 | 05.30
Топ новостей 2025 года сайта hi-tech.ua

16.12.25 | 06.25
Выбор редакции 2025. Лучшие устройства года по версии hi-tech.ua

10.12.25 | 05.45
Игровой руль Logitech G29 с педалями и коробкой: спорткар на столе

25.11.25 | 05.02
Лучшие Bluetooth колонки. Подборка моделей в разных ценовых сегментах

24.11.25 | 05.25
Лучшие OLED мониторы в диагоналях 27-49 дюймов

23.11.25 | 06.17
Зарядные станции для любых задач — от смартфона до крупной бытовой техники

22.11.25 | 05.38
Черная пятница – как покупать и экономить

21.11.25 | 05.04
Топ-5 мощных повербанков от 20000 до 50000 mAh для блекаутов и не только!

20.11.25 | 05.10
Не ошибись! Какой смарт-телевизор купить в этом году

19.11.25 | 05.44
Обзор Bluetooth наушников OPPO Enco X3s: цепкие

18.11.25 | 05.35
Вместо iPhone и Samsung. Флагманы Vivo, OnePlus, Oppo 2025 года

РќРѕРІРѕСЃС‚Рё

Oppo вывела на рынок новое поколение полностью беспроводных наушников — Oppo Enco Air 5 Pro с защитой IP55

26.02.26 | 16.17
Hyundai добавит покемонов в свои авто Hyundai автомобиль

Пользователи смогут изменять графику цифровой приборной панели Hyundai и центрального дисплея, активировать тематическую навигацию, а также анимации

26.02.26 | 18.50
Наушники Oppo Enco Air 5 Pro имеют защиту IP55 и цену $50

26.02.26 | 16.17
Hyundai добавит покемонов в свои авто

26.02.26 | 13.22
Xiaomi Tag — более доступный трекер, который совместим с Apple и Google

26.02.26 | 11.26
Представлены смартфоны Samsung Galaxy S26: много искусственного интеллекта, не слишком много прорывов

26.02.26 | 10.07
Toyota RAV4 2026: 329 л.с. и 150 км запаса хода на электримоторе

26.02.26 | 07.10
Blizzard выпустит мобильную Overwatch

25.02.26 | 17.16
В MIT на 3D принтере напечатали электродвигатель за 50 центов

25.02.26 | 14.07
monobank будет бесплатно проводить платежи по IBAN

25.02.26 | 10.20
В WhatsApp появится отправка запланированных сообщений

25.02.26 | 07.33
Microsoft добавила в Блокнот поддержку изображений

24.02.26 | 19.40
ASUS и Acer прекратили продажу ноутбуков и работу сайтов в Германии из-за выигрыша Nokia в суде

24.02.26 | 17.30
Google отключит приложение прогноза погоды

24.02.26 | 13.18
Windows 11 получит встроенный тест скорости интернет подключения, но есть нюанс

24.02.26 | 10.21
Браузер Google Chrome сможет открывать 2 вкладки в одном окне

24.02.26 | 07.16
Глава Xbox Фил Спенсер покидает Microsoft после почти 40 лет работы