Исследование: ИИ становится неотличим от человека

Тест Тьюринга долго оставался скорее теоретической границей между человеком и машиной. Но новое исследование учёных Калифорнийского университета в Сан-Диего показывает, что современные языковые модели уже перешли в зону, где люди регулярно ошибаются, пытаясь понять, кто перед ними — человек или ИИ.

Главным участником эксперимента стала модель GPT-4.5. В серии текстовых диалогов она сумела убедить участников в своей “человечности” в 73% случаев. По сути, это означает, что чат-бот чаще воспринимался как реальный человек, чем настоящие собеседники в тех же условиях.

Как проводился эксперимент

Исследователи использовали усложнённую версию классического теста Тьюринга. Участникам одновременно показывали два диалога — с человеком и с ИИ — не раскрывая, кто есть кто. После короткого общения они должны были определить, где реальный человек.

В отличие от ранних поколений чат-ботов, современные модели уже не выдают себя шаблонными ответами. Они подстраивают стиль речи, используют интернет-сленг, имитируют эмоции, добавляют юмор, паузы и даже лёгкую неуверенность — всё то, что люди подсознательно считывают как “живое” общение.

Лучший результат показала GPT-4.5 в режиме persona prompt — когда модели задаётся определённый характер. В этом случае она имитировала молодого интровертного пользователя, знакомого с интернет-культурой и современным стилем переписки. Именно такая подача оказалась наиболее убедительной.

Для сравнения, LLaMa-3.1-405B получила 56% “человеческих” оценок, GPT-4o — 21%, а классическая ELIZA 1960-х годов — 23%. Без специальной настройки поведения GPT-4.5 показывала заметно более скромный результат — 36%.

Почему люди принимают ИИ за человека

Интересный вывод исследования заключается в том, что участники оценивали не интеллект собеседника, а стиль общения. На решение влияли:

  • манера формулировать мысли;
  • эмоциональность;
  • чувство юмора;
  • естественность диалога;
  • социальные сигналы и “человеческие” ошибки.

Именно эти факторы оказались важнее содержания ответов. И современные модели научились воспроизводить их особенно хорошо.

Важно и то, что эксперимент проводился исключительно в текстовом формате — без голоса, видео или визуальных подсказок. Это усилило значение именно языкового поведения, где ИИ уже почти не уступает человеку.

Это не “разум”, но уже риск

Авторы подчёркивают: успешное прохождение теста Тьюринга не означает наличие сознания или понимания у модели. GPT-4.5 не “думает” как человек — она лишь очень точно воспроизводит человеческий стиль общения.

Однако практические последствия уже очевидны.

Если ИИ способен убедительно имитировать человека в коротком диалоге, это может повлиять на множество сфер:

  • службы поддержки;
  • соцсети;
  • приложения для знакомств;
  • образовательные платформы;
  • политические коммуникации;
  • мошеннические схемы.

Проблема в том, что люди часто формируют доверие буквально за несколько сообщений, и теперь этот процесс может быть легко сымитирован алгоритмом.

Тест Тьюринга теряет прежний смысл

Изначально тест Тьюринга задумывался как проверка способности машины имитировать человеческое мышление. Сегодня же ситуация изменилась: вопрос всё чаще звучит иначе — может ли человек отличить машину от другого человека.

И если GPT-4.5 уже справляется с этим лучше людей, граница между “настоящим” и “искусственным” в цифровом общении становится всё менее заметной.


Не пропустите интересное!

Підписывайтесь на наши каналы и читайте анонсы хай-тек новостей, тестов и обзоров в удобном формате!

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *





Статьи & тестыArticles

Обзор смартфона Oppo A6 Pro: амбициозный Oppo A6 Pro (CPH2799)

Новый смартфон Oppo A6 Pro — телефон среднего уровня с функциональностью смартфонов премиум-класса. Производитель наделил его множеством характеристик, присущих более дорогим телефонам. Но не обошлось и без компромиссов. Как именно сбалансирован Oppo A6 Pro – расскажем в обзоре.


One UI 8.5: новая жизнь старых смартфонов Samsung — что даёт обновление?

One UI 8.5 приносит старым Samsung Galaxy функции, которые ещё недавно были эксклюзивом новых флагманов. Но действительно ли обновление способно сделать Galaxy S22, S23 и S24 ближе к уровню Galaxy S26? Разбираемся, что меняется после установки прошивки.


НовостиNews
| 17.06
Phosgo Go 5 Ultra: Электробайк на солнечных батареях

Phosgo Go 5 Ultra стал одним из самых необычных электробайков года благодаря солнечным панелям в ободах колес и запасу хода до 193 км.

| 16.02
Электрический пикап за $24500 от Slate Auto: предзаказ и старт поставок

Стартап Slate Auto представил свой бюджетный электрический пикап по цене 24 500 долларов. Узнайте все подробности о технических характеристиках, условиях предзаказа и датах начала поставок модели.