Каждый десятый ответ — ошибка: исследование поставило под сомнение точность ИИ-ответов Google

Функция автоматических ответов в поиске Google, основанная на искусственном интеллекте, демонстрирует высокий уровень точности, однако сохраняется заметная доля ошибок. По результатам исследования, около 10% ответов оказываются недостоверными, что в масштабах поисковой системы означает огромный поток некорректной информации.

Как работает AI Overviews

AI Overviews — это инструмент Google, который формирует краткие ответы на запросы пользователей с помощью ИИ-моделей семейства Gemini. Впервые технология появилась в 2024 году, а затем начала активно распространяться на глобальном уровне, включая украинский рынок.

Система анализирует данные из различных источников и выдает сжатую сводку, позволяя пользователям быстрее получать нужную информацию без перехода по ссылкам.

Результаты исследования

Совместное исследование The New York Times и стартапа Oumi показало, что в среднем около 90% ответов AI Overviews являются корректными. Тем не менее, примерно один из десяти случаев содержит ошибки или вводящую в заблуждение информацию.

Проверка проводилась с использованием теста SimpleQA — набора из четырёх тысяч вопросов, разработанного OpenAI. Сравнение показало, что после обновления моделей точность выросла: ранее показатель составлял около 85%, а затем превысил 90%.

Однако даже такой уровень точности вызывает вопросы, если учитывать масштаб использования поисковой системы. В пересчёте на общее количество запросов речь может идти о миллионах неточных ответов каждый час.

Примеры неточностей

В отчёте приводятся конкретные случаи ошибок. Например, при запросе о дате превращения дома Боба Марли в музей система ссылалась на источники без точных данных или с некорректной информацией.

В другом случае ИИ утверждал, что не существует определённого музыкального учреждения, несмотря на то, что сам же ссылался на его официальный сайт. Такие противоречия подчеркивают проблему надёжности автоматически сгенерированных ответов.

Позиция Google

В Google не согласились с выводами исследования и указали на недостатки методологии. Представители компании заявили, что использованный тест может содержать ошибки и не отражает реальные пользовательские запросы.

По словам компании, для внутренней оценки применяется собственная версия тестирования с более тщательно проверенными данными, что даёт более точное представление о качестве системы.

Почему оценить ИИ сложно

Оценка точности генеративных моделей остаётся непростой задачей. Разные тесты дают разные результаты, а сами системы могут по-разному отвечать на один и тот же вопрос.

Кроме того, AI Overviews не опирается на одну конкретную модель — система динамически выбирает наиболее подходящий алгоритм для каждого запроса. Более точные модели требуют больше ресурсов, поэтому используются не всегда.

Главный риск — доверие пользователей

Несмотря на заметный прогресс, ключевая проблема заключается в восприятии пользователями. Многие склонны доверять ответам ИИ без дополнительной проверки, даже если в них могут содержаться ошибки.

Использование данных из интернета действительно повышает точность, однако одновременно увеличивает риск распространения недостоверной информации.

И хотя Google предупреждает о возможных ошибках в сгенерированных ответах, на практике далеко не все пользователи перепроверяют полученные данные.


Не пропустите интересное!

Підписывайтесь на наши каналы и читайте анонсы хай-тек новостей, тестов и обзоров в удобном формате!

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *





Статьи & тестыArticles

Обзор смартфона Oppo A6 Pro: амбициозный Oppo A6 Pro (CPH2799)

Новый смартфон Oppo A6 Pro — телефон среднего уровня с функциональностью смартфонов премиум-класса. Производитель наделил его множеством характеристик, присущих более дорогим телефонам. Но не обошлось и без компромиссов. Как именно сбалансирован Oppo A6 Pro – расскажем в обзоре.


One UI 8.5: новая жизнь старых смартфонов Samsung — что даёт обновление?

One UI 8.5 приносит старым Samsung Galaxy функции, которые ещё недавно были эксклюзивом новых флагманов. Но действительно ли обновление способно сделать Galaxy S22, S23 и S24 ближе к уровню Galaxy S26? Разбираемся, что меняется после установки прошивки.


НовостиNews
| 20.37
MSI на Computex 2026: ноутбуки с RTX 5090, ИИ-компьютеры, мониторы 5K и новая экосистема для локального ИИ

На выставке Computex 2026 компания MSI устроила одну из самых масштабных презентаций за последние годы.

| 19.04
Инженер создал лазерную систему с ИИ для автоматической борьбы с комарами

Энтузиаст разработал экспериментальную систему, которая использует искусственный интеллект, компьютерное зрение и лазер для автоматического обнаружения и уничтожения насекомых.