Каждый десятый ответ — ошибка: исследование поставило под сомнение точность ИИ-ответов Google
12.04.26
Функция автоматических ответов в поиске Google, основанная на искусственном интеллекте, демонстрирует высокий уровень точности, однако сохраняется заметная доля ошибок. По результатам исследования, около 10% ответов оказываются недостоверными, что в масштабах поисковой системы означает огромный поток некорректной информации.
Как работает AI Overviews
AI Overviews — это инструмент Google, который формирует краткие ответы на запросы пользователей с помощью ИИ-моделей семейства Gemini. Впервые технология появилась в 2024 году, а затем начала активно распространяться на глобальном уровне, включая украинский рынок.
Система анализирует данные из различных источников и выдает сжатую сводку, позволяя пользователям быстрее получать нужную информацию без перехода по ссылкам.
Результаты исследования
Совместное исследование The New York Times и стартапа Oumi показало, что в среднем около 90% ответов AI Overviews являются корректными. Тем не менее, примерно один из десяти случаев содержит ошибки или вводящую в заблуждение информацию.
Проверка проводилась с использованием теста SimpleQA — набора из четырёх тысяч вопросов, разработанного OpenAI. Сравнение показало, что после обновления моделей точность выросла: ранее показатель составлял около 85%, а затем превысил 90%.
Однако даже такой уровень точности вызывает вопросы, если учитывать масштаб использования поисковой системы. В пересчёте на общее количество запросов речь может идти о миллионах неточных ответов каждый час.
Примеры неточностей
В отчёте приводятся конкретные случаи ошибок. Например, при запросе о дате превращения дома Боба Марли в музей система ссылалась на источники без точных данных или с некорректной информацией.
В другом случае ИИ утверждал, что не существует определённого музыкального учреждения, несмотря на то, что сам же ссылался на его официальный сайт. Такие противоречия подчеркивают проблему надёжности автоматически сгенерированных ответов.
Позиция Google
В Google не согласились с выводами исследования и указали на недостатки методологии. Представители компании заявили, что использованный тест может содержать ошибки и не отражает реальные пользовательские запросы.
По словам компании, для внутренней оценки применяется собственная версия тестирования с более тщательно проверенными данными, что даёт более точное представление о качестве системы.
Почему оценить ИИ сложно
Оценка точности генеративных моделей остаётся непростой задачей. Разные тесты дают разные результаты, а сами системы могут по-разному отвечать на один и тот же вопрос.
Кроме того, AI Overviews не опирается на одну конкретную модель — система динамически выбирает наиболее подходящий алгоритм для каждого запроса. Более точные модели требуют больше ресурсов, поэтому используются не всегда.
Главный риск — доверие пользователей
Несмотря на заметный прогресс, ключевая проблема заключается в восприятии пользователями. Многие склонны доверять ответам ИИ без дополнительной проверки, даже если в них могут содержаться ошибки.
Использование данных из интернета действительно повышает точность, однако одновременно увеличивает риск распространения недостоверной информации.
И хотя Google предупреждает о возможных ошибках в сгенерированных ответах, на практике далеко не все пользователи перепроверяют полученные данные.
Не пропустите интересное!
Підписывайтесь на наши каналы и читайте анонсы хай-тек новостей, тестов и обзоров в удобном формате!
Обзор смартфона Oppo A6 Pro: амбициозный
Новый смартфон Oppo A6 Pro — телефон среднего уровня с функциональностью смартфонов премиум-класса. Производитель наделил его множеством характеристик, присущих более дорогим телефонам. Но не обошлось и без компромиссов. Как именно сбалансирован Oppo A6 Pro – расскажем в обзоре.
Обзор набора беспроводных клавиатуры и мыши Logitech MX Keys S Combo
Logitech MX Keys S Combo включает топовую мышку, клавиатуру и подставку для рук, обеспечивая хорошую эргономику, качество исполнения и широкие функциональные возможности при работе с несколькими устройствами.
Google Translate конкурент Duolingo: новые виджеты для изучения языков
Разработчики Google готовят обновление, которое добавит виджет Practice streak в мобильное приложение Google Translate.
Apple экстренно обновила iOS, iPadOS и macOS, устранив более 25 критических уязвимостей
Apple экстренно выпустила патчи безопасности 26.5.2 для iOS, iPadOS и macOS. Исправления более 25 уязвимостей обусловлены необходимостью защитить пользователей от ускоренного создания вредоносного ПО с помощью ИИ


