Каждый десятый ответ — ошибка: исследование поставило под сомнение точность ИИ-ответов Google

12.04.26

Функция автоматических ответов в поиске Google, основанная на искусственном интеллекте, демонстрирует высокий уровень точности, однако сохраняется заметная доля ошибок. По результатам исследования, около 10% ответов оказываются недостоверными, что в масштабах поисковой системы означает огромный поток некорректной информации.

Как работает AI Overviews

AI Overviews — это инструмент Google, который формирует краткие ответы на запросы пользователей с помощью ИИ-моделей семейства Gemini. Впервые технология появилась в 2024 году, а затем начала активно распространяться на глобальном уровне, включая украинский рынок.

Система анализирует данные из различных источников и выдает сжатую сводку, позволяя пользователям быстрее получать нужную информацию без перехода по ссылкам.

Результаты исследования

Совместное исследование The New York Times и стартапа Oumi показало, что в среднем около 90% ответов AI Overviews являются корректными. Тем не менее, примерно один из десяти случаев содержит ошибки или вводящую в заблуждение информацию.

Проверка проводилась с использованием теста SimpleQA — набора из четырёх тысяч вопросов, разработанного OpenAI. Сравнение показало, что после обновления моделей точность выросла: ранее показатель составлял около 85%, а затем превысил 90%.

Однако даже такой уровень точности вызывает вопросы, если учитывать масштаб использования поисковой системы. В пересчёте на общее количество запросов речь может идти о миллионах неточных ответов каждый час.

Примеры неточностей

В отчёте приводятся конкретные случаи ошибок. Например, при запросе о дате превращения дома Боба Марли в музей система ссылалась на источники без точных данных или с некорректной информацией.

В другом случае ИИ утверждал, что не существует определённого музыкального учреждения, несмотря на то, что сам же ссылался на его официальный сайт. Такие противоречия подчеркивают проблему надёжности автоматически сгенерированных ответов.

Позиция Google

В Google не согласились с выводами исследования и указали на недостатки методологии. Представители компании заявили, что использованный тест может содержать ошибки и не отражает реальные пользовательские запросы.

По словам компании, для внутренней оценки применяется собственная версия тестирования с более тщательно проверенными данными, что даёт более точное представление о качестве системы.

Почему оценить ИИ сложно

Оценка точности генеративных моделей остаётся непростой задачей. Разные тесты дают разные результаты, а сами системы могут по-разному отвечать на один и тот же вопрос.

Кроме того, AI Overviews не опирается на одну конкретную модель — система динамически выбирает наиболее подходящий алгоритм для каждого запроса. Более точные модели требуют больше ресурсов, поэтому используются не всегда.

Главный риск — доверие пользователей

Несмотря на заметный прогресс, ключевая проблема заключается в восприятии пользователями. Многие склонны доверять ответам ИИ без дополнительной проверки, даже если в них могут содержаться ошибки.

Использование данных из интернета действительно повышает точность, однако одновременно увеличивает риск распространения недостоверной информации.

И хотя Google предупреждает о возможных ошибках в сгенерированных ответах, на практике далеко не все пользователи перепроверяют полученные данные.

Не пропустите интересное!

Підписывайтесь на наши каналы и читайте анонсы хай-тек новостей, тестов и обзоров в удобном формате!

Мы в Facebook Мы в Instagram Мы в Telegram

Добавить комментарий Отменить ответ

Статьи & тесты

03.11.25
Обзор смартфона Oppo A6 Pro: амбициозный

1 233

Новый смартфон Oppo A6 Pro — телефон среднего уровня с функциональностью смартфонов премиум-класса. Производитель наделил его множеством характеристик, присущих более дорогим телефонам. Но не обошлось и без компромиссов. Как именно сбалансирован Oppo A6 Pro – расскажем в обзоре.

20.07.26
Logitech Signature Comfort Plus Combo MK880: приоритет на комфорт

Logitech Signature Comfort Plus Combo MK880 – беспроводной набор с клавиатуры и мыши, в котором акцент сделан на комфорте во время многочасовой работы, причем не только за счет эргономики корпуса, но и конструктивных дополений

20.07.26 | 05.20
Logitech Signature Comfort Plus Combo MK880: приоритет на комфорт

06.07.26 | 05.06
Обзор наушников Sony WF-1000XM6: на всю мощность

01.07.26 | 05.19
Обзор набора беспроводных клавиатуры и мыши Logitech MX Keys S Combo

19.05.26 | 06.06
One UI 8.5: новая жизнь старых смартфонов Samsung — что даёт обновление?

11.05.26 | 05.00
Обзор клавиатуры Logitech G512 X 75: максимизированная утонченность

27.04.26 | 06.05
Infinix GT 50 Pro распаковка: игровой монстр с жидкостным охлаждением и триггерами

14.04.26 | 13.50
Samsung Galaxy A37 и A57 — сравнение: за что переплачивать €100?

16.03.26 | 05.00
Тест ноутбука Acer Predator Helios 18 AI (PH18-73): уровень — бог

12.03.26 | 05.05
Обзор мышки Logitech G PRO X2 Superstrike Lightspeed: индивидуальное решение

09.03.26 | 06.05
Защита сайта от фаззинга: Вас ломают, пока вы спите

02.03.26 | 05.23
Обзор ноутбука Acer Nitro Lite 16 (NL16-71G): универсальный и симпатичный

23.02.26 | 05.48
Обзор смартфона Oppo Reno 15 5G: уверенный

17.02.26 | 22.00
Обзор наушников Logitech G G325: надежно и надолго

02.02.26 | 05.04
Обзор смартфона Poco M8 Pro: можно позволить больше

26.01.26 | 05.05
Источники автономного питания для дома: инверторы, аккумуляторы, солнечные панели

Новости

24.07.26 | 17.02
Light Flip: минималистичная раскладушка для цифрового детокса за 300$

Стартап Light представил новый телефон-раскладушку Light Flip с OLED-экраном, созданное для цифрового детокса.

24.07.26 | 13.03
Honor Robot Phone получил поворотную камеру и технологии ARRI

Обзор инновационного смартфона Honor Robot Phone с механическим подвесом, камерами на 200 МП и кинорежимом от ARRI.

24.07.26 | 17.02
Light Flip: минималистичная раскладушка для цифрового детокса за 300$

24.07.26 | 13.03
Honor Robot Phone получил поворотную камеру и технологии ARRI

24.07.26 | 10.02
Raspberry Pi представила 10-дюймовый Touch Display 2 для интерактивных проектов

24.07.26 | 07.04
Lenovo Lecoo AI Mini: компактный мини-ПК с процессором из прошлого

23.07.26 | 19.05
Британское аэротакси Valo совершило первый публичный полет

23.07.26 | 17.02
Volkswagen представил инновационный электровелосипед: безопасность автомобильного уровня

23.07.26 | 13.01
Холодильник для людей в Японии: кабина Do Hiemon Box для борьбы с жарой

23.07.26 | 12.06
Samsung представила Galaxy Watch Ultra 2 и Galaxy Watch 9. Первые впечатления

23.07.26 | 11.02
Samsung выходит на рынок умных очков: представлен гаджет на Android XR

23.07.26 | 10.13
Call of Duty: Modern Warfare 4 получит два этапа тестирования уже в августе

23.07.26 | 07.07
Synthetic Video Detector от NVIDIA поможет СМИ бороться с дипфейками

22.07.26 | 19.03
Мысленный контроль: представлена первая в мире платформа «мозг-робот»

22.07.26 | 17.08
Связь 5G уже работает в Киеве

22.07.26 | 16.05
Представлены складные смартфоны Samsung Galaxy Fold 8, Fold 8 Ultra и Galaxy Flip 8. Первые впечатления

22.07.26 | 13.02
Huawei Smart Door Lock X1: флагманский золотой «умный» замок