Эксперты сообщили о возможности генерации запрещенного контента в ChatGPT

21.06.26

Публичные версии ChatGPT, по данным исследователей, могут в отдельных случаях генерировать контент, который выходит за рамки установленных правил безопасности, включая сцены насилия и сексуализированные изображения. Об этом сообщает BBC со ссылкой на отчет британского стартапа Mindgard, специализирующегося на кибербезопасности в сфере искусственного интеллекта.

В рамках исследования специалисты заявили, что им удалось добиться подобных результатов за счет незначительных модификаций стандартных пользовательских запросов, которые обычно применяются для создания безобидного или развлекательного контента. По их словам, такие изменения могут влиять на поведение модели и приводить к нежелательной генерации.

Ответ разработчиков и меры безопасности

Компания OpenAI заявила, что после ознакомления с выводами исследования внедрила дополнительные защитные механизмы, направленные на снижение вероятности генерации запрещенного контента. В компании подчеркивают, что работа над системами фильтрации и безопасности ведется непрерывно и адаптируется к новым сценариям злоупотреблений.

В Mindgard отмечают, что даже после обновлений системы отдельные вариации подходов к формулировке запросов могут сохранять риск обхода ограничений, хотя конкретные методы в публичном доступе не раскрываются.

Примеры выявленного поведения системы

По данным исследователей, в ходе тестирования были получены изображения, которые они охарактеризовали как крайне жестокие и местами сексуализированные. Основатель Mindgard Питер Гарраган заявил, что увиденные результаты выглядели «глубоко тревожными» и иногда сочетали элементы насилия и сексуального контекста в одном изображении.

Другой участник исследования, специалист по безопасности ИИ Джим Найтингейл, сообщил, что был эмоционально шокирован результатами тестов, упомянув сцены с тяжелыми травмами и изображениями погибших людей.

Спор вокруг устойчивости ограничений ИИ

Несмотря на заявления OpenAI об устранении выявленных проблем, исследователи утверждают, что альтернативные формулировки запросов могут по-прежнему приводить к нежелательным результатам генерации. По их оценке, дальнейшие эксперименты могут выявить дополнительные сценарии, в которых система ведет себя непредсказуемо.

В Mindgard подчеркивают, что подобные случаи требуют дальнейшего изучения, поскольку они поднимают вопрос о границах надежности современных систем искусственного интеллекта и устойчивости их механизмов безопасности.

Не пропустите интересное!

Підписывайтесь на наши каналы и читайте анонсы хай-тек новостей, тестов и обзоров в удобном формате!

Мы в Facebook Мы в Instagram Мы в Telegram

Добавить комментарий Отменить ответ

Статьи & тесты

03.11.25
Обзор смартфона Oppo A6 Pro: амбициозный

1 220

Новый смартфон Oppo A6 Pro — телефон среднего уровня с функциональностью смартфонов премиум-класса. Производитель наделил его множеством характеристик, присущих более дорогим телефонам. Но не обошлось и без компромиссов. Как именно сбалансирован Oppo A6 Pro – расскажем в обзоре.

06.07.26
Обзор наушников Sony WF-1000XM6: на всю мощность

Новые наушники Sony WF-1000XM6 несколько изменили форму по сравнению с предшественником, получили новый процессор, улучшенную систему шумопоглощения, больше микрофонов и в целом технически осуществили заметный шаг вперед.

06.07.26 | 05.06
Обзор наушников Sony WF-1000XM6: на всю мощность

01.07.26 | 05.19
Обзор набора беспроводных клавиатуры и мыши Logitech MX Keys S Combo

19.05.26 | 06.06
One UI 8.5: новая жизнь старых смартфонов Samsung — что даёт обновление?

11.05.26 | 05.00
Обзор клавиатуры Logitech G512 X 75: максимизированная утонченность

27.04.26 | 06.05
Infinix GT 50 Pro распаковка: игровой монстр с жидкостным охлаждением и триггерами

14.04.26 | 13.50
Samsung Galaxy A37 и A57 — сравнение: за что переплачивать €100?

16.03.26 | 05.00
Тест ноутбука Acer Predator Helios 18 AI (PH18-73): уровень — бог

12.03.26 | 05.05
Обзор мышки Logitech G PRO X2 Superstrike Lightspeed: индивидуальное решение

09.03.26 | 06.05
Защита сайта от фаззинга: Вас ломают, пока вы спите

02.03.26 | 05.23
Обзор ноутбука Acer Nitro Lite 16 (NL16-71G): универсальный и симпатичный

23.02.26 | 05.48
Обзор смартфона Oppo Reno 15 5G: уверенный

17.02.26 | 22.00
Обзор наушников Logitech G G325: надежно и надолго

02.02.26 | 05.04
Обзор смартфона Poco M8 Pro: можно позволить больше

26.01.26 | 05.05
Источники автономного питания для дома: инверторы, аккумуляторы, солнечные панели

29.12.25 | 05.30
Топ новостей 2025 года сайта hi-tech.ua

Новости

13.07.26 | 19.09
AMD Zen 6: мощный прорыв в серверных вычислениях и ИИ

AMD официально подтвердила скорый анонс новой архитектуры Zen 6. Первыми представителями линейки станут серверные процессоры EPYC под кодовым именем Venice.

13.07.26 | 17.05
ASUS ROG Raikiri II Pro: передовой геймпад с LED-экраном и технологией SpeedNova

ROG Raikiri II Pro — флагманский контроллер с инновационным LED-дисплеем, частотой опроса 8000 Гц и модульной конструкцией стиков.

13.07.26 | 19.09
AMD Zen 6: мощный прорыв в серверных вычислениях и ИИ

13.07.26 | 17.05
ASUS ROG Raikiri II Pro: передовой геймпад с LED-экраном и технологией SpeedNova

13.07.26 | 15.06
Bigme Hibreak Dual 2: смартфон с двумя экранами, 80 Гц E Ink и производительной начинкой

13.07.26 | 14.48
Игровой смартфон ZTE Nubia Neo 5 GT Special Edition: продвинутое охлаждение и высокая мощность

13.07.26 | 13.02
Samsung Galaxy Watch 9 и Watch Ultra 2: новый чип Qualcomm и мощный аккумулятор

13.07.26 | 10.06
Ремейк Assassin’s Creed: Black Flag Resynced ставит рекорды продаж

13.07.26 | 09.06
Acer анонсировала смартфон Sospiro A15: необычный дизайн и второй экран на задней панели

13.07.26 | 08.03
Бесплатный VPN на Android: почему ваша защита — это иллюзия

13.07.26 | 07.05
Samsung Health предлагает выбор: данные для ИИ или ограничения в приложении

13.07.26 | 06.23
Без следов сгиба: реальное видео экрана Samsung Galaxy Z Fold 8 Ultra

12.07.26 | 20.29
SpaceX раскрыла характеристики системы охлаждения для орбитальных дата-центров Starmind

12.07.26 | 18.05
Попытка устроить GTA в роботакси закончилась задержанием

12.07.26 | 15.45
LEGO представила детализированный конструктор космического телескопа Hubble

12.07.26 | 14.01
Хирургия будущего: ученые провели первые операции с помощью гуманоидных роботов

12.07.26 | 12.32
Новый смартфон Hisense A10: E-Ink дисплей и уникальный съемный экран