OpenAI удалила 100 000 книг на которых тренировали GPT-3 чтобы не платить за авторские права
11.05.24
В течение нескольких месяцев Гильдия писателей (Authors Guild) просила OpenAI предоставить информацию об использованных наборах данных. Сначала компания отказывала, мотивируя это положениями о конфиденциальности Затем выяснилось, что она удалила все копии этих данных.
В техническом документе 2020 года OpenAI описала наборы данных books1 и books2 как «корпус книг из Интернета» и заявил, что в целом это 16% учебных данных, которые были использованы при создании GPT-3. В документе также говорится, что «books1» и «books2» вместе содержали 67 миллиардов токенов, или примерно 50 миллиардов слов.
Также в документах говорится о том, что двое исследователей, которые создали наборы данных «books1» и «books2», больше не работают в OpenAI. OpenAI отказывается раскрывать информацию о них, хотя и Authors Guild настаивает на этом.
В свою очередь OpenAI обратилась в суд с просьбой сохранить имена сотрудников, а также информацию о наборах данных.
Справка
Authors Guild — старейшая (создана в 1912 году) и самая авторитетная профессиональная организация писателей США. Занимается защитой свободы слова и авторских прав.
Учебные данные являются важной частью мощных моделей ИИ. Для построения этих моделей OpenAI и другие компании используют данные из Интернета, в том числе и книги. Многие компании, которые создали эту информацию, хотят получать деньги за предоставление информации для новых продуктов ИИ. Технологические компании не хотят, чтобы их заставляли платить роялти. Сейчас этот спор решается в суде по нескольким искам.
Не пропустите интересное!
Підписывайтесь на наши каналы и читайте анонсы хай-тек новостей, тестов и обзоров в удобном формате!
Обзор смартфона Oppo A6 Pro: амбициозный
Новый смартфон Oppo A6 Pro — телефон среднего уровня с функциональностью смартфонов премиум-класса. Производитель наделил его множеством характеристик, присущих более дорогим телефонам. Но не обошлось и без компромиссов. Как именно сбалансирован Oppo A6 Pro – расскажем в обзоре.
Топ новостей 2025 года сайта hi-tech.ua
Традиционно каждый год наша редакция подводит итоги. Лучшие устройства по версии редакции мы показали недавно. Теперь пришло время рассказать о топе новостей сайта hi-tech.ua в 2025 году.
Asus показала обновлённый Zenbook DUO, Zenbook A16 и A14 на CES 2026 Asus CES ZenBook монитор
Компания ASUS в рамках выставки CES 2026 представила обновленную линейку Zenbook, сделав акцент на локальной обработке задач с использованием искусственного интеллекта и высокой портативности устройств.
Какие концепты Lenovo показали на CES 2026 CES Lenovo концепт
На выставке CES 2026 компания Lenovo показала серию концептуальных устройств, которые рассматривает как задел для формирования будущей экосистемы персонального искусственного интеллекта


