OpenAI удалила 100 000 книг на которых тренировали GPT-3 чтобы не платить за авторские права
11.05.24
В течение нескольких месяцев Гильдия писателей (Authors Guild) просила OpenAI предоставить информацию об использованных наборах данных. Сначала компания отказывала, мотивируя это положениями о конфиденциальности Затем выяснилось, что она удалила все копии этих данных.
В техническом документе 2020 года OpenAI описала наборы данных books1 и books2 как «корпус книг из Интернета» и заявил, что в целом это 16% учебных данных, которые были использованы при создании GPT-3. В документе также говорится, что «books1» и «books2» вместе содержали 67 миллиардов токенов, или примерно 50 миллиардов слов.
Также в документах говорится о том, что двое исследователей, которые создали наборы данных «books1» и «books2», больше не работают в OpenAI. OpenAI отказывается раскрывать информацию о них, хотя и Authors Guild настаивает на этом.
В свою очередь OpenAI обратилась в суд с просьбой сохранить имена сотрудников, а также информацию о наборах данных.
Справка
Authors Guild — старейшая (создана в 1912 году) и самая авторитетная профессиональная организация писателей США. Занимается защитой свободы слова и авторских прав.
Учебные данные являются важной частью мощных моделей ИИ. Для построения этих моделей OpenAI и другие компании используют данные из Интернета, в том числе и книги. Многие компании, которые создали эту информацию, хотят получать деньги за предоставление информации для новых продуктов ИИ. Технологические компании не хотят, чтобы их заставляли платить роялти. Сейчас этот спор решается в суде по нескольким искам.
Не пропустите интересное!
Підписывайтесь на наши каналы и читайте анонсы хай-тек новостей, тестов и обзоров в удобном формате!
Обзор Asus Zenbook S 16 (UM5606): новая волна
Новый ноутбук Asus Zenbook S 16 выполнен в корпусе из необычного металла, построен на базе свежей платформы AMD, адаптированной для ИИ, и имеет отличную автономность. Расскажем об этом премиальном ноутбуке подробнее
5 причин приобрести восстановленный Айфон iPhone
Восстановленные смартфоны Эппл маркируются пометкой «refurbished». Внешне и по функционалу они как новые: сохраняется дизайн и производительность. В отличие от бэушных устройств, у REF-Айфонов полноценная официальная гарантия. Это не единственное преимущество.
Akash System использует алмазы для охлаждения процессоров в дата-центрах, космической и военной технике процессор разработка
Akash System заключила меморандум с Министерством торговли США, рассчитывая на $18,2 миллиона прямого финансирования и $50 миллионов налоговых льгот. Дополнительно стартап уже привлек $18 миллионов от венчурных инвесторов.