OpenAI удалила 100 000 книг на которых тренировали GPT-3 чтобы не платить за авторские права
11.05.24
В течение нескольких месяцев Гильдия писателей (Authors Guild) просила OpenAI предоставить информацию об использованных наборах данных. Сначала компания отказывала, мотивируя это положениями о конфиденциальности Затем выяснилось, что она удалила все копии этих данных.
В техническом документе 2020 года OpenAI описала наборы данных books1 и books2 как «корпус книг из Интернета» и заявил, что в целом это 16% учебных данных, которые были использованы при создании GPT-3. В документе также говорится, что «books1» и «books2» вместе содержали 67 миллиардов токенов, или примерно 50 миллиардов слов.
Также в документах говорится о том, что двое исследователей, которые создали наборы данных «books1» и «books2», больше не работают в OpenAI. OpenAI отказывается раскрывать информацию о них, хотя и Authors Guild настаивает на этом.
В свою очередь OpenAI обратилась в суд с просьбой сохранить имена сотрудников, а также информацию о наборах данных.
Справка
Authors Guild — старейшая (создана в 1912 году) и самая авторитетная профессиональная организация писателей США. Занимается защитой свободы слова и авторских прав.
Учебные данные являются важной частью мощных моделей ИИ. Для построения этих моделей OpenAI и другие компании используют данные из Интернета, в том числе и книги. Многие компании, которые создали эту информацию, хотят получать деньги за предоставление информации для новых продуктов ИИ. Технологические компании не хотят, чтобы их заставляли платить роялти. Сейчас этот спор решается в суде по нескольким искам.
Не пропустите интересное!
Підписывайтесь на наши каналы и читайте анонсы хай-тек новостей, тестов и обзоров в удобном формате!
Ультратонкие ноутбуки 2025 года — обзор лучших
Одними из самых заметных представителей этого класса стали Apple MacBook Air 13 M4, Dell XPS 13 9345 и Lenovo ThinkPad X1 Carbon Gen 12. Ниже сравнение их ключевых характеристик, сильных и слабых сторон.
SpaceX совершила 100-й запуск ракеты Falcon 9 в 2025 году SpaceX космос
Ракета SpaceX Falcon 9 стартовала с базы Космических сил Ванденберга в Калифорнии и вывела на низкую околоземную орбиту ещё 28 аппаратов.
Китайцы представили робо пса Rover X1 за $1000 Китай робот
«Первый в мире интеллектуальный домашний робопёс» от Yuejiang Robotics оценивается примерно в $1000


