OpenAI удалила 100 000 книг на которых тренировали GPT-3 чтобы не платить за авторские права
11.05.24
В течение нескольких месяцев Гильдия писателей (Authors Guild) просила OpenAI предоставить информацию об использованных наборах данных. Сначала компания отказывала, мотивируя это положениями о конфиденциальности Затем выяснилось, что она удалила все копии этих данных.
В техническом документе 2020 года OpenAI описала наборы данных books1 и books2 как «корпус книг из Интернета» и заявил, что в целом это 16% учебных данных, которые были использованы при создании GPT-3. В документе также говорится, что «books1» и «books2» вместе содержали 67 миллиардов токенов, или примерно 50 миллиардов слов.
Также в документах говорится о том, что двое исследователей, которые создали наборы данных «books1» и «books2», больше не работают в OpenAI. OpenAI отказывается раскрывать информацию о них, хотя и Authors Guild настаивает на этом.
В свою очередь OpenAI обратилась в суд с просьбой сохранить имена сотрудников, а также информацию о наборах данных.
Справка
Authors Guild — старейшая (создана в 1912 году) и самая авторитетная профессиональная организация писателей США. Занимается защитой свободы слова и авторских прав.
Учебные данные являются важной частью мощных моделей ИИ. Для построения этих моделей OpenAI и другие компании используют данные из Интернета, в том числе и книги. Многие компании, которые создали эту информацию, хотят получать деньги за предоставление информации для новых продуктов ИИ. Технологические компании не хотят, чтобы их заставляли платить роялти. Сейчас этот спор решается в суде по нескольким искам.
Не пропустите интересное!
Підписывайтесь на наши каналы и читайте анонсы хай-тек новостей, тестов и обзоров в удобном формате!

Обзор смартфона Poco X7 Pro: потенциал



Купить смартфон Poco X7 Pro стало возможным совсем недавно. Как выяснилось, это довольно интересный аппарат бренда с хорошим процессором, достаточным объемом памяти, защитой корпуса и оптической стабилизацией у камеры. Но есть и нюансы. Посмотрим, как они влияют на опыт использования

Спекулянты взвинтили цены видеокарты Nvidia GeForce RTX 5090 до $9000 GeForce RTX Nvidia бизнес видеокарта
На Тайване, который является одним из ключевых рынков для графических процессоров, видеокарты GeForce RTX 5090 уже продаются по цене 300 000 новых тайваньских долларов, что эквивалентно 9100 долларам США
Aston Martin снова в «24 часа Ле-Мана» с Valkyrie LMH на V12 автомобиль спорт
Aston Martin представил новый гиперкар Valkyrie LMH, который в 2025 году примет участие в гонке «24 часа Ле-Мана». Этот шаг станет первой попыткой британского автопроизводителя завоевать победу в общем зачёте