OpenAI видалила 100 000 книг на яких тренували GPT-3 щоб не платити за авторські права

OpenAI

 

Протягом кількох місяців Гільдія письменників (Authors Guild) просила OpenAI надати інформацію про використані набори даних. Спочатку компанія відмовляла, мотивуючи це положеннями про конфіденційність. Потім з’ясувалося, що вона видалила всі копії цих даних.

 

У технічному документі 2020 OpenAI описала набори даних books1 і books2 як «корпус книг з Інтернету» і заявив, що в цілому це 16% навчальних даних, які були використані при створенні GPT-3. У документі також йдеться, що «books1» та «books2» разом містили 67 мільярдів токенів, або приблизно 50 мільярдів слів.

 

Також у документах йдеться про те, що двоє дослідників, які створили набори даних «books1» та «books2», більше не працюють у OpenAI. OpenAI відмовляється розкривати інформацію про них, хоча Authors Guild наполягає на цьому.

 

У свою чергу OpenAI звернулася до суду із проханням зберегти імена співробітників, а також інформацію про набори даних.

 

Довідка

 

Authors Guild – найстаріша (створена в 1912 році) і найавторитетніша професійна організація письменників США. Займається захистом свободи слова та авторських прав.

 

Навчальні дані є важливою частиною потужних моделей ІІ. Для побудови цих моделей OpenAI та інші компанії використовують дані з Інтернету, зокрема книги. Багато компаній, які створили цю інформацію, хочуть отримувати гроші за надання інформації для нових продуктів ІІ. Технологічні компанії не хочуть, щоби їх змушували платити роялті. Наразі ця суперечка вирішується в суді за декількома позовами.


Не пропустіть цікаве!

Підписуйтесь на наші канали та читайте анонси хай-тек новин, тестів та оглядів у зручному форматі!

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *





Статті & тестиArticles

Кращі спортивні смарт-годинники в 2025 році Honor Watch 4 Pro

Порівняємо трьох цікавих представників спортивного класу смарт-годинників — Samsung Galaxy Watch 7 Ultra, Garmin Instinct 3 та Amazfit T-Rex 3 Pro. Рекомендації щодо вибору цих спортивних смарт-годинників – який для кого.


Замість iPhone и Samsung. Флагмани Vivo, OnePlus, Oppo 2025 року iphone cases ai

Нам стало цікаво чи можна знайти гідну альтернативу топовим смартфонам ведучих брендів/ Важливою перевагою топових смартфонів OnePlus, Vivo та Oppo є їхня ціна


НовиниNews
| 16.14
Xiaomi G27Qi 2026 із частотою 200 Гц та підтримкою HDR400 коштує €200  
Xiaomi G27Qi 2026

Xiaomi G27Qi 2026 оснащена 27-дюймовою Fast IPS-матрицею з роздільною здатністю 2560×1440 пікселів (2K), що забезпечує широкі кути огляду до 178°

| 13.02
Гібридні Porsche отримають особливий електродвигун  
Porsche 911 Carrera S 2025 1

Porsche подала до Всесвітньої організації інтелектуальної власності патентну заявку на гібридну силову установку