OpenAI видалила 100 000 книг на яких тренували GPT-3 щоб не платити за авторські права
11.05.24
Протягом кількох місяців Гільдія письменників (Authors Guild) просила OpenAI надати інформацію про використані набори даних. Спочатку компанія відмовляла, мотивуючи це положеннями про конфіденційність. Потім з’ясувалося, що вона видалила всі копії цих даних.
У технічному документі 2020 OpenAI описала набори даних books1 і books2 як «корпус книг з Інтернету» і заявив, що в цілому це 16% навчальних даних, які були використані при створенні GPT-3. У документі також йдеться, що «books1» та «books2» разом містили 67 мільярдів токенів, або приблизно 50 мільярдів слів.
Також у документах йдеться про те, що двоє дослідників, які створили набори даних «books1» та «books2», більше не працюють у OpenAI. OpenAI відмовляється розкривати інформацію про них, хоча Authors Guild наполягає на цьому.
У свою чергу OpenAI звернулася до суду із проханням зберегти імена співробітників, а також інформацію про набори даних.
Довідка
Authors Guild – найстаріша (створена в 1912 році) і найавторитетніша професійна організація письменників США. Займається захистом свободи слова та авторських прав.
Навчальні дані є важливою частиною потужних моделей ІІ. Для побудови цих моделей OpenAI та інші компанії використовують дані з Інтернету, зокрема книги. Багато компаній, які створили цю інформацію, хочуть отримувати гроші за надання інформації для нових продуктів ІІ. Технологічні компанії не хочуть, щоби їх змушували платити роялті. Наразі ця суперечка вирішується в суді за декількома позовами.
Не пропустіть цікаве!
Підписуйтесь на наші канали та читайте анонси хай-тек новин, тестів та оглядів у зручному форматі!
Огляд смартфона Oppo A6 Pro: амбітний
Новий смартфон Oppo A6 Pro – середнячок з функціональністю смартфонів преміум-класу. Виробник наділив його кількома характеристиками, властивими більш дорожчим телефонам. Але не обійшлось і без компромісів. Як саме збалансований Oppo A6 Pro – розповімо в огляді.
One UI 8.5: нове життя старих смартфонів Samsung — що дає оновлення?
One UI 8.5 дає старим смартфонам Samsung Galaxy функції, які ще зовсім недавно були ексклюзивом тільки для нових флагманів. Але чи справді це оновлення здатне зробити Galaxy S22, S23 і S24 ближчими до рівня Galaxy S26? Розбираємося, що саме змінюється після встановлення нової прошивки.
У Китаї роботам почали видавати «цифрові паспорти»: гуманоїди отримали 29-значні ID
Китай ввів національну систему цифрової ідентифікації для гуманоїдних роботів, зробивши черговий крок до формування централізованого регулювання індустрії, що швидко зростає.
MSI на Computex 2026: ноутбуки з RTX 5090, ШІ-комп’ютери, монітори 5K та нова екосистема для локального ШІ
На виставці Computex 2026 компанія MSI влаштувала одну з наймасштабніших презентацій за останні роки.


