Meta зустрінеться у суді з групою авторів у справі про використання матеріалів для навчання ШІ

Meta боротиметься з групою американських авторів у суді в одному з перших великих юридичних випробувань щодо того, чи можуть технологічні компанії використовувати матеріали, захищені авторським правом, для навчання своїх потужних моделей штучного інтелекту.

Про це пише Financial Times.

Справа, яку порушили близько десятка авторів, включно з Та-Нехісі Коутса та Річарда Кадрі, зосереджена навколо використання гігантом соціальних мереж вартістю 1,4 трильйона доларів LibGen, так званої тіньової бібліотеки з мільйонами книг, академічних статей та коміксів, для навчання своїх моделей штучного інтелекту Llama.

Це рішення матиме далекосяжні наслідки в запеклій боротьбі за авторські права між художниками та групами штучного інтелекту та є одним із низки судових позовів по всьому світу, в яких технологічні групи стверджують, що використовують контент без дозволу.

Microsoft, OpenAI та Anthropic також стикаються з аналогічними юридичними викликами щодо даних, що використовуються для навчання великих мовних моделей, які лежать в основі їхніх популярних чат-ботів зі штучним інтелектом, таких як ChatGPT та Claude.

“Моделі штучного інтелекту були навчені на сотнях тисяч, якщо не мільйонах книг, завантажених з відомих піратських сайтів, це не було випадковістю. Автори мали б отримувати за це ліцензійні збори”, – сказала Мері Разенбергер, виконавчий директор Гільдії авторів. 

Meta стверджує, що використання матеріалів, захищених авторським правом, для навчання LLM є “добросовісним використанням”, якщо вони використовуються для розробки трансформаційної технології, навіть якщо вони походять з піратських баз даних. LibGen розміщує значну частину свого контенту без дозволу правовласників. У судових документах Meta зазначає, що “використання було добросовісним незалежно від способу його отримання”.

Згідно з судовими документами, американський технологічний гігант розпочав ранні переговори з видавцями книг, вивчаючи варіанти ліцензування матеріалів для навчання своїх моделей. Позивачі стверджують, що Meta відмовилася від цього, оскільки твори були доступні через LibGen, що призвело до втрати компенсації та контролю для авторів.

Meta заявила: “Якщо ми ліцензуємо одну [sic] книгу, ми не зможемо покладатися на стратегію добросовісного використання”. Meta стверджує на свій захист, що не існує ринку для ліцензування таких творів для цієї мети.

Однак, електронні листи, виявлені в процесі розслідування судом, показують, що співробітники Meta натякають на те, що вони потрапляють у юридичну сіру зону та, ймовірно, обговорюють, як уникнути перевірки під час використання LibGen, згідно з документами позову.

В одному з електронних листів від січня минулого року Джоель Піно, нещодавно звільнена керівник дослідницької лабораторії FAIR компанії Meta, рекомендувала використовувати набір даних LibGen.


Джерело: Meta зустрінеться у суді з групою авторів у справі про використання матеріалів для навчання ШІ

Схоже