OpenAI судяться через тренування ШІ

Легендарна “Британська Енциклопедія” (Encyclopaedia Britannica) разом зі своєю дочірньою компанією Merriam-Webster виступили з гучною заявою, подавши позов до федерального суду Манхеттена проти OpenAI. Основна претензія – безпідставне, на думку позивачів, використання їхніх авторитетних довідкових матеріалів для тренування потужних моделей штучного інтелекту.

Порушення авторських прав та торгових марок

Як повідомляє видання Reuters, позов включає звинувачення у порушенні авторських прав та прав на торгові марки. “Британніка” стверджує, що OpenAI незаконно скористалася її контентом, захищеним авторським правом, у величезних обсягах, що були використані для навчання ШІ. Ситуація ускладнюється тим, що, за словами представників енциклопедії, відповіді ChatGPT на запити користувачів нерідко містять “повні або часткові дослівні відтворення статей Britannica”, що прямо вказує на неправомірне використання.

“Канібалізація трафіку” та викривлення інформації

У позовній заяві, яка була подана в п’ятницю, детально описується, як OpenAI, компанія, що активно підтримується Microsoft, використовувала онлайн-статті, енциклопедичні записи та словникові визначення Britannica для навчання свого флагманського чат-бота ChatGPT. Мета навчання – забезпечити якісні відповіді на запити користувачів. Проте, позивачі наголошують, що такий підхід призводить до “канібалізації трафіку” на сайтах Britannica, оскільки згенеровані ШІ резюме контенту відволікають користувачів від першоджерела.

Представник OpenAI, коментуючи ситуацію у понеділок, заявив: “Наші моделі сприяють інноваціям, їх навчали на публічно доступних даних та на основі добросовісного використання”. Це стандартна відповідь компаній, що працюють зі штучним інтелектом, які посилаються на доктрину “fair use” (добросовісне використання) для виправдання своїх дій.

Водночас, представники Britannica та їхні юристи поки утримуються від детальних коментарів для преси. Ця справа є однією з багатьох гучних судових баталій між власниками інтелектуальної власності (авторами, виданнями) та технологічними гігантами, що використовують їхні матеріали для навчання нейромереж без належного дозволу.

Суть конфлікту: “Добросовісне використання” проти крадіжки

Технологічні компанії, що розвивають ШІ, наполягають на тому, що їхні системи здійснюють “добросовісне використання”, трансформуючи захищений контент у щось принципово нове. Однак, згідно з позовом Britannica, було незаконно скопійовано близько 100 000 її статей, які пішли на навчання великих мовних моделей GPT. Позов стверджує, що ChatGPT здатен генерувати “майже дослівні” копії енциклопедичних вступів, словникових визначень та іншого контенту Britannica, тим самим відволікаючи потенційних відвідувачів сайтів компанії.

Окрім звинувачень у порушенні авторських прав, Britannica також висуває претензії щодо порушення торгових марок. Модель нібито помилково цитує Britannica як джерело у своїх неточних відповідях (“галюцинаціях”), генеруючи “хибний контент” та створюючи хибне враження, ніби компанія надала дозвіл на таке використання. “Британніка” вимагає від суду присудити невизначену суму грошової компенсації та видати судову заборону, яка б зупинила заявлені порушення.

Представник OpenAI, коментуючи ситуацію виданню Engadget, повторив свою позицію: “ChatGPT допомагає розвивати людську креативність, просувати наукові та медичні дослідження та дозволяє сотням мільйонів людей покращувати щоденне життя. Наші моделі сприяють інноваціям, навчання відбувається на публічно доступних даних та у рамках добросовісного використання”.

Не перший прецедент

Варто зазначити, що це не перший судовий позов Britannica проти компаній, які працюють у сфері ШІ. У вересні компанія, яка володіє Merriam-Webster, подала схожий позов проти стартапу Perplexity AI. Судовий розгляд ще триває. Крім того, OpenAI продовжує боротися в суді з виданням The New York Times, яке також звинувачує компанію в порушенні авторських прав.

Думка ІТ-Блогу: Цей позов від Encyclopaedia Britannica може стати знаковим у боротьбі за інтелектуальну власність в епоху генеративного ШІ. Рішення суду вплине на те, як компанії, що розробляють ШІ, зможуть використовувати загальнодоступний контент у майбутньому, а також на стратегії монетизації контенту для його творців.

Дізнатися більше на: itc.ua

Порушення авторських прав та торгових марок

“Канібалізація трафіку” та викривлення інформації

Суть конфлікту: “Добросовісне використання” проти крадіжки

Не перший прецедент

Залишити відповідьСкасувати відповідь