Sud će pitati kada AI odgovor prestaje biti sažetak i postaje zamjena za izvor
A courtroom-like editorial archive where an AI answer panel casts light over open Britannica-style reference volumes, with the tension centered on copied knowledge rather than generic AI hardware.📷 AI-generated image / TECH&SPACE
- ★Britannica i Merriam-Webster tvrde da je OpenAI bez dopuštenja koristio njihove referentne tekstove za treniranje modela.
- ★Spor se posebno oslanja na navode da GPT-4 može proizvesti odgovore bitno slične zaštićenom sadržaju.
- ★Ishod bi mogao utjecati na granicu između statističkog učenja, reprodukcije i zamjene za izvorne izdavače.
Encyclopedia Britannica i Merriam-Webster otvorili su novi pravni front protiv OpenAI-ja. Tvrdnje su da je kompanija bez dopuštenja koristila njihov zaštićeni sadržaj za treniranje ChatGPT-a i drugih modela. Prema izvještaju The Vergea, tužba se oslanja na tvrdnju da su odgovori umjetne inteligencije bili substantially similar njihovim tekstovima.
Središnja optužba nije samo da je sadržaj završio u trening skupu. Britannica tvrdi da je GPT-4 memorirao dijelove njezina autorskog materijala i da na zahtjev može proizvesti gotovo doslovne kopije značajnih odlomaka. To je preciznija i neugodnija tvrdnja od opće rasprave o tome smiju li se javno dostupni tekstovi koristiti za treniranje.
Ako se tvrdnje potvrde, spor bi mogao pomaknuti raspravu s apstraktnog pitanja fair usea prema operativnom pitanju izlaza modela. Drugim riječima: nije presudno samo što je model vidio, nego i što može vratiti korisniku kada se ponaša kao zamjena za enciklopediju.
Tužba pomiče spor s trening podataka na pitanje zamjenskih odgovora
A close operational view of a search/answer interface intercepting a user path between a dictionary page, an encyclopedia page and an AI response card.📷 AI-generated image / TECH&SPACE
Britannica dodatno tvrdi da OpenAI time kanibalizira njezin web promet. Razlog je što korisnik dobiva sažet odgovor bez posjeta izvornom izdanju. Taj argument povezuje autorsko pravo s ekonomijom pretraživanja, oglašavanja i pretplata, što je za izdavače jednako važno kao i sama pravna teorija.
Slučaj se uklapa u širi obrazac. Reutersovo izvještavanje, preneseno u The Vergeu, smješta tužbu uz druge postupke u kojima izdavači i autori traže naknadu za korištenje tekstova u AI treniranju. U istraživačkom kontekstu posebno odjekuje i nedavna nagodba Anthropicova spora vrijedna 1,5 milijardi dolara. Pokazuje da sudski rizik više nije rubna stavka.
Ono što još ne znamo jednako je važno: koji će primjeri navodne podudarnosti biti najjači, kako će OpenAI braniti postupak treniranja i hoće li sud razlikovati statističko učenje od reproduciranja. Te granice zvuče tehnički, ali posljedice su društvene. Određuju tko plaća znanje kada ga korisnik više ne čita na izvoru.
U konačnici, stvarno pitanje je može li AI industrija graditi univerzalne odgovore bez jasnog dogovora s institucijama koje su desetljećima gradile pouzdane izvore. Memorija modela ovdje nije metafora, ona je dokazni teren.

