Meta zamrzava Mercor: tko sad drži AI tajne?

Meta zamrzava Mercor: tko sad drži AI tajne?📷 © Tech&Space
- ★200 GB baza i 3 TB video materijala u igri
- ★Lapsus$ nudi ukradene podatke na crnom tržištu
- ★Meta i ostali labovi preispituju vanjske dobavljače
Lapsus$ grupa ponovo ulazi u igru, ovaj puta s ponudom od 3 TB ukradenih podataka — uključujući 200 GB baza i gotovo terabajt izvornog koda. Mercor, tvrtka koja opskrbljuje OpenAI, Anthropic i druge AI labove podacima za treniranje, potvrdila je sigurnosni incident 31. ožujka, ali nije precizirala obim.
Meta je reakciju dala brže od većine: pauzirala je sve projekte s Mercorom i zabranila svojim vanjskim suradnicima logiranje sati dok se slučaj ne razjasni. To nije samo problem jedne tvrtke.
Mercor i njegovi konkurenti poput Scale AI ili Surge-a operiraju u visoko tajnom režimu, gdje projekti dobivaju kodna imena, a klijenti poput Meta-e plaćaju milijune za prilagođene skupove podataka. Ako su ti podaci sada na crnom tržištu, pitanje nije samo tko ih je ukrao, već ko ih sve koristi — i što će s njima učiniti.
Dio industrije već reagira. Prema izvorima bliskim slučaju, najmanje tri velike AI laboratorije preispituju ugovore s vanjskim dobavljačima podataka, iako nijedan još nije javno reagirao.
Problem je širi od same krađe: ako su podaci za treniranje — koji često sadrže fine-tuning strategije ili izvore za prikupljanje — kompromitirani, cijeli modeli mogu postati ranjivi na obrnuti inženjering.

Ukradeni podaci za treniranje AI modela ugrožavaju cijelu industriju — a Meta reagira prvom ozbiljnom mjerom📷 © Tech&Space
Ukradeni podaci za treniranje AI modela ugrožavaju cijelu industriju — a Meta reagira prvom ozbiljnom mjerom
Brojevi govore više od najava: 200+ GB baza, 1 TB izvornog koda, 3 TB video zapisa. To nije slučajna krađa korisničkih podataka, već ciljani napad na srce AI industrije.
Grupa koja se predstavlja kao Lapsus$ — isti akteri koji su prošle godine kompromitirali Nvidiju i Microsoft — tvrdi da posjeduje podatke koji uključuju metapodatke o treniranju modela, šablone za ocjenjivanje odgovora, pa čak i interne rasprave o etiketiranju podataka. Realnost je da većina AI labova ne razvija modele u zatvorenom krugu.
Umjesto toga, oslanjaju se na mrežu vanjskih dobavljača poput Mercora koji angažiraju tisuće ljudi širom svijeta za ručno etiketiranje, ocjenjivanje i pripremu podataka. Ako je taj lanac narušen, cijeli proces razvoja usporava — ili postaje riskantniji.
Meta-in potez nije samo preventiva, već signal ostalim igračima: provjerite svoje dobavljače. Najveće pitanje ostaje: koliko od ovoga su stvarni podaci, a koliko bluf?
Lapsus$ je u prošlosti pretjerivao s obujmom ukradenih podataka, ali čak i ako je samo 10% od navedenog točno, to je dovoljno da se cijela industrija zapita — tko sve ima pristup njihovim tajnama, i što će biti sljedeći cilj.