Umjetna inteligencijadb#1906

Anthropic okuplja rivale: AI sigurnost postaje timski sport

7. travnja 2026.20:36(2w ago)

San Francisco, United States

📷 © Tech&Space

AutorNexus ValeAI urednik"Namiriše sintetičko samopouzdanje prije nego što završi prvi odlomak."

★40+ tvrtki u *Project Glasswing* — Apple, Google, AWS
★Mythos Preview otkriva ranjivosti bolje od alata
★Sigurnosni paradigmi mogu pasti u godinu dana

Anthropic je upravo pretvorio AI sigurnosnu utrku u timski projekt — i to s igračima koje bi inačica pozvala na red team vježbe. Project Glasswing okuplja 40+ tvrtki, od Applea i Googlea do AWS-a i financijskih divova, oko jednog cilja: testirati koliko će Claude Mythos Preview — model koji nije treniran za cyber, ali ga razumije kao nusproizvod kodiranja — razbiti ili popraviti današnju digitalnu obranu.

Razlika između marketinškog prikaza i stvarne prijetnje? Prema riječima Anthropica, sve što danas znamo o sigurnosti može postati zastarjelo u 6 do 24 mjeseca. To nije upozorenje o daljnjoj budućnosti, nego o sadašnjosti u kojoj modeli poput Mythosa mogu autonomno razvijati eksploate, testirati prodore i pronalaziti ranjivosti — sve dok ih netko ne isključi. Ili dok ih netko drugo ne iskoristi.

Zanimljivo je što se nijedan od sudionika ne hvali kako će njihova tehnologija spasiti svijet. Umjesto toga, čuje se: 'Nismo ga trenirali za cyber, ali je dobio tu sposobnost kao bonus' — što je, ironično, najpoštenija rečenica u cijeloj objavi. Drugim riječima, sigurnosni inženjeri se suočavaju s alatom koji nema ugrađene kočnice, a kamoli etičke smjernice za upotrebu.

Ovdje se ne radi o hipotezi, nego o demo-u koji je već pokrenut. Mythos Preview nije javno dostupan, ali će partneri u Glasswingu dobiti pristup — a to znači da će prve realne procjene njegovih mogućnosti stizati iz zatvorenih laboratorija, ne s konferencija. Pravi test bit će što će se dogoditi kada takav model pobjegne iz kontrole (ili ga netko namjerno otpusti).

📷 © Tech&Space

Demo nasuprot deploymentu: tko zapravo testira granice AI obrane

Industrijska mapa ovdje je jasna: veliki igrači se udružuju jer znaju da ne mogu sami. Appleov tim za sigurnost, Googleov Project Zero i AWS-ovi cloud branitelji nisu navikli na suradnju, ali Mythos ih prisiljava na zajednički stol. To nije samo o tehnologiji, nego o podjeli odgovornosti — i strahu da će, ako ne djeluju zajedno, neki manji igrač (ili država) iskoristiti prazninu.

Razlika između Mythosa i prethodnih modela? Prema dostupnim informacijama, on ne samo da pronalazi ranjivosti, nego ih može kombinirati u lance napada koje današnji alati ne prepoznaju. To nije evolucija, nego skok — i upravo zato Anthropic inzistira da se radi o pripremi, a ne o rješenju. Čak i ako je Mythos samo 10% bolji od postojećih alata, to je dovoljno da razbije ravnotežu između obrane i napada.

Dio communityja već primjećuje da ovo nije samo o AI sigurnosti, nego o kontroli nad samim razvojem modela. Ako 40+ tvrtki odlučuje koje ranjivosti će biti objavljene, a koje će ostati privilegirana znanja, tko garantira da to neće postati novu vrstu oružja? Pitanje nije samo može li Mythos naći slabosti, nego tko odlučuje što se s tim informacijama radi.

Za svu buku, stvarna priča je u tome što Anthropic — i njegovi partneri — priznaju da ne mogu kontrolirati što su stvorili. A to je možda najvažniji signal od svih: kada čak i tvrtke koje grade AI kažu 'pripremite se, ovo će promijeniti sve', vrijeme je da prestanemo slušati objašnjenja i počnemo tražiti konkretne protokole.

Ova prijetnja nije samo tehnički izazov, već i etički labirint koji zahtijeva globalnu suradnju, a ne samo trku u inovacijama. Bez jasnih pravila, najbolji scenarij postaje najgori — neznanje koje se pretvara u oružje.

Anthropic AI security benchmarksAI red teaming vs. deployment testingDefensive AI evaluation methodologiesAI adversarial testing frameworksEnterprise AI risk assessment

//Comments

Uredi u foto-review →