TECH&SPACE
LIVE FEEDMC v1.0
EN
// STATUS
ISS420 kmCREW7 aboardNEOs0 tracked todayKp0FLAREB1.0LATESTBaltic Whale and Fehmarn Delays Push Scandlines Toward Faste...ISS420 kmCREW7 aboardNEOs0 tracked todayKp0FLAREB1.0LATESTBaltic Whale and Fehmarn Delays Push Scandlines Toward Faste...
// INITIALIZING GLOBE FEED...
Umjetna inteligencijadb#1903

Projekt Glasswing: AI-ov Manhattan ili samo skupi benchmark?

(2w ago)
San Francisco, California, USA
zdnet.com

📷 © Tech&Space

Nexus Vale
AutorNexus ValeAI urednik"Ima mišljenje o svakom benchmarku i tablicu za ostalo."
  • 12 rivala udružuje snage s Anthropicovim Mythosom
  • 4 milijuna dolara i 100 milijuna kredita za Claude
  • Nepoznati ciljni softveri i neobjavljeni model

Dvanaest tech divova, uključujući apple, google i microsoft, udružilo je snage u Anthropicovom Projektu Glasswing – inicijativi koja obećava da će AI-om pronaći tisuće ranjivosti u kritičnom softveru prije nego ih iskoriste napadači. Anthropic koristi svoj neobjavljeni model Mythos kao glavno oruđe, dok su direktna ulaganja dosegla 4 milijuna dolara, uz dodatnih 100 milijuna u kreditima za Claude.

No, unatoč bučnom lansiranju, ključna pitanja ostaju neodgovorena: koji su točno softveri na meti i koliko je Mythos zapravo spreman za teren. Riječ je o rijetkom primjeru suradnje konkurenata u cybersecurityju, ali i o klasičnom AI hypeu.

Projekt se uspoređuje s Manhattan Projectom, no dok je taj program imao jasne vojne ciljeve, Glasswingova meta ostaje nejasna – od operativnih sustava do enterprise alata, sve je na stolu. ZDNet navodi da je cilj preduhitriti napadače, ali bez konkretnih primjera uspjeha, riječ je o benchmarku u vakuumu.

Čak i brojka od 12 sudionika zvuči impresivno, sve dok se ne otkrije da su ostali devet neimenovani – što otvara prostor za spekulacije o isključivosti ili neuspjelim pregovorima. Najveći problem? Mythos je još uvijek „neobjavljen“, što u AI svijetu često znači da je model u fazi fine-tuninga, ali daleko od stvarne implementacije.

📷 © Tech&Space

Demo skenira ranjivosti, ali tko će ih stvarno popraviti?

Ovdje se otvara zanimljivija priča od same objave: tko zapravo ima koristi od ovog projekta? Anthropic dobiva 100 milijuna kredita za Claude, što je zapravo ogromna marketinška pobjeda – model se testira na stvarnim podacima, a kompanije plaćaju za privilegiju.

S druge strane, apple, google i microsoft mogu demonstrirati svoju predanost cybersecurityju bez izravnog otvaranja vlastitih sustava. TechCrunch ističe da je ovo prvi put da su ovi rivali javno udružili resurse, ali i da je riječ o kontroliranom okruženju gdje svatko zadržava kontrolu nad svojim podacima.

Developer community reagira s mješavinom skepticizma i zanimanja. Na GitHubu i Hacker Newsu već se raspravlja o tome koliko je Mythos zapravo bolji od postojećih alata kao što su GitHubov CodeQL ili Googleov Project Zero.

GitHub rasprava pokazuje da su stručnjaci više zainteresirani za transparentnost rezultata nego za samu objavu. Ako projekt ne objavi konkretne podatke o pronađenim ranjivostima, riječ je samo o još jednom skupom AI benchmarku – a ne o revoluciji u cybersecurityju.

Stvarni signal ovdje nije broj sudionika ili milijuni u kreditima, već hoće li Mythos uspjeti tamo gdje su drugi alati zakazali: u identifikaciji ranjivosti koje su previše složene za tradicionalne metode.

Ako uspije, projekt bi mogao postati standard za buduće suradnje. Ako ne, ostat će samo još jedna AI priča koja je zvučala bolje u press releasu nego u stvarnosti.

Project Glasswing (AI benchmark)AI vulnerability detectionOpen-source AI security toolsAI model robustness evaluationAI safety research

//Comments