Anthropic opet stavlja AI u kutiju: što se promijenilo od GPT-2?
Anthropic joins OpenAI in hiding risky AI models📷 Manual upload
- ★Claude Mythos Preview povučen iz javnosti
- ★Sustav našao tisuće ranjivosti
- ★Povratak strategije 'preopasno za objavu'
Anthropic je ovih dana izvukao iz ladice model koji bi trebao osvijetliti grob ljudske slabosti u digitalnom prostoru. Claude Mythos Preview, još jedna titrajuća demonska verzija iz antropocenske ere, ovaj je put toliko dobro naučio da previše zna – pa ga zato još drže pod ključem. To nije nova taktika: prije sedam godina OpenAI je GPT-2 proglasio 'preopasnim za objavu', a onda se ipak odlučio za postepeni izlazak, bez većih šteta.
Sada je red na Anthropicu da igra istu igru, ali s novom kartom u rukavu: sistem je samostalno identificirao tisuće ranjivosti u operativnim sustavima i preglednicima, dovoljno da nadmaši sposobnost ljudske revizije. Kako bi to moglo biti opasno? Samo zamislite scenario u kojem jedan AI model otkrije koliko je mreža zapravo puna rupa – i koliko malo ljudi ima vremena da sve to popravi prije nego što netko drugi iskoristi slabosti.
Zanimljivo je da je cijela priča započela još 2019., kad je OpenAI zbog sličnih razloga zadržao GPT-2. Tada su kritičari smatrali da je odluka preterana, ali s vremenom se pokazalo da je barem djelomično imala smisla – barem dok se nisu pojavili sofisticiraniji modeli koji mogu raditi stvari koje nisu bile predviđene u scenarijima sigurnosti.
Između hvalisanih demo verzija i realnosti sigurnosnih rizika
Anthropic joins OpenAI in hiding risky AI models📷 Manual upload
Anthropicova odluka ne dolazi nasumično. Osim što su sa svojim Project Glasswingom već ušli u igru alatima za otkrivanje ranjivosti, sada imaju i Jacka Clarka, bivšeg direktora za politiku u OpenAI-ju, u svojim redovima – čovjeka koji je poznat po tome što zna koliko je teško procijeniti stvarne rizike umjetne inteligencije. Njegovo iskustvo sugerira da je Anthpoc pažljiviji u objavljivanju od svojih prethodnika, ali i da se radi o trendu koji bi mogao postati standard u industriji.
Što to znači za one koji razvijaju softver? Jednostavno: vrijeme kad smo mogli ignorirati AI kao potencijalnu prijetnju za sigurnost je prošlo. Ako i jedan od tih tisuća ranjivosti koje je Claude Mythos našao završi u krivim rukama, posljedice bi mogle biti veće od jednostavnog curenja podataka. A scenario u kojem AI otkrije ranjivost koju nijedan čovjek ne bi mogao pronaći nije više SF – to je stvarnost koju tek trebamo naučiti upravljati.