Google želi AI utrku prebaciti s velikih obećanja na mjerljive testove
Wikimedia Commons: Kaggle competition📷 © Wikideas1
- ★Rad 'Measuring Progress Toward AGI: A Cognitive Taxonomy' definira AGI kao sustav sposoban za širok spektar inteligentnih zadataka na ljudskoj razini
- ★Okvir identificira 10 ključnih kognitivnih sposobnosti – od apstraktnog zaključivanja do adaptabilnosti – s kvantificiranim metrikama za praćenje
- ★Kaggle izazov od 200.000 USD poziva globalnu zajednicu da razvije nove, reproducibilne testove i standardizirane benchmarke za usporedbu modela
DeepMind je objavio prvi formalni okvir za mjerenje napretka prema umjetnoj općoj inteligenciji, nazvan "Measuring Progress Toward AGI: A Cognitive Taxonomy". Dokument AGI definira kao sustav sposoban izvršavati širok spektar inteligentnih zadataka na ljudskoj razini, a ključna novost je sistematična dekompozicija inteligencije na deset kognitivnih modula – od apstraktnog zaključivanja preko planiranja do adaptabilnosti u nepoznatim okruženjima.
Svaka sposobnost dobila je kvantificirane metrike i pripadajuće benchmarke, što znači da se napredak više ne može prodavati kao marketinška priča. Googleova istraživačka divizija želi standardizirati evaluaciju kroz reproducibilne testove usporedive među modelima, eliminirajući dotadašnji kaos u kojem je svaki proizvođač deklarirao vlastitu definiciju "opće" inteligencije.
Paralelno s radom, pokrenut je Kaggle izazov s nagradnim fondom od 200.000 dolara za razvoj novih evaluacijskih metoda. Rok za prijave završio je 17. ožujka, a rezultati se očekuju 1. lipnja – dovoljno vremena da zajednica proizvede stvarno inovativne pristupe. Izazov eksplicitno naglašava otvorenost: najbolja rješenja neće biti zatvorena vlasničkim ograničenjima.
Od apstraktnih obećanja do ponovljivih testova: kako Googleova istraživačka divizija želi kvantificirati umjetnu opću inteligenciju
Openverse: DeepMind📷 National Academies - Earth and Life Studies / wikimedia (via Openverse)
Kako navodi izvorni izvještaj, ovaj potez ulazi u samu srž fundamentalnog problema AGI-ja – kako objektivno mjeriti nešto što još nismo u potpunosti razumjeli. DeepMindov odgovor leži u kognitivnoj taksonomiji: inteligenciju tretirati ne kao magičnu cjelinu, već kao skup specijaliziranih modula čiji se doprinos može izolirati i testirati. Pristup podsjeća na funkcionalnu organizaciju ljudskog mozga, gdje različita područja obrađuju specifične zadatke.
Za industriju to znači kraj eri impresionističkih demonstracija. Više neće biti dovoljno pokazati da model piše poeziju ili riješava IQ test – trebat će dokazati performansu kroz strukturirane, nepristrane evaluacije. To posebno znači za komercijalne sustave koji tvrde da približavaju AGI, a zapravo su sofisticirani specijalisti s ograničenim dometom.
Kritičari upozoravaju da sama taksonomija ne rješava pitanje svijesti, intencionalnosti ni etičkih dimenzija inteligencije. No čak i kao tehnički instrument, okvir je značajan: prvi put imamo mehanizam koji bi mogao razlikovati pravi napredak od optimiziranih benchmarkova. Ako rezultati Kaggle izazova budu usvojeni šire, AGI istraživanje moglo bi napokon dobiti zajednički jezik – i zajedničku mjeru.

