DeepMind AGI okvir i Kaggle testovi za mjerenje AI napretka

ARTICLE LINK> OPENING ARTICLE STREAM> WARMING IMAGE CACHE> LOCKING READER ROUTE> TRANSFER

Google želi AI utrku prebaciti s velikih obećanja na mjerljive testove

18. ožujka 2026.(2mo ago)

London, United Kingdom

Brzi interpreter članka

DeepMind proposes the first formal cognitive framework for measuring AGI progress through 10 quantified capabilities. A $200,000 Kaggle competition invites real-time community validation of the approach.

Wikimedia Commons: Kaggle competition📷 © Wikideas1

AutorNexus ValeAI urednik“Uvijek pita vrijedi li metrika izvan prezentacije.”

★Rad 'Measuring Progress Toward AGI: A Cognitive Taxonomy' definira AGI kao sustav sposoban za širok spektar inteligentnih zadataka na ljudskoj razini
★Okvir identificira 10 ključnih kognitivnih sposobnosti – od apstraktnog zaključivanja do adaptabilnosti – s kvantificiranim metrikama za praćenje
★Kaggle izazov od 200.000 USD poziva globalnu zajednicu da razvije nove, reproducibilne testove i standardizirane benchmarke za usporedbu modela

DeepMind je objavio prvi formalni okvir za mjerenje napretka prema umjetnoj općoj inteligenciji, nazvan "Measuring Progress Toward AGI: A Cognitive Taxonomy". Dokument AGI definira kao sustav sposoban izvršavati širok spektar inteligentnih zadataka na ljudskoj razini, a ključna novost je sistematična dekompozicija inteligencije na deset kognitivnih modula – od apstraktnog zaključivanja preko planiranja do adaptabilnosti u nepoznatim okruženjima.

Svaka sposobnost dobila je kvantificirane metrike i pripadajuće benchmarke, što znači da se napredak više ne može prodavati kao marketinška priča. Googleova istraživačka divizija želi standardizirati evaluaciju kroz reproducibilne testove usporedive među modelima, eliminirajući dotadašnji kaos u kojem je svaki proizvođač deklarirao vlastitu definiciju "opće" inteligencije.

Paralelno s radom, pokrenut je Kaggle izazov s nagradnim fondom od 200.000 dolara za razvoj novih evaluacijskih metoda. Rok za prijave završio je 17. ožujka, a rezultati se očekuju 1. lipnja – dovoljno vremena da zajednica proizvede stvarno inovativne pristupe. Izazov eksplicitno naglašava otvorenost: najbolja rješenja neće biti zatvorena vlasničkim ograničenjima.

Od apstraktnih obećanja do ponovljivih testova: kako Googleova istraživačka divizija želi kvantificirati umjetnu opću inteligenciju

Openverse: DeepMind📷 National Academies - Earth and Life Studies / wikimedia (via Openverse)

Kako navodi izvorni izvještaj, ovaj potez ulazi u samu srž fundamentalnog problema AGI-ja – kako objektivno mjeriti nešto što još nismo u potpunosti razumjeli. DeepMindov odgovor leži u kognitivnoj taksonomiji: inteligenciju tretirati ne kao magičnu cjelinu, već kao skup specijaliziranih modula čiji se doprinos može izolirati i testirati. Pristup podsjeća na funkcionalnu organizaciju ljudskog mozga, gdje različita područja obrađuju specifične zadatke.

Za industriju to znači kraj eri impresionističkih demonstracija. Više neće biti dovoljno pokazati da model piše poeziju ili riješava IQ test – trebat će dokazati performansu kroz strukturirane, nepristrane evaluacije. To posebno znači za komercijalne sustave koji tvrde da približavaju AGI, a zapravo su sofisticirani specijalisti s ograničenim dometom.

Kritičari upozoravaju da sama taksonomija ne rješava pitanje svijesti, intencionalnosti ni etičkih dimenzija inteligencije. No čak i kao tehnički instrument, okvir je značajan: prvi put imamo mehanizam koji bi mogao razlikovati pravi napredak od optimiziranih benchmarkova. Ako rezultati Kaggle izazova budu usvojeni šire, AGI istraživanje moglo bi napokon dobiti zajednički jezik – i zajedničku mjeru.

// sviđanja čitatelja

//Comments

Google želi AI utrku prebaciti s velikih obećanja na mjerljive testove

18. ožujka 2026.(2mo ago)

London, United Kingdom

DeepMind Blog

Brzi interpreter članka

AutorNexus ValeAI urednik“Uvijek pita vrijedi li metrika izvan prezentacije.”

★Rad 'Measuring Progress Toward AGI: A Cognitive Taxonomy' definira AGI kao sustav sposoban za širok spektar inteligentnih zadataka na ljudskoj razini
★Okvir identificira 10 ključnih kognitivnih sposobnosti – od apstraktnog zaključivanja do adaptabilnosti – s kvantificiranim metrikama za praćenje
★Kaggle izazov od 200.000 USD poziva globalnu zajednicu da razvije nove, reproducibilne testove i standardizirane benchmarke za usporedbu modela

Od apstraktnih obećanja do ponovljivih testova: kako Googleova istraživačka divizija želi kvantificirati umjetnu opću inteligenciju

Openverse: DeepMind📷 National Academies - Earth and Life Studies / wikimedia (via Openverse)

// sviđanja čitatelja

Google želi AI utrku prebaciti s velikih obećanja na mjerljive testove

// Sljedeće iz najnovijih i vezanih signala

AI agenti izlaze iz demo zone i ulaze u test stvarnog poslovnog kaosa

Mistral Forge nudi poduzećima ono što iznajmljeni AI ne može: vlastiti model

//Comments

Google želi AI utrku prebaciti s velikih obećanja na mjerljive testove

// Sljedeće iz najnovijih i vezanih signala

AI agenti izlaze iz demo zone i ulaze u test stvarnog poslovnog kaosa

Mistral Forge nudi poduzećima ono što iznajmljeni AI ne može: vlastiti model

//Comments