Neuro-simbolički ARC pristup pokazuje zašto samo veći model nije dovoljan
Symbolic ARC verification📷 TECH&SPACE deterministic editorial graphic
- ★Rad o neuro-simboličkom rezoniranju cilja ARC, benchmark za apstrakciju i generalizaciju
- ★Sustav gradi objekte iz gridova, predlaže transformacije i provjerava ih kroz simbolički DSL
- ★Rezultat je važan jer objašnjava zašto veći LLM sam po sebi ne rješava zadatke koji traže provjerljivo pravilo
ARC rad na arXivu bavi se zadacima koji izgledaju dječje jednostavno: obojeni kvadrati, nekoliko primjera i pitanje što treba napraviti s novim gridom. Ali upravo ta jednostavnost vara. ARC ne traži enciklopedijsko znanje, nego apstrakciju: prepoznaj objekt, shvati transformaciju, provjeri pravilo i primijeni ga izvan primjera. Čisti LLM tu često izgleda pametno dok ne postane jasno da pogađa površinski obrazac. Može opisati boje, rubove i simetrije, ali ne mora imati stabilan mehanizam za provjeru je li pravilo stvarno isto u svim primjerima. To je razlika između "ovo sliči na rotaciju" i "ovo je rotacija objekta oko ove osi, nakon čega se boja prenosi prema ovom uvjetu". Neuro-simbolički pristup pokušava podijeliti posao. Neuronski dio pomaže prepoznati strukturu i predložiti moguće transformacije. Simbolički dio, kroz ograničeni DSL, provjerava hipoteze. Drugim riječima, intuicija predlaže, pravilo sudi.
Kada zadatak traži pravilo, objekt i transformaciju, čista neuronska intuicija mora dobiti simbolički okvir koji može provjeriti hipotezu.
NEURAL PROPOSES explainer📷 TECH&SPACE deterministic infographic
Prosječnom čitatelju DSL može zvučati suho, ali ovdje je koristan baš zato što je ograničen. Umjesto da model izmisli slobodan tekstualni opis, mora odabrati iz skupa dopuštenih operacija: pomakni, oboji, kopiraj, izreži, spoji, reflektiraj ili kombiniraj transformacije. Ako ista operacija ne objašnjava sve primjere, hipoteza pada. To je relevantno daleko izvan ARC-a. AI agent u tablici, CAD alatu, programskom editoru ili poslovnom workflowu često mora učiniti isto: iz nekoliko opažanja izvući pravilo, zatim ga primijeniti bez razbijanja sustava. Veći model može dati bolje prijedloge, ali bez provjere prijedlog ostaje pogađanje. Ovaj rad zato ne treba čitati kao konačno rješenje ARC-a. Treba ga čitati kao smjer: budući AI sustavi vjerojatno neće biti samo veći generatori teksta. Bit će hibridi koji znaju predložiti, simulirati, odbaciti i objasniti vlastiti korak. Ako model ne može pokazati pravilo koje je koristio, njegov točan odgovor je samo sreća s boljim marketingom.

