AI više ne smije samo dokazivati: mora naučiti gdje se tvrdnja ruši
Wikipedia lead image: Life📷 Wikipedia / Wikimedia Commons
- ★Dosadašnji modeli kao što su DeepSeek ili AlphaTensor fokusirali su se isključivo na konstrukciju formalnih dokaza za istinite tvrdnje, zanemarujući generiranje kontraprimjera
- ★Nova metoda koristi prijenosno učenje s mutacijom kandidata: modeli iterativno mijenjaju potencijalne kontraprimjere dok Lean 4 ne prihvati opovrgavanje tvrdnje
- ★Integracija s Lean 4 osigurava da kontraprimjeri nisu heuristička pogađanja već formalno valjani, što zatvara kritičnu prazninu u automatiziranom matematičkom rasuđivanju
Dok su godinama svi slavili AI koji dokazuje teoreme, znanstvenici s arXiva upozoravaju: sustav koji ne zna opovrgavati ne zna ni pravo rasuđivati. Novi rad pokazuje kako veliki jezični modeli uče generirati kontraprimjere za matematičke tvrdnje i automatski ih provjeravati u Lean 4 — potez koji zatvara golemu rupu u AI matematičkom rasuđivanju.
Dosadašnji modeli poput DeepSeeka ili AlphaTensora fokusirali su se isključivo na konstrukciju formalnih dokaza za istinite tvrdnje. Neistinite? Zanemarene. Ta asimetrija stvorila je sustav koji elegantno potvrđuje, ali slijepo šeta pored grešaka. Ključan pomak dolazi prijenosnim učenjem s mutacijom kandidata: modeli iterativno mijenjaju potencijalne kontraprimjere dok Lean 4 ne prihvati opovrgavanje. Rezultat nije heurističko pogađanje već formalno valjana rušilica tvrdnji.
Metoda se oslanja na simboličku mutaciju koja iz postojećih teorema izbacuje odabrane hipoteze i generira nove trening primjere. Uz to, višestruka nagradna iteracija stručnjaka dodatno usavršava modele u oba smjera — dokazivanju i opovrgavanju.
Novi pristup učenja s prijenosom nadzora trenira jezike modele da generiraju i formalno provjere kontraprimjere u Lean 4
Wikipedia lead image: Timeline of quantum computing and communication📷 Wikipedia / Wikimedia Commons
Eksperimenti su provedeni na tri nova benchmarka koji testiraju kontradiktorno argumentiranje, a rezultati jasno sugeriraju da ovaj pristup nadmašuje tradicionalne metode. Integracija s Lean 4 osigurava da kontraprimjeri nisu estetski slučajevi već strogo provjereni objekti — što je kritično za industriju formalnih alata i istraživačkih timova koji sada dobivaju pouzdan mehanizam za praćenje i verifikaciju grešaka.
Zašto je to važno? Jer matematičko rasuđivanje bez sposobnosti opovrgavanja kao da sudite sud bez mogućnosti oslobađajuće presude. Robusnost zahtijeva oba smjera. Ovaj rad ne dodaje samo novu značajku — mijenja temeljnu pretpostavku kako AI treba pristupiti formalnoj matematici.
Dugoročno, to znači da će sustavi za verifikaciju softvera, kriptografske protokole i složene matematičke knjižnice postati značajno pouzdaniji. Kratkoročno, istraživači dobivaju alat koji ne šuti kad naiđe na lažnu tvrdnju, već aktivno traži i demonstrira zašto je lažna.

