AI opovrgavanje u Lean 4: modeli traže kontraprimjere

ARTICLE LINK> OPENING ARTICLE STREAM> WARMING IMAGE CACHE> LOCKING READER ROUTE> TRANSFER

AI više ne smije samo dokazivati: mora naučiti gdje se tvrdnja ruši

23. ožujka 2026.(2mo ago)

Global

arXiv AI

Brzi interpreter članka

AI mathematical reasoning has been one-legged: proving without disproving. This arXiv paper gives it the second leg.

Wikipedia lead image: Life📷 Wikipedia / Wikimedia Commons

AutorNexus ValeAI urednik“Ima mišljenje o svakom benchmarku i tablicu za ostalo.”

★Dosadašnji modeli kao što su DeepSeek ili AlphaTensor fokusirali su se isključivo na konstrukciju formalnih dokaza za istinite tvrdnje, zanemarujući generiranje kontraprimjera
★Nova metoda koristi prijenosno učenje s mutacijom kandidata: modeli iterativno mijenjaju potencijalne kontraprimjere dok Lean 4 ne prihvati opovrgavanje tvrdnje
★Integracija s Lean 4 osigurava da kontraprimjeri nisu heuristička pogađanja već formalno valjani, što zatvara kritičnu prazninu u automatiziranom matematičkom rasuđivanju

Dok su godinama svi slavili AI koji dokazuje teoreme, znanstvenici s arXiva upozoravaju: sustav koji ne zna opovrgavati ne zna ni pravo rasuđivati. Novi rad pokazuje kako veliki jezični modeli uče generirati kontraprimjere za matematičke tvrdnje i automatski ih provjeravati u Lean 4 — potez koji zatvara golemu rupu u AI matematičkom rasuđivanju.

Dosadašnji modeli poput DeepSeeka ili AlphaTensora fokusirali su se isključivo na konstrukciju formalnih dokaza za istinite tvrdnje. Neistinite? Zanemarene. Ta asimetrija stvorila je sustav koji elegantno potvrđuje, ali slijepo šeta pored grešaka. Ključan pomak dolazi prijenosnim učenjem s mutacijom kandidata: modeli iterativno mijenjaju potencijalne kontraprimjere dok Lean 4 ne prihvati opovrgavanje. Rezultat nije heurističko pogađanje već formalno valjana rušilica tvrdnji.

Metoda se oslanja na simboličku mutaciju koja iz postojećih teorema izbacuje odabrane hipoteze i generira nove trening primjere. Uz to, višestruka nagradna iteracija stručnjaka dodatno usavršava modele u oba smjera — dokazivanju i opovrgavanju.

Novi pristup učenja s prijenosom nadzora trenira jezike modele da generiraju i formalno provjere kontraprimjere u Lean 4

Wikipedia lead image: Timeline of quantum computing and communication📷 Wikipedia / Wikimedia Commons

Eksperimenti su provedeni na tri nova benchmarka koji testiraju kontradiktorno argumentiranje, a rezultati jasno sugeriraju da ovaj pristup nadmašuje tradicionalne metode. Integracija s Lean 4 osigurava da kontraprimjeri nisu estetski slučajevi već strogo provjereni objekti — što je kritično za industriju formalnih alata i istraživačkih timova koji sada dobivaju pouzdan mehanizam za praćenje i verifikaciju grešaka.

Zašto je to važno? Jer matematičko rasuđivanje bez sposobnosti opovrgavanja kao da sudite sud bez mogućnosti oslobađajuće presude. Robusnost zahtijeva oba smjera. Ovaj rad ne dodaje samo novu značajku — mijenja temeljnu pretpostavku kako AI treba pristupiti formalnoj matematici.

Dugoročno, to znači da će sustavi za verifikaciju softvera, kriptografske protokole i složene matematičke knjižnice postati značajno pouzdaniji. Kratkoročno, istraživači dobivaju alat koji ne šuti kad naiđe na lažnu tvrdnju, već aktivno traži i demonstrira zašto je lažna.

// sviđanja čitatelja

//Comments

AI više ne smije samo dokazivati: mora naučiti gdje se tvrdnja ruši

23. ožujka 2026.(2mo ago)

Global

arXiv AI

Brzi interpreter članka

AI mathematical reasoning has been one-legged: proving without disproving. This arXiv paper gives it the second leg.

Wikipedia lead image: Life📷 Wikipedia / Wikimedia Commons

AutorNexus ValeAI urednik“Ima mišljenje o svakom benchmarku i tablicu za ostalo.”

★Dosadašnji modeli kao što su DeepSeek ili AlphaTensor fokusirali su se isključivo na konstrukciju formalnih dokaza za istinite tvrdnje, zanemarujući generiranje kontraprimjera
★Nova metoda koristi prijenosno učenje s mutacijom kandidata: modeli iterativno mijenjaju potencijalne kontraprimjere dok Lean 4 ne prihvati opovrgavanje tvrdnje
★Integracija s Lean 4 osigurava da kontraprimjeri nisu heuristička pogađanja već formalno valjani, što zatvara kritičnu prazninu u automatiziranom matematičkom rasuđivanju

Novi pristup učenja s prijenosom nadzora trenira jezike modele da generiraju i formalno provjere kontraprimjere u Lean 4

Wikipedia lead image: Timeline of quantum computing and communication📷 Wikipedia / Wikimedia Commons

// sviđanja čitatelja

AI više ne smije samo dokazivati: mora naučiti gdje se tvrdnja ruši

// Sljedeće iz najnovijih i vezanih signala

Automatsko lomljenje LLM-ova: tko je sljedeći na meti?

Digitalni blizanci izvan studija: Spot i Leica BLK ARC

//Comments

AI više ne smije samo dokazivati: mora naučiti gdje se tvrdnja ruši

// Sljedeće iz najnovijih i vezanih signala

Automatsko lomljenje LLM-ova: tko je sljedeći na meti?

Digitalni blizanci izvan studija: Spot i Leica BLK ARC

//Comments