ChatGPT-ov dokaz u 17 minuta otvara novu cijenu provjere u matematici
ChatGPT 5.5 Pro solved an open math problem in 17 minutes📷 AI-generated / Tech&Space editorial visual
- ★Dokaz za 17 minuta
- ★Otvoreni problem iz teorije brojeva
- ★Novo mjerilo ljudskog doprinosa
Fieldsov medalist Timothy Gowers dao je ChatGPT-u 5.5 Pro jedan od najtežih testova: otvorene probleme u teoriji brojeva koje je postavio matematičar Mel Nathanson. Model nije samo generirao LaTeX preprint u rekordnom vremenu – unaprijedio je eksponencijalnu granicu na kvadratnu za 17 minuta i 5 sekundi, a na polinomnu za generalizirani problem za 31 minutu i 40 sekundi. Gowers je kasnije priznao da nije koristio nikakve 'pametne' poticaje, što dodatno naglašava autonomiju sustava.
Rezultati su toliko impresivni da je Isaac Rajagopal, MIT-ov student uključen u evaluaciju, ključnu ideju nazvao 'potpuno originalnom' – onakvom 'za koju bih bio ponosan da sam je smislio nakon tjedan-dva razmišljanja'. Iako je OpenAI izbjegao detalje o arhitekturi modela, jasno je da je 5.5 Pro korak dalje od prethodnih verzija u matematičkom zaključivanju. Izvještaj The Decodera navodi da je Gowersova konačna poruka jasna: budući da AI može samostalno rješavati probleme, novi standard za matematički doprinos postaje dokazivanje nečega što LLM-ovi ne mogu.
Model je samostalno izveo dokaz koji je čovjeku ostao otvoren, a to mijenja mjerilo matematičkog doprinosa
Article image📷 © Tech&Space
No koliko je ovaj iskorak značajan za samu matematiku? Dok su rezultati tehnički valjani, ostaje otvoreno pitanje njihove stvarne vrijednosti. Gowers je sugerirao da će se buduća istraživanja možda fokusirati na probleme koji zahtijevaju kreativnost izvan dosega trenutnih AI modela – ali što to konkretno znači? Ako LLM-ovi mogu unaprijediti granice u teoriji brojeva, hoće li to ubrzati otkrića ili samo povećati šum u akademskoj produkciji?
Još jedna dilema tiče se transparentnosti: iako je ChatGPT generirao cijele radove, nije jasno koliko je model zapravo 'razumio' probleme koje je rješavao. Rajagopalovo divljenje ideji ne mijenja činjenicu da su dokazi nastali bez ljudskog nadzora – što otvara pitanje pouzdanosti takvih rezultata u dugoročnom istraživanju. Gowersov blog često ističe važnost rigorozne provjere, ali kako to primijeniti na AI-generirane dokaze koji se stvaraju brže nego što ih ljudi mogu pročitati?

