Claude Mythos ima navodni Erdősev dokaz; sada počinje teži dio
AI modeli sada ulaze u prostor otvorenih matematičkih dokaza.📷 AI-generated image / TECH&SPACE
- ★Claude Mythos navodno je riješio Erdősev problem iz 1946. ubrzo nakon OpenAI-jeva proboja.
- ★Anthropicov Sholto Douglas tvrdi da je model do dokaza došao “preko vikenda”.
- ★Slučaj upućuje na mogući “overhang” u AI matematici: modeli možda već mogu rješavati više nego što se rutinski testira.
The Decoder prenosi da je Anthropicov Claude Mythos navodno riješio Erdősev problem jediničnih udaljenosti, i to ubrzo nakon što je OpenAI objavio vlastiti proboj na istom matematičkom terenu. Prema sažetku izvora, inženjer Sholto Douglas tvrdi da je Mythos problem iz 1946. “slomio” tijekom vikenda i došao do “slatkog, jednostavnog dokaza”.
Važan detalj nije samo da je riječ o poznatom problemu iz diskretne geometrije, nego da se isti cilj pojavljuje kao testni poligon za više frontier AI sustava gotovo u isto vrijeme. Erdősev problem jediničnih udaljenosti pita koliko se parova točaka na udaljenosti jedan može pojaviti među n točaka u ravnini. Takvi problemi obično ne padaju na čistu brute-force pretragu, nego traže strukturu, dokaz i osjećaj za rubne slučajeve.
Zato je formulacija “cute, simple proof” zanimljivija od same trijumfalne oznake. U matematici jednostavan dokaz često znači da je netko pronašao pravi kut gledanja, ne samo dulji računalni izvod. Ako je Anthropicov model doista ponudio takav dokaz, pitanje više nije samo može li AI pratiti postojeću literaturu, nego može li proizvoditi objašnjenja koja ljudi mogu provjeriti, skratiti i ugraditi u normalan matematički rad.
Anthropicov inženjer Sholto Douglas tvrdi da je model preko vikenda pronašao “sladak, jednostavan dokaz” za problem iz 1946., ubrzo nakon OpenAI-jeva proboja.
Ključ priče nije samo rezultat, nego provjerljivost samog dokaza.📷 AI-generated image / TECH&SPACE
S druge strane, kontekst traži oprez. Dostupni opis govori “reportedly”, odnosno navodno; ne daje ovdje puni dokaz, recenziju, službeni rad ni formalnu verifikaciju. To znači da tvrdnju treba čitati kao rani signal, a ne kao zatvorenu znanstvenu činjenicu. U matematici se reputacija ne dobiva time što model kaže da ima dokaz, nego time što dokaz preživi ljudsku provjeru, formalizaciju ili barem pažljivo čitanje stručnjaka.
Najveća implikacija ipak leži u Douglasovoj ocjeni da je ovo znak “serious overhang” u AI matematici. Drugim riječima, moguće je da su sposobnosti modela već ispred načina na koji ih rutinski mjerimo. Ako se takvi sustavi rijetko usmjeravaju na konkretne otvorene probleme, dio kapaciteta ostaje nevidljiv dok ga netko ne aktivira dobrim promptom, dobrim okruženjem ili dovoljno agresivnim eksperimentom.
OpenAI-jevo spominjanje u priči dodatno pojačava industrijsku dimenziju. Ako su OpenAI i Anthropic blizu istih matematičkih proboja, akademska matematika dobiva novu vrstu konkurencije i suradnika: modele koji mogu brzo pretraživati prostor ideja, ali čije rezultate još treba tvrdo provjeravati. To nije kraj matematičara. To je promjena u tome gdje se pojavljuje prvi nacrt dokaza i tko ga prvi mora ozbiljno shvatiti.

