OpenAI testira Codex ondje gdje AI greške postaju porezni problem
Codex porezni agent prikazan kao kontrolirani radni tok, ne kao običan chatbot.📷 AI-generated image / TECH&SPACE
- ★OpenAI, Thrive i Crete prikazali su Codex agenta za automatizaciju poreznih prijava i radnih tijekova.
- ★Središnja tvrdnja je samopoboljšavanje: agent se kroz ponavljanja treba bolje nositi s točnošću i operativnim zadacima.
- ★Bez dubljih tehničkih detalja, priča je najkorisnija kao signal gdje se agentni AI testira u reguliranim poslovnim procesima.
OpenAI News objavio je primjer koji dobro pokazuje u kojem se smjeru pomiče rasprava o agentima: od demonstracija u sandboxu prema dosadnim, skupim i osjetljivim poslovnim procesima. U ovom slučaju riječ je o poreznom agentu koji su s OpenAI-jem gradili Thrive i Crete, uz korištenje Codexa za automatizaciju poreznih prijava, poboljšavanje točnosti i ubrzavanje radnih tijekova.
To nije priča o tome da softver može popuniti obrazac. To je već stara ambicija automatizacije. Zanimljiviji dio je opis sustava kao samopoboljšavajućeg agenta: alata koji bi kroz ponavljanje zadataka, provjeru rezultata i rad nad stvarnim operativnim uskim grlima trebao postajati korisniji. U poreznom kontekstu ta riječ ima težinu, jer greška nije samo neugodan bug. Ona može značiti pogrešnu prijavu, dodatni ručni pregled, izgubljeno vrijeme ili potrebu da čovjek rekonstruira zašto je agent donio određeni zaključak.
Zato je korisno čitati ovu objavu hladnije nego što bi naslov sugerirao. Iz dostupnog konteksta nema dovoljno tehničkih detalja da bi se procijenilo kako je riješeno učenje iz pogrešaka, koji se podaci koriste za evaluaciju, kako se mjeri točnost ili gdje završava autonomija agenta, a počinje ljudska kontrola. No sama domena je dobro odabrana za testiranje: porezne prijave imaju ponavljajuće korake, jasne rokove, velik volumen dokumenata i dovoljno iznimaka da obična skripta brzo postane krhka.
OpenAI, Thrive i Crete prikazali su agentni sustav za porezne prijave koji ne samo automatizira zadatke nego pokušava poboljšavati točnost i tijek rada kroz ponavljanja.
Detalj provjere prijave: dokumenti, trag odluka i ručni pregled ostaju ključni.📷 AI-generated image / TECH&SPACE
Codex je ovdje važan kao operativni sloj, ne kao ukrasni AI dodatak. Ako agent može čitati zadatak, mijenjati radni tok, predlagati popravke i ostavljati provjerljiv trag, tada prelazi iz kategorije pomoćnika u kategoriju radnog sustava. To ne znači da zamjenjuje porezne stručnjake. Prije znači da se dio repetitivnog rada seli u infrastrukturu koju treba nadzirati, auditirati i disciplinirati jednako ozbiljno kao financijski softver.
Najveći rizik u ovakvim pričama je zamjena riječi “automatizirano” riječju “pouzdano”. Porezni agent može ubrzati pripremu prijava, ali njegova vrijednost ovisi o kvaliteti provjera, jasnim granicama odgovornosti i sposobnosti da se iznimke ne guraju pod tepih. U reguliranim procesima dobar agent mora znati kada stati, zatražiti pregled i pokazati na temelju čega je nešto napravio.
Zbog toga je ova objava više signal nego zaključak. OpenAI, Thrive i Crete pokazuju da se agentni AI gura u administrativne procese gdje se produktivnost može mjeriti vrlo konkretno: manje ručnog rada, brži tijekovi i manje korekcija. Ali bez objavljene metodologije, benchmarka ili neovisne evaluacije, tvrdnju o samopoboljšavanju treba tretirati kao smjer razvoja, ne kao dokazanu novu normu za porezni softver.

