GPT-5.5 prodaje agentnost po višoj cijeni
GPT-5.5 is sold as a model for working through tools, but price becomes part of the technical story.📷 AI-generated / Tech&Space
- ★OpenAI navodi 82,7% na Terminal-Bench 2.0 za GPT-5.5 naspram 75,1% za GPT-5.4
- ★API cijena na službenoj stranici iznosi 5 USD za milijun input tokena i 30 USD za milijun output tokena
- ★GPT-5.5 u Codexu ima 400K kontekst, dok API model cilja kontekstni prozor od oko milijun tokena
OpenAI je 23. travnja 2026. predstavio GPT-5.5 kao "novu klasu inteligencije za realni rad". Marketinška fraza je glasna, ali tehnički opis je konkretniji: model je namijenjen pisanju i debugiranju koda, web istraživanju, analizi podataka, stvaranju dokumenata i tablica te kretanju kroz alate dok zadatak nije dovršen.
To je agentni pitch. OpenAI tvrdi da korisnik može dati neuredan, višedijelni zadatak, a GPT-5.5 bi trebao planirati, koristiti alate, provjeravati vlastiti rad, nositi se s dvosmislenošću i nastaviti. Drugim riječima, manje promptanja korak po korak, više delegiranja cjelovitog radnog toka.
Službene evaluacije daju razlog za pažnju. GPT-5.5 postiže 82,7% na Terminal-Bench 2.0, u odnosu na 75,1% za GPT-5.4. Na FrontierMath Tier 4 doseže 35,4%, dok GPT-5.5 Pro ide do 39,6%. Na MRCR v2 testu dugog konteksta skače na 74,0% pri 512K do milijun tokena, dok je GPT-5.4 bio na 36,6%.
Cijena je jednako važan podatak. OpenAI-jeva API pricing stranica navodi GPT-5.5 na 5 USD za milijun input tokena i 30 USD za milijun output tokena. GPT-5.4 je na 2,50 USD i 15 USD, što znači da je nominalna cijena po tokenu dvostruka prije svih ušteda koje mogu doći iz manje potrošnje tokena po zadatku.
OpenAI-jeve službene brojke pokazuju stvarne skokove u kodiranju i dugom kontekstu, ali cijena i benchmarkovi još ne dokazuju pouzdanog autonomnog radnika.
Benchmark gains are useful signals, but they do not replace independent validation of agent reliability.📷 AI-generated / Tech&Space
The Decoder je u izvještaju istaknuo isti ekonomski signal: agentnost se prodaje kao premium sloj, ne kao jeftina zamjena za postojeće modele. To ima smisla ako model stvarno završava duže zadatke s manje nadzora. Nema smisla ako korisnik mora provjeravati svaku odluku, ponavljati upute i popravljati štetu nakon krivog poziva alata.
Najbolji dio objave je dugi kontekst. Ako GPT-5.5 stabilnije radi kroz stotine tisuća tokena, to može pomoći kod velikih repozitorija, istraživačkih dosjea, pravnih mapa i višesatnih analitičkih sesija. Ali kontekstni prozor nije isto što i razumijevanje prioriteta, rizika i rubnih slučajeva.
OpenAI ne objavljuje arhitekturu, broj parametara ni detalje treniranja. To nije neobično za komercijalni frontier model, ali znači da se javna procjena oslanja na službene benchmarke, cijene i stvarno ponašanje korisnika nakon lansiranja. Za developere, pitanje nije "je li GPT-5.5 pametniji", nego "koliko manje ljudskog nadzora kupuje svaki dodatni dolar".
Nexus Vale bi zaključio hladno: GPT-5.5 izgleda kao stvaran pomak u agentnom radu, ali ne kao kraj inženjerske provjere. Ako model smanji broj koraka, tokena i ljudskih intervencija, viša cijena može biti racionalna. Ako samo bolje zvuči dok koristi više alata, onda je nova klasa inteligencije zapravo nova klasa računa.

