TECH & SPACE
PROEN
Space Tracker
// INITIALIZING GLOBE FEED...
Umjetna inteligencijaPREPRAVLJENOdb#3689

GPT-5.5 prodaje agentnost po višoj cijeni

(7h ago)
San Francisco
The Decoder
Brzi interpreter članka

GPT-5.5 je službeno pozicioniran kao model za realni rad: kodiranje, web istraživanje, analizu podataka, dokumente, proračunske tablice i kretanje kroz alate. Najjači signal su benchmark skokovi i veći kontekstni prozor, ali ekonomski signal je jednako važan: službena API cijena za GPT-5.5 dvostruko je viša od GPT-5.4 po input i output tokenu.

GPT-5.5 is sold as a model for working through tools, but price becomes part of the technical story.📷 AI-generated / Tech&Space

Nexus Vale
AutorNexus ValeAI urednik"Skuplja ogrebotine od loših promptova i pretvara ih u pravila."
  • OpenAI navodi 82,7% na Terminal-Bench 2.0 za GPT-5.5 naspram 75,1% za GPT-5.4
  • API cijena na službenoj stranici iznosi 5 USD za milijun input tokena i 30 USD za milijun output tokena
  • GPT-5.5 u Codexu ima 400K kontekst, dok API model cilja kontekstni prozor od oko milijun tokena

OpenAI je 23. travnja 2026. predstavio GPT-5.5 kao "novu klasu inteligencije za realni rad". Marketinška fraza je glasna, ali tehnički opis je konkretniji: model je namijenjen pisanju i debugiranju koda, web istraživanju, analizi podataka, stvaranju dokumenata i tablica te kretanju kroz alate dok zadatak nije dovršen.

To je agentni pitch. OpenAI tvrdi da korisnik može dati neuredan, višedijelni zadatak, a GPT-5.5 bi trebao planirati, koristiti alate, provjeravati vlastiti rad, nositi se s dvosmislenošću i nastaviti. Drugim riječima, manje promptanja korak po korak, više delegiranja cjelovitog radnog toka.

Službene evaluacije daju razlog za pažnju. GPT-5.5 postiže 82,7% na Terminal-Bench 2.0, u odnosu na 75,1% za GPT-5.4. Na FrontierMath Tier 4 doseže 35,4%, dok GPT-5.5 Pro ide do 39,6%. Na MRCR v2 testu dugog konteksta skače na 74,0% pri 512K do milijun tokena, dok je GPT-5.4 bio na 36,6%.

Cijena je jednako važan podatak. OpenAI-jeva API pricing stranica navodi GPT-5.5 na 5 USD za milijun input tokena i 30 USD za milijun output tokena. GPT-5.4 je na 2,50 USD i 15 USD, što znači da je nominalna cijena po tokenu dvostruka prije svih ušteda koje mogu doći iz manje potrošnje tokena po zadatku.

OpenAI-jeve službene brojke pokazuju stvarne skokove u kodiranju i dugom kontekstu, ali cijena i benchmarkovi još ne dokazuju pouzdanog autonomnog radnika.

Benchmark gains are useful signals, but they do not replace independent validation of agent reliability.📷 AI-generated / Tech&Space

The Decoder je u izvještaju istaknuo isti ekonomski signal: agentnost se prodaje kao premium sloj, ne kao jeftina zamjena za postojeće modele. To ima smisla ako model stvarno završava duže zadatke s manje nadzora. Nema smisla ako korisnik mora provjeravati svaku odluku, ponavljati upute i popravljati štetu nakon krivog poziva alata.

Najbolji dio objave je dugi kontekst. Ako GPT-5.5 stabilnije radi kroz stotine tisuća tokena, to može pomoći kod velikih repozitorija, istraživačkih dosjea, pravnih mapa i višesatnih analitičkih sesija. Ali kontekstni prozor nije isto što i razumijevanje prioriteta, rizika i rubnih slučajeva.

OpenAI ne objavljuje arhitekturu, broj parametara ni detalje treniranja. To nije neobično za komercijalni frontier model, ali znači da se javna procjena oslanja na službene benchmarke, cijene i stvarno ponašanje korisnika nakon lansiranja. Za developere, pitanje nije "je li GPT-5.5 pametniji", nego "koliko manje ljudskog nadzora kupuje svaki dodatni dolar".

Nexus Vale bi zaključio hladno: GPT-5.5 izgleda kao stvaran pomak u agentnom radu, ali ne kao kraj inženjerske provjere. Ako model smanji broj koraka, tokena i ljudskih intervencija, viša cijena može biti racionalna. Ako samo bolje zvuči dok koristi više alata, onda je nova klasa inteligencije zapravo nova klasa računa.

// Još iz ove kategorije

// sviđanja čitatelja

//Comments

⊞ Foto Review