ChatGPT ulazi u utrku u kojoj je manje važno zvučati pametno, a više ne izmišljati
The important claim is reliability in high-stakes domains, not just a new model name.📷 Generated editorial visual / Tech&Space
- ★GPT-5.5 Instant postaje zadani ChatGPT model
- ★OpenAI navodi 52,5 posto manje izmišljenih tvrdnji u osjetljivim područjima
- ★Memory sources pokazuju koji spremljeni kontekst utječe na odgovor
GPT-5.5 Instant nije zanimljiv zato što ime zvuči veće. Zanimljiv je zato što OpenAI pokušava pomaknuti raspravu s brzine i kreativnosti prema pouzdanosti. Prema izvještaju The Decodera, novi zadani ChatGPT model donosi prijavljen pad izmišljenih tvrdnji od 52,5 posto u osjetljivim područjima poput medicine, prava i financija.
To je prava metrika za proizvod koji milijuni ljudi koriste kao sugovornika, pretraživač, savjetnika i radni alat. Halucinacija u vicevima nije ista stvar kao halucinacija u poreznom pitanju, zdravstvenom objašnjenju ili pravnom sažetku. Ako model postaje zadana površina za svakodnevne odluke, mora biti manje samouvjeren kad ne zna.
Manje halucinacija i vidljivi izvori memorije važniji su od još jednog marketinškog skoka modela.
Memory-source transparency matters because personalization changes why an answer appears.📷 Generated editorial visual / Tech&Space
Drugi važan detalj su memory sources. Ako ChatGPT koristi spremljeni kontekst iz prethodnih razgovora, datoteka ili povezanih servisa, korisnik treba vidjeti zašto odgovor vuče baš taj trag. Personalizacija bez objašnjenja brzo postaje jeziva ili nepouzdana. Personalizacija s vidljivim izvorima barem otvara prostor za ispravak.
Oprez ostaje važan. Smanjenje halucinacija nije eliminacija halucinacija. Novi default model ne znači da su visokorizične domene riješene, nego da je prag odgovornosti porastao. Korisnici će i dalje trebati provjeru, a OpenAI će morati pokazati kako brojke drže izvan vlastitih evaluacija.
Najveći pomak je možda kulturni. AI industrija se dugo natjecala u tome tko može zvučati pametnije. GPT-5.5 Instant pokazuje da sljedeća utrka ide prema tome tko može biti korisniji bez glumljenja sigurnosti. Ako model zna reći odakle vuče kontekst i češće izbjeći izmišljenu tvrdnju, to je manje spektakularno od novog demo videa, ali puno važnije za stvarnu upotrebu.
Za provjeru konteksta, korisno je usporediti The Decoder, NIST AI RMF i OECD AI Principles.

