Claudeov pravi test nije sanjanje, nego prestanak ponavljanja skupih grešaka
An agent operations room at night where failed session cards dissolve into a clean memory lattice labeled Dreaming.📷 AI-generated image / TECH&SPACE
- ★Dreaming pokušava pretvoriti neuspjele sesije u korisnu memoriju.
- ★Outcomes uvodi eksplicitniju evaluaciju rezultata.
- ★Najveći test bit će stvarni workflowi, ne demo snimke.
Anthropicov novi skup agentnih ideja, opisan u izvještaju The Decodera, nosi naziv koji zvuči gotovo previše mekan za infrastrukturu: Dreaming. Ali ispod simpatične metafore nalazi se vrlo praktičan problem. Agenti danas ne padaju zato što ne znaju napisati jedan dobar odgovor. Padaju zato što u dugom zadatku izgube kontekst, krivo procijene rezultat, poprave pogrešnu stvar i onda se vrate istom obrascu kao da se ništa nije dogodilo.
Zato je zanimljivo da se Dreaming ne prodaje samo kao još jedna memorija, nego kao post-run refleksija: agent prođe kroz prethodne sesije, izvuče što je pošlo krivo i pokuša taj trag spremiti za sljedeći pokušaj. To se dobro uklapa u Anthropicovu raniju inženjersku filozofiju iz teksta Building effective agents, gdje se agenti ne predstavljaju kao magija nego kao sustavi s alatima, petljama, evaluacijama i jasnim granicama autonomije.
Tu je pravi signal. “Agent” je postao riječ koja se lijepi na sve, od chatbota s gumbom do ozbiljnog workflow sustava. Ali agent koji ne zna procijeniti ishod nije agent; to je automatizirani optimist. Zato je komponenta Outcomes možda manje atraktivna od Dreaminga, ali važnija. Ako sustav ne razlikuje završeni zadatak od elegantno promašenog zadatka, memorija samo arhivira konfuziju.
Anthropic cilja na dosadni, ali presudni problem: agenti moraju učiti iz promašaja bez stalnog ljudskog spašavanja.
A sober evaluator desk with rubric cards, revision loops, and separate agent threads feeding a coordinator.📷 AI-generated image / TECH&SPACE
Treći dio priče, multiagent orchestration, otvara još jednu napetost. Više agenata može značiti bolju podjelu rada, ali može značiti i više mjesta na kojima greška izgleda uvjerljivo. Anthropic već gura širi ekosustav kroz Model Context Protocol, a agentni workflowi ovise o tome da modeli sigurno koriste alate, datoteke i vanjske sustave. To nije demo problem. To je problem operativne higijene.
Najbolji scenarij za Dreaming nije da Claude “sanja” kao čovjek. To je kriva metafora i nepotreban šećer. Najbolji scenarij je da se agent nakon neuspjele sesije ponaša kao dobar junior developer nakon code reviewa: ne postaje genij, ali sljedeći put ne radi istu glupost na istom mjestu.
Konkurencija će ovo morati pratiti, jer se stvarna prednost u agentima neće mjeriti time tko ima najljepši demo s 20 kartica. Mjerit će se time tko može pustiti sustav u dosadan, prljav, višekorakni posao i dobiti manje ručnih intervencija. Ako Dreaming smanji broj ponovljenih grešaka, ime će prestati zvučati simpatično. Zvučat će kao infrastruktura.

