Thoughtworksova lekcija: istraživački agent vrijedi tek kad pokaže izvore
Produkcijski istraživački agent kao nadzirani sustav, ne kao samostalni chatbot.📷 AI-generated image / TECH&SPACE
- ★Kulkarni opisuje duboke istraživačke agente kao sustave za kompleksne zadatke, a ne kao obične chatbotove s duljim odgovorom.
- ★Produkcijski izazov leži u orkestraciji više agenata, provjerljivom dohvaćanju izvora i oblikovanju izvješća koje čovjek može pregledati.
- ★Signal je važan za AI timove, ali članak ne donosi tvrde metrike, benchmarke ni dokaz jasnog tehnološkog skoka.
Duboki istraživački agenti nisu samo još jedan naziv za chatbot koji napiše dulji odgovor. Prema izvještaju InfoQ-a, Sarang Kulkarni iz Thoughtworksa na konferenciji Arc of AI 2026 govorio je o produkcijskim lekcijama iz gradnje agentnih sustava koji trebaju istraživati kompleksne teme kroz više koraka, dohvaćati informacije preko više povezanih izvora i na kraju isporučiti strukturirano analitičko izvješće.
To je bitna razlika. Klasični LLM tok često završava na jednom promptu i jednom odgovoru. Deep research agent mora razbiti zadatak, odlučiti što još ne zna, dohvatiti dodatne tragove, usporediti ih, odbaciti slabije izvore i pretvoriti rezultat u oblik koji netko u organizaciji može stvarno koristiti. U toj arhitekturi model nije cijeli proizvod. On je samo jedna komponenta unutar sustava koji mora imati planiranje, pretraživanje, memoriju, provjeru, ograničenja i izlazni format.
Sarang Kulkarni iz Thoughtworksa na Arc of AI 2026 sažeo je lekcije iz gradnje višekoračnih agentnih sustava za istraživanje, dohvat i analitička izvješća.
Višekoračni dohvat izvora mora ostaviti trag koji urednik ili tim mogu provjeriti.📷 AI-generated image / TECH&SPACE
Zato je Kulkarniijeva tema produkcijski zanimljivija od većine demonstracija agentnih alata. Ako agent treba izraditi istraživački sažetak za poslovnu, tehničku ili regulatornu odluku, nije dovoljno da rečenice zvuče uvjerljivo. Sustav mora pokazati odakle je došao do zaključka, gdje je preskočio neizvjesnost i kako se nosio s kontradiktornim informacijama. Tu nastaje razlika između korisnog istraživačkog asistenta i automata za samouvjerenu sintezu.
Širi kontekst već postoji: OpenAI je vlastiti koncept deep researcha opisao kao agentni način rada za višekoračno pretraživanje i sintezu, dok je Anthropic u tekstu o učinkovitim agentima naglasio da robusnost često dolazi iz jednostavne, nadzirane orkestracije, a ne iz prekomplicirane autonomije. Kulkarniijev InfoQ signal dobro se uklapa u tu liniju: prava tema nije magični agent, nego kontrolirana proizvodna petlja.
Važno je i ono što izvještaj ne donosi. Nema javno navedenih tvrdih metrika, usporednih benchmarka, stopa pogrešaka ili dokaza da je riječ o novom skoku u sposobnostima modela. Ovo je prije stručna lekcija iz primjene nego objava proizvoda ili znanstveni rezultat. Za timove koji uvode AI istraživačke sustave to nije slabost, nego koristan okvir: manje obećanja o autonomiji, više pitanja o tragovima, nadzoru, izvorima i odgovornosti izlaza.
Najkraći zaključak glasi: duboki istraživački agenti postaju ozbiljni tek kada prestanu glumiti sveznajućeg sugovornika i počnu se ponašati kao pregledan istraživački stroj. Produkcija ne traži samo pametan odgovor. Traži razlog zašto bi mu itko vjerovao.

