DeepSeek gradi Harness tim jer se AI agenti viÅ”e ne dobivaju samo veÄim modelom
AI agent kao sustav: model radi tek kroz harness koji ga vodi.š· AI-generated image / TECH&SPACE
- ā Pregledni rad tvrdi da je usko grlo AI agenata softverski harness, a ne samo jeziÄni model.
- ā Harness obuhvaÄa alate, memoriju, testiranje i granice dozvola koje stateless model pretvaraju u agenta.
- ā DeepSeek u Pekingu gradi poseban Harness tim oko formule model plus harness jednako AI agent.
Nova analiza o AI agentima, koju prenosi The Decoder, udara u slabiju toÄku danaÅ”nje agentne groznice: agent nije samo veliki jeziÄni model kojem je dodan ambiciozan prompt. Prema prikazanom argumentu, presudan sloj je softver oko modela, odnosno harness koji odreÄuje Å”to model smije napraviti, Äega se sjeÄa, koje alate poziva i kako se njegov rad provjerava.
To zvuÄi manje spektakularno od rasprava o novim parametrima, benchmarkovima i kontekstnim prozorima, ali je tehniÄki važnije za stvarne proizvode. JeziÄni model je sam po sebi stateless komponenta: prima ulaz, predviÄa izlaz i ne zna nužno Å”to se dogodilo prije ili Å”to se smije dogoditi poslije. Agent nastaje tek kada ga kod poveže s memorijom, vanjskim alatima, testovima, pravilima autorizacije i mehanizmima za zaustavljanje pogreÅ”nih radnji.
< ArticleBreak />
U tom okviru, ārazmiÅ”ljanjeā agenta nije mistiÄna unutarnja kvaliteta modela, nego operativni tok kroz softver. Model predlaže sljedeÄi potez, ali harness odluÄuje kako se taj potez prevodi u API poziv, terminalsku naredbu, izmjenu datoteke, pretragu, poziv baze podataka ili akciju u korisniÄkom sustavu. Zato su alati i agentni SDK-ovi postali jednako važni kao sami modeli: oni definiraju granice djelovanja, opažanja i povratne petlje.
Novi pregledni rad tvrdi da su alati, memorija, testiranje i granice dozvola stvarni operativni sloj autonomnih agenata.
Dozvole, testovi i memorija odluÄuju Å”to agent smije izvrÅ”iti.š· AI-generated image / TECH&SPACE
Najzanimljiviji industrijski signal u tekstu je DeepSeek. Prema navedenom kontekstu, tvrtka u Pekingu veÄ gradi posveÄeni āHarnessā tim, uz formulu koja sažima cijelu tezu: model plus harness jednako AI agent. To je jasan pomak od logike āsamo treniraj jaÄi modelā prema logici sustavnog inženjeringa. DeepSeek se time, barem prema opisanom smjeru, ne pozicionira samo kao proizvoÄaÄ modela, nego kao tvrtka koja želi kontrolirati i izvrÅ”ni sloj oko modela.
Za korisnike i developere to znaÄi da Äe razlika izmeÄu korisnog i opasnog agenta Äesto biti u dosadnim detaljima: dopuÅ”tenjima, audit logovima, testovima prije izvrÅ”enja, izolaciji okruženja i naÄinu na koji se memorija briÅ”e ili zadržava. Agent koji može pisati kod, slati zahtjeve ili mijenjati podatke ne smije se ocjenjivati samo po tome koliko dobro odgovara u chatu. Mora se ocjenjivati po tome kako grijeÅ”i, gdje staje i tko može rekonstruirati njegove odluke.
Zato je pregledni rad važan: vraÄa raspravu s demo-snimki na arhitekturu. Ako je softverski harness mjesto gdje agent dobiva ruke, pamÄenje i granice, onda je upravo taj sloj mjesto na kojem Äe se odluÄivati pouzdanost sljedeÄe generacije AI sustava. Modeli Äe i dalje biti snažniji, ali agenti Äe biti ozbiljni tek kad kod oko njih bude jednako pažljivo projektiran kao i neuronska mreža u sredini.

