AI agenti ulaze u fazu u kojoj račun za rad postaje glavni test
A high-density AI operations control room where one bright 12B-active compute path lights inside a larger 120B parameter lattice, suggesting selective activation rather than raw scale.📷 AI-generated image / TECH&SPACE
- ★Nemotron 3 Super ima 120 milijardi parametara, ali tijekom rada aktivira 12 milijardi.
- ★NVIDIA tvrdi da model cilja pet puta veću propusnost za agentna AI opterećenja.
- ★Najveće otvoreno pitanje ostaje trošak i pouzdanost u stvarnim poslovnim agentima.
NVIDIA je s modelom Nemotron 3 Super pogodila vrlo konkretan živac današnje AI infrastrukture: agenti nisu skupi samo zato što misle, nego zato što misle dugo, u više koraka i često s previše konteksta. Ako se tvrdnja o pet puta većoj propusnosti potvrdi u stvarnim radnim opterećenjima, ovo nije samo još jedan veći model u izlogu, nego pokušaj da agentni sustavi prestanu biti luksuzni eksperiment.
Model ima 120 milijardi parametara, ali tijekom izvođenja aktivira samo 12 milijardi, što upućuje na hibridnu mixture-of-experts arhitekturu. Takav pristup pokušava zadržati širinu velikog modela, a istodobno smanjiti računsku cijenu svakog koraka. NVIDIA ga pozicionira kao otvoreni model za kompleksne agentne sustave, no detalji licence i praktični uvjeti dostupnosti nisu razjašnjeni u dostavljenom materijalu.
Ključna je promjena načina na koji se AI koristi. Klasični chatbot uglavnom odgovara na jedan upit, dok agent mora planirati, koristiti alate, provjeravati međurezultate i donositi odluke kroz dulji lanac. U takvom režimu svaka sekunda zaključivanja i svaki dodatni token konteksta postaju operativni trošak, a ne samo tehnička fusnota.
NVIDIA tvrdi da otvoreni model od 120 milijardi parametara pri radu aktivira samo 12 milijardi
A close operational view of multiple AI agents running tool calls and verification loops through a constrained compute pipeline, with latency and context pressure shown visually without fake text.📷 AI-generated image / TECH&SPACE
Zato je važna tvrdnja da Nemotron 3 Super cilja na dva uska grla: eksploziju konteksta i takozvani thinking tax, odnosno cijenu dodatnog zaključivanja. Prema dostupnim informacijama, NVIDIA želi model koji može održati visoku točnost, ali s manjim opterećenjem po zadatku. To je posebno važno za tvrtke koje ne pokreću jednog agenta, nego stotine ili tisuće paralelnih procesa.
Rani popis integracija govori jednako mnogo kao i specifikacije. Perplexity se navodi kao jedna od AI-native kompanija koja korisnicima nudi pristup modelu, dok se u istraživačkom briefu spominju CodeRabbit, Amdocs i Siemens kao relevantni akteri za agentske platforme i poslovne procese. Ako se taj krug proširi, Nemotron 3 Super mogao bi postati test toga mogu li otvoreni modeli držati korak s komercijalnim zatvorenim sustavima u realnom, ne demonstracijskom radu.
Granica potvrđenog ipak ostaje jasna. Brojke o parametrima, namjeni i NVIDIA-inim tvrdnjama su čvrste, ali stvarna propusnost, kvaliteta zaključivanja i trošak po zadatku ovise o implementaciji, hardveru i tipu posla. U konačnici, stvarno pitanje je hoće li agenti postati pouzdana infrastruktura ili samo vrlo uvjerljivi potrošači računalnog vremena.

