Nvidia želi da se AI više ne kupuje na čip, nego na cijeli ormar
Wikimedia Commons: Jensen Huang Nvidia📷 Tom's Hardware / tomshardware.com
- ★Vera Rubin platforma uključuje Rubin GPU (3nm TSMC, 336 milijardi tranzistora, 288 GB HBM4), Rubin CPU (88 Arm jezgara, 1,5 TB LPDDR5X) i Groq 3 LPU za inference niske latencije
- ★Jedan ormar pruža ~1,5 ekzaflopsa, a 40-ormarna konfiguracija doseže 60 ekzaflopsa AI performansi — iako su takve brojke tipično vrhunske, ne održive u stvarnom svijetu
- ★Modularna POD arhitektura od pet tipova ormara označava pomak od prodaje pojedinačnih čipova prema dizajniranju cjelokupnih sustava prilagođenih različitim fazama AI pipelinea
Prošlog tjedna na GTC-u 2026 Nvidija nije predstavila novi čip — predstavila je novu jedinicu mjere. Vera Rubin platforma spaja sedam različitih procesora u modularni sustav koji od pojedinačnih GPU-a pravi cjelokupne AI tvornice u ormarima.
Srž čine tri ključna čipa: Rubin GPU na 3nm TSMC procesu s 336 milijardi tranzistora i 288 GB HBM4 memorije, Rubin CPU s 88 Armovih jezgara i 1,5 TB LPDDR5X memorije, te Groq 3 LPU za inference niske latencije. U jednom ormaru stane oko 1,5 ekzaflopsa; 40-ormarna konfiguracija penje se do 60 ekzaflopsa. Te brojke zvuče impresivno, no u praksi su vrhunske, ne održive — marketing uzima najbolji slučaj, stvarni workloadovi rijetko dosežu te vrhove.
Ključna promjena je arhitektonska. Vera Rubin nije samo novi GPU već pet tipova ormara koji rade kao koherentni sustav. Ovo je pomak od prodaje čipova prema dizajniranju cjelokupnih infrastruktura — Nvidija više ne prodaje komponente, prodaje "AI factory" u kompletu.
Od GPU-a do cjelokupnog ormara — kako Nvidija mijenja jedinicu mjere u AI infrastrukturi
og:image / twitter:image📷 © Prime Minister's Office
Modularna POD arhitektura omogućuje prilagodbu različitim fazama AI pipelinea: trening traži masivnu paralelizaciju, inference niske latencije zahtijeva drugačiji raspored resursa. Nvidija sada računa u ormarima, ne u čipovima — ekonomija mjerila pomaknula se s pojedinačnih tranzistora na cjelokupne arhitekture.
Rani signali ciljaju cloud provajdere i istraživačke centre koji traže 10x skok performansi u godinu dana. No pitanje otvorenosti ostaje: AMD Instinct i Intel Gaudi grade vlastite ekosustave, a Nvidijina akvizicija Groqa sugerira ambiciju pokriti sve faze AI procesiranja — od treninga do inferenca — pod jednom krovnom platformom.
Optimizacija realnih workloadova na sedam različitih čipova istovremeno bit će tehnički izazov. Ako Nvidija uspije, postavlja standard kojem će se konkurencija teško prilagoditi. Ako ne, "AI factory" rizikuje postati skupi, zatvoreni ekosustav koji obećava više nego što isporučuje.

