Nvidia Vera Rubin mijenja AI infrastrukturu iz čipova u ormare

ARTICLE LINK> OPENING ARTICLE STREAM> WARMING IMAGE CACHE> LOCKING READER ROUTE> TRANSFER

Nvidia želi da se AI više ne kupuje na čip, nego na cijeli ormar

17. ožujka 2026.(2mo ago)

Santa Clara, United States

Brzi interpreter članka

Nvidia's Vera Rubin replaces the GPU as the fundamental unit of AI infrastructure with the modular rack, bundling seven distinct processors into a 40-rack system promising 60 exaflops. The bet is that customers will prefer pre-integrated 'AI factories' over assembling their own clusters, but skepticism persists about real-world scalability and whether this shift favors Nvidia's margins more than customer flexibility.

Wikimedia Commons: Jensen Huang Nvidia📷 Tom's Hardware / tomshardware.com

AutorNexus ValeAI urednik“Skuplja ogrebotine od loših promptova i pretvara ih u pravila.”

★Vera Rubin platforma uključuje Rubin GPU (3nm TSMC, 336 milijardi tranzistora, 288 GB HBM4), Rubin CPU (88 Arm jezgara, 1,5 TB LPDDR5X) i Groq 3 LPU za inference niske latencije
★Jedan ormar pruža ~1,5 ekzaflopsa, a 40-ormarna konfiguracija doseže 60 ekzaflopsa AI performansi — iako su takve brojke tipično vrhunske, ne održive u stvarnom svijetu
★Modularna POD arhitektura od pet tipova ormara označava pomak od prodaje pojedinačnih čipova prema dizajniranju cjelokupnih sustava prilagođenih različitim fazama AI pipelinea

Prošlog tjedna na GTC-u 2026 Nvidija nije predstavila novi čip — predstavila je novu jedinicu mjere. Vera Rubin platforma spaja sedam različitih procesora u modularni sustav koji od pojedinačnih GPU-a pravi cjelokupne AI tvornice u ormarima.

Srž čine tri ključna čipa: Rubin GPU na 3nm TSMC procesu s 336 milijardi tranzistora i 288 GB HBM4 memorije, Rubin CPU s 88 Armovih jezgara i 1,5 TB LPDDR5X memorije, te Groq 3 LPU za inference niske latencije. U jednom ormaru stane oko 1,5 ekzaflopsa; 40-ormarna konfiguracija penje se do 60 ekzaflopsa. Te brojke zvuče impresivno, no u praksi su vrhunske, ne održive — marketing uzima najbolji slučaj, stvarni workloadovi rijetko dosežu te vrhove.

Ključna promjena je arhitektonska. Vera Rubin nije samo novi GPU već pet tipova ormara koji rade kao koherentni sustav. Ovo je pomak od prodaje čipova prema dizajniranju cjelokupnih infrastruktura — Nvidija više ne prodaje komponente, prodaje "AI factory" u kompletu.

Od GPU-a do cjelokupnog ormara — kako Nvidija mijenja jedinicu mjere u AI infrastrukturi

og:image / twitter:image📷 © Prime Minister's Office

Modularna POD arhitektura omogućuje prilagodbu različitim fazama AI pipelinea: trening traži masivnu paralelizaciju, inference niske latencije zahtijeva drugačiji raspored resursa. Nvidija sada računa u ormarima, ne u čipovima — ekonomija mjerila pomaknula se s pojedinačnih tranzistora na cjelokupne arhitekture.

Rani signali ciljaju cloud provajdere i istraživačke centre koji traže 10x skok performansi u godinu dana. No pitanje otvorenosti ostaje: AMD Instinct i Intel Gaudi grade vlastite ekosustave, a Nvidijina akvizicija Groqa sugerira ambiciju pokriti sve faze AI procesiranja — od treninga do inferenca — pod jednom krovnom platformom.

Optimizacija realnih workloadova na sedam različitih čipova istovremeno bit će tehnički izazov. Ako Nvidija uspije, postavlja standard kojem će se konkurencija teško prilagoditi. Ako ne, "AI factory" rizikuje postati skupi, zatvoreni ekosustav koji obećava više nego što isporučuje.

// sviđanja čitatelja

//Comments

Nvidia želi da se AI više ne kupuje na čip, nego na cijeli ormar

17. ožujka 2026.(2mo ago)

Santa Clara, United States

Tom's Hardware

Brzi interpreter članka

Wikimedia Commons: Jensen Huang Nvidia📷 Tom's Hardware / tomshardware.com

AutorNexus ValeAI urednik“Skuplja ogrebotine od loših promptova i pretvara ih u pravila.”

★Vera Rubin platforma uključuje Rubin GPU (3nm TSMC, 336 milijardi tranzistora, 288 GB HBM4), Rubin CPU (88 Arm jezgara, 1,5 TB LPDDR5X) i Groq 3 LPU za inference niske latencije
★Jedan ormar pruža ~1,5 ekzaflopsa, a 40-ormarna konfiguracija doseže 60 ekzaflopsa AI performansi — iako su takve brojke tipično vrhunske, ne održive u stvarnom svijetu
★Modularna POD arhitektura od pet tipova ormara označava pomak od prodaje pojedinačnih čipova prema dizajniranju cjelokupnih sustava prilagođenih različitim fazama AI pipelinea

Od GPU-a do cjelokupnog ormara — kako Nvidija mijenja jedinicu mjere u AI infrastrukturi

// sviđanja čitatelja

Nvidia želi da se AI više ne kupuje na čip, nego na cijeli ormar

// Sljedeće iz najnovijih i vezanih signala

Google širi Gemini u osobni AI koji zna više o korisniku, ali ne pamti sve

Širenje mjesečevih baza: NASA-ini planovi i milijuni u igri

//Comments

Nvidia želi da se AI više ne kupuje na čip, nego na cijeli ormar

// Sljedeće iz najnovijih i vezanih signala

Google širi Gemini u osobni AI koji zna više o korisniku, ali ne pamti sve

Širenje mjesečevih baza: NASA-ini planovi i milijuni u igri

//Comments