Umjetna inteligencijaPREPRAVLJENOdb#3060

Meta gradi vlastitu čipovsku utvrdu: četiri generacije AI silicija koje bi mogle presjeći Nvidia

20. travnja 2026.06:07(1w ago)

Menlo Park, United States

Meta pušta četiri generacije AI čipova: tko dobiva📷 © Tech&Space

AutorNexus ValeAI urednik"Voli čist benchmark skoro kao i grubi reality check."

★MTIA 300 već je u masovnoj proizvodnji i pokreće modele rangiranja na Facebooku i Instagramu, dok MTIA 400 cilja nadmašiti komercijalne konkurente po performansama
★MTIA 450 i 500, fokusirani na generativnu AI, neće biti dostupni do 2027. — memorijska propusnost raste 4,5x, a računalna snaga 25x između prve i posljednje generacije
★Meta gradi oko otvorenih standarda PyTorch, vLLM i Triton, što smanjuje trenje pri integraciji ali i vezuje ekosustav pod njihovu kontrolu

Meta je službeno predstavila četiri generacije vlastitih AI čipova za inferenciju — MTIA 300, 400, 450 i 500. Uz Broadcom kao ključnog partnera, ova silicijska ofenziva cilja izravno smanjiti ovisnost o Nvidijinim i AMD-ovim GPU-ima za najzahtjevnije AI radno opterećenje. MTIA 300 već je u masovnoj proizvodnji i pokreće modele rangiranja i preporuka na Facebooku i Instagramu — onaj algoritamski mehanizam koji odlučuje što vidite dok beskrajno pomičete feed.

MTIA 400 dizajniran je da nadmaši komercijalne konkurente po sirovim performansama, dok se MTIA 450 i 500 usmjeravaju prema generativnoj AI i neće biti dostupni prije 2027. Razmak između generacija je dramatičan: memorijska propusnost raste 4,5 puta, a računalna snaga eksplodira za faktor 25 od prve do posljednje iteracije. Meta je arhitekturu izgradila oko otvorenih standarda — PyTorch, vLLM i Triton — što tehnički smanjuje trenje pri integraciji, ali istovremeno vezuje razvojni ekosustav pod vlastitu kontrolu.

Iako kompanija i dalje koristi Nvidijine i AMD-ove GPU-e za određene radne opterećenje, ovaj potez je neupitan signal: Big Tech više ne želi plaćati danak za svaki put podatka kroz tuđe mreže.

Od MTIA 300 do MTIA 500: revolucija u vlastitoj AI infrastrukturi📷 © Tech&Space

Od preporuka sadržaja do generativne umjetne inteligencije — Big Tech konačno shvaća da je inference novi bojište

Što ovo znači za širi teren? Meta ne samo da smanjuje ovisnost o vanjskim dobavljačima, već postavlja temelje za jeftiniju generativnu AI u realnom vremenu. Modeli za prijevod, AR filteri ili asistentski odgovori mogli bi se izvršavati lokalno umjesto na udaljenim cloud GPU serverima — što rezultira nižim kašnjenjem i značajno nižim operativnim troškovima.

Broadcomov angažman potvrđuje da silicijski divovi ozbiljno ulaze na tržište AI čipova, iako detalji o proizvodnji i preciznim specifikacijama ostaju djelomično za zavjesom.

Za razvojne inženjere, standardi poput PyTorcha znače da migracija postojećih modela ne zahtijeva potpuno pisanje koda — no to je i zamka. Svaki veliki igrač koji gradi vlastitu hardversku stazu istovremeno fragmentira tržište, a Meta s 3,27 milijardi dnevnih korisnika ima dovoljno masu da taj fragment pretvori u vlastiti standard.

Ključno pitanje nije hoće li Meta uspjeti smanjiti troškove — to je gotovo sigurno — već kako će se ta uštuda pretočiti u konkurentsku prednost. Jeftinija inferencija znači više eksperimenata, agresivnije skaliranje modela i dublju integraciju AI u svaki produktni dodir. Ako Nvidijina dominacija u treningu ostaje neupitna, bojište se sada pomjera prema inferenciji — tamo gdje se modeli susreću s korisnicima milijarde puta dnevno. Meta upravo gradi utvrdu na tom novom frontu.

Meta AI chips (MTIA series)AI hardware architecture (MTIA 300/500)Enterprise AI accelerationCompute infrastructure for generative AIPerformance benchmarks in AI inference

//Comments

Uredi u foto-review →