Huawei ima novi AI čip, ali pravi test je softver koji ga mora nositi
Huawei's Atlas 350: When 1.56 PFLOPS Meets Sanctioned Reality📷 AI-generated / Tech&Space editorial visual
- ★Atlas 350 koristi osiromašenu inačicu Ascend 950PR čipa s 25% manje teoretske FP4 performanse i 12,5% manje HBM kapaciteta u odnosu na punu verziju
- ★Novi LingQu protokol omogućuje 2 TB/s međusobno povezivanje — više od dvostruko više od prethodne Ascend 910 serije
- ★Huaweiova tvrdnja o 2,87x većoj performansi od Nvidijinog H20 temelji se na usmjerenim benchmarkovima, dok raniji izvještaji upozoravaju na značajne gubitke pri prevođenju radnih opterećenja između različitih arhitektura
Huawei je na Konferenciji partnera u Šenzhenu predstavio Atlas 350, AI akcelerator koji na papiru zvuči kao teška artiljerija: 1,56 PFLOPS-a u FP4 formatu, 112 GB HBM-a i 1,4 TB/s propusnosti memorije. No upravo tu počinje prva pukotina — riječ je o osiromašenoj inačici Ascend 950PR čipa s 25% manje teoretske FP4 snage i 12,5% manje HBM kapaciteta od punog potencijala koji su kružili glasine prije lansiranja. Onih navodnih 2 PFLOPS-a i 128 GB HBM-a ostali su u ladici, a na tržište je izašao rezani proizvod.
Potrošnja od 600W dodatno komplicira priču. U usporedbi s Nvidijinim H20 koji radi na 400W, Huaweiov čip ždere 50% više energije — razlika koja u data centrima prerasta u ozbiljan operativni trošak. LingQu protokol donosi barem jednu svježinu: 2 TB/s međusobno povezivanje čipova, više od dvostruko više od prethodne Ascend 910 serije. To je konkretan tehnički pomak, no pitanje je koliko ga koristi može iskoristiti u uvjetima gdje softverski ekosustav još uvijek kasni za hardverskim obećanjima.
Huaweiova matematika o 2,87x superiornosti nad H20 proizlazi iz usmjerenih benchmarkova — onih lijepo osvijetljenih scenarija gdje sve funkcionira po planu. Stvarni svijet generativnih modela, fine-tuninga i heterogenih radnih opterećenja puno je manje kooperativan.
LingQu protokol i navodna prednost od 2,87x nad H20 stoje na ispitu stvarnih radnih opterećenja
A scaled-down accelerator with familiar specs and bold claims📷 © Tech&Space
Raniji izvještaji upozoravali su na sistematične probleme pri prevođenju radnih opterećenja između različitih arhitektura, posebno kada se modeli optimizirani za CUDA ekosustav pokušavaju pokrenuti na Ascend platformi. Gubici u performansama često prelaze ono što su sintetički testovi sugerirali, a vrijeme prilagodbe koda raste proporcionalno s kompleksnošću modela.
Sankcije koje Sjedinjene Države nameću kineskoj tehnološkoj industriji stvorile su paradoksalnu situaciju: Huawei je prisiljen graditi domaće alternative, no bez pristupa naprednim proizvodnim procesima poput TSMC-ove CoWoS tehnologije, svaki čip nosi kompromis u efikasnosti i skalabilnosti. Atlas 350 je u tom kontekstu više politički nego tehnički proizvod — signal samodostatnosti upućen i domaćem tržištu i međunarodnim promatračima.
Za programere, podrška za HiBL 1.0 memoriju i novi sistem međuspremnika nude barem djelomičnu olakšicu u migraciji. No dokle god ne postoje neovisni testovi u stvarnim uvjetima korištenja, sve tvrdnje o superiornosti ostaju u sferi marketinške retorike. Kineski kupci, prisiljeni geopolitičkom situacijom, možda će prihvatiti višu potrošnju i neizvjesnost performansi. Ostatak svijeta gledat će i čekati konkretne slučajeve upotrebe prije nego što Atlas 350 shvati ozbiljno.

