Google i Intel graditi će AI čipove — što to znači za korisnike?
📷 © Tech&Space
- ★Zajednički razvoj IPU čipova za Google Cloud
- ★Xeon 6 procesori ostaju ključni za AI inferencu
- ★Potencijalni udarac na NVIDIA-inu dominaciju u AI
Google i Intel nisu samo produžili postojeću suradnju — sada aktivno razvijaju prilagođene IPU čipove (Infrastructure Processing Units) za potrebe Google Cloud platforme. Ovo nije samo još jedan industrijski savez sklon alijansama: radi se o direktnom odgovoru na globalni nedostatak CPU-a, gdje čak i divovi poput Googla traže alternative za skaliranje AI opterećenja.
Dok se Xeon 6 procesori nastavljaju koristiti za AI inferencu i opće cloud zadatke, pravi pomak je u zajedničkom dizajnu ASIC-baziranih IPU-a. Projekt je započeo još 2021., ali sada dobiva konkretniji oblik. Intelovo ulaganje u ovu suradnju nije samo tehnološko — to je i strategijski potez protiv NVIDIA-ina monopola na GPU tržištu za AI.
Činjenica da Google ne planira potpuno odustati od Xeon procesora (čak i uz nove IPU-e) govori o pragmatičnom pristupu: balansiranim sustavima koji kombiniraju CPU, GPU i specijalizirani hardver. To je suprotno marketinškom narativu da samo najnoviji GPU-ovi rješavaju sve — realnost je da 80 % AI opterećenja u produkciji ne zahtijeva H100, već efikasnu distribuciju zadataka.
Prema Intelovim podacima, upravo ta ravnoteža donosi do 30 % bolju efikasnost u određenim scenarijima. Dio tech zajednice već spekulira hoće li ovo značiti smanjenje Googleove ovisnosti o TPU-ima (Tensor Processing Units), njihovim vlastitim ASIC rješenjima.
Međutim, prema dostupnim informacijama, IPU-i koje razvijaju s Intelom ciljaju druge slojeve infrastrukture — optimizaciju mrežnog prometa, sigurnosne zadatke i ubrzanje podataka prije nego što stignu do GPU-a ili TPU-a. Drugim riječima, ne radi se o zamjeni, već o dodatnom sloju koji bi mogao smanjiti ukupne troškove za korisnike Google Clouda.
📷 © Tech&Space
Hardverska strategija koja bi mogla promijeniti troškove i performanse u cloud AI-ju
Za korisnike Google Cloud platforme ovo partnerstvo moglo bi značiti niže latencije i predvidljivije troškove — ali ne odmah. Prvi IPU čipovi razvijeni u ovoj suradnji očekuju se tek 2025., a njihova integracija u postojeću infrastrukturu tražit će vremena. Međutim, već sada postoji konkretan korak: Xeon 6 procesori dostupni su u Google Cloudu za AI inferencu, a prema benchmarkovima pokazuju do 2x bolju performansu po vatu u odnosu na prethodnu generaciju.
To je važno za tvrtke koje pokreću modele kao što su Llama 2 ili Stable Diffusion — manje troše na CPU, više ostavljajući za GPU kada je to stvarno potrebno. Najveće pitanje ostaje: hoće li ovo stvarno ugroziti NVIDIA-inu dominaciju? Za sada, ne izravno.
GPU-ovi i dalje vladaju treniranjem velikih modela, ali Intel i Google ciljaju druge kritične točke — one koje se često zanemaruju u marketinškim pričama. Na primjer, istraživanja pokazuju da do 40 % vremena u cloud AI zadacima odlazi na preprocesiranje i transfer podataka, a ne na samo izračunavanje. Upravo tu IPU-i mogu donijeti najveću uštedu.
Međutim, bez konkretnih benchmarka i cijena (koje Intel još uvijek ne objavljuje), ostaje pitanje koliko će ovo biti stvarni napredak, a koliko samo preraspodjela troškova između različitih hardverskih komponenti. Zanimljivo je i to što ovo partnerstvo dolazi u trenutku kada Arm ulazi u CPU rat s vlastitim AGI čipom. Google, koji već koristi Armove procesore u svojim telefonima (Tensor SoC), sad jače stavlja na Intelova rješenja za cloud.
To sugerira da fleksibilnost i izbor arhitekture postaju ključni — a ne vjernost jednom dobavljaču. Za korisnike to može značiti više opcija, ali i veću kompleksnost pri odabiru optimalne konfiguracije.
Korisnici Google Cloud platforme mogli bi očekivati poboljšane performanse i niže troškove zahvaljujući ovom partnerstvu. Međutim, još uvijek je rano za konačne zaključke jer će se uspješnost ove suradnje ovisiti o brojnim čimbenicima, uključujući i kvalitetu razvijenih IPU čipova te njihovu integraciju u postojeću infrastrukturu. Slijedeći razvoj ove suradnje bit će važan za sve koji su zainteresirani za budućnost cloud AI usluga.