ARTICLE LINK> OPENING ARTICLE STREAM> WARMING IMAGE CACHE> LOCKING READER ROUTE> TRANSFER

// INITIALIZING GLOBE FEED...

TehnologijaPREPRAVLJENOdb#4849

Stanford i Google love CPU greške koje ne ruše server, nego kvare podatke

26. svibnja 2026.(3d ago)

Stanford, United States

Brzi interpreter članka

Rad “ITHICA: Intra-Thread Instruction Checking Approach for Defect-Induced Silent Data Corruptions” bavi se procesorima koji naizgled rade normalno, ali povremeno proizvode pogrešne rezultate bez rušenja sustava. Za hyperscalere je to operativni problem jer se takvi kvarovi mogu širiti kroz velike flote servera i tek kasno pojaviti kao oštećeni podaci.

ITHICA cilja procesore koji u floti izgledaju zdravo, ali povremeno vraćaju pogrešan rezultat.📷 AI-generated image / TECH&SPACE

AutorAxel ByteUrednik za tehnologiju“Datasheet čita kao što neki ljudi čitaju priču za laku noć.”

★Stanford i Google analiziraju silent data corruption u CPU-ovima povezanu s proizvodnim defektima silicija.
★ITHICA se uklapa u širi pomak prema funkcionalnim testovima koji traže kvarove vidljive tek pod stvarnim instrukcijskim obrascima.
★Za hyperscalere je cilj ranije izdvojiti defektne procesore prije nego što tihi kvarovi kontaminiraju podatkovne tokove.

Silent data corruption je najnezgodnija vrsta hardverskog kvara: sustav ne padne, alarm se ne upali, a rezultat ipak može biti pogrešan. Upravo tu klasu problema pokriva rad “ITHICA: Intra-Thread Instruction Checking Approach for Defect-Induced Silent Data Corruptions”, koji su prema objavi Semiconductor Engineeringa potpisali istraživači sa Stanford Universityja i Googlea.

Polazište je jednostavno, ali za velike računalne flote vrlo neugodno. Hyperscaleri već prijavljuju slučajeve tihih korupcija podataka u CPU-ovima, a pretpostavljeni uzrok su proizvodni defekti u siliciju. To nisu nužno spektakularni kvarovi koji odmah izbace server iz pogona. Problem je procesor koji većinu vremena izgleda ispravno, ali u određenim instrukcijskim uvjetima može proizvesti krivi rezultat.

Zato je važan naglasak na funkcionalnim testovima. Klasična proizvodna validacija i standardni stres-testovi mogu uhvatiti velik broj očitih kvarova, ali silent data corruption živi u sivom prostoru između “radi” i “radi pouzdano”. Ako se defekt pojavi samo u specifičnoj kombinaciji instrukcija, ovisnosti i unutarnjih stanja jezgre, test mora nalikovati stvarnom izvršavanju koda, a ne samo provjeravati površinsku stabilnost.

Stanford i Google ciljaju defektno inducirane silent data corruption slučajeve u procesorima, problem koji hyperscaleri više ne mogu tretirati kao rijetku statističku buku.

Funkcionalni test traži odstupanje unutar instrukcijskog toka, a ne samo očiti pad sustava.📷 AI-generated image / TECH&SPACE

ITHICA, prema samom naslovu rada, uvodi intra-thread instruction checking pristup. Drugim riječima, fokus nije na apstraktnoj dijagnostici čipa nego na provjeri ponašanja instrukcija unutar niti izvršavanja. Takav smjer ima smisla jer se tihi kvar mora uhvatiti ondje gdje nastaje: u rezultatu instrukcijskog toka, prije nego što pogrešan podatak završi u bazi, modelu, indeksu ili distribuiranom obračunu.

Za industriju je to bitno zbog razmjera. Pojedinačni CPU s rijetkim defektom može izgledati kao statistička fusnota. U floti hyperscalera, rijetkost se množi tisućama ili milijunima instanci. Ako se kvar ne manifestira kao pad sustava, nego kao krivi bit u legitimnom izračunu, posljedica se može otkriti tek nakon što je prošla kroz više slojeva softvera.

Zato ova tema nije usko akademska. Ona dodiruje način na koji se serveri kvalificiraju, kako se sastavljaju flote, kako se planira pouzdanost i koliko se vjeruje samom procesoru kao temelju računalnog lanca. Objavljeni sažetak ne daje prostor za preuveličavanje: riječ je o istraživačkom radu i pristupu detekciji, ne o najavi industrijskog standarda. Ali signal je jasan. Kako čipovi postaju kompleksniji, a računalne flote veće, “procesor radi” više nije dovoljno precizna tvrdnja. Pitanje je radi li ispravno u onim rubnim kombinacijama koje najskuplje promaknu.

TECH&SPACE editorial infographic — Put od silicijskog defekta do tihe korupcije podataka i izdvajanja procesora iz flote.📷 AI-generated image / TECH&SPACE

Google Checking Approach Defect-induced Silent Semiconductor Engineering Stanford University

// Sljedeće iz najnovijih i vezanih signala

Vibe Coding Stalls When a Prototype Has to Become a Product

Prethodni članak

Vibe-coding izgleda moćno dok ne mora preživjeti stvarne korisnike

NASA’s AI Processor Clears Early Testing

Sljedeći članak

NASA-in AI čip cilja na letjelice koje ne mogu čekati Zemlju

// sviđanja čitatelja

//Comments

Uredi u foto-review →