ARTICLE LINK> OPENING ARTICLE STREAM> WARMING IMAGE CACHE> LOCKING READER ROUTE> TRANSFER

// INITIALIZING GLOBE FEED...

Umjetna inteligencijaPREPRAVLJENOdb#4848

HSCO-Bench testira LLM agente na stvarnom HW-SW su-dizajnu čipova

26. svibnja 2026.(3d ago)

New York City, United States

Brzi interpreter članka

Istraživači s Columbia Universityja i IBM Researcha objavili su HSCO-Bench, agent-driven benchmark za end-to-end hardware-software co-design heterogenih sustava na čipu. Poanta nije još jedan izolirani test koda ili RTL-a, nego mjerenje ponašanja LLM agenata kroz povezani SoC optimizacijski tok.

HSCO-Bench prikazuje LLM agenta kao sudionika u cijelom SoC co-design toku.📷 AI-generated image / TECH&SPACE

AutorNexus ValeAI urednik“Skuplja ogrebotine od loših promptova i pretvara ih u pravila.”

★HSCO-Bench spaja softverske i hardverske evaluacije koje se u AI benchmarkovima obično mjere odvojeno.
★Benchmark je usmjeren na heterogene SoC-ove, gdje odluke o kodu, akceleratorima i platformi utječu jedna na drugu.
★Rad dolazi iz Columbia Universityja i IBM Researcha, a objavio ga je Semiconductor Engineering 25. svibnja 2026.

Istraživači s Columbia Universityja i IBM Researcha objavili su rad “HSCO-Bench: An Agent-Driven End-to-End Hardware-Software Co-design Benchmark for Systems-on-Chip”, prema sažetku koji je prenio Semiconductor Engineering. Tema je tehnička, ali problem je vrlo konkretan: veliki jezični modeli sve češće ulaze u dizajn softvera i hardvera, dok ih industrija i akademija i dalje uglavnom testiraju na odvojenim zadacima.

To je slab model za svijet heterogenih sustava na čipu. U takvom SoC-u performanse ne ovise samo o tome je li softver “dobar” ili je hardverski blok “brz”. Ovise o tome kako se posao dijeli između procesorskih jezgri, akceleratora, memorije, međuveza i softverskog sloja koji sve to koristi. Ako benchmark softveru pretpostavi fiksni hardver, a hardveru dopusti samo optimizaciju komponente, promašuje se najvažniji dio odluke: zajednički dizajn.

HSCO-Bench zato pokušava mjeriti LLM agente kroz end-to-end hardware-software co-design tok. To znači da agent nije samo generator koda, niti samo pomoćnik za optimizaciju hardverskog modula. On se procjenjuje u širem procesu u kojem se softverske i hardverske odluke međusobno uvjetuju. Za poluvodičku industriju to je bitna promjena tona, jer se AI alati ne smiju vrednovati samo po tome mogu li riješiti izolirani zadatak, nego po tome mogu li voditi složeni inženjerski kompromis.

Columbia University i IBM Research predlažu benchmark koji ne odvaja softver od hardvera, nego mjeri može li agent optimizirati cijeli heterogeni SoC tok.

Benchmark mjeri povezane odluke između koda, akceleratora i SoC platforme.📷 AI-generated image / TECH&SPACE

Upravo tu leži razlika između atraktivnog demo-scenarija i korisnog benchmarka. LLM može izgledati uvjerljivo kad napiše funkciju, predloži optimizaciju ili opiše mikroarhitekturu. Ali heterogeni SoC traži seriju povezanih odluka: što prebaciti u hardver, gdje ostaviti fleksibilnost u softveru, kako izbjeći usko grlo u memorijskom putu i kako očuvati smislen odnos performansi, potrošnje i kompleksnosti. Ako agent ne vidi cijeli lanac, njegov rezultat može biti lokalno elegantan i sistemski pogrešan.

Zato je zanimljivo da HSCO-Bench dolazi iz kombinacije akademskog i industrijskog okruženja. Columbia donosi istraživački okvir, a IBM Research ima dugu povijest rada na računalnim sustavima, čipovima i AI alatima. U objavljenom sažetku nema dovoljno detalja za zaključak o stvarnim rezultatima benchmarka, pa ih ne treba izmišljati. Važniji signal je sama definicija problema: evaluacija AI agenata za čipove mora se pomaknuti s komponenti na tokove rada.

Za korisnike izvan EDA i SoC krugova, to zvuči usko, ali posljedice su šire. Ako se LLM agenti žele koristiti u dizajnu računalnih sustava, moraju biti testirani tamo gdje odluke imaju trošak. Heterogeni SoC nije tekstualna zagonetka; to je prostor kompromisa između softverske prenosivosti, hardverske specijalizacije i proizvodne realnosti. HSCO-Bench zato nije važan zato što obećava čarobnu automatizaciju, nego zato što postavlja strože pitanje: može li agent razumjeti sustav, a ne samo njegov najlakši dio?

TECH&SPACE editorial infographic — HSCO-Bench pomiče evaluaciju s izoliranih zadataka na povezani co-design tok.📷 AI-generated image / TECH&SPACE

Semiconductor Engineering Ibm Research Real Hw-sw Chip Co-design Hardware-software Co-design Llm Agents Soc

// Sljedeće iz najnovijih i vezanih signala

NASA’s AI Processor Clears Early Testing

Prethodni članak

NASA-in AI čip cilja na letjelice koje ne mogu čekati Zemlju

Why tunneling inside V-NAND matters during erase stress

Sljedeći članak

Samsung prati što se u flash memoriji dogodi kad se brisanje gurne predaleko

// sviđanja čitatelja

//Comments

Uredi u foto-review →