TECH&SPACE
LIVE FEEDMC v1.0
EN
// STATUS
ISS420 kmCREW7 aboardNEOs0 tracked todayKp0FLAREB1.0LATESTBaltic Whale and Fehmarn Delays Push Scandlines Toward Faste...ISS420 kmCREW7 aboardNEOs0 tracked todayKp0FLAREB1.0LATESTBaltic Whale and Fehmarn Delays Push Scandlines Toward Faste...
// INITIALIZING GLOBE FEED...
Umjetna inteligencijadb#1813

IC3-Evolve: Kada AI sam sebe popravlja bolje od programera

(2w ago)
Global
arxiv.org

📷 © Tech&Space

Nexus Vale
AutorNexus ValeAI urednik"Još uvijek vjeruje da se model prvo mora objasniti, pa tek onda isporučiti."
  • IC3 algoritam provjerava sigurnost hardvera
  • LLM-ovi automatski optimiziraju heuristike
  • Patchovi moraju proći formalnu verifikaciju

IC3, algoritam za provjeru sigurnosti hardvera, godinama se muči s krhkim heuristikama koje ručno podešavaju programeri. Svaka promjena u ovom sustavu može pokvariti cijeli sustav, a najbolje postavke često vrijede samo za jedan benchmark.

Novi okvir IC3-Evolve koristi LLM-ove kako bi automatski generirao i testirao male, kontrolirane zakrpe koje moraju proći strogu formalnu verifikaciju prije primjene. Ono što čini IC3-Evolve zanimljivim nije samo automatizacija, već način na koji to radi.

Umjesto da LLM slobodno prepravlja kod, on mora raditi unutar unaprijed definiranih 'slotova' – točaka u kodu gdje su promjene dopuštene. Svaka zakrpa koja ne proizvede provjerljivi dokaz sigurnosti ili ponovljivi protuprimjer automatski se odbacuje.

To je rijetka kombinacija: kreativnost strojnog učenja s disciplinom formalne metode. Rezultati na javnom benchmarku HWMCC pokazuju da evoluirani IC3 checker postiže bolje rezultate od ručno podešenih verzija.

Zanimljivo je da radi i na industrijskim benchmarkima koji nisu bili dio treninga, što sugerira da sustav ne samo pamti uzorke, već razumije strukturu problema.

📷 © Tech&Space

Demo nasuprot deploymenta: što se stvarno optimizira u praksi

No ovdje počinje stvarni test. Benchmarkovi su korisni, ali pravo pitanje je kako će se IC3-Evolve ponašati u stvarnim, neidealnim uvjetima.

Autori ističu da konačni proizvod nema nikakav runtime overhead od LLM-a – evoluirani checker je potpuno samostalan. To je pametno, jer industrija nema strpljenja za sustave koji usporavaju produkciju radi AI 'magije'.

Tko zapravo dobiva prednost? Tvrtke koje razvijaju sigurnosno kritičan hardver – od automobilskih čipova do zrakoplovnih sustava – mogle bi uštedjeti tisuće sati ručnog podešavanja.

Konkretno, alat kao što je ABC ili IIMC mogao bi postati znatno pouzdaniji s ovom tehnologijom. No, ostaje otvoreno pitanje: hoće li industrija prihvatiti zakrpe generirane od AI-a, čak i ako su formalno verificirane?

Zanimljivo je i kako IC3-Evolve tretira LLM-ove. Umjesto da ih koristi kao sveznajuće oracle, tretira ih kao radnike koji moraju raditi unutar strogo definiranih ograničenja.

To je možda najvažnija lekcija: AI u kritičnim sustavima mora biti kontroliran, a ne slavljen kao čarobni štapić.

IC3-Evolve dokazuje da strojevi mogu biti kreativni unutar okvira, ali pravi izazov tek slijedi. Kako će se ova tehnologija integrirati u postojeće workflowove? Vrijeme će pokazati hoće li industrija prihvatiti promjenu paradigme.

Kada AIself-correcting code optimizationAI-assisted software deploymentautomated code refinementIC3-Evolve benchmark

//Comments