ARTICLE LINK> OPENING ARTICLE STREAM> WARMING IMAGE CACHE> LOCKING READER ROUTE> TRANSFER

// INITIALIZING GLOBE FEED...

Umjetna inteligencijaPREPRAVLJENOdb#4220

AI modeli bi mogli postati lakši ako nose samo module koji im stvarno trebaju

16. svibnja 2026.(1w ago)

Seattle, United States

Brzi interpreter članka

Istraživači iz Allen Institute for AI i UC Berkeley predstavili su EMO, mixture-of-experts model u kojem se eksperti specijaliziraju po sadržajnim domenama, a ne po tipovima riječi. Važno je to što model prema dostupnim podacima može raditi blizu pune izvedbe s tek 12,5 posto eksperata, što izravno cilja jedan od najskupljih problema MoE arhitektura: memoriju. MoE modeli već su standardni sastojak velikih jezičnih sustava, ali često traže da se u memoriju učita previše modela odjednom. Sada treba gledati hoće li se ta modularnost održati u stvarnim proizvodima, a ne samo u pažljivo složenim testovima.

Rasklopljeni MoE model kao velika neuralna arhitektura u kojoj se samo mali skup domenskih ekspertnih modula osvjetljava dok ostatak ostaje hladan i taman.📷 AI-generated image / TECH&SPACE

AutorNexus ValeAI urednik“Vjeruje da je prvi nacrt istine obično skriven u logovima.”

★EMO koristi granice dokumenata kako bi se eksperti specijalizirali po sadržajnim domenama.
★Izvještaj navodi 128 eksperata, modele od 1 do 14 milijardi parametara i gotovo punu izvedbu s 12,5 posto eksperata.
★Najvažniji signal nije veći benchmark, nego mogućnost isporuke manjih domenskih paketa tamo gdje memorija ograničava primjenu.

Najzanimljiviji dio priče o EMO-u nije još jedan veći model, nego mogućnost da se velik dio modela jednostavno ne nosi sa sobom. Prema izvještaju The Decodera, istraživači iz Allen Institute for AI i UC Berkeley trenirali su MoE model čiji se eksperti prirodno vežu uz sadržajne domene, umjesto da se raspoređuju oko sitnijih jezičnih obrazaca.

To zvuči kao tehnička nijansa, ali udara u vrlo praktičan zid. Mixture-of-experts arhitekture mogu biti računski elegantne jer ne aktiviraju sve dijelove modela za svaki token, no memorijski problem ostaje neugodno prisutan: cijeli skup eksperata često i dalje mora biti dostupan. EMO pokušava taj odnos promijeniti tako da se nakon treninga mogu zadržati samo relevantni moduli.

Brojka koja nosi naslov je 12,5 posto eksperata. U istraživačkom sažetku navodi se i konfiguracija s 128 eksperata te skale od 1 do 14 milijardi parametara, uz pad izvedbe od oko jednog postotnog boda kada se model smanji na četvrtinu modula. To nije magija, nego bolji raspored specijalizacije; AI marketing već će pronaći svjetliji reflektor.

Model sa 128 eksperata pokazuje zašto rijetka aktivacija nije dovoljna ako cijeli sustav i dalje mora stati u memoriju

Bliski tehnički kadar memorijskog sklopa i ekspertnih modula označenih po domenama, s vidljivim odvajanjem zadržanih i odbačenih dijelova modela.📷 AI-generated image / TECH&SPACE

Hype filter ovdje je jednostavan: EMO nije dokaz da se veliki modeli odjednom mogu besplatno vrtjeti svugdje. To je dokaz da struktura treninga može proizvesti korisniju modularnost nego klasično oslanjanje na eksperte koji se ponašaju kao unutarnji optimizacijski detalj. Prema izvornom izvještaju, ključni signal dolazi iz fiksnih granica dokumenata tijekom treninga, što modelu pomaže da razvije ekspertizu po domenama sadržaja.

Za developere i tvrtke to je potencijalno važnije od same benchmark brojke. Ako se ovo potvrdi u širim uvjetima, timovi bi mogli isporučivati manje pakete modela za specifične domene, lokalne uređaje ili okruženja u kojima memorija košta više od teorijske elegancije. Drugim riječima, ne bi se uvijek morala nositi cijela knjižnica kada aplikaciji treba samo nekoliko polica.

Benchmark kontekst ipak ostaje presudan. Gubitak od oko jedan postotni bod zvuči mali, ali bez detalja o zadacima, domenama i robusnosti teško je znati gdje se taj trošak pojavljuje. Najbolji signal za EMO neće biti još jedna lijepa tablica, nego pitanje može li isti princip preživjeti produkcijske upite, pomaknute domene i korisnike koji ne znaju da bi se trebali ponašati kao benchmark.

TECH&SPACE editorial infographic — Minimal diagram showing document boundaries flowing into 128 experts, then pruning down to 12.5% active experts and a smaller deployed model.📷 AI-generated image / TECH&SPACE

Allen Institute Uc Berkeley Moe Memory Hurts AI Benchmarking Most Emo

// Sljedeće iz najnovijih i vezanih signala

Weight-loss drugs show a measurable blood-pressure drop

Prethodni članak

Lijekovi za debljinu sada se mjere i po onome što rade krvnom tlaku

Sljedeći članak

Googleova AI pretraga ne traži novu magiju, nego bolji web

// sviđanja čitatelja

//Comments

Uredi u foto-review →