Liquid AI: 350M parametara, 28T tokena i pitanje inteligencije
Editorialni vizual za "Liquid AI: 350M parametara, 28T tokena i pitanje inteligencije", usmjeren na glavni sustav i ulog priÄe.š· Ā© Tech&Space
- ā 350M parametara protiv trendova skaliranja
- ā Reinforcement learning na 28 trilijuna tokena
- ā Tko zapravo dobiva prednost u ovom potezu
Liquid AI je upravo objavio LFM2.5-350M ā model s 350 milijuna parametara koji je proÅ”ao kroz dodatnih 18 trilijuna tokena pretrage (od ukupnih 28T) i skalirano pojaÄano uÄenje. To nije samo iteracija, nego namjerni test granica āgustoÄe inteligencijeā: koliko performanse možete iscijediti iz manjeg modela ako ga natovarite podacima i finim tuningom. Za usporedbu, Metaov Llama 3 8B ima 23 puta viÅ”e parametara, ali je treniran na ~15T tokena ā Liquid ovdje igra drugu igru.
Iako marketing naglaÅ”ava āizazivanje zakona skaliranjaā, stvarni signal leži u cijeni treniranja. 28T tokena nije malen broj ā to je razina koju veÄina startupa ne može priuÅ”titi, Äak ni s optimizacijama. Äini se da Liquid testira hipotezu: možda parametri nisu usko grlo, veÄ kvaliteta podataka i metoda fine-tuninga. To bi moglo objasniti zaÅ”to se model hvali upravo reinforcement learningom na velikom obimu, a ne samo veÄom arhitekturom.
Dio technical communityja veÄ primjeÄuje da su benchmarkovi (ako ih ima) joÅ” uvijek u fazi āizabranih primjeraā, a ne nezavisnih testova. To je kljuÄna razlika: demo ā produkt. Liquidov pritisak na āinteligeniju po parametruā zvuÄi uvjerljivo, ali dok ne vidimo realne use caseove ā npr. u production okruženjima s ograniÄenim resursima ā ostaje pitanje koliko je ovo inovacija, a koliko pametno pakiranje.
Demo nasuprot deploymenta: gdje se krije stvarna inovacija
Drugi vizualni kut koji prikazuje praktiÄni mehanizam iza teme "Demo nasuprot deploymenta: gdje se krije stvarna inovacija".š· MarkTechPost / marktechpost.com
Ako je LFM2.5-350M zaista efikasniji od veÄih modela u specifiÄnim zadacima (npr. struÄni Q&A ili kod generiranje), to bi moglo promijeniti dinamiku za edge AI i ureÄaje s ograniÄenom raÄunskom snagom. Ali tu dolazimo do suÅ”tinske dileme: Liquid joÅ” uvijek nije objavio detalje o latenciji, troÅ”kovima inferencea, ni usporedbama s konkurentima poput Mistral 7B u istim uvjetima. Bez toga, sve su to claimovi bez konteksta.
Zanimljivije od samog modela je pitanje tko ovdje stjeÄe prednost. Liquid AI nije open-source igraÄ poput Mistrala, niti ima cloud infrastrukturu kao Google. Njegova Å”ansa leži u licenciranju za niche primjene ā recimo, u financijama ili zdravstvu gdje su manji, brži modeli kritiÄni. Ali ako se ispostavi da 350M parametara zaista može držati korak s 7B+ modelima u odabranim scenarijima, to bi moglo potresti tržiÅ”te inferenÄnih Äipova (npr. Qualcomm ili NVIDIA Jetson).
Za sada, najjaÄi signal dolazi od samog Liquidovog fokusa: oni ne prodaju model, nego priÄu o uÄinkovitosti. To je pametan potez u svijetu gdje veÄina igraÄa utjeÄe na āveÄi = boljiā narativ. Ali dok god nema transparentnih benchmarka na realnim datasetovima ā a ne na sintetiÄkim testovima ā ostaje sumnja: je li ovo stvarno proboj, ili samo bolje pakirana srednja klasa?
Liquid AI mora joÅ” uvijek dokazati svoju vrijednost u stvarnim svjetskim primjenama. Ako uspije, to bi moglo biti velikim poticajem za razvoj umjetne inteligencije. MeÄutim, dok ne vidimo konkretnih rezultata, teÅ”ko je donijeti konaÄni sud. SadaÅ”nji rezultati su obeÄavajuÄi, ali joÅ” uvijek nije jasno koliko Äe se ova tehnologija moÄi primijeniti u praksi.

