Baiduov novi AI model cilja tamo gdje utrka najviše boli: cijenu treninga
AI-generated editorial image / TECH&SPACE📷 AI-generated image / TECH&SPACE
- ★6% troška predtreninga
- ★Trećina prethodnih parametara
- ★Benchmarki ne znače produkciju
Baidu je upravo lansirao Ernie 5.1, jezični model koji ne samo da smanjuje broj parametara na trećinu prethodne verzije, već i troškove predtreninga svodi na samo 6% onoga što zahtijevaju usporedivi modeli. Taj skok u efikasnosti ostvaren je zahvaljujući inovativnom pristupu nazvanom 'Once-For-All', koji omogućuje izdvajanje manjih, specijaliziranih podmodela iz jedne jedinstvene trening sesije. Umjesto da se svaki podmodel trenira zasebno, Ernie 5.1 koristi zajedničku osnovu, čime se štedi vrijeme i resursi bez žrtvovanja performansi.
Rezultati govore sami za sebe: na Search Arena ljestvici, Ernie 5.1 zauzima četvrto mjesto globalno, odmah iza dvije varijante Claude Opusa i GPT-5.5 Search. To je impresivan rezultat s obzirom na to da model koristi značajno manje parametara od konkurencije. Prema podacima objavljenim na The Decoder, Ernie 5.1 postiže 1.223 boda, što ga stavlja ispred DeepSeek-V4-Pro u zadacima autonomnih AI agenata.
Ova činjenica dodatno naglašava da veličina modela nije jedini put do vrhunskih performansi.
Manji trošak i manje parametara nisu slabost ako arhitektura radi posao
AI-generated editorial image / TECH&SPACE📷 AI-generated image / TECH&SPACE
Dodatni kontekst pruža izvorni materijal, iako ostaje pitanje koliko su ovi benchmark rezultati reprezentativni za stvarne scenarije korištenja. Iako Ernie 5.1 pokazuje izvanredne performanse u kontroliranim testovima, industrijski igrači često ističu da se stvarna vrijednost modela mjeri u produkcijskim okruženjima. Baidu je ovdje u prednosti jer već godinama integrira Ernie modele u svoje usluge, od pretraživača do chatbota, što mu daje jedinstvenu priliku za brzu validaciju u realnom svijetu.
Ono što Ernie 5.1 donosi kao najvažniju lekciju jest da inovacije u arhitekturi i trening metodama mogu nadoknaditi nedostatak sirovog obujma parametara. To bi moglo potaknuti pomak u industriji, gdje su dosad dominirali modeli s milijardama parametara i troškovima koji su za većinu kompanija nedostižni. Ako se ovaj pristup pokaže skalabilnim, mogao bi otvoriti vrata manjim igračima i akademskim institucijama za razvoj konkurentnih modela bez potrebe za superračunalima.

