Tencentov offline prevoditelj stane u 440 MB, ali benchmark nije putovnica
An offline phone scene shows translation happening on the device rather than in the cloud.š· AI-generated / Tech&Space
- ā Tencentov model od 440 MB pokriva 33 jezika, pet dijalekata ili manjinskih jezika i 1.056 smjerova prijevoda
- ā Hugging Face kartica navodi 1,25-bitnu kvantizaciju, Android APK i offline rad bez prikupljanja podataka
- ā Tvrdnje o usporedbi s Google Translateom treba Äitati kao vendor tvrdnje dok ih ne potvrde neovisni testovi
Tencentov Hy-MT1.5-1.8B-1.25bit nije samo joÅ” jedan mali model s lijepim grafikonom. Prema The Decoderu, rijeÄ je o offline prevoditelju koji stane u 440 MB i pokriva 33 jezika, pet dijalekata ili manjinskih jezika te 1.056 smjerova prijevoda.
Primarna Hugging Face kartica potvrÄuje Å”iri paket: modeli su objavljeni s težinama i GGUF formatima, Android demo APK postoji, a kartica navodi rad bez mreže i bez prikupljanja podataka. Za korisnika to znaÄi dvije konkretne prednosti. Prijevod može raditi u avionu, podzemnoj željeznici ili slaboj mreži, a osjetljiv tekst ne mora odmah napustiti ureÄaj.
TehniÄki trik je brutalna kompresija. The Decoder navodi da se model smanjuje s 3,3 GB na 440 MB pri 1,25 bita po parametru. Hugging Face stranica za srodnu 2-bitnu varijantu opisuje viÅ”efazni trening, destilaciju i kvantizaciju, a za 1,25-bitnu varijantu navodi joÅ” manji paket. To je rubni AI u najpraktiÄnijem smislu: dovoljno malen da se uopÄe može zamisliti na telefonu, a dovoljno specijaliziran da ne glumi opÄi chatbot.
Hy-MT1.5 pokazuje koliko je agresivna kompresija promijenila rubni AI, no stvarna vrijednost ovisi o jezicima, ureÄajima i reÄenicama koje nisu birane za demo.
A compression metaphor shows the model shrinking from cloud scale to phone scale.š· AI-generated / Tech&Space
Tencent tvrdi da model na standardnim mjerenjima parira komercijalnim servisima i veÄim otvorenim modelima. To je zanimljivo, ali nije isto Å”to i dokaz za stvarni svijet. Prevoditeljski benchmark obiÄno voli uredne reÄenice, poznate domene i jasne parove jezika. Korisnici nose mijeÅ”ani jezik, sleng, imena, pogreÅ”ke u pisanju, fotografirane natpise i medicinske ili pravne nijanse.
Zato tvrdnju da model "pobjeÄuje Google Translate" treba držati u navodnicima dok ne proÄe neovisne testove. Googleov servis nije samo model, nego cijeli proizvodni sustav s godinama korekcija, jeziÄnih parova, korisniÄkih signala i UX rubova. Tencentov adut nije nužno apsolutna kvaliteta, nego lokalnost: dobar prijevod bez mreže može biti važniji od savrÅ”enijeg prijevoda koji nije dostupan.
Najzanimljivija publika nisu samo putnici s najnovijim flagship telefonom. To su aplikacije za dostupnost, terenski rad, humanitarne situacije, Å”kole i tržiÅ”ta gdje je cloud nepouzdan ili regulatorno nepoželjan. Ako model radi dovoljno dobro na srednjim ureÄajima, programeri dobivaju jeziÄnu komponentu koju mogu ugraditi bez stalne API ovisnosti.
ZakljuÄak je oprezno pozitivan. Tencent je pokazao da se prevoditeljski model može stisnuti do veliÄine koja mijenja distribuciju proizvoda. Ali kvaliteta prijevoda ne živi u veliÄini datoteke. Živi u neurednim razgovorima, jeziÄnim rubovima i nezgodnim reÄenicama koje demo ne bira. Tamo Äe se vidjeti je li 440 MB proboj ili samo impresivno zapakiran benchmark.

