Googleov offline diktant koji »popravlja« misli: iOS prvi, Android čeka

Googleov offline diktant koji »popravlja« misli: iOS prvi, Android čeka📷 © Tech&Space
- ★Offline AI pretvara govor u uređeni tekst bez oblaka
- ★iOS ima prednost, Android ostaje bez roka dolaska
- ★Wispr Flow i SuperWhisper dobili konkurenta s Googleovim čipovima
Google AI Edge Eloquent nije još jedan glasan unos teksta – to je prvi ozbiljan pokušaj da se on-device AI pretvori u produktivnu prednost. Aplikacija ne samo da pretvara govor u tekst nego aktivno »čisti« rečenice: uklanja popunjavala poput »e« i »mislim«, ispravlja gramatičke greške sredinom izjave te nudi četiri predloška formata (od »Kratko« do »Formalno«). Sve to bez ikakvog oblaka – modeli se izvode lokalno na uređaju, što je ključna razlika u odnosu na konkurente poput Otter.ai, koji se još uvijek oslanjaju na servere za napredno uređivanje.
Čudno je, dakle, da je Google odlučio lansirati prvo na iOS-u, platformi koja tradicionalno ima manje fleksibilnosti za duboku integraciju s hardverom. Android korisnici – čija je platforma upravo optimizirana za Googleove Tensor čipove – morat će čekati, a rok nije naveden. To otvara pitanje: je li ovo strategijski potez da se testira tržište s manjim fragmentacijama (iOS), ili pak znak da offline AI još uvijek ima problema s performansama na raznolikijem Android ekosustavu?
Još je zanimljivije što Eloquent nije samo nadogradnja postojećeg Googleovog diktafon-alatka, nego proizlazi iz AI Edge Gallery projekta – okvira za lokalno izvođenje generativnih modela. To znači da aplikacija ne radi samo transkripciju, nego zapravo interpretira namjeru govornika, što je korak bliže onome što konkurenti poput Wispr Flow i SuperWhisper već godinama obećavaju.

Demo nasuprot deploymenta: zašto lokalni AI mijenja pravila igre📷 © Tech&Space
Demo nasuprot deploymenta: zašto lokalni AI mijenja pravila igre
Razlika? Google ovdje koristi vlastitu infrastrukturu čipova, što bi teorijski trebalo donijeti bolju energetsku učinkovitost. Ali – kao i uvijek – demo nije proizvod.
Realnost je da većina korisnika neće koristiti Eloquent zbog njegovih AI »čarolija«, nego zbog dvaju praktičnih detalja: podrške za pretraživanje snimki i prilagodljivog rječnika. Prvo omogućava brzo pronalaženje razgovora (npr. po ključnim riječima), a drugo – što je rijetkost u ovakvim alatima – dopušta unos specifičnih termina (npr. stručnih izraza ili imena) koje AI inače ne bi prepoznao. To su funkcije koje konkurenti ili naplaćuju kao premium, ili ih uopće nemaju.
No, pravi test bit će koliko će aplikacija zaista poštivati privatnost koju obećava. Google tvrdi da nijedan audio ili tekst ne napušta uređaj, ali teško je povjerovati u apsolutnu iznimku kada je riječ o kompaniji čiji je poslovni model temeljio na podacima. Istraživanje MIT-a iz 2023. pokazalo je da čak i »lokalni« modeli mogu nehotice propuštati metapodatke kroz telemetriju – a Google nije poznat po transparentnosti u tom segmentu.