Gemini Live: Glasovi koji više ne zvuče kako trebaju
📷 © Tech&Space
- ★Capella glas više nije britanski kao ranije
- ★Promjene od verzije 3.1 Flash Live
- ★Korisnici žale na nekonzistentnu kvalitetu
Promjena u Gemini Liveu pokazuje koliko je zvuk postao dio identiteta proizvoda. U takvom okruženju svaka nova funkcija brzo postaje test arhitekture, a ne samo proizvoda.
Problem nije univerzalni – neki glasovi ostaju netaknuti u brzim glasovnim kontrolama ili s Android Auto integracijom, što ukazuje na selektivne bugove, a ne na svjesnu promjenu dizajna. Razlog leži, prema dostupnim informacijama, u nadogradnjama osnovnih AI modela.
Google je u zadnjih nekoliko mjeseci uveo nova poboljšanja u Gemini – ali čini se da su ta poboljšanja imala nuspojave na glasovne profile. Korisnici na forumima poput Reddita i Googleovih podrških stranica žale se na neprirodne kadence, promijenjene tonove i čak naglaske koji više ne odgovaraju originalnim presetovima.
Ovdje se otvara klasičan reality gap: što god bila namjera, isporučena kvaliteta ne odgovara očekivanjima. A to nije samo pitanje estetike – za korisnike koji koriste Gemini Live za duže interakcije, poput čitanja knjiga ili vožnje, nekonzistentan glas postaje frustrirajući.
Google još nije komentirao problem, ali pitanje je koliko će ova greška utjecati na povjerenje u AI asistente kao pouzdane alate, a ne samo kao work in progress projekte.
Demo nasuprot deploymenta: Zašto Googleov AI asistent gubi identitet📷 © Tech&Space
Glasovi više nisu samo detalj
Čudno je da se problem pojavljuje i nestaje tjednima, što sugerira da Google možda eksperimentira s modelima u produkciji – ili pak ima problema s verzioniranjem. Prema 9to5Google, dio korisnika izvještava da se glasovi vraćaju na originalne postavke nakon ponovnog pokretanja uređaja, ali to nije trajno rješenje.
Drugim riječima, korisnici su postali beta testeri bez svoje volje. Da je ovo samo pitanje preferencija, problem ne bi bio toliko značajan.
Ali ovdje se radi o hype filter momentu: Google je Gemini Live predstavio kao premium iskustvo s visoko prilagodljivim glasovima, a sada ti isti glasovi zvuče kao da su generirani u žurbi. To nije samo tehnički detalj – to je signal o prioritizaciji u razvoju.
Ako se glasovi, kao ključna komponenta interakcije, mogu tako lako pokvariti, što onda znači za složenije funkcije? Konkurenti poput Appleovog Siri ili Amazonovog Alexa imaju svoje probleme, ali barem su dosljedni.
Googleov slučaj je zanimljiv jer ukazuje na to da brzi razvoj AI modela može narušiti korisničko iskustvo u segmentima koji su već bili stabilni. Razvojni timovi se možda fokusiraju na agentic funkcije ili multilingvalne sposobnosti, ali zaboravljaju da su osnovne stvari – poput glasova – one koje korisnici koriste svaki dan.