Naverov Seoul World Model: Street View protiv AI halucinacija
📷 © Tech&Space
- ★Milijun Street View slika za treniranje modela
- ★Generalizacija na druge gradove bez fine-tuninga
- ★Tko dobiva prednost u trci urbanih AI modela
Južnokorejski internetski div, Naver, objavio je Seoul World Model—video model svijeta temeljen na više od milijun vlastitih Street View snimaka. Ključna razlika od prethodnih pokušaja?
Koristi stvarnu geometriju gradova, a ne sintetske 3D rekonstrukcije, što bi teorijski trebalo smanjiti AI halucinacije cijelih četvrti. Naravno, „teorijski“ je ovdje ključna riječ: model radi bez fine-tuninga na drugim gradovima, ali koliko je to testirano izvan laboratorija ostaje pitanje.
Naverov pristup nije prvi pokušaj modeliranja realnih prostora—Google i Meta već godinama eksperimentiraju sa street-level datumima. No, ovdje je zanimljivo što korporacija koja već posjeduje masovu lokalnih podataka (Naver Maps, papuga search) ne mora oslanjati se na treće strane.
To je strategijska prednost: tko kontrolira podloge, kontrolira i buduće aplikacije, od autonomnih vozila do virtualnih gradova. Rani benchmarkovi (prema The Decoderu) sugeriraju da model održava koherentnost u dinamičnim scenama—npr. promjene osvjetljenja ili pokretnih objekata.
Ali, kao i uvijek, razlika između demo videa i stvarne performanse je kao razlika između K-drame i seulske gužve u 18 sati.
📷 © Tech&Space
Demo nasuprot deploymenta: koliko je ovo stvarno rješenje, a koliko marketing?
Naver nije prvi koji kombinira Street View i world modele—Wayve i Honda već koriste slične pristupe za autonomno vožnju, ali s manjim skupovima podataka. Naverova skala (milijun+ slika) i lokalna dominacija daju mu polugu, ali pitanje je hoće li model biti otvoren za vanjske developere ili ostati u zatvorenom ekosustavu.
Ako je ovo samo još jedan korporativni walled garden, njegova vrijednost za širu zajednicu bitno opada. Zanimljivo je i što Naver ne spominje autonomna vozila kao primarnu aplikaciju, iako bi to bilo najlogičnije.
Umjesto toga, naglašavaju „urbanu analitiku“ i „virtualne okoline“—što može biti znak da su performanse još uvijek nedovoljne za real-time kritične sustave. Ili pak, da je cilj prodati licencu gradovima, a ne konkurirati Tesli.
Dio AI zajednice već primjećuje da je „generalizacija bez fine-tuninga“ upitna tvrdnja ako se ne navode konkretni gradovi u testiranju. Drugi upozoravaju na sjenu Googleovog Immersive Viewa: lijepa vizualizacija ≠ funkcionalni model.
Pravi test će biti kada neki vanjski tim pokuša replicirati rezultate—do tada, ostaje nam vjerovati Naverovim demoima.
Naverov Seoul World Model predstavlja zanimljiv pokušaj kombiniranja Street View i world modela. Međutim, još uvijek ima mnogo pitanja o njegovoj stvarnoj primjeni i ograničenjima. Vrijednost ovog modela za širu zajednicu ovisi o tome hoće li biti otvoren za vanjske developere ili ostati u zatvorenom ekosustavu.