ARTICLE LINK> OPENING ARTICLE STREAM> WARMING IMAGE CACHE> LOCKING READER ROUTE> TRANSFER

RobotikaPREPRAVLJENOdb#3968

Najskuplji dio učenja robota možda se seli iz pogona u video

9. svibnja 2026.(2w ago)

Palo Alto, California, United States

Brzi interpreter članka

Rhoda AI-jev DVA pristup pokušava robotiku odmaknuti od skupih teleoperiranih skupova podataka prema video modelima, inverse dynamics prijevodu i dugom vizualnom kontekstu.

An industrial robot watches a wall of real-world video clips that collapse into one predicted action path over a workbench.📷 AI-generated image / TECH&SPACE

AutorDr. Servo LinUrednik za robotiku“Zna razliku između pametne koreografije i stvarnog preživljavanja na terenu.”

★DVA formulira robotsku politiku kao video predikciju, zatim inverse dynamics model prevodi video u akciju.
★Tvrtka navodi zadatke s 10 do 20 sati robotskih podataka, što je agresivna tvrdnja za industrijsku robotiku.
★Najveći rizik ostaje prijenos iz demonstracije u bučne, promjenjive pogone.

Robotsko prikupljanje podataka dugo izgleda kao skupi paradoks: trebaš robota koji već zna raditi da bi prikupio podatke za robota koji će tek naučiti. The Robot Report je polazna točka, ali najvažniji dio nije naslovna buka nego granica tvrdnje: The Robot Report donosi razgovor s Ericom Chanom o Rhoda AI-jevom pokušaju da robotiku skalira preko video-podataka.

Drugi sloj je mehanizam. Rhoda AI research pomaže razdvojiti ono što je potvrđeno od onoga što tek treba dokazati u praksi: DVA najprije predviđa budući video, a tek zatim mali inverse dynamics model pretvara predviđanje u pokret end-effectora.

Direct Video-Action model obećava manje ručnog prikupljanja podataka, ali pravi deployment test tek počinje.

A close control-loop scene showing future video frames translated into end-effector arrows and a small inverse-dynamics module.📷 AI-generated image / TECH&SPACE

Širi kontekst nije ukras. Google DeepMind robotics context pokazuje zašto ova priča ima težinu izvan jednog videa, objave ili laboratorijskog rezultata: ako radi, usko grlo se seli s ručnog učenja robota na kvalitetu video svijeta koji model razumije.

Najpošteniji zaključak zato ostaje discipliniran: DVA je ozbiljna ideja, ali u robotici demo završava tek kada stroj satima radi bez tihe ljudske intervencije. To je dovoljno zanimljivo bez napuhavanja, jer pravi test dolazi tek kada se obećanje sudari s korisnicima, mjerenjima ili stvarnim operacijama.

DVA workflow: web video pretraining, robot video prediction, inverse dynamics, leapfrog inference, real task execution.📷 AI-generated image / TECH&SPACE

DeepMind Google Eric Chan Factory AI AI Research

// Sljedeće iz najnovijih i vezanih signala

Movable spin qubits make the quantum chip less rigid

Prethodni članak

Kvantni čip više ne mora biti statična ploča: qubiti se uče kretati

A European Unreal rival sounds like engine politics, not just tooling

Sljedeći članak

Europa želi vlastiti game engine, ali developeri neće mijenjati pipeline zbog zastave

// sviđanja čitatelja

//Comments

Uredi u foto-review →