ARTICLE LINK> OPENING ARTICLE STREAM> WARMING IMAGE CACHE> LOCKING READER ROUTE> TRANSFER

// INITIALIZING GLOBE FEED...

Umjetna inteligencijaPREPRAVLJENOdb#4602

TiDAR želi da AI tekst misli paralelno, a govori uredno

22. svibnja 2026.(1w ago)

Global

Brzi interpreter članka

TiDAR, predstavljen kroz rad “Think in Diffusion, Talk in Autoregression”, predlaže hibridni pristup u kojem difuzijski dio služi za brže paralelno planiranje, a autoregresivni dio za kvalitetno sekvencijalno izgovaranje teksta. Supplied video analiza Yannica Kilchera naglašava da je poanta rada izravno napasti kompromis između propusnosti, iskorištenosti GPU-a i AR razine kvalitete.

TiDAR vizualizira kompromis između paralelnog planiranja i kauzalnog generiranja teksta.📷 AI-generated image / TECH&SPACE

AutorNexus ValeAI urednik“Još uvijek vjeruje da se model prvo mora objasniti, pa tek onda isporučiti.”

★TiDAR pokušava spojiti difuzijsko paralelno generiranje s autoregresivnom kvalitetom jezika.
★Rad cilja višu propusnost i bolju iskorištenost GPU-a bez potpunog napuštanja kauzalne strukture AR modela.
★Izvorni kontekst dolazi iz video analize Yannica Kilchera i rada dostupnog na arXivu.

TiDAR je zanimljiv zato što ne pokušava još jednom prodati difuzijske jezične modele kao magičnu zamjenu za autoregresivne LLM-ove. Njegova početna pretpostavka je prizemljenija: difuzijski modeli obećavaju brže paralelno generiranje, dok autoregresivni modeli i dalje drže prednost u kvaliteti jer njihov kauzalni redoslijed dobro odgovara samoj strukturi jezika. Rad nazvan “Think in Diffusion, Talk in Autoregression” zato postavlja praktično pitanje, ne marketinško: može li se izvući sinergija između propusnosti i kvalitete?

U supplied kontekstu, Yannic Kilcherova video analiza tretira TiDAR kao arhitektonski pokušaj da se smanji stari trošak izbora. Ako model generira strogo token po token, kvaliteta može biti visoka, ali paralelizam je ograničen. Ako se previše oslonimo na difuzijski stil, dobiva se šira paralelna obrada, ali kvaliteta jezika i stabilnost izlaza mogu zaostajati. TiDAR se nalazi upravo između tih režima: “misli” difuzijski, a “govori” autoregresivno.

To nije samo terminološka dosjetka. U arhitekturi je presudno gdje se događa planiranje, a gdje finalna verbalizacija. Difuzijski dio može služiti za šire, paralelnije oblikovanje sekvence ili latentnog plana, dok autoregresivni dio zadržava disciplinu kauzalnog izlaza. Time se ne odbacuje lekcija koju su LLM-ovi već naučili: jezik nije samo skup riječi koji treba popuniti, nego slijed odluka u kojem raniji tokeni uvjetuju kasnije.

Analiza rada pokazuje pokušaj da se paralelna brzina difuzijskih jezičnih modela približi kvaliteti autoregresivnih LLM-ova.

Hibridni model pretvara difuzijski plan u autoregresivni tok tokena.📷 AI-generated image / TECH&SPACE

Najvažniji tehnički motiv je iskorištenost GPU-a. Autoregresivno generiranje često ostavlja hardver u režimu u kojem se čeka sljedeći token, sljedeći korak, sljedeća ovisnost. Difuzijski pristupi obećavaju više posla po koraku jer mogu obrađivati veće dijelove sekvence paralelno. TiDAR, prema sažetku rada i supplied signalu, pokušava postići višu propusnost i bolje iskorištenje GPU-a bez pada na slabiji model ili grubu aproksimaciju koja ruši kvalitetu.

Ovdje je bitno ne pretjerati s tvrdnjama. Supplied kontekst ne daje konkretne benchmark brojeve, imena usporednih modela ni tablice rezultata, pa ih ne treba izmišljati. Ono što se može reći jest da je ambicija rada jasna: presložiti odnos između difuzijskog i AR generiranja tako da se ne mora birati između brzine i jezične kvalitete kao da su potpuno suprotni ciljevi. Za čitatelje koji žele provjeriti izvor, korisni su i arXiv zapis rada i izravni PDF rada.

Za industriju LLM-ova, takav smjer je važan čak i prije nego što se vidi koliko će konkretna metoda preživjeti reprodukciju, skaliranje i implementacijske detalje. Trošak inferencije, latencija i iskorištenost akceleratora više nisu sporedne metrike; one određuju može li se model koristiti u proizvodu, agentnom sustavu ili višekorisničkoj usluzi bez eksplozije računa. TiDAR zato treba čitati kao dio šire potrage za modelima koji ne samo da odgovaraju bolje, nego koriste računalo pametnije.

TECH&SPACE editorial infographic — Shema prikazuje gdje TiDAR spaja propusnost i kvalitetu.📷 AI-generated image / TECH&SPACE

GPU Yannic Kilcher Tidar arXiv Autoregressive Models Diffusion Language Models

// Sljedeće iz najnovijih i vezanih signala

DeepSeek’s Engram: A Fix or Just Another Benchmark Mirage?

Prethodni članak

DeepSeek riješio AI problem koji smo svi osjećali – ali kako?

SoLA tries to shrink an LLM without cutting its nerves

Sljedeći članak

AI modeli postaju preskupi za svaku aplikaciju; SoLA traži mekši način da ih smanji

// sviđanja čitatelja

//Comments

Uredi u foto-review →