TECH&SPACE
LIVE FEEDMC v1.0
EN
// STATUS
ISS420 kmCREW7 aboardNEOs0 tracked todayKp0FLAREB1.0LATESTBaltic Whale and Fehmarn Delays Push Scandlines Toward Faste...ISS420 kmCREW7 aboardNEOs0 tracked todayKp0FLAREB1.0LATESTBaltic Whale and Fehmarn Delays Push Scandlines Toward Faste...
// INITIALIZING GLOBE FEED...
Umjetna inteligencijadb#2608

Zašto embeddinzi neće spasiti AI pretragu

(1w ago)
Global
youtube.com
Zašto embeddinzi neće spasiti AI pretragu

Zašto embeddinzi neće spasiti AI pretragu📷 © Tech&Space

  • Teorijski limiti vektorskih embedinga
  • Novi benchmarki pogoršavaju stare probleme
  • Yannic Kilcher razotkriva industrijsku hype

ArXiv papir On the Theoretical Limitations of Embedding-Based Retrieval (arXiv:2508.21038) [1] ne samo da potvrđuje ono što su istraživači već godinama šaptali – vektorski embedinzi imaju teorijske granice koje se ne mogu zaobići skaliranjem. Autori ne poriču da su embedinzi korisni za klasične zadatke pretrage, ali upozoravaju: kada se ti isti alati koriste za razmišljanje, slijeđenje instrukcija ili generiranje koda, problemi postaju fundamentalni, a ne samo tehnički.

Problem nije u tome što embedinzi ne rade – rade, ali unutar uskog raspona definiranog njihovom matematičkom prirodom. Kada se od njih traži da shvate 'relevantnost' u kontekstu koji nije statičan (npr. dinamički upiti ili multimodalni scenariji), sustav se raspada.

To nije bug, već značajka. Ili, kako bi rekli autori papira: 'Warning: Rant'.

Yannic Kilcher, čija je video-analiza [2] ovog rada već privukla pažnju tehničke zajednice, naglašava da se industrija pomiče prema sve ambicioznijim benchmarkima bez da je riješila osnovne nedostatke.

Benchmarki za razmišljanje i kodiranje samo proširuju jaz između obećanja i stvarnosti

Part 2: Umjesto da se fokusira na poboljšanje embedinga za specifične domene, trend je gurnuti ih u sve više zadataka – i onda se čuditi zašto rezultati variraju od 'dobrih' do 'potpuno krivih'. Ono što papir ne kaže eksplicitno, ali se podrazumijeva, jest da su ovi limiti posebno bolni za tvrtke koje embedinge tretiraju kao univerzalno rješenje.

Ako je vaš proizvod ovisan o pretrazi koja mora razumjeti nijanse (npr. pravne dokumente ili medicinske dijagnoze), embedinzi će vas prije ili kasnije izdati. To nije pitanje skaliranja modela, već dizajna sustava.

Reakcije u zajednici su podijeljene: dio istraživača vidi papir kao zdravu dozu skepticizma, dok drugi smatraju da autori pretjeruju s kritikom. Na GitHubu i tehnološkim forumima [3] već se pojavljuju rasprave o alternativama, poput hibridnih pristupa koji kombiniraju embedinge s klasičnim metodama pretrage.

Rješenje ovog problema nije jednostavno, ali je jasno da se mora promijeniti pristup korištenju embedinza. Umjesto da se fokusira na univerzalna rješenja, treba se usmjeriti na specifične zadatke i domene. Također, treba se razviti bolja razumijevanja ograničenja embedinza i kako ih zaobići. To će zahtijevati suradnju između istraživača, developera i industrijalaca. Jedno je sigurno: embedinzi neće spasiti AI pretragu, ali mogu biti važan dio rješenja.

AI search benchmarksembedding limitations in retrievalcode generation vs. real-world search performanceLLM evaluation gapssemantic search benchmarking

//Comments