Le Chat pada na iranskoj ratnoj propagandi u 60 posto vodećih upita
Editorial visualization for Le Chat fails on Iran war propaganda in 60 percent of leading prompts📷 AI-generated / Tech&Space
- ★NewsGuard je testirao Le Chat na deset lažnih tvrdnji iz ruskih, iranskih i kineskih narativa
- ★Stopa pogreške skočila je s 10 posto za neutralne upite na 80 posto za zlonamjerne upite
- ★Francusko Ministarstvo obrane koristi prilagođenu offline verziju Le Chata, ali audit nije testirao tu instancu
GDJE JE LE CHAT POSRNUO
NewsGuardov audit, kako ga prenosi The Decoder, testirao je Mistralov Le Chat na deset lažnih tvrdnji povezanih s ruskim, iranskim i kineskim narativima. Najproblematičniji rezultat dolazi iz vodećih upita o Iranu: model je, prema izvještaju, ponovio dezinformaciju u 60 posto takvih pokušaja.
Važan je i raspon. Kod neutralnih upita stopa pogreške bila je 10 posto, kod vodećih 60 posto, a kod zlonamjernih upita 80 posto. To ne izgleda kao slučajna omaška, nego kao sustav koji postaje znatno slabiji čim korisnik promptu doda smjer, uvjerenje ili manipulativnu strukturu.
Mistral se pozicionira kao europska alternativa američkim AI laboratorijima, s naglaskom na otvorenost, brzinu i suverenost podataka. Taj argument i dalje može biti relevantan za kupce koji ne žele svu AI infrastrukturu vezati uz SAD. No NewsGuardov nalaz pokazuje granicu tog obećanja: geopolitičko podrijetlo modela ne govori dovoljno o tome koliko dobro odbija ratnu propagandu.
Posebno osjetljiv dio priče je francuska obrambena upotreba. Izvor navodi da Francusko Ministarstvo obrane koristi prilagođenu offline verziju Le Chata. Audit, koliko je navedeno u dostupnom materijalu, ne testira baš tu izoliranu instancu, pa taj detalj ne treba pretvoriti u tvrdnju o konkretnom vojnom sustavu. Ali rizik je očit: ako javna verzija modela lako prihvaća zlonamjerno kadriranje, obrambeni korisnici moraju znati što je u njihovoj verziji stvarno popravljeno.
NewsGuardov audit ne ruši ideju europskog AI suvereniteta, ali pokazuje da lokalni model nije automatski pouzdaniji model.
Secondary editorial visualization for Le Chat fails on Iran war propaganda in 60 percent of leading prompts📷 AI-generated / Tech&Space
SUVERENOST NIJE ISTO ŠTO I SIGURNOST
Ovdje nije dovoljno reći da svaki veliki jezični model ponekad halucinira. Tema nije kreativna pogreška, nego spremnost modela da ponovi politički korisnu laž kada ga prompt gurne u tom smjeru. Kod ratnih narativa takva pogreška nije kozmetička; ona može pojačati tuđi informacijski rad uz gotovo nikakav trošak za napadača.
Metodologija ipak ostavlja prostor za oprez. Dostupni izvještaj sažima rezultate, ali ne daje potpunu sliku svih upita, uzorka i dizajna napada. To znači da brojke treba čitati kao ozbiljan signal za provjeru, a ne kao konačnu forenzičku kartu svih Le Chat implementacija.
Najbolji odgovor za Mistral bio bi dosadan i konkretan: objaviti jasniji opis testiranja, objasniti gdje su zaštite zakazale i dati vremenski okvir za popravke. Obrambenim i državnim korisnicima treba više od tvrdnje da je model europski ili offline. Treba im dokaz da ga se ne može lako navesti da uredno isporuči protivnički narativ.
Pouka je šira od jednog francuskog modela. AI suverenitet ima smisla samo ako uključuje suverenost nad kvalitetom, evaluacijom i sigurnosnim standardom. Bez toga lokalna infrastruktura može ostati samo lokalni način širenja tuđe dezinformacije.