Copilot je iz iste tablice izmislio razlike među državama. To je uredski rizik
Iste brojke, druga oznaka države, pogrešan zaključak AI alata.📷 AI-generated image / TECH&SPACE
- ★Adam Kucharski je Copilotu dao identične podatke s različitim oznakama država i dobio izmišljene razlike.
- ★Problem pokazuje kako zadani AI modeli mogu pretvoriti društvene stereotipe u lažnu analitiku.
- ★Za ozbiljnu analizu korisnici moraju svjesno birati modele s jačim zaključivanjem i provjeravati izlaz.
Uredski AI alati prodaju se kao skraćenica do analize. U praksi, zadani model ponekad nije analitičar nego vrlo uvjerljiv pripovjedač. Prema tekstu koji je objavio The Decoder, matematičar Adam Kucharski dao je Microsoft Copilotu identične skupove podataka, ali s različitim oznakama država. Umjesto da prepozna da se brojke ne razlikuju, Copilot je izgradio objašnjenja o navodnim nacionalnim razlikama.
To je sitan test s neugodnom poukom. Ako se jedini promijenjeni element nalazi u naljepnici stupca, korektan odgovor mora biti da nema stvarne razlike. Model koji iz toga izvlači priču o državi, kulturi ili ponašanju ne radi statistiku, nego popunjava prazninu obrascima iz jezika na kojem je treniran. Još gore, izlaz izgleda kao analiza: ima ton, strukturu i sigurnost. Upravo zato je opasan u poslovnim dokumentima, izvještajima, školskim radovima i internim prezentacijama.
Ovdje nije poanta samo Copilot. Isti obrazac vrijedi za kategoriju alata u kojoj korisnik često ne vidi jasno koji model radi posao, zašto je odabran i gdje su njegove granice. Google Gemini i slični asistenti sve više nude više načina rada, ali sučelja korisnike guraju prema zadanom izboru jer je brži, jeftiniji ili dovoljno dobar za običan tekst. Problem nastaje kada se isti taj izbor koristi za usporedbu podataka, procjenu rizika ili donošenje zaključaka o ljudima.
Copilot je na identičnim podacima izmislio razlike među državama, što pokazuje zašto izbor modela u uredskim AI alatima postaje urednička, analitička i poslovna kontrola kvalitete.
Izbor modela postaje dio provjere, ne samo postavka sučelja.📷 AI-generated image / TECH&SPACE
The Decoder navodi ključnu razliku: modeli s jačim zaključivanjem lakše uhvate zamku. To ne znači da su nepogrešivi, nego da je model selection postao dio metode. Kao što analitičar ne bi koristio istu proceduru za čišćenje tablice, test hipoteze i pisanje sažetka, tako ni AI alat ne bi smio automatski dobiti isti zadatak bez provjere načina rada.
Za korisnika to mijenja rutinu. Ako alat analizira podatke, prvo pitanje više nije samo "što kaže AI", nego koji model kaže, na temelju čega i može li se rezultat ponoviti. Treba tražiti usporedbu s nul-hipotezom, provjeru jesu li skupovi podataka stvarno različiti i kratko objašnjenje metode. Ako model priča o razlikama prije nego što potvrdi da razlike postoje, to je znak za prekid, ne za kopiranje odgovora.
Za tvrtke je lekcija još neugodnija. Uvođenje AI asistenta u ured ne završava kupnjom licence. Potrebna su pravila za zadatke visokog rizika, jasna uputa kada se koristi jači model, te obaveza da se analitički izlazi provjere izvan chata. Dokumentacija o Microsoft 365 Copilotu i Googleovi javni materijali za Gemini mogu objasniti funkcije, ali organizacija mora sama odlučiti gdje automatizirani odgovor prestaje biti pomoć i postaje dokazni materijal.
Kucharskijev test zato nije trik za društvene mreže. To je kratka demonstracija kako stereotip može ući u tablicu kroz stražnja vrata, pod maskom produktivnosti. Zadani model je praktičan početak za pisanje e-maila. Za podatke, ljude i usporedbe, zadani model mora biti samo početna sumnja.

