Columbia University nalazi AI citate koji biomedicini kvare provjeru izvora
Lažne reference izgledaju uredno, ali ruše provjerljivost biomedicinske literature.📷 AI-generated image / TECH&SPACE
- ★Revizija 2,5 milijuna biomedicinskih radova bilježi više od dvanaesterostruk rast izmišljenih referenci od 2023.
- ★Lažne reference često odgovaraju temi rada i izgledaju uredno formatirano, što ih čini posebno teškima za ručnu provjeru.
- ★Prema sažetku nalaza, 98 posto pogođenih radova nije dobilo odgovor izdavača.
Revizija 2,5 milijuna biomedicinskih radova, koju su proveli istraživači s Columbia University i drugih institucija, pokazuje neugodan obrazac: izmišljene reference u znanstvenim radovima više nisu rubna anomalija. Prema izvještaju The Decodera, stopa fabriciranih citata porasla je više od dvanaest puta od 2023. godine.
To je bitno zato što se biomedicina ne oslanja samo na pojedinačne rezultate, nego na lanac provjerljivih tvrdnji. Referenca je u tom lancu osnovni osigurač: čitatelj, recenzent, urednik ili autor smjernica mora moći otvoriti izvor i provjeriti što je doista pokazano. Ako citirani rad ne postoji, a pritom izgleda dovoljno uvjerljivo da prođe kroz sustav, tada problem nije kozmetički. To je kvar u infrastrukturi povjerenja.
Istraživači sumnjaju da je rast povezan sa širokom uporabom jezičnih modela. Razlog nije samo vremenska podudarnost nakon 2023., nego oblik samih pogrešaka. Lažne reference, prema opisu nalaza, često odgovaraju temi rada, imaju pravilan bibliografski ritam i izgledaju kao nešto što bi moglo postojati. Drugim riječima, nisu nasumične besmislice koje iskaču iz stranice. Upravo zato su opasne: sustav ih može tretirati kao normalan šum dok se ne pokuša otvoriti stvarni izvor.
Revizija 2,5 milijuna radova upozorava da su izmišljene reference porasle više od dvanaest puta od 2023., a dio takvih radova već dodiruje literaturu koja oblikuje kliničke smjernice.
Najopasniji citat je onaj koji izgleda kao da pripada stvarnom radu.📷 AI-generated image / TECH&SPACE
Posebno je osjetljiv dio priče veza s radovima koji oblikuju kliničke smjernice. Kliničke preporuke ne nastaju iz jednog citata, ali se grade na pregledima literature, metaanalizama i mrežama prethodnih radova. Ako se u tu mrežu uvuku nepostojeći izvori, rizik nije da će svaki takav rad odmah promijeniti terapiju. Rizik je sporiji i podmukliji: onečišćenje literature koje otežava provjeru, troši vrijeme urednika i recenzenata te slabi povjerenje u radove koji bi morali biti najprecizniji.
Najneugodniji broj iz sažetka nalaza jest da 98 posto pogođenih radova nije dobilo odgovor svojih izdavača. To sugerira da se problem ne rješava brzinom kojom se širi. Za izdavače, baze podataka i uredništva to više nije pitanje dobre volje autora, nego tehničkog i uredničkog nadzora. Provjera referenci mora postati strojno potpomognuta rutina, usporediva s provjerom DOI-ja, indeksiranja i metapodataka kroz servise poput Crossrefa ili medicinskih baza poput PubMeda.
AI ovdje nije magični krivac koji sve objašnjava, ali jest akcelerator starog problema. Autori su i prije mogli pogrešno citirati, kopirati reference bez provjere ili gurati radove kroz slabe uredničke procese. Razlika je u tome što jezični modeli mogu proizvesti uvjerljiv, tematski usklađen bibliografski artefakt u sekundi. Ako ga nitko ne provjeri, izmišljeni citat počinje izgledati kao dio akademskog krajolika.
Za biomedicinu je prag tolerancije nizak. Rad koji ne može dokazati vlastite izvore ne bi smio mirno putovati prema preglednim člancima, smjernicama i kliničkoj praksi. Sljedeći test za izdavače nije deklarativna zabrana haluciniranih referenci, nego mjerljiv odgovor: koliko brzo mogu pronaći, označiti i ispraviti radove u kojima bibliografija više nije dokaz, nego fikcija.

