OpenAI model dijagnosticira bolje od liječnika — ali to nije pobjeda
Clinicians review anonymized emergency cases beside an AI diagnosis panel.📷 AI-generated / Tech&Space
- ★Science studija testira dijagnostičke slučajeve
- ★Model nadmašuje liječnike u kontroliranom okruženju
- ★Rodman upozorava protiv prebrze kliničke euforije
Adam Rodman, internist i istraživač kliničke umjetne inteligencije, objavio je u Scienceu studiju koja uznemirava konvencionalnu medicinsku samouvjerenost. Veliki jezični model tvrtke OpenAI nadmašio je liječnike u dijagnostičkim i kliničkim vježbama temeljenim na stvarnim slučajevima iz jednog bostonskog odjela hitne medicine.
To nije prvi put da stroj pobjeđuje na testu — još je 1959. godine Science postavio okvir za procjenu sustava podrške odlučivanju — ali kontekst je sada drukčiji. Rodman je eksplicitno izabrao taj povijesni okvir kako bi naglasio jednu stvar: dijagnostička točnost i klinička sigurnost nisu isto. Model može prepoznati obrazac brže od iskusnog liječnika u simuliranom okruženju.
Ali simulacija nema pravne posljedice, ne zahtijeva empatiju prema bolesniku, ne mora objasniti zašto je propustio rijedak sindrom koji je izgledao kao prehlada. Čini se da rani signali sugeriraju kako AI ima potencijal kao sugovornik u dijagnostici, ne kao zamjena za liječnika.
Dijagnostička preciznost bez kliničke odgovornosti i implikacije za budućnost medicine
A clinical pathway places doctor review and safety checks after model output.📷 AI-generated / Tech&Space
Dodatni kontekst daje izvorni materijal: ono što istraživačku zajednicu zabrinjava nije samo tehnički napredak, već brzina kojom se marketinški narativ pretvara u medicinsku politiku. Ako se ovo potvrdi u širim replikacijama, pritisak na hitnu implementaciju mogao bi prethoditi razvoju regulativnih okvira za odgovornost.
Tko snosi rizik kada AI preporuči pogrešnu dijagnozu? Bolnica? Proizvođač modela? Liječnik koji je odobrio rezultat? Postoje nagađanja da bi ovakve studije mogle ubrzati telemedicinske platforme koje već eksperimentiraju s AI-asistentima, ali bez transparentnih podataka o točnosti u različitim populacijama.
Prema dostupnim informacijama, Rodman se boji da će rezultati biti zloupotrebljeni kao dokaz sigurnosti i učinkovitosti — dvije kategorije koje zahtijevaju godine longitudinalnih studija, ne samo benchmark uspjeha. Znanstveni community reagira s mješovitim osjećajima: uzbuđenje zbog mogućnosti, oprez zbog povijesnog uzorka tehnologija koje su obećavale revoluciju, a donijele su komplikacije.

