Svemirdb#985

Trilion genoma: AI u potrazi za evolucijskim kodom života

30. ožujka 2026.09:08(3w ago)

San Francisco, US

📷 © Tech&Space

AutorOrion VegaUrednik za svemir"Mission control uspije učiniti gotovo previše mirnim."

★100 milijuna vrsta u globalnoj bazi genoma
★NVIDIA infrastruktura za AI modeliranje evolucije
★100-put veća genetska raznolikost za dizajn lijekova

Projekt Trillion Gene Atlas nije samo nova baza podataka — to je prvi korak prema sistematskom čitanju evolucijske knjige koja je do sada bila nedostupna. Basecamp Research, u suradnji s Anthropicom, Ultima Genomicsom i PacBijom, pokreće inicijativu za sekvenciranje genoma 100 milijuna vrsta, što bi trebalo povećati poznatu genetsku raznolikost čimbenikom 100. To nije samo kvantitativni skok, već kvalitativna promjena: do sada su AI modeli u biologiji trenirani na 'uskom rezancu života', kako to precizno opisuje tim.

Razlika je u razmjeru i pristupu. Dok su prethodni projekti poput Earth BioGenome ciljali na sekvenciranje 1,8 milijuna eukariotskih vrsta do 2029., Trillion Gene Atlas ide korak dalje — ne samo po broju vrsta, nego po dubini analize. Podaci se prikupljaju s tisuća lokacija širom svijeta, a procesom upravlja NVIDIA-ina AI infrastruktura, optimizirana za obradu triliona genomske informacije. To nije samo arhiva; to je aktivni modeliranjem podloga za AI koji učiti iz evolucijske povijesti.

Ključna točka leži u tri stupa projekta: masovno sekvenciranje DNA, globalne partnerstva za opskrbu podacima i napredno računarstvo. Bez obzira na ambicioznost, pitanje ostaje — kako će se ovi podaci pretvoriti u konkretne medicinske inovacije, a ne ostati samo kao akademska zbirka.

📷 © Tech&Space

Podaci koji pretvaraju biologiju iz 'podatkovno siromašne' u poligon za AI

Značaj projekta najbolje ilustrira usporedba s drugim područjima AI razvoja. Dok su modeli za jezik ili računalni vid trenirani na petabajtima podataka, biologija je do sada bila 'podatkovno siromašna', kako ističe Basecampov tim. Razlog je jednostavan: nedostajale su alate za generiranje podataka u potrebnom obimu. EDEN foundation models, koje je Basecamp objavio u siječnju, već su pokazali kako biološki AI može učiti iz evolucijskih obrasaca — ali sada dobivaju podlogu koja je 100 puta bogatija.

Praktična implikacija je jasna: brži i sistematičniji dizajn lijekova. Umjesto nasumičnog testiranja molekula, AI će moći 'pitati' evoluciju koja je već milijunima godina optimizirala biološka rješenja. No, tu se pojavljuje i dilema. Koliko će ova raznolikost biti pristupačna široj znanstvenoj zajednici, a ne ostati zatvorena u privatnim bazama podataka? Partnerstva s institucijama poput Wellcome Sanger Institutea sugeriraju otvoreniji pristup, ali konkretne odredbe još nisu jasne.

Što se tiče sljedećih koraka, tim će se usredotočiti na skaliranje prikupljanja podataka i poboljšanje AI modela za predviđanje proteinskih struktura. Prvi benchmark rezultati očekuju se do kraja 2025., kada će biti jasno koliko je ovaj pristup zaista ubrzao proces otkrića lijekova. Do tada ostaje pitanje: hoće li genetska raznolikost postati nova 'nafta' za farmaceutske divove, ili će ostati javno dobro za globalno zdravlje?

U konačnici, stvarno pitanje nije koliko podataka možemo sakupiti, već kako ćemo ih koristiti. Trilion genoma nije samo broj — to je evolucijska povijest Zemlje komprimirana u oblike koje AI može čitati. A to mijenja pravila igre za medicinu, ali i za naše razumijevanje života kao takvog.

GenomicsEvolutionary Biology

//Comments

Uredi u foto-review →