Evo 2 čita genome preko svih domena života, ali dizajn biologije još nije klik na gumb
The hero visual shows Evo 2 as an open model reading long genomic contexts, not as a magic life editor.📷 AI-generated / Tech&Space
- ★Nature opisuje Evo 2 kao model s kontekstom od milijun tokena na razini pojedinačnog nukleotida
- ★Model uči obilježja poput granica egzona i introna, veznih mjesta transkripcijskih faktora i BRCA1 varijanti
- ★Arc Institute objavio je parametre modela, kod za treniranje i inferenciju te OpenGenome2 dataset
Evo 2 je važan jer biologiju tretira kao jezik bez pretvaranja da je to jednostavan jezik. U Nature radu autori opisuju biološki foundation model treniran na oko 9 bilijuna DNA parova baza, s kontekstnim prozorom od milijun tokena i rezolucijom pojedinačnog nukleotida.
To nije samo veća verzija starog alata za anotaciju. Ars Technica objašnjava zašto je skok s bakterijskih genoma na eukariote težak: introni prekidaju kodirajuće regije, regulacija može biti razbacana daleko od gena, a mnogi signali nisu jasne riječi nego slabe statističke tendencije.
Evo 2 zato ne traži samo gene. Rad navodi reprezentacije povezane s granicama egzona i introna, veznim mjestima transkripcijskih faktora, proteinskim strukturnim elementima i profagnim regijama. To je vrsta uzorka koju čovjek može opisati nakon desetljeća biologije, ali ne želi ručno tražiti kroz genom od milijardi baza.
Najjači urednički signal je otvorenost. Autori navode da su objavljeni parametri modela, kod za treniranje i inferenciju te OpenGenome2 dataset. Arc Institute isti projekt veže uz otvorenu i kolaborativnu znanost, što je u genomici više od dobrog PR-a: reproduktivnost i provjera nisu dodatak, nego infrastruktura povjerenja.
Otvoreni model Arc Institutea i partnera treniran je na genomskim podacima planetarne skale, no najveća vrijednost zasad je anotacija i razumijevanje, ne obećanje instant terapija.
The second visual emphasizes open artifacts: parameters, code, and dataset.📷 AI-generated / Tech&Space
Evo 2 ima generativne sposobnosti, ali tu treba usporiti. Model može proizvoditi mitohondrijske, prokariotske i eukariotske sekvence, a rad opisuje i generiranje uzoraka kromatinske pristupačnosti kada ga vode prediktivni modeli i pretraga tijekom inferencije. To je impresivno, ali biologija ne postaje istinita zato što sekvenca izgleda prirodno.
Testiranje u stanicama ostaje presudno. Ars Technica posebno ističe da su neki rezultati dizajna regulatorne DNA bili ograničeni: dio sekvenci pokazao je različitu aktivnost između tipova stanica, ali ne na razini koja bi opravdala priču o instant dizajnu funkcionalne biologije. To nije slabost rada, nego pošten podsjetnik na razliku između predikcije i eksperimenta.
Medicinski kut također treba držati pod kontrolom. Evo 2 može pomoći u razumijevanju varijanti, uključujući klinički važne mutacije poput onih u BRCA1, ali to nije dijagnostički proizvod za pacijente. Model je istraživački instrument koji može ubrzati hipoteze, prioritetizirati eksperimente i označiti regije vrijedne provjere.
Zbog toga je Evo 2 najzanimljiviji kao javna platforma za biologe i računalne znanstvenike. Ako zajednica može pregledati repozitorije, modele i podatke, tada će slabosti biti vidljive, a primjene realnije. Pravi napredak nije obećanje da će AI dizajnirati život na zahtjev, nego da genomika dobiva alat koji se može provjeravati u javnosti.

