IA crea genomi da zero e predice impatti delle mutazioni con EVO 2

Contenuti dell'articolo

Il modello di intelligenza artificiale Evo 2 rappresenta un’importante innovazione nel campo della genomica, sviluppato grazie alla collaborazione tra l’Arc Institute, la Stanford University e NVIDIA. Addestrato su un vasto dataset contenente 9,3 mila miliardi di coppie di basi di DNA, Evo 2 è in grado di prevedere le variazioni genetiche e generare sequenze genomiche attraverso tutti i domini della vita.

caratteristiche avanzate di evo 2

Evo 2 si distingue per la sua capacità di analizzare e generare sequenze genomiche con una precisione notevole. I test effettuati dimostrano che il modello può predire accuratamente gli effetti funzionali delle mutazioni nei genomi sia procariotici che eucariotici. Inoltre, Evo 2 ha mostrato la capacità unica di riscrivere il genoma del mammut lanoso a partire da sequenze grezze senza necessità di riferimenti diretti.

capacità predittive

Durante il processo di addestramento, Evo 2 ha dimostrato abilità simili a quelle dei modelli linguistici: è in grado di prevedere la coppia di basi successiva all’interno di una sequenza. Questa metodologia consente al modello di identificare strutture genomiche complesse e modellare con accuratezza l’impatto delle variazioni genetiche.

generazione su scala genomica

Evo 2 ha anche dato prova della sua abilità nella generazione su scala genomica, riuscendo a creare genomi mitocondriali completi, genomi batterici e sequenze cromosomiche del lievito. Gli sviluppatori hanno deciso di rendere questo modello completamente aperto, inclusi i parametri del modello stesso e i codici utilizzati per l’addestramento e l’inferenza.

conclusioni sull’intelligenza artificiale genomica

L’approccio aperto adottato per Evo 2 rappresenta un significativo passo avanti nell’ambito dell’intelligenza artificiale applicata alla genomica. Questo sviluppo combina una notevole accuratezza predittiva con capacità generative su scala vasta, contribuendo così ad accelerare l’esplorazione della complessità biologica.

  • Arc Institute
  • Stanford University
  • NVIDIA
  • Mammut lanoso
  • OpenGenome2
  • Genomi mitocondriali completi
  • Sequenze cromosomiche del lievito