Evo 2 améliore la recherche génétique avec l'IA, à une échelle et une précision inégalées

Par
CTOL Editors - Ken
4 min de lecture

Evo 2 : Le Plus Grand Modèle d'IA pour la Biologie Révolutionne la Recherche Génétique

Une avancée capitale dans le domaine de l'intelligence artificielle et de la biologie : l'Arc Institute, en collaboration avec NVIDIA, a dévoilé Evo 2, le modèle d'IA le plus vaste à ce jour pour la génomique. Des chercheurs de l'Université Stanford, UC Berkeley et UC San Francisco ont joué un rôle essentiel dans ce projet, qui devrait transformer notre compréhension de la génétique. Evo 2, un modèle d'IA générative entraîné sur un nombre sans précédent de 9,3 billions de nucléotides provenant de 128 000 génomes complets des trois domaines de la vie, permet aux scientifiques de prédire les mutations causant des maladies, de modéliser l'évolution biologique et même de concevoir des génomes synthétiques.

Les chercheurs ont publié une prépublication détaillée du modèle Evo 2 le 19 février 2025, ainsi qu'un outil convivial appelé Evo Designer. Le code d'Evo 2 sera open source, ce qui permettra une accessibilité et une collaboration à grande échelle. En exploitant plus de 2 000 GPU NVIDIA H100 via la plateforme NVIDIA DGX Cloud AI sur AWS, le modèle a réalisé une percée dans le traitement de séquences génétiques allant jusqu'à 1 million de nucléotides à la fois.

Points Clés

  • Le Plus Grand Modèle d'IA en Biologie : Evo 2 est le modèle d'IA biologique le plus puissant jamais développé, entraîné sur 9,3 billions de paires de bases ADN/ARN.
  • Prédiction des Mutations Pathogènes : Evo 2 atteint plus de 90 % de précision dans l'identification des mutations pathogènes, telles que celles liées au cancer du sein.
  • Potentiel d'Ingénierie du Génome : Le modèle peut concevoir des génomes entiers, ouvrant la voie aux progrès de la biologie synthétique.
  • Collaboration avec NVIDIA : Evo 2 a été entraîné à l'aide de l'architecture StripedHyena 2, un nouveau cadre d'IA permettant un calcul biologique à grande échelle.
  • Open Source pour le Progrès Scientifique : L'ensemble des données d'entraînement, des poids du modèle et du code d'Evo 2 seront mis à la disposition de la communauté mondiale de chercheurs.

Analyse Approfondie

La Puissance de l'IA Biologique à Grande Échelle

Evo 2 représente un changement de paradigme dans la recherche génétique, permettant aux scientifiques d'analyser les interactions génomiques à longue portée grâce à une approche basée sur l'IA. Contrairement aux modèles précédents, qui nécessitaient un réglage fin important pour chaque tâche, Evo 2 fonctionne comme un modèle généraliste, apprenant les modèles fondamentaux des séquences génétiques dans tous les domaines de la vie.

Comment Evo 2 Atteint des Performances Inégalées

  • Fenêtre Contextuelle d'Un Million de Tokens : Le modèle traite de longues séquences génétiques, capturant les relations distantes que les modèles traditionnels manquent.
  • Architecture StripedHyena 2 : Ce cadre convolutionnel multi-hybride assure un entraînement efficace de l'IA à une échelle sans précédent.
  • Apprentissage Zéro-Shot pour la Génomique : Evo 2 prédit avec précision les impacts des variantes génétiques à travers les espèces sans entraînement préalable sur des tâches spécifiques.
  • Interprétabilité Mécanistique : Un visualiseur spécialisé développé avec le laboratoire d'IA Goodfire permet aux chercheurs de comprendre comment Evo 2 identifie les caractéristiques génétiques clés.

Impact sur la Science et l'Industrie

Recherche Académique
  • Accélère la recherche fondamentale en biologie, permettant de nouvelles perspectives sur la régulation des gènes, la fonction des protéines et la biologie évolutive.
  • Relie l'IA et la génomique, favorisant la collaboration interdisciplinaire entre les scientifiques en calcul et les scientifiques expérimentaux.
  • Pionnier de la biologie générative, permettant la création de séquences d'ADN synthétiques avec les caractéristiques souhaitées.
Industrie Médicale et Pharmaceutique
  • Médecine Personnalisée : La grande précision d'Evo 2 dans la prédiction des risques de troubles génétiques peut révolutionner les diagnostics.
  • Découverte de Médicaments : L'analyse génétique assistée par l'IA peut identifier de nouvelles cibles thérapeutiques et optimiser la conception des médicaments.
  • Thérapie Génique : La capacité d'ingénier des éléments génétiques avec un contrôle précis pourrait améliorer les traitements des maladies complexes.
Bio-ingénierie et Agriculture
  • Applications de biologie synthétique, notamment la conception de souches microbiennes pour les processus industriels.
  • Améliorations agricoles, telles que les cultures génétiquement optimisées avec une résistance accrue aux maladies et un rendement supérieur.

Considérations Éthiques

L'équipe de recherche a pris en compte les considérations éthiques en excluant les agents pathogènes infectant l'humain de l'ensemble de données d'entraînement. De plus, le laboratoire de bioéthique de Stanford Medicine a guidé l'équipe pour assurer un déploiement responsable de l'IA.

Le Saviez-Vous ?

  • Evo 2 est 30 fois plus riche en données que son prédécesseur, Evo 1, ce qui lui permet de modéliser 128 000 génomes au lieu de simples organismes unicellulaires.
  • Le modèle a été entraîné à l'aide de plus de 2 000 GPU NVIDIA H100, ce qui en fait l'un des plus grands projets d'entraînement d'IA en biologie.
  • Evo 2 peut analyser les mutations du gène BRCA1 avec une précision supérieure aux méthodes de tests génétiques traditionnelles.
  • L'ensemble de données d'entraînement d'Evo 2, OpenGenome2, est l'ensemble de données de séquences biologiques le plus diversifié jamais compilé.
  • L'architecture d'IA derrière Evo 2, StripedHyena 2, a été développée avec la contribution du co-fondateur d'OpenAI, Greg Brockman.

Réflexions Finales

Evo 2 est plus qu'un simple modèle d'IA : c'est une étape révolutionnaire vers la compréhension et la conception de la vie au niveau génétique. Avec des applications allant de la médecine à la biologie synthétique et à l'agriculture, sa nature open source est appelée à autonomiser les chercheurs du monde entier. La fusion de l'IA et de la biologie n'a jamais été aussi prometteuse, et Evo 2 est à l'avant-garde d'une ère de sciences de la vie axées sur l'IA.

Vous aimerez peut-être aussi

Cet article est soumis par notre utilisateur en vertu des Règles et directives de soumission de nouvelles. La photo de couverture est une œuvre d'art générée par ordinateur à des fins illustratives uniquement; ne reflète pas le contenu factuel. Si vous pensez que cet article viole les droits d'auteur, n'hésitez pas à le signaler en nous envoyant un e-mail. Votre vigilance et votre coopération sont inestimables pour nous aider à maintenir une communauté respectueuse et juridiquement conforme.

Abonnez-vous à notre bulletin d'information

Obtenez les dernières nouvelles de l'entreprise et de la technologie avec des aperçus exclusifs de nos nouvelles offres