Créer des molécules avec de l’intelligence artificielle semble désormais possible. L’année dernière, d’anciens chercheurs chez Meta, fondateurs de l’entreprise EvolutionaryScale, ont dévoilé une protéine appelée "esmGFP" créée entièrement par un modèle d’intelligence artificielle.
D'après Live Science, la protéine esmGFP est une création virtuelle, générée par un code informatique. Néanmoins, si elle n'existe pas dans la nature, son code contient les instructions pour fabriquer une nouvelle protéine fluorescente verte, similaire à celles qui donnent leur éclat aux méduses et aux coraux fluorescents. Cette création étonnante a pu récemment être évaluée dans le cadre d’une étude publiée le 16 janvier dans la revue Science.
500 millions d’années d’évolution simulée
D’après les chercheurs de l’étude, si cette protéine avait vu le jour naturellement, elle aurait mis 500 millions d’années à évoluer normalement. Ce qui équivaut à affirmer que le modèle d’IA ESM3 a simulé un demi-milliard d'années d’évolution.
Mais au lieu de suivre les contraintes habituelles de l'évolution, cette IA agit comme un solveur de problème qui comble les lacunes du code de la protéine qui existe dans la nature. Voilà pourquoi la séquence génétique du code fabriqué par l’IA n’est que 58 % similaire à celui de la protéine la plus proche : celle de l’anémone de mer à bout bulbeux (Entacmaea quadricolor).
Le modèle, similaire à GPT-4 d'OpenAI mais basé sur la biologie, a été entraîné sur des données provenant de 2,78 milliards de protéines naturelles. Cela permet à l'IA de "remplir les blancs" dans des séquences de protéines et d'explorer des structures biologiques inédites.
After we trained ESM3, we were excited to see it could respond to complex prompts, which greatly improved with scale. While scaling has been driving advances across AI—in biology it has been largely underestimated. Article by @ewencallaway for @Nature: https://t.co/tccjfi1Is3— Alex Rives (@alexrives) July 9, 2024
Une idée révolutionnaire qui pose encore quelques limites
EvolutionaryScale, pourrait révolutionner l'ingénierie des protéines. Le modèle d'IA qu'ils utilisent apprend la biologie fondamentale et peut générer des "protéines fonctionnelles en dehors des limites de l'évolution naturelle" comme l'explique Alex Rives, co-auteur de l'étude et scientifique en chef de l'entreprise. Ainsi, les capacités d'ESM3 pourraient aider à concevoir de nouveaux médicaments.
Cependant, si cette approche offre des perspectives intéressantes, elle suscite également des interrogations. Tiffany Taylor, biologiste évolutive à l'université de Bath, souligne que la simulation de 500 millions d'années d'évolution par l'IA "se concentre uniquement sur les protéines individuelles" et ignore les processus complexes de sélection naturelle. "L'ingénierie des protéines pilotée par l'IA est fascinante, mais je ne peux m'empêcher de penser que nous pourrions être un peu trop confiants en supposant que nous pouvons tromper les processus complexes affinés par des millions d'années de sélection naturelle", conclut-elle.
Ne manquez aucun article en vous abonnant à GEO sur Google News
Des protéines retrouvées sur un dinosaure vieux de 195 millions d'années