C’est avec des roulements de tambour que DeepMind, la filiale d’intelligence artificielle (IA) de Google, a dévoilé dans la revue Nature le 8 mai AlphaFold 3, la nouvelle version de son logiciel appliquée à la biologie. « Plus rapide, plus précis, capable de tâches bien plus complexes », se réjouissait, lors d’une conférence de presse, le 7 mai, Demis Hassabis, le directeur de DeepMind, au sujet de ce nouvel opus qui permet de modéliser la quasi-totalité des protéines et de leurs interactions, ouvrant de prometteuses perspectives pour le développement de nouveaux médicaments. Mais l’accueil que lui a réservé la communauté scientifique est plus réservé. Et pour cause : contrairement à la version précédente, Google a gardé secret le code du fameux algorithme.
Modéliser la structure des protéines peut sembler anecdotique. Pourtant, les enjeux sont immenses. Les protéines sont de grosses molécules essentielles au fonctionnement des organismes vivants. Parmi elles, on compte notamment les anticorps, les enzymes ou encore l’hémoglobine, qui transporte l’oxygène dans notre sang. Les protéines se présentent sous la forme de longues chaînes d’acides aminés, semblables à des colliers de perles. Rapidement, elles se replient de manière complexe, ressemblant à un paquet de câbles que vous auriez laissé s’emmêler dans votre poche. Ce repliement n’est pas aléatoire : chaque protéine adopte une forme spécifique, qui lui permet d’accomplir sa fonction. Une protéine mal formée ne pourra donc pas remplir son rôle. C’est le cas, par exemple, dans la drépanocytose (ou anémie falciforme) : un défaut dans la forme de l’hémoglobine réduit sa capacité à transporter l’oxygène dans le sang.
Cependant, bien que l’on ait accès à la composition en acides aminés de n’importe quelle protéine, déterminer son repliement reste une aventure longue et compliquée. Cela requiert des mois, voire des années, de travail en laboratoire pour une seule protéine… sachant qu’il en existe près de 20 000 différentes chez les humains !
Précision déconcertante
La sortie d’AlphaFold 2 en 2021 a ainsi fait l’effet d’une bombe. L’IA permettait de prédire en moins de vingt-quatre heures le repliement de n’importe quelle protéine. Il suffisait de fournir la séquence d’acides aminés pour que le programme prédise la structure tridimensionnelle, souvent avec une précision et une confiance déconcertantes. Le secret ? Le deep learning, ou apprentissage profond. L’IA s’est d’abord entraînée sur toutes les protéines dont la structure était connue, et prédit désormais par analogie le repliement d’autres protéines.
Il vous reste 64.39% de cet article à lire. La suite est réservée aux abonnés.