•  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  

La plus grande base de données de protéines humaines rendue disponible

Illustration d'une protéine.

La structure en 3D d'une protéine détermine sa fonction spécifique.

Photo : DeepMind

Agence France-Presse

Des scientifiques ont annoncé jeudi dans la revue Nature la mise à disposition de la plus grande base de données de protéines qui forment les briques de la vie, ce qui va « changer fondamentalement la recherche en biologie », selon des spécialistes.

Chaque cellule d'un organisme vivant exécute sa fonction à l'aide de protéines qui livrent en permanence des instructions pour maintenir en bonne santé cette cellule et combattre les infections.

À la différence du génome, la séquence des gènes qui encodent la vie cellulaire, le protéome humain change en permanence en réponse à des instructions génétiques et à des stimuli extérieurs.

La compréhension du fonctionnement des protéines, via la forme qu'elles adoptent, au sein des cellules est un véritable défi. Les scientifiques se sont échinés à déterminer par l'expérimentation leur fonction précise. Mais après 50 ans de recherche, on ne connaît que 17 % des acides aminés, ou composants, du protéome humain.

Les chercheurs de Google DeepMind et du Laboratoire européen de biologie moléculaire (EMBL) ont dévoilé jeudi une base de données, libre d'accès, de 20 000 protéines exprimées par le génome humain. Auxquelles s'ajoutent 350 000 protéines de 20 organismes, comme des bactéries ou des souris, utilisés par la recherche.

Cette base a été obtenue grâce à un programme d'apprentissage automatique capable de prédire avec précision la forme d'une protéine à partir de sa séquence d'acides aminés. Le programme AlphaFold s'est entraîné sur une base de 170 000 structures connues de protéines et il a ensuite prédit la forme de 58 % de toutes les protéines du protéome humain. Ce qui a plus que doublé le nombre de structures de protéines humaines connues avec précision.

Les applications potentielles de ces données vont de la recherche sur les maladies génétiques à l'ingénierie de récoltes résistant à la sécheresse.

Selon Paul Nurse, Prix Nobel de médecine et directeur de l'Institut Francis Crick, cette avancée est un grand pas pour l'innovation en biologie.

John McGeehan, directeur du Centre for Enzyme Innovation à l'Université de Portsmouth, a remarqué que ce qui prenait des mois et des années à accomplir a été fait en un week-end par AlphaFold.

La capacité à prédire avec un programme informatique la forme d'une protéine à partir de sa séquence d'acides aminés est déjà mise à profit dans certains secteurs de la recherche.

Vos commentaires

Veuillez noter que Radio-Canada ne cautionne pas les opinions exprimées. Vos commentaires seront modérés, et publiés s’ils respectent la nétiquette. Bonne discussion !