•  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  

Des milliards de documents archivés grâce à l’ADN

Les supports informatiques actuels ne suffiront plus d'ici quelques années à stocker les milliards de données produites quotidiennement. Mais un support vieux de 4 milliards d'années serait la solution. Bienvenue dans l'univers de l’archivage moléculaire.

Un modèle de la structure à double hélice de l'ADN humain.

Un modèle de la structure à double hélice de l'ADN humain.

Photo : iStock

Aujourd'hui, tout est documenté. Écrits ou vidéos, des dizaines de milliards de documents sont produits chaque jour. Un océan d’informations difficile à gérer.

On stocke environ 30 % de l'information générée. D'ici 10 ans, ce sera 3 %. Avec l'explosion de l'intelligence artificielle et l’abondance des objets connectés, on a besoin de stocker de plus en plus de données, mais nos supports actuels ne pourront plus le faire.

Une citation de Stéphane Lemaire, biologiste moléculaire, Laboratoire de biologie computationnelle et quantitative, Sorbonne Université/CNRS

Aujourd’hui, l’information est emmagasinée sur des supports numériques, mais ces derniers posent de nombreux défis. Ils sont fragiles, encombrants, énergivores, et leur empreinte environnementale est peu reluisante.

Le nouveau support sur lequel travaille le biologiste moléculaire n’est pas si nouveau. En fait, il existe depuis... 4 milliards d’années. Ce support, c’est l’ADN.

Portrait de Stéphane Lemaire.

Stéphane Lemaire, biologiste moléculaire, Laboratoire de biologie computationnelle et quantitative, Sorbonne Université / CNRS.

Photo : Isabelle Morison

La molécule qui porte les instructions génétiques de la vie, Stéphane Lemaire s’en inspire pour créer un outil d'archivage.

L’ADN est une forme de stockage ultradense, des millions de fois plus dense que les supports numériques actuels. Par exemple, l'intégralité des données numériques du monde entier, de tous les disques durs, de tous les datacenters pourrait tenir dans 100 grammes d'ADN, c'est-à-dire l'équivalent du volume d'une tablette de chocolat, explique Stéphane Lemaire.

Grâce à l’informatique, aujourd’hui, on numérise les données sous la forme de 0 et de 1. Pour transposer un document sur l’ADN, on utilise la même série de chiffres qu’il suffit de convertir en lettres.

Ici, on utilise l’alphabet des généticiens, les lettres A, C, T et G. Un robot produit chimiquement une paire de lettres à la fois. On crée de petits fragments qu’on assemble ensuite pour former une longue molécule d’ADN synthétique.

Cette molécule est hyperstable, exactement comme un polymère, dit le biologiste Lemaire. Elle est ultrarésistante et ne présente aucun risque de cassure.

Une capsule d'un peu plus d'un centimètre.

Cette capsule en acier inoxydable peut contenir 100 milliards de copies du même texte.

Photo : Radio-Canada

À l’automne 2021, deux capsules en acier inoxydable ont été ajoutées à l’Armoire de fer des Archives nationales à Paris. Une première.

L'équipe de Stéphane Lemaire a décidé d'encoder sur ADN deux textes historiques français : soit la Déclaration des droits de l'homme et du citoyen de 1789 et la Déclaration des droits de la femme et de la citoyenne rédigée en 1791 par Olympe de Gouges.

Chaque capsule contient 100 milliards de copies. Comment fait-on pour en produire autant?

Une fois qu'on a obtenu une molécule d’ADN encodée, on l’introduit dans une bactérie. On multiplie cette bactérie pour obtenir au final des milliards de copies. On extrait ensuite ces molécules pour les purifier. On les lyophilise pour ensuite les stocker dans de petites capsules métalliques.

Une citation de Stéphane Lemaire, biologiste moléculaire, Sorbonne Université / CNRS

Quand la bactérie se divise, elle transfère son ADN à une nouvelle bactérie. Un photocopieur vivant! Mais lorsqu’elle se réplique, des erreurs de transcription sont possibles.

Un biologiste manipule une éprouvette.

Expérience d'archivage moléculaire.

Photo : Radio-Canada

Ce n'est pas une seule bactérie, un seul organisme qui multiplie les copies, mais un très grand nombre, précise Stéphane Lemaire. Sur les 100 milliards de copies, certaines auront des mutations, mais les autres n'en auront pas. On pourra toujours relire l'information parce que la majorité des molécules n'auront pas de mutation.

Bien qu’elle soit spectaculaire, cette technologie n’est pas encore au point. L’encodage de données prend plusieurs jours. Le décodage, lui, se fait à l’aide d’un séquenceur classique, ce qui demande plusieurs heures.

Pour ces raisons, l'ADN ne convient qu’à l’encodage de certains documents, ceux qu’on consulte rarement. Reste que, pour un archiviste, l’ADN est un support idéal.

Quand on stocke sur l'ADN, il est stable pour 50 000 ans, sans aucun apport d'énergie. En plus, on pourra toujours le relire parce que le vivant ne va pas changer, l’ADN sera toujours le support de l'information génétique. On en aura toujours besoin en médecine ou en recherche. Donc, c'est un support qui ne sera jamais obsolescent. C'est carrément le Graal des archivistes.

Une citation de Stéphane Lemaire, biologiste moléculaire, Sorbonne Université / CNRS

Le reportage de Danny Lemieux et de Vincent Laurin sera diffusé à l'émission Découverte dimanche à 18 h 30 sur ICI Radio-Canada Télé.

Vous souhaitez signaler une erreur?Écrivez-nous (Nouvelle fenêtre)

Vous voulez signaler un événement dont vous êtes témoin?Écrivez-nous en toute confidentialité (Nouvelle fenêtre)

Vous aimeriez en savoir plus sur le travail de journaliste?Consultez nos normes et pratiques journalistiques (Nouvelle fenêtre)

Chargement en cours

Infolettre Info nationale

Nouvelles, analyses, reportages : deux fois par jour, recevez l’essentiel de l’actualité.

Formulaire pour s’abonner à l’infolettre Info nationale.