Le futur du stockage se trouve-t-il dans l’ADN ?

Temps de lecture : 5 min

Face à l’augmentation massive du volume de données mondiales à stocker, des équipes de chercheurs du monde entier se mobilisent pour trouver une solution efficace sur le long terme. 

Après de nombreuses recherches sur le sujet, l’ADN s’est avéré détenir un fort potentiel pour le stockage de données, et pourrait même s’apparenter à une technologie révolutionnaire pour les années à venir. 

Retour sur cette nouvelle révolution.

 

Comment fonctionne le stockage ADN ?

L’ADN (Acide Désoxyribonucléique) est une substance présente dans les cellules de tous les êtres vivants et qui a pour but de contenir l’ensemble des informations génétiques de l’individu/animal en question.
Grâce à ces milliers de gènes, l’ADN contient toute l’information génétique et est en quelque sorte notre disque dur interne.
C’est ce constat qui a fait réfléchir de nombreux chercheurs sur son potentiel à devenir un support de stockage plus vaste, notamment pour des données numériques.

Pour stocker de l’information numérique dans un support d’ADN, il faut passer par cinq étapes différentes : 

1/ Coder :
Un fichier numérique doit être traduit en une séquence ADN.
Pour ce faire, le langage binaire (0 ou 1) doit être transformé en langage quaternaire conforme aux nucléotides composant la séquence ADN, à savoir l’adénine, la cytosine, la guanine et la thymine (A, C, G et T).

2/ Écrire :
Ce langage doit ensuite s’écrire au sein d’une molécule ADN, grâce à la synthèse d’une séquence de nucléotides correspondant exactement à la séquence numérique qui vient d’être codée.

3/ Stocker :
L’ADN est alors stocké avec l’information numérique qu’il contient, et doit être dans de bonnes conditions pour pouvoir retranscrire ses informations, à savoir à l’abri de la lumière, de l’air et de l’eau.

4 et 5 / Lire et décoder :
Enfin, la séquence enregistrée pourra ensuite être lue et décodée sous la forme de la séquence binaire originale grâce à des solutions automatisées, comme un spectromètre par exemple.

 

Des avantages et des inconvénients

Le stockage ADN possède de nombreux avantages.

Selon plusieurs experts, l’ADN détiendrait des capacités de stockage plusieurs millions de fois supérieures aux mémoires traditionnelles. L’ensemble des données de la terre entière pourrait être contenu dans une seule pièce grâce à l’ADN.

Le stockage ADN permettrait alors de réduire le problème de place, imposé par les solutions traditionnelles, grâce à sa densité informationnelle surprenante, tout en réduisant du même coup la consommation électrique nécessaire à ces datacenters.

L’ADN possède également une longévité extrêmement importante.
Si l’ADN est stocké dans des conditions optimales, les informations stockées pourraient être encore déchiffrées après plusieurs dizaines de milliers d’années.
En comparaison, un datacenter a une durée de vie moyenne de 20 ans.

En revanche, le stockage sur ADN étant une technique encore très complexe, il demande beaucoup de temps et représente un coût élevé.
De plus, il est difficilement modifiable, contrairement aux stockages habituels.
Ainsi, le stockage dans l’ADN devrait, du moins dans un premier temps, servir davantage au stockage “froid”, c’est-à-dire pour des données qui n’ont pas besoin d’être utilisées fréquemment.

 

 

Plusieurs essais concluants

Même si le stockage ADN paraît encore être un thème de science-fiction, il commence peu à peu à faire sa place notamment pour des expériences visant à tester ses réelles capacités et les enjeux de sa technologie.

George Church, un généticien de la Harvard Médical School de Boston, a débuté ses essais en 2012, en utilisant la technologie ADN pour stocker un essai de 300 pages sur la biologie de synthèse sur un minuscule brin d’ADN.
Les équipes techniques du généticien avaient alors enregistré dans un premier temps le livre sous forme numérique avec son texte binaire, avant de le synthétiser sous forme d’ADN.
Une révolution pour l’époque, qui a permis de mettre en avant les immenses possibilités de l’ADN encore très méconnues.

En 2017, le généticien et son équipe réalisaient de nouveau l’exploit, avec cette fois-ci le stockage dans l’ADN d’une bactérie vivante d’un GIF important, puisqu’il s’agissait de l’une des premières vidéos de l’histoire, une chronophotographie du XIXe siècle représentant un cheval au galop.

Fin 2020, George Church et son équipe arrivaient à encoder un extrait de musique du jeu vidéo Super Mario Bros dans les transitions entre l’exécution de bases génétiques synthétiques identiques.

En 2018, la Start-up américaine Catalog avait réussi à stocker le Wikipédia anglais sur des brins d’ADN, soit 16Go de données. Catalog précisait même pouvoir stocker 600 milliards de gigaoctets au sein d’un seul et même volume d’ADN.

En 2019, l’université de Washington et Microsoft Research mettaient au point un premier prototype de système de stockage hybride “moléculaire & électronique” complètement automatisé et visant à stocker et lire une information numérique placée sur de l’ADN.
Cet appareil innovant est capable de transformer automatiquement une séquence de bits en molécules d’ADN codés, puis de restituer la séquence de bits enregistrée afin de la lire.

 

 

Les molécules, une alternative à l’ADN

L’ADN ne serait d’ailleurs pas le seul à pouvoir stocker des données.
C’est ce qu’à cherché à prouver le chercheur Jacob Rosenstein de la Brown University de Rhode Island début 2019, en cherchant d’autres molécules pour le stockage de données.

Avec son équipe, il a développé des mixtures de métabolites, des composés organiques stables issus de la transformation biochimique d’une molécule initiale par le métabolisme.
Ces substances contenaient entre autres, des sucres, des acides aminés et d’autres petites molécules.
En utilisant la présence ou l’absence de métabolites spécifiques, les chercheurs ont ainsi pu recréer les valeurs binaires permettant ainsi aux données d’être encodées.

Leur solution a pu être testée sur l’image d’un chat d’une tombe égyptienne, d’un bouquetin, mais aussi d’une ancre, qu’ils ont réussi à enregistrer et à décoder avec une précision de 99% grâce à un spectromètre.

Une autre équipe de chercheurs de Harvard et de l’Université de Northwestern ont également cherché une alternative plus stable que l’ADN en 2019.
Pour cela, ils ont développé une solution de stockage sur des molécules nommées oligopeptides, qui sont petites, légères, plus fréquentes et plus stables que l’ADN, et qui permettent d’encoder l’information, basée sur des techniques courantes de chimie organique et analytique. 

Ces peptides sont principalement constitués des acides α- aminés et elles varient donc selon le nombre et le type d’acide aminés qui les composent, ce qui permet de les distinguer et donc de créer un alphabet moléculaire binaire. Une solution plutôt complémentaire pour de l’archivage à long terme.

Grâce à une seule synthèse, l’équipe de chercheurs a réussi à produire suffisamment de molécules pour pouvoir encoder plusieurs vidéos de chats en même temps, le tout avec une méthode moins complexe en comparaison à l’encodage dans de l’ADN, et par conséquent plus rapide et moins couteuse.

 

Avec un volume de données mondiales en pleine explosion, l’ADN pourrait être une solution ingénieuse pour pallier les limites des solutions traditionnelles.
Dans la même idée que l’ADN, les molécules sont également envisagées, le tout pour une optimisation du stockage des données, du temps et de place.

 

Rejoignez-nou

Vos études touchent à leurs fins ou vous êtes à la recherche de nouveaux défis ? Alors rejoignez Adentis dès aujourd’hui en cliquant sur le lien ci-dessous :

>> Je veux rejoindre Adentis <<

 

Photo de couverture : image d’illustration.