À l’avenir, les données devraient être stockées dans de l’ADN : gain de place et sauvegarde de longue durée

À l’ère du "tout numérique", résoudre l’équation entre capacité de stockage et quantité des données à sauvegarder est LE défi à relever. Jusqu’à présent, la solution passe par la mise en place de data centers, des centres de données, c'est à dire des centres de stockage grands comme des terrains de foot où des serveurs informatiques permettent de sauvegarder les données numériques du monde entier. Le hic, c’est que ces serveurs sont énergivores et leur technologie, aussi moderne soit elle, n’a pas une durée de vie illimitée. A l’avenir, de l’ADN synthétique pourrait offrir la technique de stockage rêvée. De l’ADN dans quelques gouttes de liquide pourrait suffire pour conserver des quantités gigantesques de données. L’Union européenne a misé sur cette technologie.

Il faudra de plus en plus de capacités de stockage

L’essor du numérique dans tous les secteurs d’activité pose un défi de taille : comment gérer l’explosion du volume de données générées dans le monde ? Le digital est partout, des images, des vidéos, des données bancaires, des données relatives à l’internet des objets, les données des réseaux sociaux ou encore l’avènement de la 5G, la liste des applications où le stockage de données est nécessaire est quasi sans limites.

Plusieurs analyses concordantes ont quantifié l’évolution du volume de données numériques au cours des années. Selon les estimations du Digital Economy Compass 2019 de Statista, le monde stocke actuellement, annuellement, 20 fois plus de données qu’il y a 10 ans. Statista estime à 50 zettaoctets le volume de données stockées en 2020. Pour avoir une petite idée de ce que cela représente, 1 Zettaoctet vaut "1 000 000 000 000 000 000 000" octets, soit un milliard de fois plus qu’un disque dur d’1 TO (Teraoctet). Un autre organisme, IDC, évalue le volume de données dans le monde à 175 zettaoctets en 2025 alors qu’on en était à 33 zettaoctets en 2018. Certaines estimations misent même sur 2000 zettaoctets en 2035. 

Actuellement, le stockage repose sur de gigantesques centres de données

Pour conserver toutes ces données, le monde compte actuellement sur des "data centers", des centres de données. Selon Datacenter Map, , la planète compte actuellement environ 4729 centres de ce type répartis dans 127 pays.

Le matériel informatique utilisé dans ces centres, comme les serveurs et les unités de stockage, est particulièrement gourmand en énergie. Ces machines chauffent et doivent être refroidies. Certains de ces centres de données sont gigantesques. En 2018, dans un rapport sur la consommation d’énergie dans les centres de stockage de données, la Commission européenne estimait la consommation énergétique des data centers de l’Union européenne à 76,8 TWh/an, soit environ 76.800 fois la capacité de production d’un des réacteurs nucléaires de centrales belges.

A plus long terme, construire toujours plus de centres de données n’est probablement pas la solution la plus viable, sans compter qu’il faudra aussi prendre en compte l’obsolescence des centres de données actuelles. Aussi performants soient-ils, les serveurs et les unités de stockage ne seront pas éternels.

L’ADN comme alternative du futur

C’est dans ce contexte que les recherches ont commencé à se tourner, il y a quelques années déjà, vers l’ADN. L’ADN, l’acide désoxyribonucléique se trouve dans les cellules des êtres vivants. Il contient les informations génétiques. Dans chaque ADN sont contenus des dizaines de milliers de gènes qui déterminent les caractéristiques de chaque être vivant. Avec ses capacités de stockages énormes, l’ADN pourrait être considéré comme une sorte de disque dur naturel.

C’est cette capacité de stockage qui a poussé des chercheurs à étudier l’ADN sous un autre angle. Cette substance pourrait-elle servir à stocker d’autres données ? Pourrait-on transformer l’ADN pour y stocker toutes les données que le monde produit, comme des vidéos par exemple ?

Aujourd'hui, on pense sérieusement que c’est possible. C’est dans les années 80 que les premières utilisations de stockage de données sur ADN ont été réalisées. Et depuis, de nombreux chercheurs ont essayé d’améliorer les techniques pour y parvenir. En 2017, une équipe de l’Université de Columbia, à New York, est parvenue à stocker dans des brins d’ADN plusieurs choses : les données d’un système d’exploitation d’ordinateur, une carte d’achat de 50 dollars, un virus informatique, une vidéo, celle du film de 1895 des frères Lumière, "L’arrivée d’un train à La Ciotat" ainsi que quelques autres choses. Ces données ont pu être codées et stockées dans l’ADN et ont ensuite pu être décodées.

Comment fonctionne le stockage ADN ?

Dans l’ADN, on retrouve quatre principaux composants : l’adénine la cytosine, la guanine et la thymine. Ces quatre composants sont représentés par les lettres A, C, G et T. 

En informatique, les données que l’on stocke sont converties en données binaires, une succession de "1" et de "0", ce qu’on appelle des bits.

La prouesse dans le stockage ADN est d’utiliser, à la place des "1" et des "O", les lettres A, C, G et T des composants de l’ADN. On aura alors, dans une molécule d’ADN, les quatre composants, A, C, G et T qui formeront une séquence dans un ordre bien précis identique à l’ordre des données du fichier numérique d’origine.

Pour y parvenir, on utilise un ADN de synthèse, fabriqué en labo. L’ADN est glissé, par exemple, dans quelques gouttes de liquide dans lesquelles une quantité phénoménale de données peut être stockée.

Avantages et inconvénients

Le principal avantage du stockage de données dans l’ADN, c’est que cela nécessite peu de place par rapport au volume de données que l’on peut y conserver. Selon des experts, avec cette technique, on pourrait stocker un milliard de fois plus de données qu'avec les méthodes de stockage électroniques actuelles. Dans la littérature disponible sur le sujet, on estime tantôt à une boîte de chaussures, tantôt à un coffre de voiture, tantôt à une pièce d’habitation l’espace nécessaire pour stocker dans de l’ADN l’ensemble des données numériques de la planète.  Dans tous les cas, ce serait nettement moins que l'espace occupé par les serveurs des data centers du monde entier. 

Un autre avantage, c’est la durée de vie de l’ADN. Si dans la nature, on peut aujourd’hui toujours retrouver, par exemple de l’ADN de mammouth de bonne qualité, ceux qui cherchent des données sur de l’ADN se disent qu’on a de bonnes chances de toujours pouvoir décoder les fichiers stockés. L’ADN resterait utilisable pendant des milliers d'années, voire plus. De toute façon bien plus longtemps qu’un disque dur ou une bande magnétique…

Encore très cher

Le principal inconvénient du stockage ADN est le coût. L’expérience menée en 2017 par l’Université de Columbia, où l’on avait stocké la vidéo d’un film des frères Lumières n’a pas pu être utilisée à grande échelle pour d’autres stockages de données. En effet, à cette occasion, il a été estimé qu’il en coûterait 7000 dollars pour coder 2 mégaoctets de données, et 2000 dollars pour les décoder.   Pour ce prix-là, on peut se payer de nombreux disques durs...

L’autre inconvénient, c’est le temps. Là où, il faut très peu de temps aujourd’hui pour accéder à des données stockées sur disques durs ou dans des serveurs informatiques, décoder des données contenues dans de l’ADN nécessite plus de temps, par exemple un à deux jours.

Le projet de stockage ADN européen "OligoArchive"

De son côté, l’Europe croit aussi beaucoup au potentiel de l’ADN de synthèse pour stocker des données. Elle finance, à concurrence de 3 millions d’euros le projet "OligoArchive". Le but de ce programme de recherche est d’établir des preuves qu’il est possible de stocker des données sur ADN. Les chercheurs dépendent de départements universitaires français, britanniques et irlandais. Ils ont trois ans pour trouver le moyen de stocker et extraire des données numériques le plus efficacement possible. L’objectif est la construction d'un disque ADN pour remplacer, peut-être un jour, les moyens de stockage numériques actuels.

Parmi les pistes des chercheurs européens, pour donner un avenir au stockage ADN, il y a l’idée de n’utiliser ce stockage que pour les données "froides", celles dont on n’a pas besoin immédiatement et pour lesquelles on pourrait se permettre d’attendre le délai nécessaire au décodage d’un fichier ADN. On y stockerait ainsi, par exemple, toutes ces photos, vidéos accumulées au fil des ans et dont on n’a pas forcément besoin tout de suite, ou encore des documents administratifs, des archives. En revanche, pour les données "chaudes" nécessaires au fonctionnement de la société numérique, on continuerait à recourir aux centres de données actuels qui permettent une exploitation plus rapide des données.

Il n’y a bien sûr pas que l’Europe qui est sur la piste de moyens performants de stocker les données sur ADN. Du côté des entreprises, Microsoft est très impliqué dans l’élaboration d’applications liées au stockage ADN.  Et tout récemment, le 16 mars, une start-up américaine, Iridia a communiqué avoir levé 24 millions de dollars pour financer des recherches dans ce domaine. Le but de cette société est aussi de développer une solution de stockage ADN économiquement viable.

Newsletter info

Recevez chaque matin l’essentiel de l'actualité.

OK

{INREAD}