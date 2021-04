Plusieurs analyses concordantes ont quantifié l’évolution du volume de données numériques au cours des années. Selon les estimations du Digital Economy Compass 2019 de Statista, le monde stocke actuellement, annuellement, 20 fois plus de données qu’il y a 10 ans. Statista estime à 50 zettaoctets le volume de données stockées en 2020. Pour avoir une petite idée de ce que cela représente, 1 Zettaoctet vaut "1 000 000 000 000 000 000 000" octets, soit un milliard de fois plus qu’un disque dur d’1 TO (Teraoctet). Un autre organisme, IDC, évalue le volume de données dans le monde à 175 zettaoctets en 2025 alors qu’on en était à 33 zettaoctets en 2018. Certaines estimations misent même sur 2000 zettaoctets en 2035.

A plus long terme, construire toujours plus de data centers n’est probablement pas la solution la plus viable, sans compter qu’il faudra aussi prendre en compte l’obsolescence des centres de données actuelles. Aussi performants soient-ils, les serveurs et les unités de stockage ne seront pas éternels.

Aujourd'hui, on pense sérieusement que c’est possible. C’est dans les années 80 que les premières utilisations de stockage de données sur ADN ont été réalisées. Et depuis, de nombreux chercheurs ont essayé d’améliorer les techniques pour y parvenir. En 2017, une équipe de l’Université de Columbia, à New York, est parvenue à stocker dans des brins d’ADN plusieurs choses : les données d’un système d’exploitation d’ordinateur, une carte d’achat de 50 dollars, un virus informatique, une vidéo, celle du film de 1895 des frères Lumière, "L’arrivée d’un train à La Ciotat" ainsi que quelques autres choses. Ces données ont pu être codées et stockées dans l’ADN et ont ensuite pu être décodées.

La prouesse dans le stockage ADN est d’utiliser, à la place des "1" et des "O", les lettres A, C, G et T des composants de l’ADN. On aura alors, dans une molécule d’ADN, les quatre composants, A, C, G et T qui formeront une séquence dans un ordre bien précis identique à l’ordre des données du fichier numérique d’origine.

Dans l’ADN, on retrouve quatre principaux composants : l’adénine la cytosine, la guanine et la thymine. Ces quatre composants sont représentés par les lettres A, C, G et T.

Un autre avantage, c’est la durée de vie de l’ADN. Si dans la nature, on peut aujourd’hui toujours retrouver, par exemple de l’ADN de mammouth de bonne qualité, ceux qui cherchent des données sur de l’ADN se disent qu’on a de bonnes chances de toujours pouvoir décoder les fichiers stockés. L’ADN resterait utilisable pendant des milliers d'années, voire plus. De toute façon bien plus longtemps qu’un disque dur ou une bande magnétique…

Le principal avantage du stockage de données dans l’ADN, c’est que cela nécessite peu de place par rapport au volume de données que l’on peut y conserver. Selon des experts, avec cette technique, on pourrait stocker un milliard de fois plus de données que dans les méthodes de stockage électroniques actuelles. Dans la littérature disponible sur le sujet, on estime tantôt à une boîte de chaussures, tantôt à un coffre de voiture, tantôt à une pièce d’habitation l’espace nécessaire pour stocker dans de l’ADN l’ensemble des données numériques de la planète. Dans tous les cas, ce serait nettement moins que l'espace occupé par les serveurs des data centers du monde entier.

De son côté, l’Europe croit aussi beaucoup au potentiel de l’ADN de synthèse pour stocker des données. Elle finance, à concurrence de 3 millions d’euros le projet "OligoArchive". Le but de ce programme de recherche est d’établir des preuves qu’il est possible de stocker des données sur ADN. Les chercheurs dépendent de départements universitaires français, britanniques et irlandais. Ils ont trois ans pour trouver le moyen de stocker et extraire des données numériques le plus efficacement possible. L’objectif est la construction d'un disque ADN pour remplacer, peut-être un jour, les moyens de stockage numériques actuels.

Parmi les pistes des chercheurs européens, pour donner un avenir au stockage ADN, il y a l’idée de n’utiliser ce stockage que pour les données "froides", celles dont on n’a pas besoin immédiatement et pour lesquelles on pourrait se permettre d’attendre le délai nécessaire au décodage d’un fichier ADN. On y stockerait ainsi, par exemple, toutes ces photos, vidéos accumulées au fil des ans et dont on n’a pas forcément besoin tout de suite, ou encore des documents administratifs, des archives. En revanche, pour les données "chaudes" nécessaires au fonctionnement de la société numérique, on continuerait à recourir aux data center actuels qui permettent une exploitation plus rapide des données.

Il n’y a bien sûr pas que l’Europe qui est sur la piste de moyens performants de stocker les données sur ADN. Du côté des entreprises, Microsoft est très impliqué dans l’élaboration d’applications liées au stockage ADN. Et tout récemment, le 2 avril, une start-up américaine, Iridia a communiqué avoir levé 24 millions de dollars pour financer des recherches dans ce domaine. Le but de cette société est aussi de développer une solution de stockage ADN économiquement viable.