"Les entrechats d'Eros mènent aux entrelacs de l'ADN par un sacré culbutage des chromosomes"
Eva Almassy - Ecrivain
Le grand défi du stockage des données numériques sera à terme de trouver les infrastructures les mieux adaptées - en proposant à défaut des alternatives aux équipements électroniques - d'assurer leur maintenance à moindre coût et enfin de limiter leur consommation en énergie.
Les données numériques
Actuellement, près de la moitié des données numériques que l’on cherche à stocker ne trouve pas de place dans les data centers. Données personnelles et professionnelles, photos, vidéos, etc. sont rassemblées dans des fermes de serveurs informatiques. Ainsi, les big-datas contiendraient autant d’octets que d’étoiles contenues dans l’Univers observable, soit 100 milles milliards de milliards d'étoiles, càd 100 Zettaoctets*. Et nul doute qu'avec l'arrivée de l'IOT - en français dans le texte, les objets connectés sur internet - et avec le déploiement de la 5G, les chiffres vont exploser. On peut imaginer que les volumes annuels auront doublé d'ici 4 à 5 ans.
Alors comment continuer à stocker toutes ces données ?
* A noter au passage que l'on est ici sur le même ordre de grandeur que le nombre d'Avogadro (environ 6 × 10^23) convenance qui permet de passer du monde microscopique des molécules à celui macroscopique des expériences, soit du monde de l'atome à celui de la mole.
Informatique et biologie
Il y a plus de 4 milliards d'années, la vie apparaissait sur terre.
Les organismes vivants ont prospéré et ont évolué en s'appuyant sur un plan de fonctionnement codé et conservé sur de longues chaînes moléculaires que l'on nomme ADN. Dans chaque cellule du vivant, les chromosomes sont le support du code génétique. Les trois milliards et quelques … de couples de nucléotides formant le génome humain sont ainsi présents dans chacune de nos trente milles milliards de cellules. L'homme est un énorme data center concentrant près d'un Zettaoctet de paires de nucléotides. Il suffirait ainsi d'une centaine de petits bonshommes pour stocker les données numériques estimées créées à date dans une année par l'humanité.
La nature est quand même vertigineuse et sacrement bien faite …
Des communautés d'informaticiens et de biologistes essaient actuellement d'appliquer le principe de conservation de l'information initié par la nature, au stockage des données numériques. Il ne semble pas idiot de chercher à imiter ce que la nature a mis en place depuis maintenant plusieurs milliards d'années, sachant que le mécanisme utilisé semble plutôt fiable, efficace et robuste. Sinon, on ne serait pas là pour en parler …
Outre sa capacité à pouvoir stocker une énorme quantité d’informations dans un volume très faible, ce mécanisme a également l'énorme avantage de ne pas consommer d’énergie et d'être très stable lorsqu’il est bien conservé - le plus vieil échantillon d'ADN connu date de plus de 1,5 million d’années.
Différentes recherches sont également engagées en parallèle, recherches qui s'appuient sur d'autres polymères, par exemple les polysaccarides.
Le procédé
Dans nos ordinateurs, l’information est codée sous forme binaire (0 et 1).
• Pour l'ADN, elle est codée par un des 4 nucléotides A, T, C ou G.
• Pour les autres polymères, elle est codée par le raccordement ou non d'un atome à chacune des monomères de la chaine.
Perspectives
Même s'ils demeurent encore élevés, les coûts de production de l'ADN synthétique et les coûts liés à son séquençage en vue de récupérer les données stockées ont vocation à diminuer, coûts qui par ailleurs sont directement liés à l'utilisation qui sera faite de la solution. Pour le stockage, le seul impératif est de conserver les brins d’ADN loin de toute humidité, en les enfermant par exemple dans une capsule étanche. Les données peuvent ainsi être gardées à température ambiante sur des milliers d’années, sans risque de dégradation.
L'inconvénient majeur du procédé est bien entendu son manque de rapidité et de souplesse. Il n'est adapté et applicable que pour le stockage de données n'ayant pas vocation à être modifiées ou lues régulièrement, pour des données d'archives en quelque sorte.
Les données éligibles à cette forme de stockage représentent cependant plus de la moitié des données existantes, une part qui ne devrait être amenée qu'à croître. Pour sûr, il y a un marché lucratif à la clé.
댓글