Résumé
Le stockage des données numériques devient un défi pour l'humanité en raison de la durée de vie relativement courte des dispositifs de stockage. De plus, l'augmentation exponentielle de la génération de données numériques crée le besoin de construire constamment de nouvelles ressources pour gérer leur archivage. Des études récentes suggèrent l'utilisation de la molécule d'ADN comme un nouveau candidat prometteur qui pourrait contenir théoriquement 215 pétaoctets dans un seul gramme. Toute information numérique peut être synthétisée en ADN in vitro et stockée dans de minuscules capsules spéciales qui proposent une fiabilité de stockage de plusieurs centaines d'années. La séquence d'ADN stockée peut être récupérée à tout moment à l'aide de machines spéciales appelées « séquenceurs ». L'ensemble de ce processus est très difficile car la synthèse de l'ADN est coûteuse et le séquençage est sujet à des erreurs. Cependant, des études ont montré qu'en respectant plusieurs règles dans le codage, la probabilité d'erreur de séquençage est réduite. Par conséquent, le codage de l'information numérique n'est pas trivial, et les données d'entrée doivent être efficacement compressées avant leur codage afin de réduire le coût élevé de la synthèse.
Dans cette présentation, nous parlerons de l'état de l'art en matière de stockage de données ADN pour l'encodage efficace de données numériques dans un code quaternaire constitué des 4 bases ADN A (Adénine), T (Thymine), C (Cytosine) et G (Guanine). Nous présenterons également une nouvelle solution prometteuse de codage d'images numériques dans de l'ADN synthétique que nous avons développée au laboratoire I3S au cours des 5 dernières années et qui prend en compte les contraintes liées au stockage des données sur ADN tout en optimisant le compromis qualité de compression et coût de synthèse.