Comment l'ADN constitue-t-il un moyen de stockage plus pérenne et plus économe que ceux existants actuellement ?
La nécessité de redondance de l'information
Comme pour le stockage numérique traditionnel, une redondance de l'information est nécessaire pour offrir une certaine fiabilité. Cette redondance est mise en place grâce à un système de fragments chevauchant, possédant chacun une partie du code du précédent. On divise le code obtenu à l'étape précédente en fragments de 4 nucléotides. Ces fragments sont regroupés par 4 en morceaux de code de 16 nucléotides. Seulement, chaque fragment de 4 nucléotides appartiendra à quatre morceaux de code de 16 nucléotides, mais occupera une position différente dans chaque morceau. Les 3/4, soit 12 premiers nucléotides de chaque morceau seront les mêmes que les 12 derniers du morceau précédent, conformément au principe de chevauchement.
On adjoint à chaque morceau codant, une part d'informations d'indexation leur permettant de reconstituer un brin codant final, redondant, dans lequel, les morceaux chevauchants sont ordonnées. Ce processus est schématisé ci-dessous.

En pratique, on construit les morceaux de 16 bases avec leurs informations d'indexation par synthétiseur. En utilisant des enzymes appelées ligases, on lie les morceaux dans l'ordre pour obtenir le brin final.