Libros escritos en código genético

¿Qué es el Genoma Humano?
23/08/2012
El gran debate…del vivir y del morir
23/08/2012

Por Hayley Dunning – Publicado en The Scientist el 16 de Agosto de 2012
 
Unos investigadores han escrito un libro utilizando el mismo código de traducción del mensaje del ADN, lo que demuestra la posibilidad de utilizar la molécula biológica para almacenamiento de datos a largo plazo.
 
La codificación de mensajes en ADN fue ya demostrada en la década de 1980, pero la tecnología de la época sólo permitiría codificar símbolos gráficos. Sin embargo, esa capacidad ha crecido en las últimas 3 décadas, el proyecto más grande hasta la fecha, completado en 2010, logró sólo 7.920 bits de datos, lo que equivale a aproximadamente la mitad de una página de texto mecanografiado. Utilizando una novedosa técnica, detallado hoy en Science, unos investigadores de las universidades de Johns Hopkins en Harvard, han codificado ahora un libro de 53.000 palabras en ADN, incluyendo 11 imágenes JPG y un programa JavaScript.

Por Hayley Dunning – Publicado en The Scientist el 16 de Agosto de 2012
 
Unos investigadores han escrito un libro utilizando el mismo código de traducción del mensaje del ADN, lo que demuestra la posibilidad de utilizar la molécula biológica para almacenamiento de datos a largo plazo.
 
La codificación de mensajes en ADN fue ya demostrada en la década de 1980, pero la tecnología de la época sólo permitiría codificar símbolos gráficos. Sin embargo, esa capacidad ha crecido en las últimas 3 décadas, el proyecto más grande hasta la fecha, completado en 2010, logró sólo 7.920 bits de datos, lo que equivale a aproximadamente la mitad de una página de texto mecanografiado. Utilizando una novedosa técnica, detallado hoy en Science, unos investigadores de las universidades de Johns Hopkins en Harvard, han codificado ahora un libro de 53.000 palabras en ADN, incluyendo 11 imágenes JPG y un programa JavaScript.
 
Sriram Kosuri.coautor del trabajo ha dicho que: «Otros han señalado que el ADN tiene ciertas ventajas… Pero nadie había llevado el uso del código a un nivel realmente útil de información».
 
Las ventajas incluyen la densidad de información que puede ser almacenada. Una estimación de la capacidad máxima predice que un gramo de ADN de cadena sencilla podría almacenar tanto como un exabyte (1018 bytes) de datos. Sin embargo, la síntesis y la secuenciación del ADN conlleva un montón de errores inherentes. Usualmente un ADN sintético tiene un nucleótido incorrecto de cada 70, y las técnicas de secuenciación de próxima generación pueden cometer muchos errores al interpretar los datos almacenados.
 
Para superar estos errores, el equipo ha designado a las bases A (Adenina) y C (Citosina) como ceros y a las G (Guanina) y T (Timina) como unos, creando una secuencia de datos digitales. El manuscrito y sus acompañamientos — un borrador de un libro escrito por uno de los autores del estudio, George Church, llamado Regenesis: How Synthetic Biology Will Reinvent Nature and Ourselves (Regénesis: cómo la biología sintética reinventará la naturaleza y a nosotros mismos) — fue convertida a HTML antes de ser traducida al torrente de 0s y 1s que se pudo escribir en la secuencia de ADN. La secuencia resultante fue larga, de 5,27 megabits o 5,270 millones de dígitos 0s y 1s.
 
Los métodos anteriores habían tratado de resolver los problemas al intentar crear secuencias enteras en una larga secuencia de ADN, un proceso complicado y costoso. La solución del equipo autor de este trabajo fue dividir la secuencia en secciones más pequeñas. Estas codifican unos 96 bits por sección de nucleótidos corta, llamada un oligonucleótido, cada uno de los cuales contenía una "dirección" de 19 bits para ordenar la información en la secuencia general. Cada oligonucleótido fue sintetizado varias veces, para que la lectura y los errores pudieran compararse en cada copia solucionándolos mediante lectura de consenso.
 
«Es un método similar al de la secuencia del genoma humano. Nno se secuencia una vez, se secuencia de 30 o 50 veces y se utiliza el consenso en cada posición». señaló Kosuri.
 
Después de sintetizar la secuencia y colocar gotas de ADN en chips de microarrays, se almacenaron los datos a 4 grados centígrados durante 3 meses antes de disolverse en agua, amplificarlos por PCR y secuenciarlos. Al almacenar múltiples copias y proceder a la secuenciación de cada copia muchas veces para alcanzar un consenso, el equipo logró descifrar la secuencia completa de 5,270 millones-bit con errores de tan solo 10 bits.

El biólogo sintético Steven Benner de la Foundation for Applied Molecular Evolution, que no estuvo involucrado en el estudio, ha declarado que: «se trata de una manera muy inteligente de gestionar el error en la creación de la información… Los autores proporcionan algunas formas inteligentes para sortear los problemas, permitiendo la lectura de las moléculas en minoría que contiene la información deseada en medio de un número mayor de moléculas no informativas».

Mientras que el almacenamiento de ADN no es regrabable y no está pensado para reemplazar el disco duro, la idea de almacenamiento a largo plazo de grandes cantidades de datos en un espacio muy pequeño tiene ventajas para archivar registros y datos. A diferencia de un disco plano como un CD, con datos inscritos sólo sobre la superficie de una lámina, el ADN tiene datos almacenados en todo su espesor. Sin embargo, el principal desafío sigue siendo hoy el costo, la eficiencia de la síntesis y las tecnologías de secuenciación, que actualmente hacen de este sistema impracticable para un para uso regular. No obstante, a medida que vayan disminuyendo los costes de secuenciación y continúen avanzando las tecnologías, dichas estrategias de almacenamiento del ADN serán cada vez más y más prácticas.

 Otro desafío que debe superarse es el de la conservación. El ADN de restos de miles de años puede ya ser secuenciado, pero esas secuencias son raramente completas. «La química del ADN no se presta fácilmente a la conservación de  archivos a escala de siglos, sin envasar» dijo Benner. «Sin embargo, este papel debe alentar a la gente para enfrentar los desafíos de almacenamiento de información basada en la molécula, dado su potencial de almacenamiento de alta densidad».
 
Referencia
 
George M. Church, Yuan Gao, Sriram Kosuri.“Next-generation digital information storage in DNA,” Science,
DOI: 10.1126/science.1226355, 2012. Enlace
 
Abstract
 
Digital information is accumulating at an astounding rate, straining our ability to store and archive it. DNA is among the most dense and stable information media known. The development of new technologies in both DNA synthesis and sequencing make DNA an increasingly feasible digital storage medium. Here, we develop a strategy to encode arbitrary digital information in DNA, write a 5.27-megabit book using DNA microchips, and read the book using next-generation DNA sequencing.

CíViCa
CíViCa
Ciencia | Cultura | Vida Asociación de Investigadores y Profesionales por la Vida.