Secuencias de ADN perdidas en un mar de datos

Un artículo reciente del periódico New York Times describe en gran detalle y con una perspectiva global el nuevo reto que está enfrentando la investigación en genómica: en análisis de la gran cantidad de datos producida con los equipos de secuenciación de ADN.

Centros de investigación como BGI (Beijing Genomics Insititute) compro en el 2010 un total de 167 equipos de secuenciación de nueva generación los cuales permiten secuenciar un total de 2000 genomas completos por día. Importante recordad aquí que la secuenciación del primer genoma humano que se termino en el 2001 tomo 10 anos y costo 3 billones de dólares.

Otros laboratorios como el Centro de Innovación de la universidad de McGill en Canadá tiene un total de 18 secuenciadores de nueva generación. Para ver un mapa mundial indicando la cantidad de secuenciadores en distintas partes del mundo se puede visitar la página desarrollada por un grupo de investigadores de Inglaterra que tiene toda la información actualizada.

Estas nuevas tecnologías disponibles actualmente alrededor del mundo están haciendo avanzar la genómica a pasos agigantados y están permitiendo hacer realidad el reto que lanzo el NIH en el 2009: secuencia un genoma completo por menos de 1000 dólares.

Con estos avances pasamos entonces de la dificultad de producir las secuencias de ADN a la dificultad de analizar dichas secuencias. El reto empieza con el transporte de los datos, imposible enviar un genoma completo (y menos aun 100 o 200 genomas) por email. Las ‘drop box’ y los ‘clowds’ podrían ser una solución pero la capacidad de transmisión por internet no permite en muchos casos transferir están gran cantidad de datos.

Un vez los datos han sido transferidos el reto continúa con el análisis de la información, no existen aun programas de computador capaces de analizar o de comparar los genomas (tres mil millones de letras por genomas) de varios individuos a la vez.

El desarrollo del campo de la bioinformatica será entonces crucial para poder tener científicos capacitados y programas de computador innovadores que permitan analizar de una forma productiva esta gran cantidad de datos.

This entry was posted in Genómica, Secuenciación and tagged , , . Bookmark the permalink.

Leave a Reply

Your email address will not be published. Required fields are marked *

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>