LoginRSS 2.0 Feed

lunes, 24 de julio de 2006

Ya hace casi un año (22 de Agosto de 2005) que se alcanzó la astronómica cifra de 100 Gigabases en las bases de datos de DNA y RNA disponibles públicamente para tod@ aquel con espacio para descargarlas (actualmente ¡99 GB de ficheros comprimidos!). Esta compilación de genomas, secuencias y fragmentos de secuencia es debida principalmente al esfuerzo de todos los investigadores de proyectos de secuenciación y a tres entidades coordinadoras: NCBI (National Center for Biotechnology Information, Estados Unidos), EMBL (European Molecular Biology Laboratory, Europa) y DDBJ (DNA Data Bank of Japan, Japón).


Cada una de estas entidades ha publicado, al principio por separado, y más tarde de forma coordinada, sus propias compilaciones de secuencias. Esta coordinación dio como fruto la creación del INSDC (International Sequence Database Collaboration) y el establecimiento de protocolos conjuntos de difusión y "curado" de la información.

Leyendo la noticia original de aquel momento, podemos leer que las secuencias de DNA y RNA que conformaban aquel grueso de 100 Gigabases provenían de alrededor de 165000 organismos. Lo más curioso de todo esto es que el número de organismos para los que conocemos por completo su genoma es muy pequeño (menos de 100). Si tuviéramos la información completa de todos los genomas de todos esos organismos, ¡tendríamos que multiplicar la cifra total de pares de bases por 100 o 200!

A pesar de que estas cifras mareen casi a cualquiera, hay que recordar que buena parte de las técnicas bioinformáticas actuales de minería de datos se basan de forma directa o indirecta en la similitud entre secuencias, y la información asociada a esas secuencias.Aunque la información sobre los distintos organismos está codificada en sus genomas, seguimos sin poder extraer de forma directa dicha información.

Usando la analogía del libro de la vida, por mucha información que tengamos aún no sabemos leer (y a veces, incluso abrir) el libro, y ¡necesitamos una Piedra de Roseta!

16:04 | gestionado por José María Fernández González | Enviar comentario (0)

La pasada semana me la tomé de vacaciones, y aproveché para descansar, tomar el sol, hacer deporte, ... y ver las noticias. Pude comprobar por las imágenes en televisión toda la destrucción provocada por Hezbolá y el ejército de Israel.

¿En qué afecta esto a la bioinformática? Del 10 al 13 de Septiembre se va a celebrar en Eilat, Israel el ECCB 2006 (5th European Conference on Computational Biology). A pique de parecer cotilla, de vuelta de mis mini-vacaciones he oído en el laboratorio de investigación donde trabajo rumores de que tal vez se suspenda esta conferencia. Por lo que tengo entendido, también hay bastantes asistentes que van a dejar de asistir por el posible riesgo personal.

No pienso entrar en el debate de quién tiene razón en el conflicto Líbano-Israel, porque en la guerra, ya sea declarada o encubierta, nadie la tiene: tod@s son víctimas. Solo sé que hay un par de víctimas más: ECCB y la bioinformática.

15:20 | gestionado por José María Fernández González | Enviar comentario (1)