LoginRSS 2.0 Feed

viernes, 11 de noviembre de 2005

Echándole un vistazo a los titulares de BioMed Central, me he encontrado con una noticia sorprendente, sobre todo por sus implicaciones. La noticia trata sobre el aumento espectacular del número de autores que publican en revistas de libre acceso. Dicha conclusión surge del estudio "New Journal Publishing Models: An International Survey of Senior Researchers", realizado por CIBER (Centre for Information Behaviour and the Evaluation of Research) y publicado en Septiembre de 2005.

Este estudio está basado en una encuesta realizada sobre 5513 autores de artículos, principalmente directores de investigación y jefes de grupo,  que habían publicado durante el año 2004 en alguna revista indexada por ISI (cuyo producto más conocido es ISI Web of Knowledge). Dichas encuestas han revelado que desde que se realizó el mismo estudio en año 2004 ha habido un gran aumento en el número de de autores que tenían mucha idea de lo que eran las revistas de libre acceso, y que había disminuído ostensiblemente el número de autores que desconocían por completo su existencia y funcionamiento.

Todo esto indica que se está produciendo un cambio de mentalidad en la forma de publicar trabajos pioneros y nuevos descubrimientos, más enfocado a Internet y al libre acceso y distribución de los artículos que al modelo tradicional de revistas especializadas accesibles sólo por suscripción, con control férreo sobre la distribución del artículo.

Enlaces:

23:20 | gestionado por José María Fernández González | Enviar comentario (0)

Durante  esta semana y la que viene se celebra en Madrid la V Semana de la Ciencia (un poco contradictorio que una semana de la ciencia dure dos), y con motivo de la misma se van a celebrar representaciones de teatro, charlas coloquio, mesas redondas y jornadas de puertas abiertas en los distintos centros de investigación y entidades que participen. Actualmente trabajo para el CSIC en el CNB, este centro de investigación va a tener el 15 de Noviembre su jornada de puertas abiertas para preuniversitarios (4 grupos de 10 chavales cada uno), y hace unas semanas me pidieron que impartiera la charla de Computación Científica y Bioinformática.

Pensando en qué contarle a los muchachos, surgió la reflexión que estoy escribiendo ahora. Hay una pregunta que todos los que trabajamos en ciencia podemos responder fácil o díficilmente, dependiendo de con quién estemos hablando, y es "en qué estamos trabajando". En mi caso, respuestas como "Soy Bioinformático" o "Trabajo en Bioinformática" pueden ser entendidas así:

a)  Es tu día de suerte, y saben lo que es a grosso modo la bioinformática (¡Dios existe!)

b) Caso reduccionista 1. Se olvidan del término Bio, y entonces se quedan con que eres informático.

c) Caso reduccionista 2. Se piensan que eres un biólogo que "sabe" de informática.

d) Caso típico. "Y eso... ¿qué es?"


¡Y aquí es donde comienza el problema! Muchas veces he explicado en qué consiste la bioinformática, y muchas de ellas les ha sonado a chino a quien se lo haya explicado. Ya os habreis dado cuenta que los casos anteriores no son excluyentes entre sí. Más de uno ha pasado por los casos b), c) y d) en una misma explicación. Todavía recuerdo que al poco de empezar a trabajar me tocaba hacer la defensa de mi Proyecto Fin de Carrera, y al hablar con mi director de proyecto y contarle que trabajaba en Bioinformática con bases de datos, me respondió algo así como:

"Vale, de acuerdo, esa es la explicación oficial, pero ahora dime, ¿estás haciendo de administrador de máquinas?"

Expresándolo claramente ¡esa respuesta me jodió mucho en aquel momento! ¡Mi propio tutor estimó por una simple palabra que mi recién obtenido título no servía para nada! Al poco me di cuenta de que, simplemente, estaba trabajando en algo tan nuevo que apenas unos pocos en España sabían explicar qué es la Bioinformática. Desde entonces, como se dice vulgarmente, "ha llovido mucho", y con la secuenciación del genoma humano, la clonación de la oveja Dolly, y otros hitos, la gente, aunque no entiende o sabe qué es la biotecnología y la bioinformática, ya tiene la sensación de que trabajas en algo importante del mundo de la investigación. La última persona hasta la fecha que me ha preguntado sobre qué es la bioinformática ha sido el periodista de La Flecha que se puso en contacto conmigo, y que también me ha inspirado para escribir esta reflexión. Porque, ¿qué es la Bioinformática? En todos los años que llevo trabajando en esto todavía no he encontrado una respuesta corta que me satisfaga. En Wikipedia podemos encontrar una definición bastante concisa, pero algo sesgada.

Aunque la bioinformática es una rama de la ciencia que se puede considerar en sus comienzos, está repleta de áreas de investigación muy dispares en constante ebullición. Por ejemplo, anotación de la función de proteínas, predicción de estructura tridimensional de proteínas, predicción de interacciones, definición y anotación de dominios funcionales mediante HMM (Hidden Markov Models), análisis automatizado de textos científicos para la realización de inferencias, simulación de la dinámica de plegamiento de una proteína, simulaciones de dinámica molecular... Y así, un largo, largo etcétera. Por eso creo que el término bioinformática sólo lo puedo definir vagamente, algo muy parecido a "la informática al servicio de la biología y la biotecnología". Y por esa razón hay trabajando en bioinformática gente de disciplinas muy diversas: matemáticos, físicos, bioquímicos, ingenieros en informática, ingenieros en telecomunicación, algún lingüísta, biólogos (por supuesto), etc. En nuestro trabajo se suelen aplicar y usar muchos de los desarrollos originados en otras disciplinas, y lo más importante, se trata de un trabajo colaborativo, en equipo.

Muchas de las herramientas que se desarrollan en bioinformática tienen como objetivo predecir propiedades físicas de sistemas biológicos o de alguno de sus elementos, ya sea a bajo nivel (estructura de una proteína, por ejemplo) o a un nivel mayor (inferencia de la influencia de una familia de proteínas sobre las rutas metabólicas de un organismo). Muchos de los algoritmos usados en bioinformática necesitan analizar volúmenes de datos del orden de decenas o cientos de gigabytes (109 bytes) para una sola entrada, ¡y normalmente pueden recibir miles de una sola tacada! Estos datos tienen su origen en información experimental recopilada de los distintos experimentos que realizan los biólogos en los distintos organismos, y el volumen de los mismos crece de forma exponencial (a un ritmo mayor que la ley de Moore) por la creciente automatización y ejecución masiva de muchos experimentos que antes sólo se podían hacer a mano, uno a uno. Sólo la Astronomía y la Física de Altas Energías generan un volumen datos mayor que la Bioinformática (y las Ciencias de la Vida en general).

Terminando de escribir esta reflexión me he puesto a pensar en el papel de la informática en la bioinformática, pero eso lo dejo para otro día. Para terminar, me viene a la mente la cara que puso la chica del Carrefour encargada de compras a plazos cuando compré un frigorífico, me preguntó dónde trabajaba, y le respondí "En el CSIC" y le enseñé la nómina. ¡Se pensaba que era un espía del CESID!

5:58 | gestionado por José María Fernández González | Enviar comentario (6)

Para el pasado ECCB05 varios compañeros de trabajo tuvieron la idea de adaptar el adictivo juego del Sudoku a estructuras de proteínas, y ahí nació el Foldoku. La dificultad del mismo está en que en lugar de números, tenemos estructuras de proteínas, lo cuál es una dificultad para el ojo que no está acostumbrado a distinguir la diferencia entre las mismas a simple vista. En otras palabras, ¡es como hacer un Sudoku con caras de chinos siendo occidental!

Está hecho en Javascript, y aunque tendría que funcionar de maravilla en Firefox, debido a un fallo de programación se mete en un bucle infinito de carga. Lo he probado en Opera y Mozilla, y carga perfectamente (no hagais caso al mensaje de que sólo funciona en Firefox), mientras que tiene algunos problemas con Konqueror.

¡Que lo disfruteis (si os atreveis)!

Enlace: Foldoku


5:55 | gestionado por José María Fernández González | Enviar comentario (3)

José Manuel Gimeno, del diario digital "La Flecha", me mandó el enlace a una noticia publicada en su diario ("La mayor simulación informática de la biología reproduce la dinámica celular"), basada en un artículo recientemente publicado en la revista PNAS. Intentando indagar en la noticia, me puse a buscar las fuentes de la misma, entre las cuáles está la página web sobre el experimento publicada por el laboratorio de Los Álamos, en cuyos ordenadores fue realizada la simulación. Dicha página explica en lenguaje coloquial el trabajo realizado, el número de ordenadores empleados y la importancia de los resultados conseguidos, pero no proporcionaba otros detalles técnicos como el tiempo simulado. Así que tuve que indagar más.

El artículo que describe en profundidad el trabajo realizado y los resultados obtenidos fue publicado el pasado 1 de Noviembre en la revista PNAS, con el título "Simulating movement of tRNA into the ribosome during decoding". Dicho artículo trata sobre cómo han conseguido realizar una simulación de 20ns del moviemiento del tRNA dentro del ribosoma durante la decodificación, habiendo realizado previamente siete simulaciones de 2ns de prueba. Para ello, los autores de este trabajo emplearon el programa NAMD, que es uno de los estándares de facto de aquellos que trabajan en dinámica molecular por su versatilidad, y un algoritmo de su propia cosecha ("targeted molecular dynamics algorithm").

Aunque una simulación de 20ns puede parecer muy pequeña para las escalas temporales que normalmente manejamos, es un gran logro para una simulación de dinámica molecular, teniendo en cuenta además el número de átomos simulados (2.64x106). Todo el cálculo está basado en ecuaciones diferenciales que representan una simplificación y estimación de los campos de fuerzas y entorno que influyen en las partículas de la simulación, junto con una serie de restricciones. El espacio de tiempo a simular se divide en una serie de iteraciones, y en cada iteración se resuelven las ecuaciones diferenciales que definen el problema para cada uno de los átomos, y cuyos resultados son calibrados y empleados como entrada para el siguiente ciclo de ejecución de las mismas. Toda simulación tiene asociada un error acumulado que es la diferencia entre los resultados obtenidos en la simulación y la realidad, y cuanto más larga es una simulación mayor es el error acumulado. Varias formas de reducir el error es simplificando menos el problema usando un campo de fuerzas simulado más cercano a la realidad, a costa de un tiempo de computación mucho mayor. Otra alternativa es mejorar las restricciones, que son un arma de doble filo porque también son capaces de introducir errores.

Curiosamente, aunque aparece publicado el número de procesadores empleados (768) del ASCI Q (8192) de Los Álamos, no aparece la información del tiempo que llevó realizar la simulación total (posiblemente varias semanas). En cualquier caso, os recomiendo que os leáis el artículo, aunque hay que reconocer que está más cerca de la parte Bio que de la parte Informática.

Enlaces:

5:38 | gestionado por José María Fernández González | Enviar comentario (0)