LoginRSS 2.0 Feed

martes, 03 de enero de 2006

¡Como se nota que se me ha acumulado el trabajo del weblog! Hace un par de semanas Verónica desde Argentina escribió lo siguiente, preguntando sobre la bioinformática en Argentina, su futuro y cómo entrar en ella:

Hola, soy Verónica de Argentina y estoy estudiando la Lic. En análisis de sistemas y hace poco empecé con la locura de estudiar también Bioquímica. Me apasionan estos dos campos y lo que más quisiera en un futuro es poder combinarlos a ambos. Si no leí mal en alguno de tus posts, creo que vos también estudiaste informática y luego te inclinaste a la biología o me estoy equivocando? Bueno, te escribo para que si podés me comentes como fue tu experiencia ya que creo que combinar las dos cosas es algo muy duro y se necesita de mucho esfuerzo, por lo menos a mí, que tengo la mente totalmente informatizada, empezar a leer de proteínas y ADN casi me vuelve loca. Me apasiona pero me cuesta leer tanta cantidad de información, yo creo que a los Biológos le debe pasar algo similar cuando tienen que sentarse a estudiar Informática. Ojalá puedas mandarme algún comentario porque acá en Argentina no está muy divulgado el tema de la bioinformática y solamente se puede hablar con alguien que sepa de informática o alguien que sepa de Biología y no encuentro mucha información sobre el tema.


    En mi caso, oficialmente soy Ingeneriero en Informática, en el sentido de que no he llegado a realizar de forma oficial ninguna carrera de Biología o Bioquímica. Entré en este mundo de la Bioinformática porque es algo distinto a lo habitual, un área de conocimiento casi virgen, con mucho por explorar, y que propone muchos retos de diseño a un ingeniero o licenciado en informática. También entré porque la biología me gustaba, ¡aunque nunca pensé cuando terminé mi último examen de la carrera que me iba a dedicar a esto! En palabras llanas, la excepción es la regla en la bioinformática, tanto a nivel de estudios como a nivel de curriculum. Tengo un compañero de trabajo de Galicia, Osvaldo Graña, que sí ha hecho algo similar a lo que estás haciendo ahora mismo, dado que estudió primero Biología y luego Informática de Sistemas (corrígeme si me equivoco, Osvaldo). Él puede aconsejarte mejor que yo en este caso.

    Como bien dices, un@ se puede volver loc@ intentando asimilar simultáneamente ambas carreras, y los esfuerzos que estás dedicando tienen un grandísimo mérito (me quito el sombrero ante ti). Cuando termines ambas puede suceder que seas una bioquímica con conocimientos avanzados de informática y programación, una licenciada en informática con conocimientos profundos de bioquímica, ¡o ambas a la vez! Tras leer tu correo tengo la impresión de que puedes llegar a ser una buena bioinformática, sobre todo si al final eres capaz de ver los problemas de investigación desde ambos puntos de vista: el biológico y el informático.

Bueno, ¿algun@ de vosotr@s tiene consejos para Verónica, o bien conoce a la persona indicada?

4:16 | gestionado por José María Fernández González | Enviar comentario (24)

Hace poco ha salido publicado en la revista Nature un artículo que habla sobre Google Base, uno de los nuevos servicios Beta de investigación que Google está desarrollando, y su uso para facilitar la minería de datos sobre contenidos almacenados en él.

Google Base es un lugar donde se puede almacenar todo tipo de contenido, ya sea enlaces a sitios web o ficheros que no se encuentran publicados en Internet. A partir de ese momento, dicho contenido se encuentra disponible e indexado en Google Base, y puede ser etiquetado y descrito con atributos (al estilo de palabras clave tipo 'Autor', 'Fecha', etc...), de forma que la búsqueda de contenidos se agilice. Si el contenido es relevante, el contenido almacenado puede llegar a aparecer incluso en las búsquedas Google.

En el artículo de la revista Nature apuntan que los principales usuarios del servicio serán científicos (entre ellos, bioinformáticos), dado que permite a cualquiera compartir, almacenar y anotar información de forma global. El funcionamiento de dicho servicio se parece al objetivo de los grupos de W3C dedicados a web semántica: contenido simultáneamente legible por las personas y procesable por los ordenadores, ya sea de forma puntual o sistemática.

La mayor parte del contenido web está diseñado para ser visto, leído y asimilado por personas, y no contiene información descriptiva adicional aprovechable por los ordenadores. Esto limita su utilidad a la hora de realizar búsquedas masivas o intentar extraer conclusiones, salvo con herramientas especializadas y muy limitadas a un determinado dominio del problema, como por ejemplo SRS en bioinformática). Otro problema es la imposibilidad de reaprovechar la mayor parte de los datos relacionados con un contenido, simplemente porque se encuentran en una tabla accesoria en un formato no manejable de forma automática por el ordenador, o redibujar las gráficas basadas en dicha tabla junto con datos adicionales.

Evidentemente, existe un inconveniente: la heterogeneidad actual en los formatos de fichero empleados en Bioinformática (tanto en los artículos como en los datos y bases de datos), incomprensibles para el sistema Google Base a pesar de encontrarse en formato textual. En ese sentido, Google Base es muy sencillo, y no se adecua a las necesidades actuales de los bioinformáticos, pero puede ser el comienzo de algo muy importante si dedican desarrollos e investigación en Google. Cuando llegue el momento, llegará la siguiente pregunta: ¿será capaz de buscar en el volumen de datos disponibles en bioinformática de forma ágil?

En cualquier caso, recomiendo la lectura de este artículo.

Enlaces:

3:31 | gestionado por José María Fernández González | Enviar comentario (2)

Continuando con la serie de artículos sobre la Bioinformática en su vertiente más 'cacharrera', me he encontrado con que EMBnet genera periódicamente un DVD con un sistema Linux completo. Dicho DVD contiene el software más usado en bioinformática (en todas sus vertientes), preinstalado en el mismo. Lo mejor de todo es que el DVD es Live, lo que permite que puedas usarlo sin necesidad de instalar nada en tu ordenador. La noticia me llegó a través de un correo del reponsable del nodo EMBnet en España, J.R. Valverde:

Hola a todos,

está disponible una nueva versión del DVD 'en vivo' de EMBnet. Quien
desée una copia puede solicitarla (bajando un DVD virgen) en el servicio de
Informática Científica, EMBnet/CNB.

Para usuarios externos, hay una copia disponible en nuestro servidor
WWW y FTP:

ftp://ftp.es.embnet.org/pub/EMBnet/LiveDVD/
http://www.es.embnet.org/Services/ftp/EMBnet/LiveDVD/

El DVD 'en vivo' de EMBnet está disponible solamente para trabajar con
ordenadores PC. Contiene un sistema operativo Linux y una multitud de programas
tanto científicos como de oficina.

Para usarlo basta arrancar el ordenador con el DVD dentro. Al hacerlo
inicia un sistema Linux (independientemente de lo que contenga nuestro PC),
reconoce las particiones de Windows y da acceso a las mismas, y proporciona
acceso a una gran variedad de herramientas configuradas para trabajar
directamente que incluyen

- análisis de secuencias (EMBOSS...)
- análisis de estructura molecular (TINKER, Gromacs, SPDBV...)
- análisis de imagen y geles (ImageJ, GIM...)
- análisis químico (MPQC, PSI3, Ghemical...)
- matemáticas (R, MuPAD, SciLab...)
- software de ofimática (OpenOffice, Ximian Office...)
- servidor Web integrado con portal de trabajo en grupo
- software de videoconferencia

y mucho más.

El DVD 'en vivo' de EMBnet será la herramienta base que usaremos en los
próximos cursos de informática científica.

Muchas de estas herramientas están disponibles también para Mac. Si
necesitáis información, consultad con el servicio de Informática Científica
EMBnet/CNB.

    Me lo acabo de descargar para probarlo, y nada más arrancar con él me he encontrado con una agradable sorpresa: ¡está basado en Gentoo! Nada más arrancar, pregunta el kernel que queremos usar. Si teneis problemas con los gráficos al arrancar, os recomiendo que useis 'gentoo-nofb', y en caso contrario, 'gentoo'. En ese momento se inicia el proceso de puesta en marcha del LiveDVD, que consiste en reconocer todos los dispositivos del sistema, autoconfigurar la red y el sonido. A partir de ese instante empieza a arrancar un sistema completo: mysql (bases de datos), apache2 (servidor web), cups (servidor de impresión), entorno gráfico, etc...

    He de reconocer que para probarlo lo he sometido a condiciones extremas, porque he usado una máquina virtual creada con qemu para evitar quemar el DVD en cuestión. La máquina virtual era equivalente a un Pentium II con 1.2GHz y 128MB de memoria, y aunque el arranque ha sido muy lento (principalmente por las limitaciones que le he impuesto) ¡ha superado la prueba! Obviamente recomiendo usar un ordenador real, y que dicho ordenador tenga como mínimo 256MB o 512MB de memoria. El principal inconveniente de este LiveDVD es que sólo funciona en los PCs (ya sea con procesadores Intel o AMD), con lo que los usuarios actuales de ordenadores Apple (o arquitecturas más exóticas) quedan fuera.

    En definitiva, si teneis miedo a que vuestro ordenador deje de funcionar al instalar Linux y sois usuarios esporádicos de programas bioinformáticos, este LiveDVD puede ser la solución para vosotros, al ser una de las soluciones menos invasivas.

Enlaces relacionados:

3:22 | gestionado por José María Fernández González | Enviar comentario (10)

Uno de los principales colaboradores de este weblog, David González Pisano, me ha mandado esta noticia:

Vía BIO-IT World (http://www.bio-itworld.com/newsitems/2005/nov2005/11-22-05-news-w3c) leo esta noticia que me parece muy interesante. La W3C (http://www.w3c.org) es la organización que produce los estándares para la web (http://es.wikipedia.org/wiki/W3C). Está muy interesada en integrar comunidades de interés específicas en su viaje hacia la web semántica(http://es.wikipedia.org/wiki/Web_sem%C3%A1ntica), y en este caso ha creado un grupo de interés relacionado con las ciencias de la salud y de la vida.

En concreto, el grupo de interés se centrará en impulsar nuevos modelos informáticos que puedan unificar muchos tipos de información médica y biológica entre diferentes instituciones, a través de la codificación del significado de los datos y su interpretación. Al enfocarse en la semántica de la información, los investigadores tendrán mayor acceso al conocimiento requerido para encontrar curas efectivas para las enfermedades, mientras que los profesionales de la salud tendrán mejores herramientas para el tratamiento clínico individualizado de los pacientes.

El primer encuentro formal del grupo se realizará en Boston los días 25 y 26 de Enero del 2006 (más informacion en http://www.w3.org/2001/sw/hcls/news)

¡Ah!, el gran sueño de todo bioinformático, ¡poder intercambiar el conocimiento entre todos los programas de forma sencilla, sin tener que hacer tanto cutre-script! Con el impulso de W3C os aseguro que saldrán formatos bastante interesantes, librerías de programación, etc..., pero también tengo claro que no será de un día para otro. En cualquier caso, asentará los pilares para estándares mejor diseñados y que evolucionen mejor que el formato original de los ficheros PDB.

2:05 | gestionado por José María Fernández González | Enviar comentario (0)

Hola a tod@s, ¡y Feliz Año Nuevo!,
    para los que leeis el blog, os habreis dado cuenta que durante 3 semanas no ha aparecido nada de nada. Durante este tiempo he estado de vacaciones fuera de España, descansando y relajándome (mis muñecas con tendinitis me lo han agradecido) dado que no me las tomé el verano pasado.

    Aunque todavía estoy digiriendo los e-mails del trabajo y las sugerencias que habeis mandado al blog, me ha llamado la atención un correo interno del CNB basado en una noticia publicada el 28 de Diciembre en el sitio web Rebelión, día de los Santos Inocentes. A continuación  os incluyo el comienzo de la misma:

Sería un estudiante cuando, sin haber acabado sus estudios reglados y para la consecución de la titulación de los mismos, realiza unas prácticas tuteladas por un profesor, el centro de formación y la propia empresa, en un tiempo parcial académico, por lo que forman parte del curriculum escolar. Por el contrario, un titulado de cualquier grado estaría trabajando, haciendo unas determinadas funciones e incluso adquiriendo nuevos conocimientos y prácticas profesionales. De hecho, existen los contratos en prácticas y formación para jóvenes titulados o no, que se incorporan al mercado laboral.

Intentar denominar 'becarios' a las personas que realizan unas determinadas actividades profesionales porque son jóvenes, no tienen experiencia, etc., para ningunearles la categoría de trabajador, forma parte de la picaresca de ciertas empresas expertas en la explotación y el fraude de cotizaciones sociales.

El artículo describe bastante bien la situación actual de los precarios, y demuestra una vez más que casi todos los que estamos en el mundo de la investigación es por vocación (porque nos gusta). Mientras estuve de viaje tuve la oportunidad de ver a través del Canal Internacional de TVE un minireportaje del Workshop que se celebró en el CNB el pasado 27 de Diciembre, y esta mañana en Onda Cero Radio, mientras trataba de superar el jet-lag, estaban entrevistando a un joven investigador. En ambos casos los entrevistados (si me equivoco, que alguien me corrija) explicaron que salieron de España para poder continuar con sus líneas de investigación. Como muy bien menciona el artículo, se invierte muy poco en España en investigación, y aunque la gente y los políticos 'simpaticen' con los investigadores, no tienen tan claro que una investigación en bioinformática, por ejemplo, sea de forma indirecta beneficioso para ell@s. Os incluyo una viñeta del genial Forges:

Y ayer volví a España, y aunque hayamos cambiado de año ¡todo parece seguir igual! ¡Esperemos que los Reyes Magos nos ayuden a superar la cuesta de Enero!

Referencias:

1:54 | gestionado por José María Fernández González | Enviar comentario (0)