LoginRSS 2.0 Feed

viernes, 25 de abril de 2008

Los sistemas CAPTCHA son los mecanismos más comunmente utilizados en los sistemas de registro a servicios Web (blogs, correo electrónico, etc.) para velar por que el suscriptor del servicio es un ser humano, y no un programa informático. Se trata usualmente de imágenes distorsionadas, que incluyen códigos breves que un ser humano corriente es capaz de identificar, y se espera que un programa de computadora no. Si tienes una cuenta de correo en Gmail o el correo Yahoo, o un blog en Blogger, seguro que has rellenado un código como éstos. Estos sistemas se deben principalmente al joven investigador Luis van Ahn, de la Universidad de Carnegie Mellon, cuyo trabajo combina elementos de Inteligencia Articial y criptografía.


¿Porqué querria alguien verificar si hay un ser humano "al otro lado"? Básicamente, para prevenir el abuso de estos recursos. Por ejemplo, para evitar que un spammer o emisor de correo basura cree centenares de cuentas para realizar sus envíos masivos desde un servicio como este. O también, para que impedir que alguien crée cientos de blogs automáticamente y los utilice para publicar enlaces a una página que quiere promocionar, mecanismo que se denomina link bombing.

Un ejemplo de CAPCTHA es el siguiente:



Mi interés en este tema deriva de que combina dos elementos que me interesan especialmente, que son la seguridad (especialmente la prevención de spam en correo electrónico y en buscadores), y la inteligencia artificial. CAPTCHA es un acrónimo de "Completely Automated Public Turing test to tell Computers and Humans Apart". El test de Turing es un método para verificar si una computador ha alcanzado el nivel de inteligencia de un ser humano.

Ésta es quizá la gran victoria de la disciplina de la inteligencia artificial. Mientras intentamos que las computadoras muestren un comportamiento inteligente, obtenemos subproductos que nos ayudan a resolver problemas, y no sólo de seguridad. Por ejemplo, las redes semánticas, desfasadas excepto por WordNet y las ontologías de la Web Semántica, son la base de los diagramas entidad-relación para el modelado de bases de datos, o de los diagramas de clases en UML.

La ecuación ganadora que ayuda

Según von Ahn, los CAPTCHAs generan una ecuación ganadora:

  • Si un tipo concreto de CAPTCHA es capaz de resistir los ataques de los hackers o spammers, se trata de un mecanismo de seguridad eficaz.
  • Si no lo es, entonces se ha conseguido un avance significativo en las técnicas de reconocimiento de imagen.

Es decir, se mire por donde se mire, la comunidad siempre sale ganando. El ingenio de los creadores de CAPTCHAs es otra cuestión a destacar. Dos sistemas que han llamado mi atención son reCAPTCHA y ASIRRA.

  • reCAPTCHA es el sistema mostrado en la imagen de arriba, y permite que los usuarios, al resolverlo, ayuden a digitalizar libros.
  • ASIRRA es un CATPCHA de selección (el usuario tiene que seleccionar una serie de imágenes que cumplen un criterio) y, gracias a una colaboración con Petfinder.com, sirve de ayuda para encontrar hogares a las mascotas desamparadas.

Atacados

Como todo mecanismo de seguridad, los CAPTCHAs están siendo constantemente víctimas de ataques por parte de hackers y spammers. Recientemente se han publicado noticias sobre la ruptura de los que usa Google. Justin Mason ha realizado un análisis de los detalles de la ruptura, que demuestra que, en efecto, han sido rotos ¡¡¡por seres humanos!!! Existen evidencias de que los spammers están contratando personas en la India para que resuelvan manualmente los CAPTCHAs, con el fin de registrar masivamente cuentas de correo electrónico en los grandes proveedores de Webmail, como Gmail o Microsoft Live Mail.

Por otra parte, un informe de Websense ha confirmado que algunos de los CAPTCHAs también están siendo quebrantados de manera automática, usando avanzadas técnicas de reconocimiento óptico de caracteres, con un éxito variable. Los sistemas CAPTCHA que utilizan imágenes poco distorsionadas pueden ser vencidos en hasta el 100% de las veces, y los más complicados resisten más del 80% de los ataques, o ni siquiera han sido vencidos. En otras palabras, se puede afirmar que los CAPTCHAs resisten, puesto que el concepto en sí no ha sido de momento violado.

Referencias

En CiteUlike está disponible una selección de artículos sobre el tema.

[José María Gómez Hidalgo]

15:22 | gestionado por Grupo de Sistemas Inteligentes - UEM | Enviar comentario (0)