LoginRSS 2.0 Feed

martes, 06 de mayo de 2008

Después de una defensa férrea por parte de Yahoo, que ha llegado a amenazar con la venta de su negocio de publicidad (la base económica de Yahoo) a Google, el pasado lunes Microsoft decidía retirar su propuesta de adquisición de Yahoo! En esta entrada repasamos la historia de este desamor, así como analizamos la noticia desde 6 distintas perspectivas.

La historia del intento de compra de Yahoo! por parte de Microsoft ha sido uno de los culebrones más noticiados a lo largo y ancho de la red durante estos últimos meses. A grandes rasgos, los principales acontecimientos de esta "historia de desamor" fueron los siguientes:

El "culebrón" sigue su curso, aunque parezca una batalla ya terminada, y suscita opiniones de todo tipo. A continuación mostramos 6 distintas perspectivas acerca de esta noticia.


Yahoo frustra el intento de Microsoft por competir con Google (Yaiza Temprado)

A pesar de la aún breve historia de la informática, estamos asistiendo ya al primer relevo generacional: no cabe ninguna duda de que Microsoft revolucionó durante los años 80 y 90 la experiencia del usuario a la hora de enfrentarse a un ordenador, consiguiendo un poder cercano (aunque bien merecido) al monopolio en lo que a sistemas operativos se refiere. Con los años 90 hemos asistido a un cambio de paradigma, transmitiéndose gran parte del poder del escritorio a Internet, y apareciendo un gran número de empresas focalizadas en este nuevo mundo. Muchas llegaron y cayeron; muchas otras alcanzaron un éxito más o menos moderado, y otras arrasaron. El más claro ejemplo, Google.

Microsoft, dándose cuenta un poco tarde de que el futuro está en Internet y no en el escritorio, entró en el juego de los buscadores con lentitud y escaso acierto, dejando que Yahoo y Google se repartieran la mayor parte del pastel.

Cuando pienso en lo que ha logrado Microsoft siempre me imagino a un hombre de mediana edad, que se está empezando a dar cuenta de que ya no aprende al mismo ritmo que antes, que nota cómo los jóvenes van arrebatándole el trabajo haciéndolo mejor y más rápido, pero que, en vez de aceptar las canas como parte del proceso natural que es el envejecimiento, decide patalear para volver a la cumbre. Eso, y no otra cosa, es lo que intentaba comprando Yahoo.

Lo que no deja de resultar chocante es que Microsoft parece no darse cuenta de que el problema no radica sólo en las canas, sino en el modelo de negocio que él mismo se marcó en sus comienzos. Años de productos deficientes, de soporte mediocre y de políticas censurables han proporcionado a Microsoft el dudoso honor de ser una de las empresas menos confiables del panorama actual, y eso no va a cambiar a golpe de talonario. Como digo, el relevo generacional es inminente. Microsoft puede aceptarlo con dignidad o seguir negándolo. En pocos años el final será el mismo.


No siempre es dinero...¿o si? (Francisco Manuel Carrero)

El 4 de mayo encontrábamos en BusinessWeek una noticia en la que se conjeturaba sobre el resultado de la fusión entre Microsoft y Yahoo!. En ella, se comentaban las diferentes razones expuestas por diversos bloggers para aducir una previsible falta de entendimiento entre los dos colosos: el tamaño de las empresas, diferencias culturales, la abundancia de grandes egos entre los ejecutivos o la redundancia tecnológica eran señaladas como las más determinantes.

Sin embargo, en la web de Microsoft nos encontramos con la siguiente noticia fechada el 3 de mayo: Microsoft retira su proposición para adquirir Yahoo!. En ella se expone la carta abierta de Ballmer a Yang, en la que se cita como única razón el dinero, algo respaldado por la carta de contestación de Yang.

A lo mejor, a veces nos complicamos la vida especulando sobre temas que nos resultan ajenos. Quizás, las cosas suelen ser más sencillas de lo que parecen (como sugiere la navaja de Occam), y la razón siempre es el dinero.


Todo sigue (José Carlos Cortizo)

Salvados por la campana...por ahora. Esa es mi sensación actual. El devenir de los negocios de Internet es muy incierto, por lo que nunca se puede estar tranquilo, pero como usuario de Flickr, una de las redes sociales a mi juicio más interesantes y con "más valor" de la red, no dejaba de abandonarme un miedo atroz a ver reconvertido Flickr en "Microsoft Flickr Live", con lavado de cara a "lo Microsoft" incluido.

Desde una perspectiva más objetiva, si Microsoft hubiera comprado Yahoo!, las cosas hubieran seguido más o menos igual que hasta ahora en la red. La gran ventaja de Internet es que permite que surjan continuos servicios a manos de pequeños grupos de desarrolladores, generando un panorama cambiante en el que los intentos de monopolio se diluyen un tanto. Todavía recuerdo los resquemores que tenía cuándo Yahoo! compró Flickr, pero el paso del tiempo a demostrado que la esencia de Flickr ha seguido siendo la misma, apenas ha habido cambios sustanciales más allá de las mejoras del servicio o alguna que otra polémica más reciente.

Morriñas aparte, no pasa nada, todo sigue igual en la red...


¿Forma todo parte del plan? (Borja Monsalve)

Cuando Microsoft presentó su oferta por Yahoo!, no hacía mucho que esta última protagonizaba el mayor recorte de plantilla de su historia, y su cotización no era nada halagüeña, ya que acababa de experimentar una significativa caída en bolsa. A día de hoy, tras conocerse la retirada de la oferta de Microsoft, el precio de las acciones de Yahoo! bajaban nuevamente, en esta ocasión en torno al 13% a mitad de la sesión. Quién sabe... tal vez todo esto forme parte de un plan bien orquestado desde el gigante informático, más caracterizado por fagocitar a los rivales que por dejarles escapar, donde el objetivo pueda ser desinflar el valor de las acciones de Yahoo! para, entonces sí, lanzar la opa hostil con la que amenazó en su día...


¿El fin de los monopolios en internet? (José María Gómez)

El abandono de la oferta de compra de Yahoo! por parte de Microsoft constituye una buena noticia para los usuarios de Internet. La razón es que, por mucho de así lo defienda Steve Ballmer, el número dos de Microsoft, no es la sinergia entre empresas la que permite un mejor servicio de sus usuarios. Muy al contrario, es la competencia la que les obliga a ser siempre innovadoras, y entregar más servicios y más calidad a menor precio.

Microsoft ha ejercido una posición dominante en el campo de los sistemas operativos para usuarios y empresas, y sus productos se nutren una y otra vez de la innovación que generan otras empresas. Además, sus tácticas han sido ya juzgadas como monopolísticas por la Comisión Europea, que les ha impuesto por ello una sanción multimillonaria.

Sin embargo, no hay que olvidar a una de las máximas beneficiadas de la decisión de Microsoft, que es la misma Google. Esta empresa ha sabido adquirir una imagen más positiva de cara a sus usuarios, no sólo por la calidad de sus sistemas (indudable), sino por múltiples apuestas por el software libre, la ecología, los estándares abiertos, y la apertura de sus propios sistemas a los usuarios programadores.

Esta imagen está empañada por el tema de la censura en China, censura que Google acata para poder entrar en el mayor mercado de internautas del mundo. Y si las cuotas de penetración de Google son altísimas (dominantes, claramente) en Europa, por ejemplo, ¿que le impide que decida que contenidos de Internet pueden los europeos acceder y cuales no? Es la consecuencia de una posición dominante en el mercado de la información en Internet.

Tampoco podemos olvidar que Google ha adquirido DoubleClick, una empresa de anuncios por Internet, por lo que también adquiere una posición dominante en la publicidad por Internet. Desde esta posición, puede fijar el precio de las palabras clave, de los anuncios, etc. casi a placer.

En resumen, la calidad de Google y su imagen más "simpática" no nos debe hacer olvidar que es una empresa que posee posiciones dominantes en varios mercados, con el riesgo que eso supone para los usuarios de Internet. Ni Microsoft es el "coco", ni Google es el "Principe Valiente". Y viceversa. Ambas son empresas, y sus usuarios nos beneficiamos de que compitan, y más aún, si otras compiten con ellas.


Una vez más Microsoft fracasa en el intento de conseguir absorber una gran .com (Adrián Yanes)

Es evidente que la gente de Redmond son conscientes de sus carencias o necesidades ( según como se quiera ver ) respecto a los servicios que ofrecen en la red.

Si por un lado la red MSN Messenger tiene gran acogida entre los usuarios, los portales como MSN o su reciente buscador live.com no ofrecen lo que el público espera. La compra de Yahoo se mostró como una "gran oferta inevitable" desde el principio, aunque finalmente ha sido Microsoft la que se ha negado a ofrecer más dinero por la adquisición. A pesar de haber aumentado la oferta recientemente Yahoo se ha mantenido estático ante los movimientos de Microsoft.

Microsoft vuelve a perder la oportunidad de conseguir no solo un buscador mas eficiente sino a todos los usuarios fieles que este arrastra. El gigante de software nos deja patente una vez más que hace falta más que buenas ofertas para conseguir los objetivos fijados. No obstante no desistirá en la dura batalla que se esta librando por la hegemonía de las búsquedas en Internet, aunque muy posiblemente sea una batalla a la que llegan tarde.



[Grupo de Investigación en Sistemas Inteligentes - UEM]

14:54 | gestionado por Grupo de Sistemas Inteligentes - UEM | Enviar comentario (1)

lunes, 05 de mayo de 2008

El jueves, en la World Wide Web Conference en Beijing, dos científicos de Google presentaron un artículo que describía lo que llamaron VisualRank, un algoritmo que reúne técnicas de reconoimiento de imágenes con técnicas para la ponderación y rankeado de imágenes en función del parecido entre ellas.

No son los primeros en hacerlo, ya que desde hace tiempo existen servicios como Like.com, de Riya, proyectos de investigación como Alipr (del MIT) y herramientas como imgSeek y otras similares que llevan tiempo suscitando un gran interés, y permiten realizar recuperación de imágenes en función del contenido, y no del contexto, tal y como se ha venido haciendo tradicionalmente. Pero Google, con la gran cantidad de datos que manejan, son capaces de convertir en oro casi todo lo que tocan, y no sería de extrañar ver esta tecnología totalmente operativa en los servicios de Google dentro de muy poco.

Tal y como describe la noticia original, del New York Times del 28 de Abril, científicos de Google han sido capaces de desarrollar un algoritmo similar al PageRank pero que trabaja con el contenido de las imágenes (reconociendo formas y analizando su parecido) y no con el texto contextual. Shumeet Baluja, investigador senior en Google, comentaba durante la presentación que realizó con Yushi Jing, que "nosotros queremos incorporar todos los avances de la Visión por Computador en un entorno Web". La gran experiencia de la compañía en crear gigantescos grafos dónde los nodos (webs) son valorados o pesados, acorde a su autoridad, puede ser transportada al mundo de las imágenes.

El artículo presentado en esta conferencia, "PageRank for Product Image Search", se centra en un subconjunto de las imágenes que Google ha catalogado, ya que el análisis y comparación de imágenes digitales requiere de un coste computacional tremendo. Realizar esta labor para todas las imágenes indexadas por el buscador sería una tarea casi imposible, a día de hoy. A pesar que Google no aporta datos acerca de cuántas imágenes tiene catalogadas, aseguran que Google Image Search es "la búsqueda de imágenes más amplia de toda la Web".

Este tipo de tecnología puede resultar muy útil, no solo para buscar imágenes parecidas entre si, si no para la recuperación de fotografías similares, si no para otros fines como la catalogación automática, la asociación de imágenes con categorías de ontologías permitiendo el razonamiento sobre las mismas, el filtrado de imágenes inapropiadas, etc. La recuperación y tratamiento avanzado de imágenes en la web sigue siendo un problema interesante, con mucho trabajo por hacer y, por tanto, un nicho de investigación más que interesante.


[José Carlos Cortizo Pérez]

18:40 | gestionado por Grupo de Sistemas Inteligentes - UEM | Enviar comentario (2)

viernes, 02 de mayo de 2008

La visión de la Web semántica de Tim Berners-Lee [BernersLee01] permite un mayor grado de expresividad en las páginas, ya que en las páginas Web no solo se codifican datos (palabras), si no que también se introduce conocimiento (conceptos y reglas de inferencia). Este conocimiento adicional proporciona información extra que seguramente no sea útil al que navega por la página, pero si que resulta muy útil para que las máquinas sean capaces de extraer conocimiento de una forma más simple y estandarizada y, por tanto mejorar los resultados de las búsquedas en la web.


El rápido crecimiento del número de páginas Web ha ido forzando las necesidades en cuánto a herramientas y tecnologías que permitan un acceso más cómodo y eficiente a las mismas.  En un principio, la única forma de navegar por la Web era conocer de antemano las direcciones (URLs) de las páginas a consultar, lo cuál limitaba en gran medida la capacidad de recuperar información relevante, así como condicionaba el acceso a nuevos contenidos. Posteriormente surgieron los directorios dónde se categorizaban las páginas de forma manual en una taxonomía de temas de interés y, finalmente, surgieron los buscadores como Lycos y AltaVista que descubrían automáticamente las nuevas páginas Web y las añadían a su base de datos indexándolas para  permitir recuperarlas al buscar ciertos términos.

La visión de la Web semántica de Tim Berners-Lee [BernersLee01] permite un mayor grado de expresividad en las páginas, ya que en las páginas Web no solo se codifican datos (palabras), si no que también se introduce conocimiento (conceptos y reglas de inferencia). Este conocimiento adicional proporciona información extra que seguramente no sea útil al que navega por la página, pero si que resulta muy útil para que las máquinas sean capaces de extraer conocimiento de una forma más simple y estandarizada. A este respecto, sirva el ejemplo de una página Web de un trabajador de una empresa, dónde se incluye su información de contacto. Para un humano resulta muy simple extraer la información de contacto, ya que asocia patrones de texto (una dirección junto a un teléfono y un mail, por ejemplo) y es capaz de extrapolar del mundo de los datos al mundo de los conceptos. Sin embargo para automatizar el proceso de forma que un programa pueda extraer esta información, se necesita un software muy elaborado, ya que hay que saber identificar patrones de direcciones, teléfonos, correos, así como reconocer de todas las posibles direcciones que aparezcan en una web, cuál es la referente al contacto. Ahora bien, para facilitar la comprensión de estos datos, se puede etiquetar la web con conocimiento acerca de la información que existe en la misma, por ejemplo que estamos hablando de una persona, cuyo nombre es “Fulanito”, su dirección de correo electrónico es “fulatino@miempresa.com” y su dirección postal es “C/Perdida, 32 (Madrid)”.


Semantic Representation


La Web Semántica se puede definir como un marco que permite publicar, compartir y reutilizar datos y conocimiento tanto en la red como a través de aplicaciones [Ding05]. Dentro de este marco, se encuentran

  1. XML, que provee una sintaxis elemental para estructura el contenido dentro de los documentos, pero sin asociar ningún tipo de semántica al mismo.
  2. RDF, un lenguaje que permite expresar modelos de datos, tanto las descripciones de los objetos (recursos) como las relaciones entre los mismos. Los modelos basados en RDF se pueden representar en sintaxis XML.
  3. OWL, que añade más vocabulario para describir propiedades y clases como las relaciones entre clases (por ejemplo que sean disjuntas), cardinalidad (por ejemplo que sean exactamente 3), igualdad, características de las propiedades (por ejemplo simetría) y clases enumeradas.
  4. SPARQL, un protocolo y lenguaje de consultas para recursos de la Web semántica.
  5. Ontologías, que definen conceptos y relaciones entre los mismos, como FoaF (Friend of a Friend) [Foaf07], que es una ontología basada en RDF que permite modelar la información de personas y las relaciones entre las mismas.

Conociendo estas herramientas, ya podemos modelar la información de contacto del ejemplo anterior. La Figura 4.1 muestra un diagrama que muestra de una forma visual las relaciones entre los distintos conceptos que forman parte de esta información.

Con todo esto, ya se pueden generar documentos anotados semánticamente pero, ¿cómo afecta esto a la búsqueda de documentos? El funcionamiento en los buscadores convencionales comienza con la introducción de una serie de palabras clave a buscar, sin embargo, un buscador para la Web semántica debe aprovechar la información conceptual para sacar mayor partido de la consulta, lo cuál implica una mayor precisión a la hora de realizar las consultas. Siguiendo el ejemplo anterior, si se quiere conocer la dirección de contacto de una persona que se llama Fulanito, se tendrá que indicar que vamos a buscar un campo conceptualmente etiquetado como dirección de contacto asociado a un individuo cuyo nombre es “Fulanito”.

Puede parecer intrincado el tener que desarrollar consultas tan elaboradas, sin embargo, conviene resaltar que la Web Semántica está orientada a la comunicación entre máquinas [BaezaYates07a]. La Web Semántica promueve la creación de Agentes, software autónomo y seudo-inteligente capaz de procesar la información proveniente de diversas fuentes, mezclarla e intercambiar los resultados con otros programas. Imagínese que tiene una cita con Fulanito dentro de 4 horas, que está correctamente anotada en su agenda electrónica, pero no tiene la dirección de contacto. Cuándo le pida a su agenda electrónica ver a dónde se tiene que dirigir, será el agente inteligente programado en la misma la que se encargará de realizar esta intrincada consulta mostrando, posteriormente, los resultados (por ejemplo un callejero dónde se señala la dirección a la que tiene que acudir), de forma totalmente transparente al usuario, y sin que este tenga que aprender a utilizar ninguno de los lenguajes que están dentro del marco de la Web Semántica.

Desde un punto de vista práctico, los grandes de la búsqueda, Google y Yahoo, ya llevan tiempo trabajando en este campo. Dentro de los proyectos y tendencias, resalta el "Intent Driven Search" (búsqueda basada en intenciones) de Yahoo, con su proyecto clave MindSet. MindSet es capaz de discernir entre varios conceptos a partir de las palabras clave introducidas por el usuario, y ajustar los resultados de la búsqueda en función de la intención final de la búsqueda del usuario. Así pues, el usuario dispone de una barra dónde modula el interés por cada uno de los conceptos que le ofrece la herramienta y el sistema reajusta los resultados en función de las intenciones.


REFERENCIAS:

  • [BaezaYates07a] Baeza-Yates, R., Boldi, P., Gómez Hidalgo, J.M. Presentación: buscando en la Web del futuro. Novática (Revista de la Asociación de Técnicos de Informática), número 185, enero.febrero 2007, año XXXIII, páginas 3--4.
  • [BernersLee01] Berners-Lee, T., Hendler, J., Lassila, O., “The Semantic Web” Scientific American 284 (5), 35-43, 2001.
  • [Ding05] Ding, L., Finin, T., Joshi, A., Peng, Y., Pan, R., Reddivari, P., 2005. “Search on the Semantic Web”, Technical Report TR CS-05-09, Department of Computer Science and Electrical Engineering, University of Maryland, Baltimore.
  • [Foaf07] FOAF, 2007. The Friend of a Friend (FOAF) Project. Sitio Web accesible en: http://www.foaf-project.org/. [Último acceso: 04/07/2007].

[José Carlos Cortizo Pérez]

15:08 | gestionado por Grupo de Sistemas Inteligentes - UEM | Enviar comentario (0)

lunes, 28 de abril de 2008

Es un hecho ampliamente aceptado que la globalización ha provocado cambios a nivel político y económico. No obstante, en ningún caso debemos olvidar que tan importante como estos dos aspectos es la identidad cultural, dentro de la cual el lenguaje juega un papel esencial. En este sentido, la mayor penetración inicial de Internet en la cultura anglosajona llevó consigo una inicial predominancia de la lengua inglesa, tanto a nivel de usuarios como de contenidos. Sin embargo, estudios recientes demuestran que la preponderancia del inglés se ha visto reducida, en detrimento de una mayor diversidad lingüística.

Por ejemplo, el estudio “Lenguas y culturas en la red 2007”, realizado por FUNREDES y Unión Latina, concluía que el idioma predominante en Internet era el inglés, aunque las estadísticas mostraban un constante aumento del resto de las lenguas en la red. Entre 1998 y 2007, el porcentaje de internautas de habla inglesa bajó de un 60,5% a un 31,7%, mientras la presencia las páginas web en inglés bajó del 75% al 45%. Por otra parte, un informe emitido en abril de 2008 por el CNNIC, que señala que China se ha convertido el país con mayor número de usuarios de internet, con 221 millones de internautas, frente a los 215 millones de usuarios estadounidenses. Además, si hacemos caso a la tendencia (desde diciembre de 2007, el crecimiento en China ha sido de 11 millones de internautas), es de esperar que en pocos años existan más usuarios de internet en China que habitantes en Estados Unidos.

Si bien es cierto que cada vez más personas en el mundo hablan otros lenguajes además de su lengua materna, y que el inglés es el idioma más extendido como segunda lengua, un usuario que, como ejemplo, hable sólo español, en 2007 tenía acceso únicamente al 3,8% del total de páginas Web disponibles en Internet.

En la actualidad, la mayoría de motores de búsqueda están limitados a devolver documentos en el mismo idioma de la consulta. Algunos, como Google, utilizan sistemas de traducción automática para traducir los documentos encontrados, pero, como ellos mismos reconocen en su web, “incluso el software sofisticado de hoy en día no se aproxima a la fluidez de un hablante nativo”. En este punto, se hace necesario integrar las capacidades de búsqueda con esta creciente diversidad lingüística, algo que no ha pasado desapercibido para investigadores de todo el mundo. La recuperación translingüe de información tiene como objetivo proporcionar a un usuario información en un lenguaje diferente al lenguaje utilizado en la consulta (generalmente, su lengua materna).

Desde que se creara un taller dedicado específicamente a la recuperación translingüe de información, en la conferencia ACM SIGIR de 1996 [Grefenstette96], han aparecido programas internacionales de investigación, talleres, conferencias y campañas centradas en el tema, como el Foro de Evaluación Translingüe en 2000 [Peters01]. Estos programas han impulsado la investigación en la recuperación de información translingüe, obteniéndose unos resultados esperanzadores, pero de momento poco eficientes para ser implementados en motores de búsqueda reales.

En general, se aplican tres estrategias en la mayoría de los sistemas desarrollados: traducción de consultas, traducción de documentos interactiva y traducción en segundo plano con indexación de documentos. La primera convierte el texto de la consulta en el lenguaje en que se desea recuperar la información, lo que plantea tres retos

  1. Encontrar una traducción para cada uno de los términos escritos en el idioma original. Algunos términos no tienen una traducción directa, y otros son extranjerismos (expresiones lingüísticas tomadas de un idioma extranjero y usadas en la lengua propia).

  2. Seleccionar las traducciones adecuadas para cada término de entre las posibles, en función del contexto.

  3. Un sistema de recuperación translingüe debe ser capaz de asignar diferentes pesos a las diversas traducciones posibles.

La segunda estrategia consiste en realizar una traducción online de los documentos recuperados. En la práctica, la eficiencia de este enfoque es muy baja, debido a la complejidad computacional que requiere la traducción automática y al gran tamaño que presenta generalmente la colección de documentos. Como alternativa, se puede realizar una traducción menos costosa y menos precisa que permita aplicar técnicas de recuperación de información.

Por último, una tercera estrategia consiste en traducir toda la colección de documentos al lenguaje del usuario, reduciendo la búsqueda translingüe a una búsqueda monolingüe en los documentos traducidos. Este enfoque puede ser demasiado costoso en espacio de almacenamiento si todos los documentos deben ser previamente traducidos a todos los lenguajes disponibles.

Hasta el momento, Google es el motor de búsqueda que está obteniendo mejores resultados en la implantación de sistemas de recuperación translingüe. Recientemente, ha puesto a disposición de los usuarios de Internet un prototipo que no se limita únicamente a traducir las páginas devueltas en sus búsquedas, permitiendo realizar consultas en varios idiomas. Como ejemplo, la consulta para la frase “historia de alemania”, expresada en español, puede devolver resultados en español y en inglés, según se puede observar en la figura 1. El resto de los buscadores principales parecen quedar un poco rezagados. Por ejemplo, Altavista o Yahoo! ofrece un enlace directo a su traductor en la página de inicio, pero en ambos casos el traductor utilizado es Babel Fish.



Figura 1. Resultado de una búsqueda experimental translingüe en Google. A la izquierda, los resultados en español, y a la derecha en inglés.

Si los buscadores más dominantes aún no son capaces de ofrecer una búsqueda translingüe medianamente eficaz, no podemos esperar grandes avances a corto plazo. De momento, parece que el camino más directo hacia los contenidos multilingües consiste en aprender nosotros mismos los idiomas.

REFERENCIAS

  • [Grefenstette96] Grefenstette, G. 1996. Cross-linguistic information retrieval workshop. In Proceedings of the 19th Annual international ACM SIGIR Conference on Research and Development in information Retrieval (Zurich, Switzerland, August 18 - 22, 1996). SIGIR '96. ACM Press, New York, NY, 344.
  • [Peters01] C. Peters (Ed.). Cross-Language Information Retrieval and Evaluation. Workshop of Cross-Language Evaluation Forum, CLEF 2000, Lisbon, Portugal, September 21-22, 2000, Revised Papers. Lecture Notes in Computer Science 2069, Springer 2001.

[Francisco M. Carrero García]

5:50 | gestionado por Grupo de Sistemas Inteligentes - UEM | Enviar comentario (0)

viernes, 25 de abril de 2008

Los sistemas CAPTCHA son los mecanismos más comunmente utilizados en los sistemas de registro a servicios Web (blogs, correo electrónico, etc.) para velar por que el suscriptor del servicio es un ser humano, y no un programa informático. Se trata usualmente de imágenes distorsionadas, que incluyen códigos breves que un ser humano corriente es capaz de identificar, y se espera que un programa de computadora no. Si tienes una cuenta de correo en Gmail o el correo Yahoo, o un blog en Blogger, seguro que has rellenado un código como éstos. Estos sistemas se deben principalmente al joven investigador Luis van Ahn, de la Universidad de Carnegie Mellon, cuyo trabajo combina elementos de Inteligencia Articial y criptografía.


¿Porqué querria alguien verificar si hay un ser humano "al otro lado"? Básicamente, para prevenir el abuso de estos recursos. Por ejemplo, para evitar que un spammer o emisor de correo basura cree centenares de cuentas para realizar sus envíos masivos desde un servicio como este. O también, para que impedir que alguien crée cientos de blogs automáticamente y los utilice para publicar enlaces a una página que quiere promocionar, mecanismo que se denomina link bombing.

Un ejemplo de CAPCTHA es el siguiente:



Mi interés en este tema deriva de que combina dos elementos que me interesan especialmente, que son la seguridad (especialmente la prevención de spam en correo electrónico y en buscadores), y la inteligencia artificial. CAPTCHA es un acrónimo de "Completely Automated Public Turing test to tell Computers and Humans Apart". El test de Turing es un método para verificar si una computador ha alcanzado el nivel de inteligencia de un ser humano.

Ésta es quizá la gran victoria de la disciplina de la inteligencia artificial. Mientras intentamos que las computadoras muestren un comportamiento inteligente, obtenemos subproductos que nos ayudan a resolver problemas, y no sólo de seguridad. Por ejemplo, las redes semánticas, desfasadas excepto por WordNet y las ontologías de la Web Semántica, son la base de los diagramas entidad-relación para el modelado de bases de datos, o de los diagramas de clases en UML.

La ecuación ganadora que ayuda

Según von Ahn, los CAPTCHAs generan una ecuación ganadora:

  • Si un tipo concreto de CAPTCHA es capaz de resistir los ataques de los hackers o spammers, se trata de un mecanismo de seguridad eficaz.
  • Si no lo es, entonces se ha conseguido un avance significativo en las técnicas de reconocimiento de imagen.

Es decir, se mire por donde se mire, la comunidad siempre sale ganando. El ingenio de los creadores de CAPTCHAs es otra cuestión a destacar. Dos sistemas que han llamado mi atención son reCAPTCHA y ASIRRA.

  • reCAPTCHA es el sistema mostrado en la imagen de arriba, y permite que los usuarios, al resolverlo, ayuden a digitalizar libros.
  • ASIRRA es un CATPCHA de selección (el usuario tiene que seleccionar una serie de imágenes que cumplen un criterio) y, gracias a una colaboración con Petfinder.com, sirve de ayuda para encontrar hogares a las mascotas desamparadas.

Atacados

Como todo mecanismo de seguridad, los CAPTCHAs están siendo constantemente víctimas de ataques por parte de hackers y spammers. Recientemente se han publicado noticias sobre la ruptura de los que usa Google. Justin Mason ha realizado un análisis de los detalles de la ruptura, que demuestra que, en efecto, han sido rotos ¡¡¡por seres humanos!!! Existen evidencias de que los spammers están contratando personas en la India para que resuelvan manualmente los CAPTCHAs, con el fin de registrar masivamente cuentas de correo electrónico en los grandes proveedores de Webmail, como Gmail o Microsoft Live Mail.

Por otra parte, un informe de Websense ha confirmado que algunos de los CAPTCHAs también están siendo quebrantados de manera automática, usando avanzadas técnicas de reconocimiento óptico de caracteres, con un éxito variable. Los sistemas CAPTCHA que utilizan imágenes poco distorsionadas pueden ser vencidos en hasta el 100% de las veces, y los más complicados resisten más del 80% de los ataques, o ni siquiera han sido vencidos. En otras palabras, se puede afirmar que los CAPTCHAs resisten, puesto que el concepto en sí no ha sido de momento violado.

Referencias

En CiteUlike está disponible una selección de artículos sobre el tema.

[José María Gómez Hidalgo]

15:22 | gestionado por Grupo de Sistemas Inteligentes - UEM | Enviar comentario (0)

jueves, 24 de abril de 2008

Existen muchos tipos de programas que hacen un gran uso de elementos de Inteligencia Artificial, como puedan ser los planificadores económicos, sistemas de reglas de negocio, sistemas de automática y control, etc. Estos elementos incluyen localización, búsqueda en árboles, resolución de problemas, toma de decisiones y aprendizaje. Pero uno de los campos del desarrollo software que más ha ido tomando de la Inteligencia Artificial ha sido, sin duda, el desarrollo de videojuegos [1].

La ley de Moore sobre el incremento en la velocidad de los procesadores a lo largo del tiempo parece también aplicarse al desarrollo de los videojuegos, que parecen duplicar su complejidad cada 18 meses. Este aumento de complejidad, hace que los juegos aumenten su interés y su capacidad de adicción, lo que ha logrado que los juegos pasen de ser una mera distracción de unos minutos a una forma de expresión artística y un hobby serio para los jugadores.

La historia de la Inteligencia Artificial aplicada a los juegos se remonta a finales de los años 50, cuándo Arthur L. Samuel, trabajador de IBM, desarrolló un programa para la IBM 701, la primera máquina comercial de IBM, capaz de jugar a las damas mediante aprendizaje [2]. Este programa representa el primer programa desarrollado en el mundo capaz de aprender y supuso una demostración de fuerza tanto a nivel de desarrollo software como a nivel de hardware que supuso un gran incremento en las ventas de máquinas de IBM. Después de este acercamiento, la aplicación de técnicas de IA en los videojuegos se fue extendiendo, en gran medida debido a que los juegos empezaron a dejar de ser mayoritariamente juegos de jugador contra jugador, lo cuál motivaba la aparición de técnicas que permitieran a los usuarios sentir que estaban jugando contra otros oponentes humanos o, al menos, con un nivel de dificultar similar para que el juego supusiera un reto y fuera “adictivo”.

Más de 50 años después, la Inteligencia Artificial se ha convertido en un pilar fundamental de los videojuegos, tal y como puede verse en la existencia de módulos formativos específicos en los Másters de Videojuegos , así como en la aparición de una gran multitud de libros acerca de este tema tan específico o la gran demanda de especialistas en IA por parte de empresas desarrolladoras de videojuegos.
¿En qué aspectos concretos ayuda la Inteligencia Artificial a los Videojuegos? Ante todo a modelar el comportamiento de los jugadores no humanos (NPC en inglés, PNJ en castellano), y para ello la IA nos aporta múltiples ayudas:

  • Pathfinding” o búsqueda de caminos: La mayoría de los videojuegos cuentan con pantallas confeccionadas a modo de mapas, dónde se mueven tanto los jugadores como los PNJ. Por regla general, algunos (o todos) PNJ, tienen que buscar al jugador para evitar que este termine la fase o continúe su objetivo y, para esta tarea, se pueden utilizar los algoritmos de “pathfinding” muy habituales y técnicas básicas dentro de la IA. La mayoría de estos algoritmos están basados en algoritmos clásicos como el algoritmo A*  o el algoritmo de Dijkstra. Así mismo, últimamente también está surgiendo mucho interés en la aplicación de técnicas de planificación derivadas del pathfinding.
  • Las máquinas de estados son una de las técnicas más básicas utilizadas dentro de la IA para videojuegos. Desde el punto de vista de la IA, las máquinas de estados no tienen gran valor, pero al aplicarse a los Videojuegos permiten establecer distintos tipos de comportamientos en los PNJ que van cambiando a lo largo del tiempo en función de una serie de parámetros. Ejemplificando el concepto de máquina de estados, si entramos en una cueva llena de enemigos, éstos pueden estar programados para matarnos si estamos cerca de ellos, pero si conseguimos “robar” el cofre del tesoro que están vigilando, todos los enemigos nos perseguirán. Este comportamiento “simula” una especie de señal de alerta y hace creer al humano que los PNJ son más inteligentes. Hay algunas variantes de las máquinas de estados que tienen más interés para la IA, como son las máquinas de estados difusas, dónde las transiciones entre los estados ocurren de forma difusa, es decir, en función de una serie de probabilidades, lo cuál hace todavía más interesante el comportamiento de los NPJ. La literatura de máquinas de estados para videojuegos en realmente extensa ya que han sido utilizadas ampliamente en el desarrollo de videojuegos.
  • La Inteligencia Emergente es un concepto que ha empezado a implementarse en los Videojuegos hace relativamente poco tiempo. Estas técnicas de IA permiten que en los juegos se muestre una serie de criaturas (un buen ejemplo sería un Tamahotchi), que son capaces de ir aprendiendo en función de las decisiones del jugador y también evolucionan de forma acorde a estas acciones y a su aprendizaje. Estas técnicas están muy inspiradas en el funcionamiento de la naturaleza, por lo que el jugador tiene la sensación de que la evolución de estas criaturas es “real” y no simulada.
  • “Inteligencia Estafadora”. Algunos juegos utilizan técnicas para detectar cuándo el jugador está en una situación muy ventajosa con respecto a la computadora y, entonces, favorecen el comportamiento de la IA para conseguir una situación más compleja para el jugador y aumentar el grado de dificultad. Este tipo de técnicas son muy habituales en videojuegos de deportes como el EA Sport’s Madden NFL o el Mario Karts.
Existen muchas más técnicas que se están aplicando en los Videojuegos, como las redes neuronales o algoritmos genéticos utilizados para ir adaptando el comportamiento de los NPJ en función de unos objetivos (por ejemplo ir mejorando como los NPJ conducen en una carrera de coches). Aún así, existen muchos retos en los Videojuegos en los que la IA tiene mucho que decir, como mejorar todavía más la sensación de inteligencia, sobre todo en entornos con muchos NPJ para que colaboren de una forma más útil entre ellos o bien la creación de interfaces en lenguaje natural que permitan a los jugadores controlar sus personajes sin necesidad de teclado y ratón, algo que puede ser muy útil en juegos de estrategia dónde hay que controlar muchas unidades al mismo tiempo y de forma rápida.

La industria de los Videojuegos es una de las industrias más bollantes de los últimos tiempos, y ya está empezando a notarse en el campo de la IA la creciente necesidad de expertos en estas materias para el mundo de los videojuegos. Además, el nivel gráfico de los videojuegos actuales está llegando a cotas muy difíciles de superar y las nuevas arquitecturas hardware (p.e. los chips Cell con varios cores de proceso) abren nuevas puertas a la IA al permitir tener varias unidades de proceso volcadas en el estudio del comportamiento inteligente. No sería de extrañar que, en unos años, el número de expertos en IA que participan en un proyecto de desarrollo de un videojuego se equiparara al número de desarrolladores del juego en sí.


REFERENCIAS

[1] J. Wexler, “Artificial Intelligence in Games: A look at the smarts behind Lionhead Studio’s Black and White”
[2] A. Samuel, “Some Studies in Machine Learning Using the Game of Checkers”, IBM Journal 3 (3): 210-229.


[José Carlos Cortizo Pérez]

7:38 | gestionado por Grupo de Sistemas Inteligentes - UEM | Enviar comentario (1)

lunes, 14 de abril de 2008

Marvin Lee Minsky nació el 9 de Agosto de 1972, en Nueva York, y es uno de los científicos vivos más influyentes dentro del campo de la Inteligencia Artificial. Actualmente ostenta la cátedra Toshiba de Artes Multimedia y Ciencias, y es profesor de Ingeniería Electrónica y Ciencias de la Computación en el prestigioso Instituto de Tecnología de Massachusetts (MIT).

Marvin L. Minsky nació en Nueva York, dónde acudió al Fieldston School y al Bronx High School of Science, un instituto público de Nueva York especializado en ciencia. Posteriormente viajó a Andover, Massachussetts, para estudiar en la Philips Academy, una prestigiosa escuela de preparación a la Universidad. Entre 1944 y 1945 sirvió en la marina de los Estados Unidos, para posteriormente estudiar Matemáticas en Harvard (1950) y doctorarse también en Matemáticas en Princeton (1954).

Desde los años 50, Minsky ha trabajado en la caracterización de procesos psicológicos humanos mediante la utilización de computadoras, así como en tratar de dotar de inteligencia a las computadoras. En 1951 creó la primera red neuronal capaz de aprender (llamada SNARC, Stochastic Neural-Analog Reinforcement Computer), basada en el refuerzo de coeficientes que simulan las transmisiones sinápticas. Ya en 1956 inventó y construyó el primer microscopio cofocal, un instrumento óptico con resolución y calidad de imagen sin precedentes.

En 1959 fundó junto a John McCarthy lo que se convertiría en el Laboratorio de Inteligencia Artificial del MIT, y su larga labor como codirector ha sembrado el campo de la Inteligencia Artificial con su impronta. En 1961 escribió un artículo muy importante dentro de su carrera, “Steps Towards Artificial Intelligence”, dónde recopilaba y analizaba lo que se había hecho hasta ahora en Inteligencia Artificial y establecía los problemas más importantes de esta disciplina.

En 1963, Minsky publicó “Matter, Mind and Models”, dónde analizaba el problema de construir máquinas conscientes de si mismas, un problema que, a día de hoy, todavía está en un estado realmente verde y dónde pocos investigadores (el portal Consciouss-robots trata a fondo esta cuestión) trabajan debido a la complejidad del mismo. En 1969, junto a Seymour Papert, publicó “Perceptrons”, dónde caracterizaba las capacidades y limitaciones de los algoritmos de aprendizaje y los algoritmos de reconocimiento de patrones.

A principio de los 70, Minsky y Papert comenzaron a formular una teoría denominada “The Society of Mind” (“La sociedad de la mente”), que combinaba la psicología de desarrollo de los niños y sus vastos conocimientos de Inteligencia Artificial. En “The Society of Mind”, se propone que la inteligencia no es el producto de ningún mecanismo singular, pero proviene de las interacciones gestionadas de una gran variedad de agentes. En este trabajo se expone que se necesita una diversidad de agentes ya que diferentes tareas requieren mecanismos fundamentales muy distintos. Esto transforma la psicología desde una búsqueda por unos pocos principios básicos sin frutos en una búsqueda por mecanismos que la mente pueda usar para gestionar las interacciones de todos los elementos que actúan. En 1986 se publicó un libro orientado al público general conteniendo toda esta teoría de la Sociedad de la Mente. Este libro contenía 270 ideas, cada una de ellas desarrollada en una página, mostrando el propio espíritu de la teoría en el propio libro. En 2006 se publicó su secuela, “The Emotion Machine”, un libro que critica muchas teorías populares acerca de cómo funciona la mente humana y sugiera teorías alternativas.

El trabajo de Minsky le ha llevado a recibir un gran número de prestigiosos premios, como el premio Turing en 1969, el Premio Japón en 1990 y la Medalla Franklin del Instituto Franklin en 2001. El “profesor” Isaac Asimov describió a Marvin Minsky como una de las pocas personas en el mundo más inteligentes que él (la otra era Carl Sagan), lo cuál denota la impronta de un personaje tan singular.


Enlaces de Interés:

[José Carlos Cortizo Pérez]

19:11 | gestionado por Grupo de Sistemas Inteligentes - UEM | Enviar comentario (0)

DARPA (Defense Advanced Research Projects Agency) ha aprobado la segunda fase del desarrollo de un Sistema Inteligente que será capaz de controlar el tráfico aereo militar de forma automática.

El sistema GILA (Generalized Integrated Learning Architecture) ha sido desarrollado por Lockheed Martin's Advanced Technology Laboratories, bajo un contrado de 22 millones de dólares y una duración de 48 meses. Este proyecto tiene la finalidad de ayudar a las Fuerzas Aéreas americanas, en particular trata de controlar el espacio aereo de forma segura, incluso con un gran volumen de tráfico y con la llegada de vehículos aéreos no tripulados (UAVs)

Este sistema integra diversas técnicas de Inteligencia Artificial, aprendiendo mediante el ensamblaje de conocimiento proveniente de distintas fuentes y generando nuevo conocimiento por razonamiento. Este software tiene que combinar una serie limitada de observaciones con conocimiento de expertos, conocimiento general, razonamiento, así como ser capaz de responder a preguntas del tipo "qué pasaría si...". El sistema de aprendizaje integrado también tendrá objetivos de aprendizaje específicos, tendrá que gestionar lo que no conoce, lo que necesita conocer, así como razonar sobre sus incertidumbres. También tendrá que ser capaz de figurarse algunas cosas, así como tolerar errores e información no existente mediante el uso de la información existente y procesos de razonamiento.

Se pretende que este sistema, GILA, mejore en un 125% la capacidad planificadora de un humano novato, así como permita a los usuarios sin experiencia obtener un entrenamiento acelerado.


[José Carlos Cortizo Pérez]


18:09 | gestionado por Grupo de Sistemas Inteligentes - UEM | Enviar comentario (0)

martes, 08 de abril de 2008

La llegada de blogs, wikis y las comunidades OnLine han transformado de una forma rápida y eficaz el panorama de Internet. La Web 2.0 requiere que los buscadores se adapten a un nuevo paradigma de generación de información centrado más en los usuarios, que ahora son, también, los proveedores de contenidos.

Internet ha ido evolucionando vertiginosamente con el paso del tiempo de mano de sus usuarios. Heredera de una red a la que inicialmente tenían sólo acceso unos pocos (militares y científicos básicamente), la World Wide Web dio sus primeros pasos hacia el estrellato en 1989, cuando fue creado el lenguaje HTML que ayudaría a que, en pocos años, ya fuera accesible desde todo el mundo.

En 1990 la red tenía aproximadamente un millón de usuarios. En el año 2002, se estimaba que existían alrededor de 605 millones de internautas, y según Internet World Stats  hoy en día hay más de 1.133 millones de personas que navegan entre sus incontables páginas repletas de información.




A medida que el número de usuarios ha ido aumentando, lo ha hecho también la cantidad de información disponible. Al principio poseer una página web era algo reservado a unos pocos: prácticamente sólo grandes empresas, organismos oficiales o usuarios avezados podían presumir de ello. Inicialmente esta presencia era meramente informativa. Básicamente se reducía a ofrecer información estática al internauta; información que terceras partes consideraban que podía ser interesante para el navegante, pero no demandada directamente por este. En resumidas cuentas: no existía interacción con el usuario.

Poco a poco esta tendencia fue cambiando, y la propia Red ha ido volviéndose más dinámica e interactiva. Se pasó de tener páginas meramente informativas a sitios creados por y para los usuarios. Ya no era necesario poseer conocimientos técnicos para convertirse en creador de un vistoso y exitoso sitio web; bastaba con tener algo que contar y ser capaz de rellenar un formulario. Habían llegado los blogs, las wikis o las comunidades online (de fotos, como flickr , o de videos, como youtube ). En definitiva, lugares en la Red que facilitaban y fomentaban que los usuarios pudieran colaborar y compartir. Había nacido la llamada Web 2.0 o web social, denominada así no porque se hubiera producido una evolución en la tecnología, sino por el cambio que se estaba dando entre desarrolladores y usuarios a la hora de utilizar Internet.

Esta variación originó a su vez nuevas necesidades y enfoques a la hora de localizar información interesante para el usuario. Comenzaron a quedarse pequeños los buscadores “tradicionales”, basados en técnicas de análisis del contenido de las páginas o de los enlaces de las mismas, como los primeros Altavista, Yahoo! o Google. Se hacía necesario tener en cuenta nuevos factores, derivados precisamente de ese nuevo uso que se estaba dando a la web. Comienzan entonces a surgir buscadores que tienen también en cuenta aspectos tales como la colaboración entre usuarios, la inteligencia colectiva y otros factores que permiten obtener mayor rendimiento de la información. Algunos ejemplos de estos nuevos buscadores, llamados buscadores sociales o buscadores 2.0, son Swicki  (un buscador regido por una comunidad, y que aprende de las búsquedas que hacen sus miembros para ofrecer resultados más concretos), Rollyo  (que también realiza búsquedas dentro de una comunidad), Clusty  (un motor cluster , que agrupa los elementos similares, organizando así las búsquedas por categorías) o Lexxe  (diseñado para responder brevemente a las consultas, en lugar de localizar la página donde podría encontrarse la respuesta).

Los buscadores tradicionales son muy buenos encontrando información, y lo hacen cada vez con más precisión y analizando más datos. Sin embargo no tienen en cuenta las ideas asociadas a las palabras que están buscando. Los buscadores sociales tratan de avanzar en esa línea, haciendo búsquedas más significativas y hasta basadas en preguntas (como Lexxe). Exploran una vía alternativa, ya que profundizan en los intereses de los usuarios, y han dado lugar a nuevas maneras de representar la información, como por ejemplo las tag clouds (nube de etiquetas), que se utilizan como representaciones visuales de las palabras clave (o etiquetas) utilizadas en un sitio web, y donde los usuarios pueden ver fácilmente qué conceptos son los más relevantes, ya que aparecen destacados con respecto los demás por su mayor tamaño.



Figura 2.- Una nube de etiquetas populares

En la actualidad algunas las empresas más representativas del mundo de las búsquedas en Internet ya comienzan a mover ficha hacia la búsqueda social. Yahoo! por ejemplo posee un buscador (MyWeb 2.0) que cada vez integra más aspectos sociales en sus búsquedas. Google por su parte también está tomando cartas en el asunto, añadiendo una sección de  favoritos  al historial de búsqueda, que permite crear etiquetas y comentarios para asociarlos a las páginas que ya se han visitado. Esto podría permitir a los usuarios, en un futuro, ver las etiquetas y comentarios de otras personas e incluir esta información en las búsquedas. Mientras, Microsoft, que estima que el 50% de las consultas realizadas no son del todo resueltas por los buscadores tradicionales, comienza a trabajar en un proyecto de buscador social donde, entre otras características, pretenden incorporar en los procesos de búsqueda consultas en círculos de amigos.


[Borja Monsalve Piqueras]

10:54 | gestionado por Grupo de Sistemas Inteligentes - UEM | Enviar comentario (0)

domingo, 06 de abril de 2008

Del 14 al 18 de Abril, se organizan las Jornadas de Conocimiento Libre 2008 en la Universidad Europea de Madrid. Estas jornadas se centran en los diversos aspectos del software libre, cultura libre y filosofía libre y pretenden ser un foro de encuentro dónde se discuta la influencia de este movimiento en la sociedad.

El auge del Software Libre ha permitido que otros movimientos cobren fuerza y puedan venderse mejor y llegar a un público más amplio. A este respecto, en los últimos tiempos, movimientos como Creative Commons y sus derivados (Science Commons, etc.), han sido capaces de transladar parte de la cultura e ideología que hay dentás del Software Libre a otros dominios más allá del software. Todos estos movimientos han ido integrandose en algo que podemos denominar la cultura del "Conocimiento Libre" y que busca rescatar el valor del conocimiento como bien público, de forma que se pueda utilizar como base para un desarrollo igualitario.

Debido a este gran y creciente interés, últimamente, se están organizando una serie de eventos y actividades relacionadas con este movimiento, como son el Ciclo “Dominio Abierto” del Círculo de Bellas Artes, el “Laboratorio de Procomún” de MediaLab Prado, “Procomún” del CSIC, “La Radio Libre” en Radio 87 Mhz, “Sin Antena, TV libre por Internet”. Así mismo, la Unión Europea está tomando cartas sobre este asunto, apoyando la libre difusión de la ciencia. De hecho, el denominado "Open Access" empezará a implantarse cada vez más gracias a una directiva europea.

Desde GLUEM y el área de Informática de la UEM, mostramos nuestro interés y apoyo a este fascinante movimiento, que tantas cosas buenas nos ha de deparar. Gracias a este interés, se han organizado las primeras Jornadas de Conocimiento Libre, que esperamos sean de vuestro interés y contribuyan a la difusión de los ideales y necesidades que implica un movimiento tan singular como el Conocimiento Libre. Queremos también aprovechar este pequeño texto para agradecer la colaboración y participación de los ponentes, sin la cuál estas jornadas no podrían haberse hecho realidad.

El programa definitivo se encuentra en la web de las jornadas, e incluye nombres tan conocidos como Jorge Cortell, Ricardo Galli, Javier Echeverría, Álvaro López, Bram de Jong, etc. Desde aquí os invitamos a todos a asistir a estas jornadas y contribuir


[Grupo de Usuarios de Linux y Software Libre de la UEM]

18:18 | gestionado por Grupo de Sistemas Inteligentes - UEM | Enviar comentario (0)

viernes, 04 de abril de 2008

La cantidad de información disponible en la Red aumenta de forma exponencial, creando nuevos retos para una búsqueda más efectiva [Liu04]. Cuándo se envía la misma consulta  a un motor de búsqueda que no admite personalización, devuelve los mismos resultados sea cuál sea el usuario que ha realizado la consulta. Sin embargo, las necesidades de información de los distintos usuarios no son las mismas, ni sus gustos, preferencias ni cultura. Por ejemplo, para la consulta “apple”, algunos usuarios estarán buscando información sobre manzanas, mientras que otros estarán buscando información sobre la compañía Apple Inc. Una opción para desambiguar las consultas es el restringirlas al ámbito de una categoría temática jerárquica (como las existentes en DMOZ  o Yahoo! ), sin embargo existe una gran oportunidad de desambiguación utilizando el conocimiento que los buscadores tienen sobre el usuario.


Los buscadores como Yahoo! y Google almacenan todos los días Terabytes de información acerca de los usuarios de sus sistemas [BaezaYates06]. Además, gracias a la gran integración de nuevos servicios, los datos disponibles son de muy diversa índole (correos electrónicos, búsquedas realizadas, páginas visitadas, fotografías, noticias, etc.) lo cuál ofrece una gran cantidad de información de gran calidad, que permite obtener una visión general del usuario bastante acorde con sus gustos e intereses (perfil). De esta manera, a un usuario que recientemente ha buscado términos como “iPhone”, “MacBook” y ha estado viendo fotografías de un monitor de Apple, y habitualmente consulta noticias tecnológicas relacionadas con la empresa Apple Inc, cuándo busque “apple” en el buscador, se le devolverán los documentos que tengan que ver con la empresa Apple Inc. Sin embargo, a una persona que habitualmente busca información acerca de frutas, se le devolverá información sobre manzanas y no sobre la compañía de ordenadores.

La personalización no solo se basa en el historial de navegación del usuario (sus gustos), también puede tener en cuenta otros aspectos importantes como los dispositivos utilizados para navegar. Si el usuario realiza una consulta a un buscador desde su teléfono móvil, es preferible devolverle aquellas webs que están especialmente diseñadas para visionarse con dispositivos móviles, de forma que se mejore su experiencia en la Red.

Google Localization

Figura 1: Búsqueda por tiendas de mascotas localizada a la ubicación del usuario (en la Gran Vía madrileña).

La localización también es relativa a la personalización pero se queda a un nivel más general que el usuario, pues no tiene en cuenta los gustos concretos de éste, si no que trata de adaptar los contenidos a la ubicación física de los usuarios. Para el caso de un usuario que busque “tienda de mascotas” y realice una consulta desde Madrid, la localización premia aquellos resultados que tengan una vinculación con la localización física del usuario, Madrid. Así pues, las páginas web de aquellas tiendas de animales que estén en Madrid, deben salir antes que otras pues son de mayor interés para el usuario que las que estén en otras ubicaciones. Este aspecto es todavía más importante cuándo la búsqueda se realiza desde un dispositivo móvil, ya que si un usuario busca un restaurante desde su móvil, agradecerá que la primera información que se le ofrezca sea la de aquellos restaurantes que estén más cerca de su ubicación actual. En la Figura 1 se muestran los resultados de una búsqueda por “tiendas de mascotas” estando el usuario en la Gran Vía de Madrid. En los resultados se puede apreciar como las primeras entradas son aquellas que más cerca se encuentran de la ubicación del usuario.

Tanto la personalización como la localización son tecnologías bastante cercanas y en creciente uso, sobre todo por la gran variedad de dispositivos con los que podemos conectarnos, la siempre presente ubicuidad y la gran cantidad de información existente que hace que cualquier manera de restringirla, sin perder información de interés, sea de gran beneficio para el usuario.

A su vez, además de beneficiar al usuario, la personalización y localización permiten mejorar el modelo de negocio de los buscadores, ya que permite que estos muestren publicidad más efectiva al usuario, bien sea por proximidad geográfica o bien por afinidad en cuánto a gustos y costumbres.

Las técnicas utilizadas para la localización y personalización de las búsquedas van desde el aprendizaje por refuerzo [Sutton98], agrupamiento [Ferragina07], categorización automática [Gomez05] y generación automática de perfiles [Sugiyama04]. Además de estas técnicas de aprendizaje, es muy importante contar con una buena organización de los datos y una gran capacidad de almacenamiento y computo, ya que debido al gran número de usuarios de Internet, se manejan Terabytes de información a diario, por lo que si no se hace de una forma óptima, se corre el riesgo de no ser capaces de explotar los datos al ritmo al que se producen.

Ahora bien, tanto la personalización como la localización tienen el riesgo añadido de poder invadir la privacidad del usuario [Sullivan03]. ¿Dónde se puede poner el listón de lo que es tolerable o no por parte del usuario en cuánto a la utilización de sus datos? Los buscadores corren el riesgo de convertirse en el “Gran Hermano” de Orwell si no son capaces de imponerse límites a la hora de aprovechar la información personal de los usuarios.


Referencias
  • [BaezaYates06] Baeza-Yates, R., “Queries and Clicks as a Source of Knowledge” I Jornadas MAVIR; Tecnologías de la Lengua en la WWW: retos y mercados potenciales.
  • [Ferragina07] Ferragina, P., Gulli, A., “Snaket: A Personalizad Search-result Clustering Engine”, UPGRADE: European Journal for the Informatics Professional, Vol. VIII, No. 1, February 2007.
  • [Gomez05] Gomez-Hidalgo, J.M., Buenaga, M., Cortizo-Pérez, J.C., “The Role of Word Sense Disambiguation in Automated Text Categorization”. Proceedings of the 10th International Conference on Applications of Natural Language to Information Systems, NLDB 2005. Pp. 298-309, 2005.
  • [Liu04] Liu, F., Yu, C., Meng, W., “Personalizad Web Search for Improving Retrieval Effectiveness”, IEEE Transactions on Knowledge and Data Engineering, Vol. 16, No 1, 28-40, January 2004.
  • [Sugiyama04] Sugiyama, K., Hatano, K., Yoshikawa, M., “Adaptive Web Search Based on User Profile Constructed without Any Effort from Users”. Proceedings of the 13th International Conference on World Wide Web. Pp. 675-684.
  • [Sullivan03] Sullivan, D., “Search Privacy at Google & Other Search Engines” de Danny Sullivan. Search Engine Watch, April 2003.
  • [Sutton98] Sutton, R., Barto, A., “Reinforcement Learning: An Introduction”, MIT Press, Cambridge, 1998.


[José Carlos Cortizo Pérez]

18:39 | gestionado por Grupo de Sistemas Inteligentes - UEM | Enviar comentario (0)

jueves, 03 de abril de 2008

Robots controlados por los movimientos de los ojos y sillas de ruedas controladas por la mente. Estos son algunos de los últimos avances en cibernética que prometen mejorar de forma considerable la calidad de vida de discapacitados y parapléjicos.

IMG_4390
Kevin Warwick en las III Jornadas de Informática de la UEM (Noviembre, 2007)

Si bien, desde un punto de vista méramente científico, la cibernética trata de los sistemas de control basados en la retroalimentación, en este artículo utilizaremos su concepto más cercano a la ciencia ficción y los cyborgs, la conexión entre máquinas y humanos. Esta ciencia resulta absolutamente fascinante, ya que se encuentra a medio camino entre muchas áreas del saber, como la robótica, filosofía y ética, sistemas inteligentes, medicina, etc.

Los avances en cibernética son muy variados e interesantes. Por ejemplo, en los últimos años, el profesor Kevin Warwick, ha sido capaz de conectar su sistema nervioso a una máquina e, incluso, ha mandado la información de los impulsos nerviosos a través de una red de computadoras para acabar conectando en otro sistema nervioso humano (el de su mujer) o conectado en un brazo robótico que puede ser controlado a distancia con el simple movimiento de la mano.

En esta línea, recientemente se han publicado varias noticias que corroboran el creciente interés de la comunidad científica por esta área de conocimiento:

1.- "Un investigador español diseña la primera silla de ruedas controlada por la mente"
Un equipo de científicos con base en Suiza y dirigidos por el investigador español José del Rocío Millán trabajan en el diseño de una silla de ruedas robótica controlada por la mente y por un sistema combinado de inteligencia artificial.

El movimiento se ejecuta  mediante la concentración de los pensamientos en la acción deseada, como si se realizara con el brazo, aunque físicamente no sea posible. Por ejemplo, si el usuario piensa en mover el brazo derecho, el sistema capta la señal para girar hacia la izquierda. Como herramienta adicional, la nueva silla cuenta con sensores que evitan el choque contra obstáculos o que el usuario se precipite por una cuesta en caso de peligro.

2.- "Crean en España un sistema que lee los ojos y envía órdenes a un robot"

Un grupo de investigadores de la Universidad Miguel Hernández (UMH) ha desarrollado una interfaz cerebral capaz de leer los movimientos de los ojos del usuario y, a través de estos estímulos, enviar órdenes a un robot.

El sistema se compone de unos electrodos que se acoplan a la cabeza, a la altura de la sien, y son capaces de distinguir entre varios estímulos según se muevan los ojos: izquierda, derecha, arriba o abajo, además de combinaciones de estos movimientos.

Los estímulos se convierten en órdenes para que las ejecute un robot o un brazo mecánico, de forma que el usuario puede mover y agarrar objetos moviendo tan sólo sus ojos.

Aún falta mucho tiempo para que estas tecnologías maduren y se integren en nuestras vidas cotidianas. Mientras, hay que seguir invertiendo en I+D, para ser capaces de mejorar poco a poco la Sociedad con estos apasionantes avances.


[Grupo de Investigación en Sistemas Inteligentes]

20:48 | gestionado por Grupo de Sistemas Inteligentes - UEM | Enviar comentario (0)

miércoles, 02 de abril de 2008

En Google están en continuo desarrollo de técnicas y tecnologías capaces de lidiar con distintos aspectos del acceso a la información y el procesamiento de la misma. Desde hace ya algún tiempo cuentan con un traductor automático que, además, han conectado con otras de sus herramientas (como Google Talk). Esta capacidad de traducción automática tiene sus limitaciones pero cuenta con una gran ventaja, el API que Google pone a disposición de los desarrolladores para integrar su sistema de traducción automático en otras webs o, incluso, aplicaciones.

En Google están en continuo desarrollo de técnicas y tecnologías capaces de lidiar con distintos aspectos del acceso a la información y el procesamiento de la misma. Desde hace ya algún tiempo cuentan con un traductor automático que, además, han conectado con otras de sus herramientas (como Google Talk). Esta capacidad de traducción automática tiene sus limitaciones pero cuenta con una gran ventaja, el API que Google pone a disposición de los desarrolladores para integrar su sistema de traducción automático en otras webs o, incluso, aplicaciones.

Cuerpo: Una de las grandes ventajas de Google es que ofrecen vía una serie de APIs una gran cantidad de las funcionalidades que desarrollan o integran en sus aplicaciones web. En este caso nos centramos en las APIs de traducción, que permiten acceso a estas funcionalidades tanto desde una aplicación desarrollada en Java (por lo que podemos acceder desde cualquier plataforma) como en aplicaciones web vía AJAX.

Si queremos utilizar el servicio de traducción de Google en una aplicación en Java, tendremos que bajarnos un archivo jar que contiene el API desde la página del Google API Translate Java. Una vez bajado este fichero, bastará con desarrollar un código java que invoque a este API, como el siguiente ejemplo:

import com.google.api.translate.Language;
import com.google.api.translate.Translate;

public class Main {
  public static void main(String[] args) {
    try {
      String translatedText = Translate.translate("Hola Mundo",
Language.SPANISH, Language.ENGLISH);
      System.out.println(translatedText);
    } catch (Exception ex) {
      ex.printStackTrace();
    }
  }
}

En este ejemplo traducimos desde el Español hasta el Inglés, aunque estos lenguajes son configurables (y utilizan el inglés como lenguaje intermedio para traducciones en los que el ni el idioma de origen ni el de destino sean el inglés.

Google también nos provee acceso a su API de traducción vía AJAX, lo cuál nos permite integrar esta funcionalidad en páginas web, blogs o incluso aplicaciones web o widgets de escritorio basados en tecnologías web.

<html>
  <head>
    <script type="text/javascript" src="http://www.google.com/jsapi"
></script>
    <script type="text/javascript">

    google.load("language", "1");

    function traducir() {
      var text = document.formul.entrada.value;
      google.language.detect(text, function(result) {
        if (!result.error && result.language) {
          google.language.translate(text, result.language, "en",
                                    function(result) {
            
            if (result.translation) {
              document.formul.entrada.value = result.translation;
            }
          });
        }
      });
    }
    </script>
  </head>
  <body>
    <div id="text">
        <form name="formul"> 
          <input type="text" name="entrada" id="entrada">
          <input type="button" name="boton" id="boton" value="Traducir"
onClick="traducir()">
        </form>
    </div>
  <div id="translation"></div>
  </body>
</html>

Este ejemplo cogería el texto que se introduzca en el campo de texto, detectaría el idioma y lo traduciría al inglés, colocando el resultado en el mismo campo de texto. Esto nos permite crear un formulario de traducción en nuestra propia web, como el siguiente:



Como podemos ver, estas APIs ofrece gran facilidad de uso y, además, las posibles aplicaciones son miles, por lo que merece la pena "jugar" un rato con ellos para tratar de exprimirlos al máximo. No sería de extrañar ver integrada esta tecnología, dentro de muy poco, en módulos de gestores de contenidos dedicados a gestionar las traducciones de sitios web, como JoomFish. Las aplicaciones dentro de los Sistemas Inteligentes son innumerables, ya que por una parte estas APIs permiten hacer prototipos de aplicaciones que necesiten de tecnologías de traducción de texto de forma rápida y simple. Por otro lado, se puede combinar con la utilización de sintetizadores de voz, reconocimiento de habla u otras tecnologías para obtener sistemas complejos a un esfuerzo menor del que se necesitaría sin estas herramientas que ofrece Google.


[José Carlos Cortizo Pérez]

18:31 | gestionado por Grupo de Sistemas Inteligentes - UEM | Enviar comentario (1)

martes, 01 de abril de 2008

Es indudable que Internet en general, y la Web en particular, tienen una influencia creciente en nuestras vidas, y se han convertido en un medio de comunicación y un recurso informativo de primer orden. La gran cantidad de información disponible en la Web se hace accesible primordialmente a través de los motores de búsqueda como Google, Yahoo! o Altavista. En esta serie de artículos presentamos una revisión de algunas de las tecnologías que creemos clave para los motores de búsqueda del presente y del futuro.

En los últimos años, Internet ha dejado de ser una red de comunicación empresarial y universitaria para convertirse en un medio de comunicación de masas. Más de 1,000 millones de usuarios se conectan a Internet para enviar correos a sus amigos, compañeros y clientes, para adquirir productos como DVDs y libros, para buscar información sobre su compañía o la competencia, o sobre salud, para reservar billetes de avión, y para innumerables cosas más. Internet y la información almacenada en ella se ha convertido en un instrumento de uso común, casi imprescindible en el trabajo y cada vez más usado para el ocio. 

Si el correo electrónico fue la primera aplicación que se extendió en Internet, sin duda su llegada al gran público se debe a la invención de la World Wide Web por parte de Tim Berners-Lee, en 1991. La simplicidad de la consulta y de la edición de contenidos, junto con su creciente interactividad, ha convertido a la Web en la aplicación por excelencia en Internet. La cantidad de información y recursos disponibles en la Web es tan asombrosa, que los motores de búsqueda o buscadores como Google se han erigido en el punto de entrada en la misma por excelencia, y lógicamente, en las páginas más visitadas. Hoy por hoy, los buscadores son grandes corporaciones con ingresos millonarios en publicidad, que incluso aspiran a "organizar y dar acceso a toda la información disponible", como es el caso de Google. 

Los buscadores tienen la difícil misión de ayudar a sus usuarios a localizar la información que buscan entre la disponible en la Web (e incluso en Internet). Tan compleja misión presenta la dificultad adicional de que el modo en que los usuarios utilizan la Internet y la Web no ha dejado de evolucionar desde su inicio. Los nuevos usos representan nuevos retos para los buscadores, que deben incorporar tecnologías cada vez más avanzadas para satisfacer las demandas de sus usuarios. 

En esta serie de posts pretendemos revisar algunas de las tecnologías emergentes en los buscadores y en la Web. Algunos de estos temas se revisan en la reciente monografía centrada en la búsqueda en la Web del futuro de la revista Novática [Baeza-Yates07] y algunos otros en [Gómez07]. Algunos de los temas que trataremos (e iremos enlazando también de este post son los siguientes):


Referencias


[José María Gómez Hidalgo]

14:05 | gestionado por Grupo de Sistemas Inteligentes - UEM | Enviar comentario (1)

lunes, 31 de marzo de 2008

Alan Mathison Turing (1912-1954) fue un matemático, criptógrafo y pionero de la informática moderna. La influencia de este brillante científico en el campo de la computación ha sido tan fuerte que, desde 1966, la ACM (Association for Computing Machinery) otorga de forma anual los Premios Turing a aquellas personas que han aportado contribuciones técnicas de gran impacto al campo de la computación (se consideran como los “Nobel” de la computación).

  Alan M. Turing nació el 23 de Junio de 1912 en Paddington, Inglaterra. Como Charles Babbage, y muchos otros genios del campo, Turing mostró signos tempranos de lo que muchos denominan el desorden de personalidad que lleva a vocaciones como la Ingeniería y las Matemáticas. La curiosidad de Turing a menudo se confundía con un carácter travieso. Se dice que, a una edad muy temprana, fue capaz de aprender a leer él solo en únicamente 3 semanas. Poco después descubriría los números, por los que quedaría tan fascinado que durante un tiempo se dedicó a revisar los números de serie de todas las farolas que encontraba en su camino.

Existen muchas anécdotas de la infancia de Turing, pero quizás una de las más sorprendentes es la que se relata en “El Criptonomicón”, un libro de ficción escrito por Neal Stephenson dónde Alan Turing aparece como personaje secundario. Parece ser que Alan tenía una bicicleta que tenía un problema en la cadena, ya que se salía cada cierto tiempo. Alan estudió este problema, contó el número de vueltas que hacía falta que se dieran para que la cadena se saliera y se dio cuenta que el fallo era regular, ocurría de forma repetida cada cierto número de revoluciones. Turing desarrolló un pequeño artefacto mecánico capaz de contar el número de revoluciones y reajustar la cadena de forma automática para no tener que bajarse de la bicicleta a arreglarla. Esta pequeña anécdota demuestra la personalidad de este gran genio, capaz de retarse a si mismo para solucionar problemas complejos en lugar de tomar los caminos más simples.

Sus padres lo inscribieron en el colegio St. Michael cuándo tenía 6 años, dónde sus profesores se percataron de su genialidad pero, a pesar de ello, se le obligó a seguir el camino natural dentro del sistema educativo inglés. A los 14 años fue al Sherborne School en Dorset, pero su primer día de colegio coincidió con una huelga general el inglaterra, así que, guiado por su determinación, cogió su bicicleta y pedaleó durante casi 100 kilómetros desde Southampton hasta su escuela, haciendo noche en una posada. Este hecho fue tan impactante que fue recogido como noticia en la prensa local. Sin embargo, Alan no hizo buenas migas con la escuela de Sherborne, más inclinada a formar ciudadanos que estudiantes y con mucho apego a los “clásicos”.

Alan cultivó su interés devorando libros. En 1927 fue capaz de encontrar las series infinitas de la función tangente inversa sin haber cursado cálculo elemental. Al año siguiente, a la edad de 16 años, encontró el trabajo de Albert Einstein, que no solo fue capaz de comprender si no también de extrapolar el cuestionamiento que hacía Einstein las leyes de movimiento de Newton a partir de un texto dónde no se hacía referencia explícita a esta cuestión. Posteriormente se interesó por la física cuántica, interés en el que estuvo acompañado de Christopher Morcom, el primer amor de Turing. Sin embargo, Christopher murió de tuberculosis bovina lo cuál condujo a Alan a convertirse al ateísmo.

Turing acabó la educación básica y era hora de asistir a la Universidad. Turing decidió ir a Cambridge ya que, durante los años 20, había alcanzado grandes cotas en las matemáticas modernas, solo detrás de la Universidad de Gottingen, en Alemania, lugar dónde trabajaron genios de la talla de John Von Neumann. Trató de ir al Trinity College, pero no logró obtener una beca, así que acabó yendo a su segunda opción, el King’s College, también en Cambridge, dónde entró en 1931, se graduó con distinción en 1934 y fue elegido profesor en 1935 gracias a la fuerza de su tesis sobre el teorema de límite central.

En Mayo de 1936, Alan Turing definió, en su artículo “On Computable Numbers, with an Application to the Entscheidungsproblem” [Turing 1936], Turing reformuló los resultados de Gödel, desarrollando lo que se llamaría como Máquinas de Turing, unos “artefactos” formales y simples capaces de computar cualquier problema. Turing probó que una máquina, como la que definía en este artículo, sería capaz de resolver cualquier problema matemático si fuera representado como un algoritmo.

Durante la Segunda Guerra Mundial, Alan Turing trabajó en Bletchley Park ayudando a romper los códigos de los nazis, siendo responsable de importantes avances que ayudaron a romper tanto Enigma como Lorenz S