LoginRSS 2.0 Feed

lunes, 17 de marzo de 2008

La web semántica es una extensión de la web tal y como la conocemos hoy en día en la que se define la semántica de la información y servicios, haciendo posible para las máquinas comprender y satisfacer las peticiones de gente y otras máquinas que utilizan el contenido web. La web semántica no es para nada un concepto nuevo, de hecho ya en 1999 Tim Berners Lee [Berners-Lee 1999], el padre de Internet tal y como la conocemos hoy en día, hablaba del interés de una posible Web Semántica dónde las máquinas serían capaces de analizar todos los datos existentes en la red hasta límites insospechados.


"Tengo un sueño para la Web, en el que las computadoras serán capaces de analizar todos los datos en la red - el contenido, los links y las transacciones entre las personas y las computadoras. Una 'Web Semántica', que debería hacer esto posible, tiene que emerger, pero cuándo lo haga, los mecanismos habituales de intercambio, burocracia y nuestras vidas cotidianas serán manejadas por maquinas capaces de hablar entre ellas. Lo que la gente de los 'agentes inteligentes' han vendido durante siglos finalmente se hará realidad".

Tim Berners-Lee, 1999, [Berners-Lee, 1999]


Con unos 1.300 millos de usuarios (aproximadamente el 20% de la población mundial), internet se ha convertido en una herramienta sin procedentes, que nos ayuda y acompaña a lo largo de nuestras múltiples facetas diarias, tanto en el trabajo como para cuestiones personales o de ocio. Internet nos ha permitido una comunicación más rápida y directa con herramientas como el correo electrónico o la mensajería instantánea, nos ha permitido nuevos paradigmas para la difusión del conocimiento, como son las webs o los blogs que, en cierta medida, han sustituido a medios de comunicación más tradicionales como los periódicos, ha cambiado nuestros hábitos de compra, nuestra forma de disfrutar de nuestro ocio o, incluso, de establecer y mantener relaciones con otras personas.

A pesar de todas estas virtudes, la web presenta un inconveniente palpable. Contiene una gran cantidad de información, millones y millones de páginas webs conteniendo datos sobre cualquier tema imaginable, pero el acceso a esta información resulta complejo, por lo que para poder operar con esta información para algún fin concreto, suele hacer falta un humano para guiar el proceso. Y esto resulta tanto un inconveniente como una pena, ya que día a día realizamos multitud de operaciones en la web que pueden ser automatizadas. Buscamos los viajes más baratos que se adecuan a nuestro periodo vacacional y nuestros gustos en multitud de páginas dedicadas a viajes, buscando los viajes más baratos. Revisamos multitud de páginas en busca de información sobre nuestros hobbies. Revisamos los comentarios de los blogs dónde solemos comentar o en las redes sociales que solemos utilizar, buscando nuevos comentarios para seguir las conversaciones que ahí mantenemos. Buscamos las primeras ediciones de nuestros libros favoritos y las nuevas películas en DVD que han dirigido los directores que más nos gustan.

En la Web Semántica, además de los datos en sí, se permite añadir la semántica de las cosas. Para añadir la semántica se utilizan tecnologías descriptivas como RDF (Resource Description Framework) y OWL (Web Ontoloy Language) que permiten añadir descripciones suplementarias a los contenidos actuales de los documentos web. Estas descripciones son estructuradas y procesables por las computadoras quienes pueden procesar este conocimiento usando procesos de razonamiento similares al razonamiento deductivo y la inferencia.

La idea de la Web Semántica es una idea realmente potente y que lleva muchos años germinando. Así pues, ¿por qué no ha llegado la Web Semántica todavía? Muchos pueden ser los motivos. Para empezar, la Web Semántica necesita de una serie de estándares de representación del conocimiento, así como la definición de lenguajes comunes, que han tenido que desarrollarse durante estos años. Por otra parte, los intereses de las empresas han ido cambiando a lo largo de este tiempo, permitiendo que la Web 2.0 adelantara a la Web Semántica. Este movimiento por parte de las empresas es más que lógico, ya que los conceptos detrás de la Web 2.0 permiten están orientados a una mayor facilidad a la hora de generar contenidos y comunidades de usuarios en torno a ellos, lo cuál ha resultado vital para el despertar de multitud de servicios web. Con esta orientación, han surgido multitud de Redes Sociales que han permitido la comunicación entre usuarios y la generación de grandes repositorios de conocimiento y cultura. Pero la Web Semántica ha de llegar para beneficiar a la Web en general y a los servicios 2.0 en particular. Las redes sociales se han convertido en grandes monstruos en cuanto a volumen de información almacenado, por lo que resulta difícil encontrar información en las mismas pero más aún interoperar entre ellas o buscar información en diversas redes sociales a la vez. La implantación de estos servicios utilizando las tecnologías que proporciona la Web Semántica permitiría automatizar la búsqueda de información en todas las redes sociales en las que participe, así como interoperar entre ellas. Además, lo más importante de la Web Semántica es que permitirá la aparición de servicios pseudo-inteligentes capaces de realizar tareas cotidianas y rutinarias por nosotros cómo comprar los libros de mis escritores favoritos por internet pero en la tienda en la que se encuentren más baratos o informarme del estreno de las películas que encajen con mis gustos.

La Web Semántica todavía no ha llegado, pero está llegando, y un síntoma de esto es el posicionamiento de los grandes en internet. Yahoo! acaba de anunciar que ya comienza a indexar microformatos, algunos de ellos estándares de la red semántica como RDF, hCard, hCalendar, hReview, hAtom, y XFN, y Open Search. Por otra parte, Google ya hace tiempo que anunció un API que "permite acceder a las relaciones entre usuarios que estén explícitamente declaradas en la web mediante enlaces y haciendo uso de los estándares XFN y FOAF". El interés de estos monstruos de la información en internet no es infundado. Cada día encontramos más plataformas de contenidos como Youtube o Flickr que publican contenidos de una forma más o menos estructurada y disponen de gran cantidad de información sobre relaciones entre personas. Estandarizar y permitir explotar de forma automática esta información es el siguiente paso obvio, y quién sea capaz de llevarse el gato al agua, será el próximo "rey de internet".


Referencias:
  • [Berners-Lee 1999] Berners-Lee, T., Fischetti, M., "Weaving the Web", HarperSanFrancisco, 1999.
Algunos enlaces de interés:
Algunas charlas relacionadas:

[José Carlos Cortizo Pérez]

7:59 | gestionado por Grupo de Sistemas Inteligentes - UEM | Enviar comentario (2)