LoginRSS 2.0 Feed

miércoles, 11 de abril de 2007

Una gran parte de la web académica es invisible por la torpeza de quienes diseñaron el sistema de archivado o recuperación de la información.

Seguimos de aniversario: dos años blogueando El tamaño de la web académica invisible es objeto de debate. Una cuantificación reciente publicada por Dirk Lewandowski and Philipp Mayr reconoce que el mejor estudio precedente fue publicado en 2001 por Michael K. Bergman, quien arriesgó una estimación que convertía la deep web académica en unas 550 veces más grande que la de superficie, o web visible (1.000 millones de páginas).


Estas cifras, al parecer, son exageradas, una crítica que no comparte Bergman como puede verse en su. Según el nuevo estudio, los contenidos de la web académica invisible (en total unas 13.000 bases de datos con un tamaño medio de 1.150.000 documentos) no sobrepasaría los 20.000 millones de documentos, una cifra que como mucho podría llegar hasta los cien mil millones.

Más allá de las cifras, necesitadas -explica Bergman en su blog AI3 - de nuevos estudios que las aquilaten, lo que Lewandowski & Mayr han descubierto es que gran parte de lo que creíamos que pertenecía a la web oculta (deep web o también invisible web) no lo era intencionalmente. Lo único que sucedía es que se había archivado en formatos o con tecnologías que los buscadores no podían encontrar.

Todas estas cifras y estas prácticas, como explica Peter Suber, dan mucho que pensar, porque podríamos estar acelerando la construcción de repositorios de libre acceso que, sin embargo, no fueran visibles para los buscadores generalistas. De forma que aunque formal y técnicamente se trate de web de libre acceso, en la práctica quedarían ocultas a no poder ser indexadas por los buscadores más populares.

13:22 | gestionado por Antonio Lafuente | Enviar comentario (1)