Enviado el miércoles, 11 de abril de 2007 13:22
Una gran parte de la web académica
es invisible por la torpeza de quienes diseñaron el sistema de
archivado o recuperación de la información.

El tamaño de la web académica
invisible es objeto de debate. Una cuantificación reciente
publicada por
Dirk
Lewandowski and Philipp Mayr reconoce que el mejor estudio precedente fue
publicado en 2001 por
Michael
K. Bergman, quien arriesgó una estimación que
convertía la deep web académica en unas 550 veces más
grande que la de superficie, o web visible (1.000 millones de
páginas).
Estas cifras, al parecer, son
exageradas, una crítica que no comparte Bergman como puede
verse en su. Según el nuevo estudio, los contenidos de la web
académica invisible (en total unas 13.000 bases de datos con
un tamaño medio de 1.150.000 documentos) no sobrepasaría
los 20.000 millones de documentos, una cifra que como mucho podría
llegar hasta los cien mil millones.
Más allá de las cifras,
necesitadas -explica Bergman en su blog
AI3
- de nuevos estudios que las aquilaten, lo que Lewandowski &
Mayr han descubierto es que gran parte de lo que creíamos que
pertenecía a la web oculta (
deep web o también
invisible web) no lo era intencionalmente. Lo único que
sucedía es que se había archivado en formatos o con
tecnologías que los buscadores no podían encontrar.
Todas estas cifras y estas prácticas,
como
explica
Peter Suber, dan mucho que pensar, porque podríamos estar
acelerando la construcción de repositorios de libre acceso
que, sin embargo, no fueran visibles para los buscadores
generalistas. De forma que aunque formal y técnicamente se
trate de web de libre acceso, en la práctica quedarían
ocultas a no poder ser indexadas por los buscadores más
populares.