Los buscadores habituales sólo rastrean un 10% de la Red. ¿Qué hay en el otro 90%? Esto es lo que se conoce como Internet Invisible, Infranet o Deep Web.
[Extracto de artículo publicado en abril de 2005]
Imagine que está entrando en la inmensa biblioteca de Alejandría, maravilla de las maravillas de la antigüedad, que albergaba 700.000 rollos de papiro con las obras de los más fascinantes autores de la historia antigua. Cuál sería su sorpresa si a la hora de buscar el texto de algún filósofo griego se encontrara con que ¡hay catalogadas menos de 2.000 obras! Pues ahora imagine que esa biblioteca es lo que hoy llamamos Internet y que usando un buscador tradicional como el Google, con más de 4 mil millones de páginas almacenadas, sólo podremos ver parte de esa Red que crece inexorablemente, ya que el resto no está indexado y puede ser hasta 500 veces mayor (unos 7.500 terabytes de información). Gary Price, bibliotecario en la Universidad George Washington, lo bautizó como la Internet Invisible.
Según las estimaciones más optimistas, los buscadores de Internet sólo son capaces de rastrear el 10% de la información existente en la Red, pero si tuviéramos que hacer caso a las más pesimistas (y realistas) sólo sería el 0,2%. Esto es debido a que Internet no sólo son páginas web si no también catálogos, publicaciones científicas y de investigación, grupos de noticias, FAQs, grupos de discusión, noticias de prensa, formularios, nomenclaturas, genealogías, patentes, la Enciclopedia Británica, documentos PDF, páginas de pago o de acceso restringido y, sobre todo, bases de datos que generan la información dependiendo de la consulta que se haya realizado con lo que las páginas se crean en el momento y no existen más que en ese preciso instante.
EXTRACTO ARTÍCULO
Velásquez Espinel, Nicolás. Hay una «Infranet» que no ves. Revista QUO, Nº 115, Abril 2005, pág. 144