
En su blog oficial, Google escribe que sus programadores han creado un nuevo sistema de indexación bajo el nombre de Caffeine, que presentará resultados hasta 50% más actualizados que el sistema anterior. Al realizarse búsquedas en Internet, la búsqueda tiene lugar en el índice de Google, que es un reflejo de la red y que pudiera ser comparado al índice de un libro.
Sin embargo, este índice nunca ha sido una copia exacta de Internet, debido a que los sitios son constantemente modificados con nueva información. Entonces, y prácticamente por definición, el índice queda obsoleto inmediatamente después de ser creado.
El índice anterior de Google tenía varias capas, algunas de las cuales eran refrescadas con mayor rapidez que otras; la capa principal era refrescada cada dos semanas, pero requería que los programas de búsqueda de Google, o robots, recorrieran toda Internet, lo que implica que pasaba algo de tiempo desde que los programas encontraban una página hasta que esta quedaba disponible en el índice.
Con Caffeine, la red es analizada en pequeñas porciones a la vez, y el índice es actualizado continuamente. Cuando Google encuentra nuevas páginas, o cambios en páginas antiguas, éstas son incorporadas inmediatamente al índice. Caffeine logra analizar cientos de miles de páginas por segundo, explica Google. El índice en sí ocupa 100 petabyte (100 millones de gigabytes), y crece a un ritmo de 100.000 GB diarios.
Para poner en perspectiva tal volumen de datos, Google escribe que si los datos estuvieran impresos en papel, el espesor del legajo aumentaría en 4,5 kilómetros por segundo.
Fuente: DiarioTI
Etiquetas: Caffeine, Google, Internet



.jpg)
.jpg)
.jpg)
.jpg)
.jpg)
.jpg)
.jpg)