La técnica detrás del update Caffeine del buscador de Google

Hace unos días la novedad fue el anuncio sobre el proyecto secreto de Google:  el Update Caffeine.  Y cómo ya lo había mencionado:  cuando Matt Cutts dice «nueva infraestructura» se trata de cambios en los data centers (DC) posiblemente en el hardware, el sistema operativo o mejoras profundas en el software, cómo ya sucedió con el update  Big Daddy.

Ahora ya está claro qué es la parte fundamental del Update Caffeine: Se trata de una nueva versión del Google File System (GFS), ahora denominado GFS 2, cómo lo menciona un articulo del Register. El mencionado artículo explica algunos de los conceptos del nuevo sistema de gestión de archivos de Google.

Debido a que el GFS2 mejora mucho los conceptos de archivos distribuidos, es más rápido, mucho más  dinámico  y adaptable, el nuevo indicie de Google que correrá sobre este nuevo sistema de archivos –  justamente Caffeine – también será mucho más veloz en sus tiempos de respuesta y permitirá la gestión de un numero mayor de documentos.

Y justamente estos dos factores permitirán al buscador de Google gestionar más peticiones por segundo y aumentar significativamente el numero de páginas indexadas lo que consecuentemente mejorará – según Google – la calidad del buscador.

En lo que se refiere a los algoritmos propios del buscador, parece que el Update Caffeine no nos dará muchas sorpresas.

Así pues, ahora solamente debemos esperar que los ingenieros de Google den luz verde a Caffeine para que se vaya propagando de data center en data center, aunque con la experiencia de Big Daddy esto se puede extender por varios meses…