Archivo de la categoría: Google

Se prepara Google para convertirse en un buscador de tiempo real?

Ya hace algún tiempo Google se puso nervioso con el éxito de Twitter y Facebook por la actualidad de sus resultados.

Por ese motivo, Google comenzo a realizar pruebas con una nueva infraestructura caffeine y también a crear  nuevas opciones de búsqueda en  las que aparecen mostrar resultados actuales.

Ahora, han aparecido en la red informaciones sobre una serie de parámetros que Google podría usar para mostrar resultados en los últimos minutos o segundos.

El parámetro es qdr y puede tener los siguientes valores:

all – todos los resultados
y – resultados del último año
m – resultados del último mes
d – resultados del último día
nX – resultados de los últimos X minutos
sX – resultados de los últimos X segundos

Los parámetros para devolver en los últimos minutos o segundos son nuevos! mientras que los otros ya se los podía seleccionar mediante la nueva opción de búsqueda o por la búsqueda avanzada.

El uso de estos nuevos parámetros demuestra que Google no solo está trabajando en los algoritmos con caffeine, sino que próximamente presentará oficialmente nuevas opciones en el buscador para devolver resultados en tiempo real para así contraatacar a Twiiter y Faceboook.

Pero como ya lo había mencionado anteriormente, esta batalla es un poco desigual ya que tanto Twitter como Facebook ya tienen toda la información en sus bases de datos y solamente la tienen que mostar cómo resultado de una búsqueda. Mientras que Google tiene que rastrear las webs más actuales, analizarlas, ordenarlas en el índice para recién poder mostrarlas en los resultados de una búsqueda en tiempo real.

Más Tamaño Para las Búsquedas

Aunque este tema ya fue discutido en la blogsefera en ingles, creo que merece ser mencionada aunque no pienso que vaya tener grandes repercusiones en la usabilidad de la página principal de Google.

Más parecería ser un acercamiento al layout de Bing.

Aquí la nota en el blog de Google en español.

Los factores más importantes para el ranking en Google

Cómo ya se hizo costumbre, SEOmoz realiza periodicamente una encuesta entre SEOs de diferentes países del mundo para conocer su opinión sobre los factores que influyen en el ranking dels buscador de Google (ver artículo).

El cuestionario contiene más de 100 factores que podrían influir en el posicionamiento de una página Web. Los resultados de este año son los siguientes:

Factores principales del ranking en Google

Factores generales del algoritmo

24% Confianza/Autoridad del dominio
22% Popularidad de enlaces de la página especifica
20% Texto en anchor de los enlaces externos
15% Uso de palabras claves en la página (on-page)
7% Tráfico y el click-through de la página
6% Métricas de redes sociales
5% Registro y parámetros del hosting

El Top 5 de los factores del Ranking de Google

El Top 5 de los factores para el ranking

1. Texto en anchor de los enlaces externos (73%)
2. Uso de palabras claves en la etiqueta title (66%)
3. La popularidad de enlaces (64%)
4. Diversidad de dominios en los enlaces entrantes (64%)
5. Uso de palabras claves en el nombre del dominio (60%)

Los top 5 de los factores negativos para el ranking

Los top 5 de los factores negativos para el ranking
1. Cloacking con intenciones maliciosas (68%)
2. Compra de enlaces de brokers de enlaces (66%)
3. Cloacking usando el user agent (51%)
4. Caídas frecuentes del servidor (51%)
5. Enlazar a páginas con SPAM (48%)

Cómo se puede observar, los resultados de las encuestas  no dan grandes novedades en lo que se refiere al conocimiento sobre posicionamiento en Google, pero muestran claramente cuales son los puntos más importantes que todo SEO o webmaster debe tomar en cuenta cuando trata de posicionar una página o un proyecto en el buscador más usado del mundo, Google. En esta página puedes leer la lista completa de los factores que influyen en el ranking.

La técnica detrás del update Caffeine del buscador de Google

Hace unos días la novedad fue el anuncio sobre el proyecto secreto de Google:  el Update Caffeine.  Y cómo ya lo había mencionado:  cuando Matt Cutts dice «nueva infraestructura» se trata de cambios en los data centers (DC) posiblemente en el hardware, el sistema operativo o mejoras profundas en el software, cómo ya sucedió con el update  Big Daddy.

Ahora ya está claro qué es la parte fundamental del Update Caffeine: Se trata de una nueva versión del Google File System (GFS), ahora denominado GFS 2, cómo lo menciona un articulo del Register. El mencionado artículo explica algunos de los conceptos del nuevo sistema de gestión de archivos de Google.

Debido a que el GFS2 mejora mucho los conceptos de archivos distribuidos, es más rápido, mucho más  dinámico  y adaptable, el nuevo indicie de Google que correrá sobre este nuevo sistema de archivos –  justamente Caffeine – también será mucho más veloz en sus tiempos de respuesta y permitirá la gestión de un numero mayor de documentos.

Y justamente estos dos factores permitirán al buscador de Google gestionar más peticiones por segundo y aumentar significativamente el numero de páginas indexadas lo que consecuentemente mejorará – según Google – la calidad del buscador.

En lo que se refiere a los algoritmos propios del buscador, parece que el Update Caffeine no nos dará muchas sorpresas.

Así pues, ahora solamente debemos esperar que los ingenieros de Google den luz verde a Caffeine para que se vaya propagando de data center en data center, aunque con la experiencia de Big Daddy esto se puede extender por varios meses…

Primeros experimentos con Google Caffeine – La nueva generación

Ayer, apareció en el blog oficial de Google la noticia de que estaban trabajando en un proyecto secreto con el código caffeine para implementar un buscador de nueva generación.

Hoy día ya han salido los primeros resultados de las pruebas que han realizado varios expertos. Una de estas pruebas es la de Mashable (pruebas con el nuevo Google).

los parámetros parametros que han usado son:

  • Velocidad
  • Exactitud
  • Relevancia en el tiempo
  • Tamaño del índice

También se debe mencionar el post de Matt Cutts (sobre el caffeine update). Y la mención de Update hace presumir que este cambio no es tan revolucionario como se lo creyó. Ya estamos acostumbrados a estos updates en forma regular. hace dos años atrás se hizo un update de la infraestructura, como lo llamó Matt,que incluía nuevo hardware en los data centers (DC) y también nuevo software. Este update se alargo por varios meses hasta abarcar a todos los DCs.

El mayor impacto de este update fue el incremento de capacidad de indexación, mejoras en la sincronización y propagación de las bases de datos entre los DCs, y claro un incremento en la velocidad de indexación y presentación de los resultados. Después de este update, los blogs pueden ser indexados y mostrados en los resultados en cuestión de segundos o minutos.

Bueno, ahora parece que Caffeine es la nueva versión de este update: La meta es el buscador en tiempo real, para mantener a raya a twitter y también Bing.

Pero como siempre, Matt dá pistas sobre los cambios en este update:

john chen and Daniel Sterling, most of the changes are in things like our core indexing, so there’s less changes for things like rankings. Lots of users won’t notice a big difference.

pavs and McMohan, we’re not looking to make huge changes in ranking with this new infrastructure. Some rankings will change, but that’s not the main thrust of the infrastructure.

Así pues, creo que Caffeine es un update más de Google y no como se lo postulo ayer: El buscador de nueva generación.

Actualización

Un vídeo de Matt Cutts sobre el tema

El buscador de Google – Next generation

Hoy día Google ha dado a conocer que está trabajando en una infraestructura secreta de nueva generación para su buscador.

En esta entrada del blog oficial de Google, se menciona que para crear un motor de búsqueda grandioso se necesita:

  • Rastrear un pedazo grande de Internet.
  • Indexar los resultados y computarizar / valorizar cuán reputables son estas páginas.
  • Armar un ranking y mostrar a los usuarios las páginas más relevantes para sus búsquedas lo más rápido posible.

Esto resume más o menos lo que Google está tratando de crear: Un buscador con resultados en tiempo real.

En esta entrada también menciona:

For the last several months, a large team of Googlers has been working on a secret project: a next-generation architecture for Google’s web search. It’s the first step in a process that will let us push the envelope on size, indexing speed, accuracy, comprehensiveness and other dimensions. The new infrastructure sits «under the hood» of Google’s search engine, which means that most users won’t notice a difference in search results. But web developers and power searchers might notice a few differences,…

La palabra infraestructura en la boca de Google ya es bien conocida y significa «grandes cambios» en lo que se refiere a hardware, es decir servidores, pero también al software que corre sobre este hardware. Especialmente en lo que se refiere a algoritmos rápidos y que puedan procesar inmensas cantidades de información.

En la entrada también invitan a los usuarios avanzados del buscador a enviar su feedback sobre los resultados del nuevo buscador experimental www2.sandbox.google.com.

Right now, we only want feedback on the differences between Google’s current search results and our new system. We’re also interested in higher-level feedback («These types of sites seem to rank better or worse in the new system») in addition to «This specific site should or shouldn’t rank for this query.»

La palabra clave para los emails de feedback es caffeine y ahora queda claro lo que Matt Cutts estaba twitteando en los últimos días 🙂

Bueno, en resumen parece que Google apunta a un buscador en tiempo real, lo que ya estaba sucediendo con los blogs en wordpress que envían un ping  pueden ser rastreados rápidamente. Esta nueva infraestructura pretende contrarrestar el aumento de popularidad de Twitter.

Así, pues ahora la frescura de los datos en las web (no solo blogs) será un factor muy importante para aparecer en las primeras posiciones del buscador de nueva generación de Google.

Finalmente Google presenta su sistema operativo – Chrome OS

Esta nota en el blog oficial de Google esta causando una ola de discusiones en la blogsfera: Se trata del anuncio de Chrome OS, el sistema operativo de Google sobre el que tanto se había especulado.

Google Chrome OS is an open source, lightweight operating system that will initially be targeted at netbooks. Later this year we will open-source its code, and netbooks running Google Chrome OS will be available for consumers in the second half of 2010. Because we’re already talking to partners about the project, and we’ll soon be working with the open source community, we wanted to share our vision now so everyone understands what we are trying to achieve.

Se trata de un sistema operativo con código abierto especialmente diseñado para netbooks, que funcionará sobre chips del tipo x86 y ARM basado en el kernel de Linux con un interfaz gráfico sencillo.

Lo interesante de todo esto es que los programas que correrán sobre Google Chrome serán «solamente» aplicaciones web, de modo que los desarrolladores web también podrán crear aplicaciones para este sistema operativo.

Bueno, la primera versión recién saldrá el 2010 y parece que Google Chrome no va ha ser el killer de Windows, pero apunta a un segmento especifico: Usuarios que usan mayormente aplicaciones web, lo que está creciendo mucho en los últimos años, y no para los usuarios / empresas que usan aplicaciones de escritorio tradicionales.

Actualización

Aquí la nota en el blog de Google en  español: Presentando a Google Chrome OS

Google Chrome saldrá del beta y el nace Native Client

TechCrunch se refiere hoy día a un comentario de Marrisa Mayer, en la conferencia Le Web 08, en la que ella menciona que Google pronto sacará a su navegador Google Chrome del beta y así será llevado hasta los usuarios finales en equipos OEM.

Esto muestra que Google apostará en 2009 a mejorar la penetración de mercado de Chrome. Solo queda esperar que Google adicioné una Toolbar y también los plug-ins que han popularizado a Firefox.

Pero paralelamente a Chrome, Google acaba de lanzar su Cliente Nativo (native client) (ver publicación en el blog de Google) una tecnología que ha sido resumida de la siguiente manera en la página oficial del Native Client

Native Client is an open-source research technology for running x86 native code in web applications, with the goal of maintaining the browser neutrality, OS portability, and safety that people expect from web apps. We’ve released this project at an early, research stage to get feedback from the security and broader open-source communities. We believe that Native Client technology will someday help web developers to create richer and more dynamic browser-based applications.

Es decir, Google Native Client (GNC) es una aplicación open source en GCC que se puede incrustar mayoría de los navegadores (Firefox, Safari, Opera und Google Chrome, pero no IE), y permite así correr programas en forma local independientemente del sistema operativo. Se trata de una especie de control ActiveX de Microsoft.

Debido a que el poder arrancar una aplicación en la máquina local representa un gran riesgo de seguridad, las aplicaciones del cliente nativo corren en un sandbox. Y justamente este posible riesgo ha sido la motivación de Google para presentar este nuevo proyecto todavía en estado inicial a la comunidad del open source para que ayuden crear una aplicación robusta y bien testeada.

A pesar de que este nuevo proyecto todavía se encuentra en su fase inicial, demuestra una vez más que Google está tratando de crear un nuevo paradigma en Internet. Una plataforma o como muchos lo quieren llamar «sistema operativo web» que permita correr aplicaciones ricas (rich applications) en las máquinas locales, pero con la misma facilidad cómo se descarga una página HTML. Lo que justamente todavía no sucede con Silverlight de Microsoft o AIR de Adobe.

Actualizacion (11.12.2008) 
Google acaba de anunciar que Chrome ya ha salido de la fase beta. Y aquí la nota en español del blog de Webmasters para América Latina.

Google Zeitgeist 2008 para más de 30 paises

Marissa Mayer, VP de Search Products & User Experience de Google acaba de publicar una entrada en el blog oficial de Google informando que el Global Zeitgeist de fin de año para el 2008 ya está a disposición, y que además de las búsquedas globales más populares, también ver las de más de otros 30 paises

Aquí por ejemplo los resultados para España
Emergentes (Fastest Rising)
1. fama
2. tuenti
3. cintube
4. facebook
5. hi5
6. fotolog
7. myspace
8. youtube
9. badoo
10. loquo

Más Populares (Most Popular)
1. youtube
2. juegos
3. hotmail
4. marca
5. juegos juegos
6. tuenti
7. yahoo
8. videos
9. you
10. as

Serie
1. heroes
2. prison break
3. lost
4. house
5. los hombres de paco
6. el internado
7. dexter
8. física o química
9. aida
10. anatomia de grey

Blogs
1. el blog salmon
2. blog leopoldo abadia
3. el blog de lobato
4. el blog de risto mejide
5. el blog de banyeres
6. el blog de bibiana aido
7. xakata blog
8. blog de andaya
9. el blog de trecet
10. blog de eva se desnuda

Sporty
1. rafael nada
2. almudena cid
3. pau gasol
4. gemma mengual
5. michael phelps
6. gervasio deferr
7. valentino rossi
8. roger federer
9. david meca
10. miguel indurain

Ministros
1. bibiana aido
2. pedro solbes
3. maría teresa fernández de la vega
4. celestino corbacho
5. cristina garmendia
6. magdalena álvarez
7. bernat aoria
8. eduardo zaplana
9. ángel acebes
10. elena salgado

Y los resultados para Argentina son los siguientes

Emergentes (Fastest Rising)
1. gran dt
2. facebook
3. claro
4. critica
5. taringa
6. poringa
7. casi angeles
8. tn
9. youtube
10. dolar

Más Populares (Most Popular)
1. juegos juegos
2. juegos
3. argentina
4. youtube
5. videos
6. fotos
7. clarin
8. you
9. yahoo
10. hotmail

Google
1. google
2. google earth
3. traductor google
4. google maps
5. google videos
6. google chrome
7. google imagenes
8. google talk
9. barra google
10. gmail

Fútbol
1. boca
2. river
3. san lorenzo
4. racing
5. independiente
6. velez
7. tigre
8. arsenal
9. lanus
10. huracan

Conflicto del campo
1. retenciones
2. campo vs. gobierno
3. kirchner
4. alfredo de angelis
5. cobos
6. sociedad rural argentina
7. federacion agraria
8. cristina
9. cortes de ruta
10. paro agropecuario

Economia
1. dolar
2. pbi
3. rentas
4. inflacion
5. crisis
6. retenciones
7. banco central
8. kirchner
9. lousteau
10. bolsa de valores

Actualización
El blog oficial de Google para América Latina acaba de presentar una página interesante: El Zeitgeist 2008 para países de habla hispana en América Latina, donde se incluyen los datos ya mencionado en el Zeitgeist global 2008, pero solamente para algunos países de Sudamerica: Argentina, México, Chile y Colombia.

Actualización 1
En el Zeitgeist 2008 para América Latina también existe una página para los otros países que enlaza directamente a los resultados de Google Insights for Search.