Matt responde a las preguntas de los SEO’s

Hoy día Matt ha comenzado a responder en su blog a las preguntas de los SEO’s que se habia dispuesto a responder (ver nota).

Como las respuestas son MUY importantes para los que están interesados en posicionar sus páginas en Google las voy a transcribir a continuación al español:

P: Se ha propagado Bigdaddy por completo?
R: Si, creo que cada uno de los data centers ya tiene el upgrade de la infraestructura de software Bigdaddy.

P: Cuál es la historia sobre el Mozilla Googlebot? Es esto lo que envía Bigdaddy?
Si, así lo creo. Probablemente Uds. verán menos al viejo googlebot, que tiene como user-agent “Googlebot/2.1 (+http://www.google.com/bot.html)”. Creo que la nueva infraestructura Bigdaddy tiene un nuevo robot, cual es Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)”

P: Llevaste a Emmy a San Fransisco?
R: Nop, Emmy es una gata casera, no le gusta viajar

P: Algunas novedades sobre los sitios que muestran resultados suplementarios?
R: A fines de la ultima semana se han hecho algunos cambios con escaneos (crawlings) adicionales para mostrar mas de estos sitios, pero todavía va ha tomar algún tiempo (algunos días más) para poder mostrarlos en el índice. Echaré una ojeada a aquellos sitios que la gente me ha mencionado.

P: El parámetro RK ha sido completamente desactivado, o podemos esperar de verlo nuevamente?
A: No creo que el parámetro RK vuelva a tener un valor diferente de 0.

P: Que es el parámetro RK?
A: Es el parámetro que se puede ver en el Google Toolbar query. Alguna gente fuera de Gogle ha especulado que este valor era el PageRank actual (live), que este valor difería entre Bigdaddy y la antigua infraestructura, etc.

P: Ahora que Bigdaddy ya esta afuera, habrá una exportación del PageRank (quiere decir actualización de la barrita verde) pronto? y ahora en Bigdaddy se van a estabilizar los aspectos relacionados al PR?
A: Preguntaré por aquí sobre esto. Si es que no existen obstáculos logísticos, voy a preguntar si podemos hacer visible el PageRank en las próximas semanas. Y espero que a medida de que Bigdaddy se estabilice en todo lado, la variación del PR en la Toolbar va ha terminar.

P: El data center http://64.233.185.104/ trabaja en forma diferente a los otros. Lo note hace unas horas… Como encaja este DC en el esquema?
R: Ojos agudos, g1smd. No me sorprendería. A medida de que Bigdaddy se enfríe, eso nos libera para hacer nuevas/otras cosas.

P: No es una pregunta… Consigue una PSP
A: He conseguido una hoy día…..

(Algunas preguntas y respuestas irrelevantes al tema)

P: Por qué focalizas mucho tu atención en los SEOs y no en los webmasters que haces páginas web de calidad?
R: Yo creo que este tema es algo personal, porque yo paso mucho tiempo observando SPAM. Muchas otras personas se enfocan a ayudar a webmasters en general. Como el equipo de sitemaps, por ejemplo. He comenzado en hacer post ‘Consejos para SEOs’ y no ‘Errores de los SEOs’ Pero tienes razón. Personalmente debería tener un recordatorio para mantenerme enfocado en sitios que tienen calidad. Gracias por mencionarlo.

Q: Mi sitemap tiene 1320 URLs. Y ya hacen más de 2+ años que todas mis páginas no pueden ser indexadas. Estoy olvidándome de algo?
R: Uno de los clásicas estrategias del escaneo (crawling) de Google es usar el valor del PageRank de tus páginas. Solamente porque tu sitio tiene un par de años (o por que has enviado un sitemap), no significa que automáticamente todas las páginas de tu sitio serán escaneadas. En general, obteniendo enlaces buenos y de calidad nos ayudaría probablemente a escanear tu sitio mas profundamente. Tu deberías mirar las URLs que hasta ahora no han sido indexadas. Talvez tienen parámetros (nosotros preferimos URLs con 1-2 parámetros)? Existe un archivo robots.txt. Es posible fácilmente alcanzar URLs no indexadas siguiendo enlaces estáticos de texto (no Flash, JavaScripts, cookies, frames, etc. tienes algo así?). Esto seria lo que recomendaría controlar.

P: Cuándo modifico robots.txt para excluir archivos que han sido escaneados, cuanto tiempo toma hasta que estos sean borrados del índice? Tal vez la respuesta depende del PR del sitio y de la frecuencia del escaneo?
A: Esta en función a la frecuencia con la cual es sitio es escaneado. Yo creo que en el pasado, cada escaneo de varios de cientos de páginas o tras varios días, el bot chequea nuevamente robots.txt. Cabe mencionar que para los resultados suplementarios, debes re-escanar para saber que ha sucedido con esas páginas para que el robots.txt haga efecto en esas páginas. Si estas seguro que quieres que esas páginas no aparezcan mas, puedes usar la herramienta para borrar URLs por seis meses. Pero yo seria muy cuidadoso con esta herramienta, a no ser que seas experto. Si es que cometes un error (por ejemplo) y borras todo el sitio, esta es tu responsabilidad. Algunas veces Google puede revertir esto, pero no lo garantizamos.

P: Yo quisiera buscar por código HTML y observar como se posiciona
R: Yo también quisiera. Indexar partes invisibles como puntuación, JavScript, HTML seria grandioso, pero abultaría el tamaño del índice. Cada vez que consideras una nueva característica (por ejemplo la numeración de los resultados) tienes que valorar el costo de tener un índice mas grande con el beneficio de esta funcionalidad. Creo que no ofreceríamos algo así en un futuro próximo.

(Preguntas y respuestas sin mucha relevancia)

P: Si alguien ofrece vender espacio en su sitio (o considera comprar en otro) seria una buena idea de colocar la etiqueta NOFOLLOW para generar trafico por los anuncios y no aparentar una venta de enlaces para manipular el PR?
R: Si, si vendes enlaces, deberías marcarlos con la etiqueta nofollow. El no hacerlo puede afectar tu reputación en Google.

P: En sitios dirigidos a publico internacional con el mismo contenido (con alta calidad) en diferentes idiomas, es mejor usar varios TLDs como mydomain.com, mydomain.de, mydomain.fr, etc. o en subdominios como en.mydomain.eu, de.mydomain.eu, fr.mydomain.eu, o algo así mydomain.com/en, mydomain.com/de, mydomain.com/fr?
R: Buena pregunta. Si solo tienes un pequeño numero de páginas, yo comenzaría con los subdominios, p.e. de.mydomain.eu o de.mydomain.com Después de que has desarrollado una sustanciosa presencia o una gran cantidad de páginas en cada idioma, haría sentido de desarrollar en dominios separados.

P: Algunos resultados por qué dominios IDN no muestran PageRank?
R: He visto también algunas veces esto también, pero lo voy a revisar. Pienso que hay un problema de normalización en algún lugar de la cadena (pathway) de la barra del PageRank.

P: Será posible de adicionar un rango de fechas a las búsquedas? Yo obtendría 91,000.000 resultados, pero los primeros 200 tendrían 2-3 años de antigüedad. Desearía limitar los resultados a no más de 6-12 meses
R: Revisa la opción de busquedas avanzadas. Tara Calashian hizo cosas interesantes sobre esto. Google Hacks es un lindo libro que puedes leer para esto.

P: Que hay acerca del problema de comparación de directorios y shops con spam que sobre escribe páginas reales?
A: Fair Feedback. Lo mismo he escuchado últimamente de un Googler también. Algunas veces pensamos sobre el spam estrictamente como texto oculto, cloacking, etc. Pero los usuarios piensan sobre spam como ruido: Cosas que ellos no desean. Si ellos están tratando de obtener información, solucionar un problema, leer artículos, etc. entonces estos sitios no son de ayuda.

P: Esta planeando visitar/hablar en el Reino Unido en un futuro próximo?
R: Lamentablemente, no. Solo puedo asistir a 4-5 conferencias al año.

P: Una de las cosas que interesa a la gente es cuales son las intenciones Post Bigdaddy? Arreglos (fixes), temas de spam. regeneración de indices puros, resultados suplementarios, actualización de PR, BL, etc.
A: No puedo dar un cronograma (por ejemplo, escalar la comunicación en Abril, mas trabajos en canónicas en Mayo) porque las prioridades puede cambiar, especialmente por aspectos de las maquinas, propagación de nuevos binarios, desarrollo del webspam, etc. A corto plazo no me sorprendería de ver pronto un cambio en los resultados suplementarios y PageRank visibles diferentes en las próximas semanas.

(Preguntas y respuestas sin relevancia)

AdBlackList presenta una lista de sitios hechos solo para AdSense

Como informa Search Engine Watch, el sitio AdBlackList.com se ha dedicado a construir una base de datos con todas las páginas que se han creado solamente para colocar anuncios de AdSense y así obtener ganancias. Este tipo de páginas se las llama en ingles MFA (Made for AdSense).

Generalmente estas páginas a su vez anuncian en Google AdWords para generar una gran cantidad de visitas que hagan clic en sus anuncios. Por este motivo estos anuncios no generan muchos ingresos cuando son publicados en las páginas de un asociado a Google AdSense.

Usando la lista de AdBlackList.com se pueden bloquear esos anuncios en la propia página web para evitar un bajo rendimiento en AdSense.

Matt Cutts dispuesto a responder preguntas de los SEO’s

Matt ha escrito una nota en la cual menciona que esta dispuesto a responder “preguntas generales de los SEO’s”. Por el momento esta recibiendo las preguntas. Hasta el momento ya se han juntado una infinidad de preguntas J

Lo interesante es que Matt dice que estaría dispuesto a responder preguntas como las siguientes:

Examples of fine questions include:
– Is Bigdaddy fully deployed?
– What’s the story on the Mozilla Googlebot? Is that what Bigdaddy sends out?
– Any new word on sites that were showing more supplemental results?
– Is the RK parameter turned off, or should we expect to see it again?
– What’s an RK parameter?

Solamente las respuestas a este ejemplo de preguntas podrían aclarar muchas de las incógnitas que momentáneamente están confundiendo y preocupando a los SEO’s.

A medida que Matt vaya respondiendo las preguntas, las voy a informar y comentar en mi blog…

WMW da oficialmente por concluido a Big Daddy

Uno de los foreros de WMW que se ha especializado en el análisis y rastreo de los diferentes data centers (DC’s) de Google, ha dado hoy día por concluido a Big Daddy. Reseller, informa que todos los DC’s ya tienen los datos de Big Daddy.


Ladies and Gentelmen…Please Welcome The New Google

Hi Folks!

New Google infrastructure calls for new way of thinking regarding our sites indexing and ranking. I said it before..nothing will be the same on Google from now on.

I know, many kind fellow members finding it hard to understand whats happening. «Classic» explanations for current situations would bring us anywhere. If you notice changes on the DCs, try to look for «fresh» analysis and understanding.

And don’t expect «The Kentuckian» or GoogleGuy to tell us the whole story. There are things in any company that employees can’t tell «outsiders» about. We should understand and respect our good friends at the plex situations.

Wish you all a great day.. high ranking and more pages indexing on The Mother of All Search Engines…Google 😉

Reseller da la bienvenida a una nueva era de Google, en la cual nada será igual a lo que se conocía antes.

Debido a esta nueva estructura (se rumorea que se han instalado nuevos servidores con procesadores de 64 Bits, así como cambios en la estructura de las bases de datos), Google posiblemente cambiará totalmente su forma de trabajo, especialmente en lo que se refiere a todos los tipos de actualizaciones (backlinks, pagerank, ranking, etc.), de modo que los usuarios no percibirán estas actualizaciones, ya que se podrían realizar dinámicamente, es decir en linea y no por propagación de DC en DC.

Adicionalmente, los algoritmos para calcular el índice trabajaran desde ahora de forma diferente, lo cual hace que todos los métodos y teorías sobre el posicionamiento que se habían desarrollado en los últimos años, ya no tendrán validez…

Comienza la verdadera actualización del PageRank en los próximos días?

Las variaciones en el PageRank que comenzaron a observarse desde el 18.02.2006 no se las puede considerar como una actualización del PageeRank ya que hasta ahora no todos los data centers muestran los nuevos valores, como se puede apreciar en el siguiente diagrama mostrando el numero de data centers con el nuevo PR de 2 proyectos, medidos desde el 21.02.2006 hasta hoy día.


PageRank Dance

Posiblemente la propagación de Big Daddy y un intento paralelo de actualización del PR tuvo que ser suspendido por los ingenieros de Google.

Hoy día, Matt Cutts escribe en un comentario en su blog lo siguiente:

Um, now that Bigdaddy is almost done rolling out, I think you’re more likely to see a PR update soon. After the Boston pubcon, I don’t plan to hit any search engine conferences until San Jose.

Y como ya conocemos a Matt, este comentario tiene un mensaje interesante entre sus líneas.

También hoy día, y como arte de magia, el valor RK que muestra uno de los interfaces de Google, y que ha sido interpretado como el PageRank actual (live) o también conocido como el futuro PR, muestra 0 en casi todos los data centers y para todos los sitios.

Aquí existen en principio 2 teorías:

  1. Google ha resetado este valor para hacer nuevamente un calculo sobre la base del nuevo índice de Big Daddy y es verdaderamente el inicio de una actualización del PR.
  2. Esta interfaz de Google, que mostraba el PR actual o interno del buscador, ha sido muy comentada en varios foros, especialmente en WMW. Por eso han aparecido una infinidad de tools que muestran este valor hasta en 78 DC’s. Debido a esto, Google a decidido, no mostrar mas este valor para despistar una vez más a los SEO’s.

Ya que este era un valor que solamente se observaba mediante una interfaz interna de Google y que no tiene ningún efecto en sus usuarios, posiblemente ya no vamos a ver más el PageRank actual, y en el futuro tendremos que orientarnos en los oráculos para saber cual será el nuevo PR de nuestros sitios 🙂

Google Reader presenta función para compartir y publicar feeds

Hoy día, Google Reader en su blog oficial anuncia la nueva función Share (compartir).

Y efectivamente, esta nueva función aparece como una nueva etiqueta en el Google Reader.

Mediante esta nueva función se puede compartir feeds (sindicaciones) con otros usuarios. Para esto simplemente se precisa enviar un email a la persona con la cual quieres compartir el feed.

Pero la función más interesante para los webmasters es la posibilidad de incluir los feeds en las propias páginas. Para esto solo es preciso elegir la etiqueta, y algunos parámetros para el layout.


Google Reader Share

Luego solamente se debe copiar el código en JavaScript y pegarlo a la web, como se puede apreciar en la siguiente imagen:

Google Reader Share en una página web
Google Reader Share en una página web

Inicialmente todo estaba funcionando muy bien y rápido, pero como parece que ya se corrió la voz, el servidor de Google que genera el código HTML se esta poniendo lento. Bueno, ya estamos acostumbrados a esto: Seguramente, muy pronto van a desactivar la función para nuevos feeds 🙂

El nuevo servicio financiero de Google ya esta integrado en el buscador

El nuevo servicio Google Finance (como siempre en beta) que se ha presentado hoy, ya esta completamente integrado en el buscador. Solo se necesita escribir el código de la acción y como resultado aparecen los datos en tiempo real, como se puede apreciar en la siguiente imagen:


Google Finance

El servicio de Google Finance muestra varios datos interesantes sobre las acciones (datos sobre la empresa, noticias relacionadas a las acciones, y una serie de gráficos), pero según los expertos esta dirigida mas a usuarios y accionistas que nos son profesionales, y le falta bastante para poder competir con los servicios de Yahoo!


Google Finance

BigDaddy ya esta finalizando?

Los asiduos observadores de los diferentes Data Centers de Google en el foro WMW mencionan hoy que casi el 95% de los DC’s ya esta mostrando los resultados de BiggDady.

Eso significaría que poco a poco finalmente vamos a tener claridad con respecto a lo que Google ha estado realizando estos 2 últimos dos meses. Ya que después de que todos los DC’s tengan datos sincronizados, los resultados en el índice volverán a ser nuevamente estables, y también el PageRank no oscilará como en las ultimas semanas.

También cabe mencionar un comentario de Matt en su blog, respondiendo a la siguiente pregunta:

I see BigDaddy roll out very fast and there are only few non-BigDaddy DCs left . What should we expect to see after BigDaddy is deployed on all the DCs?

– PR/Back link update?
– Algos update?
– both?
– attempt to resolving canonical issues?
– attempt to resolving supplemental issues?

Harith, I can’t promise what we’ll do in the future, but things like a PR update seem doable after Bigdaddy is done. And all of the things you mentioned are things that I would like us to tackle down the road.

Esta respuesta da mucho que pensar, ya que es bien conocido que Matt siempre envia un mensaje entre las lineas de sus comentarios. Según esto, la actualización del PR y los backlinks que se cruzó con BigDaddy parecería ser un tema que no se ha podido concluir y quedo a medias.

Posiblemente, y luego que BigDaddy concluya, veremos en las proximas semanas una nueva, o mejor dicho la verdadera actualización de los backlinks y el PR desde más de 5 meses.

Y bueno, los problemas que todavía no pudieron ser solucionados, urls canonicas y resultados suplementarios, quedarán aun pendientas…

Joga – La red social de Google y Nike para el mundial

Ya es conocido que Google es un especialista en aprovechar la coyuntura en muchos de los temas que hacen noticia mundial, como por ejemplo los deportes: Para las olimpiadas de Invierno en Turín 2006 Google diseño logos alusivos en su buscador, presento videos especiales en Google Video (que no se pudieron ver en muchos países del mundo) y mejoró la resolución de sus fotos satelitales para la región de Turín en su servicio Google Maps.

Ahora, a menos de 3 meses del inicio de la Copa Mundial de Fútbol 2006, Google ya comienza a mostrar todo lo ha preparado.

Hace unos días presento conjuntamente con Nike joga, una red social para los fanáticos del Fútbol. La inscripción funciona solo por invitación, y parece que el sistema es muy similar a Orkut.


Joga - La Reds social de Google y Nike

Ya que aun no tengo una invitación, no he podido probar Joga… Seguramente, en los próximos días ya van a comenzar a circular las invitaciones por la red.

Robot se registra automáticamente en miles de foros phpBB

Desde hace unas dos semanas un robot se esta registrando en miles de foros con el nombre FuntKlakow Con esta búsqueda ya se puede observar que también en muchos foros en español este usuario ya aparece registrado.

Por el momento este usuario ha estado colocando mensajes esporádicos, con textos como «Wow, that is cool!», «I agree with you completely» o «Ditto». Algunas veces coloca propaganda en su signatura.

Por el momento, los expertos no están muy de acuerdo con la función de este robot. Algún opinan que simplemente se trata de un robot para hacer spam con publicidad, mientras que otros piensan que se trata de la preparación de algún ataque masivo a los foros con phpBB, que posiblemente usaría una vulnerabilidad aun desconocida que precisa de la cuenta de un usuario.

De todas maneras, esto se debe tomar como una advertencia para todos los webmasters de foros, ya que los estragos que causo un gusano a fines del 2004 ya son bien conocidos.

La mejor manera de evitar la inscripción de FuntKlakow en los foros es deshabilitar este nombre como usuario (Disallow Names) y/o también activar la opción de confirmación de la inscripción por Email. De esta manera se puede proteger a los foros de algún posible ataque que pueda ocurrir en los próximos días.

Via heise security