Se ha lanzado a Google Code Search

Como lo anuncia Garett Rogers en su blog, Google acaba de lanzar una nueva herramienta de búsquedas: Google Code Search.


Google Code Search
Se trata de una herramienta para buscar código fuente en la red. Las búsquedas se pueden también hacer usando expresiones regulares.

Es una herramienta muy interesante para programadores que buscan código fuente para diferentes algoritmos, como muestra esta búsqueda para captcha solo en PHP.Más sobre el tema en el blog oficial de Google.

Novedades sobre el PageRank de Google

Después de que Matt Cutts de Google publico en su blog una entrada indicando que se se estaba realizando la actualización del PageRank, le llovieron una gran cantidad de preguntas sobre el tema.

Ahora las ha contestado en una nueva nota Mas Infos sobre el PageRank. A pesar de que son novedades que ya se conocían hace bastante tiempo, es muy bueno que sean ‘oficializadas’ de una vez por todas.

Entre los puntos más importantes se puede destacar:

El valor del PageRank se lo debería considerar como un numero float. El PageRank interno tiene más grados de resolución que de 0-10 como se muestra en la barra de herramientas.

Si a uno no le importa el PageRank y la página esta bien posesionada, entonces no hay por que preocuparse.

La mayoría de los data centers ya tiene la nueva infraestructura para las funciones info:, related:, link: y PageRank. Pero no seria sorprendente de que los otros DCs necesiten 1 a 2 meses para cambiar a esta nueva estructura.

Uno no se debería preocupar por la fecha del PageRank. En algún momento tomamos los PRs internos y los exportamos al PR visible de la barra de herramientas de Google. En vez de preocuparse por la fecha del PR y de los backlinks, es mejor analizar los logs del servidor y las palabras claves, para crear nuevo contenido pensando en mantener la atractividad de la web.

El PageRank se calcula continuamente. Existen maquinas en Google que toman datos y alimentan al algoritmo del PR. De esta manera en un momento dado, una URL siempre tiene un PR actualizado. De tiempo en tiempo este valor es exportado a lo que vemos en la barra de herramientas.

La exportación del PageRank no es ningun evento importante en Google, y ni siquiera sabia que se realiza cada 3-4 meses.

En el momento que se puede observar el PageRank en la barra de herramientas, estos valores ya han sido incorporados en los resultados del índice. Por ese motivo no se observan cambios en el Ranking al aparecer este nuevo PR.

Finalmente, en un comentario Matt dice:

Oy, enough PageRank questions! 🙂 My advice is not to obsess about PageRank too much; it is one of more than 100 different factors in how we score documents.

Finalmente arranca actualización del PageRank visible

Después de una larga espera, hoy día a comenzado la actualización del PageRang visible, es decir el valor de la barrita verde.

Con esta herramienta se puede observar la propagación del PageRank por los diferentes datacenters.

Actualización
Adicionalmente se ha iniciado una actulización de los backlinks.

Y GoogleGuy tenia razón 🙂

A fines del verano en el hemisferio norte habrán varios cambios en los data centers

Cómo posicionarse bien en otros países?

Esta es una pregunta que regularmente aparece en los diferentes foros de posicionamiento en buscadores.

Hoy día, Search Engine Roundtable resume un hilo del foro cre8asite con algunas recomendaciones de los participantes del foro.

Por ejemplo para posicionarse en Google Canadá, se deberían seguir los siguientes pasos:

  1. La web debería estar alojada en Canadá
  2. El dominio debería tener un top level domain (TLD) de Canadá
  3. Se deberían usar atributos canadienses en la web, como por ejemplo direcciones, números de teléfono, información meta, etc.
  4. Se debería conseguir enlaces de sitios canadienses

Muchas veces, a pesar de que la web no puede ser alojada en Canadá y tampoco no puede tener un TLD de Canadá, se la puede posicionar muy bien en Google Canadá, usando un TLD .com y sobre todo enlazándola con links de web canadienses con mucha autoridad.

Este ejemplo para Google Canadá se puede usar en forma análoga para el posicionamiento en Google España, Máxico, Argentina, etc.

Inyección SQL usando el buscador de Google

Michael Sutton presenta en su blog un interesante artículo sobre la inyección SQL en aplicaciones web.

Inyección SQL es una forma de vulnerabilidad que pueden tener aplicaciones web a nivel de base de datos. Este ataque en aplicaciones web puede ocurrir cuando se usan formularios web que interactuan con una base de datos. Mayores detalles en Wikipedia.

Michael Sutton presenta en su artículo un pequeño programa que usa búsquedas en Google para encontrar webs que sean posibles candidatos a este tipo de vulnerabilidad.

Siempre es muy importante que los webmasters controlen continuamente sus webs y hagan pruebas contra todo tipo de vulnerabilidades. A pesar de que esta tarea puede tomar bastante tiempo, siempre es mejor corregir cualquier problema con antelación y no lamentar luego las grandes pérdidas que pudieran causar un ataque de este tipo.

Via Philipp Lenssen

Google tiene el mayor numero de páginas muertas y obsoletas

Ziv Bar Yossef ha escrito un paper sobre un método para generar muestras de un motor de búsquedas usando el interfaz del usuario.

Este metodo permite realizar estudios por ejemplo sobre comparaciones del tamaño del índice entre los diferentes buscadores, la cantidad de spam o la actualidad del indice.

Ziv Bar Yossef ha usado su método para comparar entre los buscadores el numero de páginas muertas (paginas indexadas en el buscador pero que ya no existen en la red) y la actualidad de los resultados.

Según sus resultados, Google tiene en su índice el mayor número de páginas muertas y obsoletas. En este vídeo se puede ver la charla de Ziv Bar Yossef.

Via Google Operating System

Y el plagio continua…

Uno de mis lectores me ha informado que ha visto 2 de mis artículos en otra web. Lo más interesante del caso es que en el cache de Google del 22.09.2006 todavía no muestra a ninguno de mis artículos en la web como se puede observar en la siguiente imagen:


Cache de Google del 22.09.2006

En la portada de hoy ya se pueden observar los enlaces a los artículos:


Portada de la web del 24.09.2006

En este caso ni siquiera se han dado el trabajo de copiar las imágenes. Todas las imágenes las jalan de mi blog.

Parece que alguien esta muy interesado en calentar la polémica que he generado haciendo esta denuncia.

Para evitar que los Pepes falsos llenen nuevamente de comentarios fake mi blog, esta vez están cerrados 🙂

Cómo ganar con AdSense mediante artículos ajenos

Justamente hoy día cuando estaba analizando algunos referers a mi blog he encontrado en webtaller.com un artículo con el titulo ‘Sobre la estabilidad del Google Ranking’, que es una copia exacta de uno de mis artículos.

Como se puede observar en la siguiente imagen:


Articulos ajenos con AdSense
mi artículo esta tapizado de anuncios de AdSense, y al final aparece mi nombre y un enlace a mi página. Observando otros artículos publicados en esta web, veo que están armados de la misma forma.

Lo peor de todo es que nadie me ha pedido autorización para publicar mi artículo en esta página.

Esta web tiene actualmente 151.000 páginas indexadas en Google. Yo me pregunto cuantos de todos estos artículos han sido publicados con la autorización de sus autores?

Cómo se puede luchar en contra de este tipo de webs que usan artículos ajenos, sin autorización, obtienen buenas posiciones en el índice de Google y ganan un montón de dinero?


Trafico en Alexa

Tráfico en Alexa