Archivo por meses: febrero 2007

Como combatir el plagio

Hace varios meses descubrí casualmente que una web española había plagiado uno de mis artículos (ver Cómo ganar con AdSense mediante artículos ajenos, Y el plagio continua…, hilo similar en meneame). Luego de enviar un email a la ‘responsable’ de la web, mi artículo fue retirado y copiado en otra web. Pero la bien conocida señora creo a su manera (nicks, emails, IPs falsos) una gran polémica en los comentarios de mi blog para evitar el desprestigio de su red de proyectos de plagio.

Casualmente (ya que esa web esta baneada de mis favoritos), hace unas semanas encontré nuevamente en Google un enlace a la página que había sido retirada meses atrás, y para mi sorpresa estaba mejor posicionada que mi propio artículo para varias frases relacionadas al tema.

Nuevamente envié un email a la mencionada señora para que retirase mis artículos de sus webs, pero esta vez ni se digno en contestar.

Después de consultar a algunos amigos abogados en España, me informaron que las leyes españolas actualmente no pueden hacer mucho en este tipo de situaciones. Por el contrario, por ejemplo las leyes alemanas sobre temas de Internet y de derechos de autoría de contenidos en Internet, ya estas más avanzadas.

Con esta situación, me puse a pensar de cual sería la mejor solución para evitar este tipo plagio y la respuesta fue rápida: Evitar que este tipo de redes y webs obtengan tráfico. Si es que estas páginas no se pueden posicionar bien en los buscadores, entonces el negocio generado por AdSense con artículos copiados, ya no será tan rentable y estas personas pronto perderán el interés de hacerse de la propiedad ajena.

Con esta motivación, comencé un experimento: Posicionar mi artículo! Con un poco de trabajo SEO conseguí fácilmente obtener mejores posiciones que el articulo falso en unas poca semanas.

Ahora, mi artículo aparece en las primeras búsquedas para diferentes frases y ha desplazado a la página plagiadora, como lo demuestran estas imágenes:

Resultados del 28 de Enero de 2007

Resultados en el buscador de Google del 28 de Enero de 2007

Resultados en el buscado de Google del 07 de Febrero de 2007

Resultados en el buscador de Google del 07de Febrero de 2007

Y aunque este ejemplo solo es una pequeña prueba de como combatir este tipo de webs, si todos los damnificados logran posicionar sus artículos por encima de los plagiados, los usuarios que buscan información en los motores de búsqueda, siempre encontrarán primero al artículo original. Y por consecuencia, esto causará la caída dramática del trafico de estas webs.

Y para finalizar algunos consejos más para evitar el auge de las redes de webs plagiadoras.

  • No enlazar naturalmente a ninguna de las páginas de estas webs
  • No realizar intercambio de enlaces
  • Divulgar en foros, blog, y otros medios de comunicación el modo de trabajo de estas webs y siempre mencionar que el fin de este modelo es simplemente conseguir ganancias con los avisos contextuales como AdSense en contenidos robados.

Espero que todos los afectados se puedan unir para luchar contra este tipo de plagio.

Sobre la localización de los resultados del buscador de Google

Hace más o menos un año atrás Google comenzo cambiar su infraestructura de servidores para su servicio de búsqueda. Este emprendimiento fue bautizado con el nombre de Bigdaddy. Según algunos de los ingenieros de Google, esta nueva infraestructura permitiría mejorar considerablemente la calidad de los resultados y la flexibilidad del buscador.

Antes de Bigdaddy, el conjunto de data centers (DCs) de Google, es decir el conjunto de servidores con bases de datos que tiene Google repartidos por el mundo, contenían el mismo índice, es decir para una búsqueda dada desde una computadora en cualquier parte del mundo, se mostraba siempre el mismo resultado.

El único efecto que irritaba a los webmasters era el llamado Google Dancing, que ocurría periódicamente cuando los ingenieros de Google calculaban nuevamente el índice y los datos eran propagados poco a poco a todos los DCs. Esta propagación de datos duraba generalmente algunos días, y en este tiempo los resultados de las búsquedas ‘bailaban’ continuamente. Luego de la completa propagación de los datos, el índice volvía a la calma y era absoluto para todos los usuarios de nuestro planeta.

Con la implementación de la nueva infraestructura, que recién concluyo en Septiembre/Octubre del año pasado, los resultados del buscador se han vuelto completamente relativos y dependientes de muchos factores.

Entre estos factores se pueden contar:

  • La forma de actualización del índice ha variado completamente, las pequeñas variaciones, también llamadas data push, son inyectadas en cada uno de los DCs casi diariamente. Es decir, páginas nuevas, páginas que han mejorado su popularidad, etc. se posicionan en los nuevos lugares y desplazan a las otras. Este es uno de los motivos por el cual, ahora los webmasters siempre ven bajar y subir sus páginas en algunas posiciones.
  • Ya que la propagación de datos es casi continua, ya no existe un momento en el tiempo t en el cual todos los DCs contengan el mismo índice. Ahora todo siempre esta fluctuando, y eso también lo pueden percibir tanto los usuarios como los webmasters.
  • Otro aspecto que ahora también juega un rol muy importante en los resultados que muestra el buscador de Google es la localización geografica del usuario. Por ejemplo, si un usuario en España hace una búsqueda especifica con el parámetro ‘buscar en la web’, obtendrá resultados diferentes a los de un usuario que hace la misma búsqueda en México. Parece ser que la nueva infraestructura contiene filtros que consideran la posición geográfica del usuario, información que se puede se puede obtener por el IP de su computadora.
  • Finalmente, parece que también existen otros filtros que se aplican cuando se usa un buscador especifico a un país, independientemente del DC que procese la búsqueda. Un ejemplo de esta situación se puede observar en la siguiente imagen:Resultados de Google por países

    Por ejemplo, para una búsqueda muy competitiva una página web puede aparecer en google.es en la posición 248, en google.com.ar en la posición 187 o en google.com.bo en la posición 3. Aquí se debe mencionar que en todos los casos el numero de páginas indexadas es casi igual. Y en dos de los casos, el DC que ha procesado la búsqueda ha sido el mismo. La única explicación para esta gran diferencia en los resultados es que la página web en cuestión tiende a contener más temas del país donde aparece en las primeras posiciones.

Todo esto nos muestra que de ahora en adelante va ha ser mucho mas difícil posicionar una web en el mismo idioma para diferentes países.

Aunque también se debe mencionar que webs que tienen mucha autoridad en un tema especifico, alcanzan buenas posiciones en todos los buscadores de los diferentes países y no fluctúan en sus posiciones por las inyecciones de datos diarios. Un ejemplo de esta situación se puede observar en la siguiente imagen:
Resulatos de Google por paises para una página con autoridad

Nota: las imágenes se han realizado con la siguiente herramienta: Google Ranking por país.

Novedades en algunos productos de Google

Como ya es costumbre, los ingenierios de Google no descansan y de quantum en quantum hacen mejoras en sus diferentes productos. Hoy día tenemos:

Gmail para todos
Desde hoy día ya es posible inscribirse al servicio de email de Google Gmail directamente y sin la necesidad de tener una invitación.

Google Docs en Español
Como ya es bien conocido, Google esta tratando de imponerse con diferentes servicios en linea para tratar de romper la supremacía de Microft Office. El paquete de Google ya tiene un calendario (Google Calender) y Google Docs & Spreadsheets. Hoy día, Google ha incorporado nuevos idiomas idiomas a este servicio (Frances, italiano, Alemán, Español, chino tradicional, chino simplificado, coreano, turco, polaco, holandes y portugués brasileño). Mas informaciones en el blog oficial de Google.

Google Docs en varios idiomas

Finalmente Google muestra los backlinks correctamente

Ayer, la noticia más importante fue la presentación de la función de los links en Google Webmaster Tools (pestaña links).

El blog oficial de Google Webmaster Central da más detalles sobre como usar esa nueva herramienta para los webmasters.

En principio existen 2 funciones:

External Links
Esta función muestra una lista de páginas de una web y las páginas externas, es decir de otras webs que las enlazan.

Internal Links
Esta función muestra una lista de páginas de una web y las páginas internas que las enlazan.

En el blog de Google se menciona que estos datos no muestran el 100% de todos los enlaces, pero de todas maneras es mucho más fiable que la función link: del buscador. Cada registo tiene una fecha de descubrimiento o actualización, lo que permite conocer cuando Google ha encontrado a cada uno de los enlaces.

Ambas funciones permiten descargar todos los datos en el formato csv.

Es muy interesante analizar todos estos datos, ya que por ejemplo he encontrado enlaces que apuntan a mis webs que no conocía. También es muy interesante analizar qué páginas internas reciben mas enlaces, etc.

Con seguridad, esta nueva herramienta de Google va ha ayudar a los webmasters a demostrar y/o revocar muchas de las teorías que que habían construido alrededor de los backlinks. Por el momento, estos datos deben ser analizados cuidadosamente para poder sacar conclusiones.

Actualización
Cuando estaba escribiendo esta nota, ya tenia algunos problemas al ingresar a las páginas de esta herramienta. Ahora veo que la pestaña link ha desaparecido. Posiblemente el ataque de los webmasters ha hecho colapsar los servidores de Google, como ya ocurrió por ejemplo luego del lanzamiento de Google Analytics.

Otro de los motivos para la desaparición repentina es un bug que permitia ver los enlaces de cualquier web, cambiando solamente en la URL la página propia con una página de la competencia.

Actualización
Una interesante discusión sobre el tema en el blog de Matt Cutts.

pidiendo por ejemplo mostrar marcados los enlaces con con el atributo nofollow. Según Matt no todos los enlaces que se muestran con esta nueva herramienta tiene ‘peso’, es decir que no cuentan para la valoración de la popularidad de una página web.

Dos años después del lanzamiento de Microsoft Search Live

Microsoft Live Search

Ya hacen 2 años desde el pomposo lanzamiento del nuevo buscador de Microsoft, Search Live (ver historia de los buscadores, MSN ya redirecciona a Live Search) y todavía no han logrado dar batalla a Google como fue pronosticado por Steve Ballmer, el CEO de Microsoft.

Por el contrario, desde que MSN esta usando Live Search la penetración de mercado del buscador ha caído considerablemente.

Justamente son los webmasters los que primero notan que el tráfico que genera Live Search hacia las web, no es considerable. Hasta resultados en las primeras posiciones no logran generan visitas considerables en las webs. Esto muestra, que por lo menos en los países hispano parlantes, Search Live no juega un rol protagonico en el mercado de los buscadores.

Por ejemplo, en la siguiente imagen se puede apreciar el origen de las visitas de uno de mis proyectos durante el año 2006.

Visitas de Search Live

Mientras que desde Google se obtuvieron el 64.37% y de Yahoo el 12.95% de las visitas, Live Search (aka MSN) generó solamente 1.83% del total de las visitas.

Justamente en WMW se esta discutiendo sobre el tema.

Visto en Seo Roundtable

Actualización de la herramienta del Google Ranking

Hace ya algún tiempo he escrito un artículo sobre la estabilidad del Google Ranking en los diferentes data centers (DCs).

En base a los resultados de este artículo he creado una herramienta que calcula la estabilidad de una página web para una frase dada en diferentes DCs. Adicionalmente, también he creado otra herramienta que muestra el Google Ranking en diferentes data centers.

Debido a una discusión y algunas sugerencias de los foreros de xeoweb he realizado algunas mejoras a esta herramienta:

  • El numero de los data centers analizados ha sido elevado a 40
  • Ahora la herramienta muestra hasta las primeras 400 posiciones

La siguiente imagen muestra un ejemplo de los resultados en varios data centers:

Los nuevos resultados de la herramienta del Google Ranking

Espero que les sea de utilidad, y si es que tienen sugerencias cosntructivas, las pueden dejar aquí.

Keyword Discovery – otra herramienta para generar palabras clave

Hace unos días presente Wordtraker – Keywords como un remplazo a la herramienta de Yahoo! (antes Overture) que dejo de funcionar hace unos días y nuevamente esta operativa.

La desventaja de las herramientas anteriormente mencionadas es que se basan en un solo motor de búsqueda en ingles, mientras Keyword Discovery se basa, según lo informan, en mas de 180 motores de búsqueda a nivel mundial.

Pero lamentablemente, tampoco genera resultados fiables para búsquedas en Español. Como ejemplo he tomado la palabra vuelos. Los resultados con Keyword Discovery se pueden observar en la siguiente imagen:

Keyword Discovery

Mientras que Free Keyword Tracker muestra para la misma búsqueda los siguientes resultados:

Free Keyword Tracker

Ahora bien, si comparamos las palabras claves vuelos, vuelos baratos, y ofertas vuelos en Google Trends obtenemos el siguiente gráfico:

Vuelos en Google Trends

Esto nos muestra claramente que los resultados de Keyword Discovery, por lo menos en español, no son fiables, a pesar de que mencionan que usan mas de 180 motores de búsqueda para recolectar sus datos y eso durante todo un año.

Lamentablemente hasta ahora no se cuenta con una herramienta fiable para analizar y sugerir palabras claves en español…

Vulnerabilidad – Windows Vista puede ser controlado con la voz desde una web

Windows Vista esta a la venta al publico en general desde hace solamente 2 días y ya ha aparecido una vulnerabilidad del nuevo sistema operativo de Microsoft. Aunque realmente se debe mencionar que se trata de una nueva forma de vulnerabilidad muy sutil 🙂

Windows Vista tiene un sistema de reconocimiento de voz, y cuando se abre una página web preparada que arranca un archivo de audio con comandos para la computadora, esta podría ser controlada desde la Internet.

Para este fin, el archivo tiene que ser reproducido por los parlantes de la computadora y al mismo tiempo tiene que ser interpretado por el sistema de reconocimiento de voz mediante el micrófono.

Es una situación bastante inusual, y seguramente el usuario se diaria cuenta de inmediato, si al navegar por una web escucha comandos para su computadora 🙂

Otro aspecto que hace difícil el funcionamiento práctico de esta vulnerabilidad es que el sistema de reconocimiento de voz todavía no esta completamente desarrolado y tiene que ser entrenado, por lo que solo reconocería la voz de su usuario.

De todas maneras, es una nueva forma novedosa de posibles vulnerabilidades a nuestros sistemas informáticos.

Aunque Microsoft anunció que este tipo de ataque es muy improbable, ha aconsejado desactivar el control de voz o el microfono cuando la computadora se encuentra sola.

Via heise online