Archivo por meses: enero 2006

Llueven las criticas a Google después de aceptar censura China

Luego de que ayer Google acepto la censura del gobierno chino para poder operar sus servidores de búsqueda en territorio chino, ha habido una avalancha de criticas.

Como este tema esta siendo comentado por todos lados, solo les paso una lista de blogs y artículos interesantes sobre el tema:

Sergey Brin on China Censorship

Estudiantes en contra de Google

Selbstzensur in China: Google wird böse (en alemán)

Lo más importante de toda discusión va a ser el efecto que va a tener la censura china y el conflicto con el gobierno norte americano a los datos económicos de Google que serán publicados a fines de Enero.

Actualización (27.01.2006)
Google responde a las criticas
Bill Gates defiende negocios en China

Como mejorar y monitorear el rendimiento de MySQL

1. Introducción
Hace unos días recibí un email de mi proveedor de hosting, indicándome que uno de mis proyectos estaba consumiendo una gran parte de los recursos del servidor de la base de datos, que comparto con otros clientes.

Bueno, uno de los motivos era que gracias a mi trabajo de posicionamiento en Google, el trafico de este proyecto había aumentado considerablemente.

Debido al aumento del numero de transacciones, recién salió a luz que alguna componente del proyecto no estaba funcionando bien.

Pero como saber que era lo que estaba sucediendo en el servidor?

2. Monitoreo
Una forma de investigar lo que estaba sucediendo en el servidor era colocar mensajes de Debug, pero en un sistema que esta en producción, o como ahora se acostumbra a decir live, no era posible.

La única forma era entonces monitorear directamente la base de datos de MySQL para encontrar el origen del problema.

Buscando un poco en la red, encontré en el blog de Ajaxian la herramienta que estaba necesitando. Un monitor de MySQL en Ajax (AjaxMyTop) que muestra periódicamente el estado actual de todas las conexiones a una base de datos. Es una herramienta muy sencilla que recién se esta comenzando a desarrollar (versión 0.1) pero que tiene un gran futuro.


MySQL Monitor
3. Análisis
Revisando los resultados del monitor, pude descubrir 2 casos interesantes:

  1. Cuando los usuarios accesaban a algunas páginas (justamente aquellas que están en las primeras posiciones de Google), no todas las conexiones a la base de datos se cerraban al terminar el proceso del web server.De esta manera, en muy corto tiempo, el número de conexiones abiertas crecía rápidamente antes de que los timeouts del servidor pudiesen actuar. En las horas pico, el servidor tenia unas 4000 pageviews por hora, es decir unos 66 pageviews por segundo.
  2. Cuando las páginas del proyecto, que estaban ahora en las primeras posiciones de Google eran accesadas, se podía observar en el monitor que el número de conexiones a la base de datos aumentaba desmesuradamente. En las horas pico, esto causaba que mi proyecto consumiera una gran parte de los recursos del servidor de la base de datos.

4. Solución
En el caso 1. el problema estaba claro: En algún lugar del código yo no había cerrado la conexión a la base de datos. Este error fue resuelto rápidamente.

El caso 2. era más difícil de resolver. Aquí no me quedo mas que realizar pruebas en mi sistema local, colocando mensajes de Debug en una de las páginas que era mas accesada por los usuarios.

Después de un análisis profundo de todos los accesos a la base de datos, me di cuenta que la programación con objetos y a alto nivel puede ser en algunos casos muy peligrosa: En muchos lugares del código de PHP usaba funciones de una clase, que al parecer sencillas de usar, realizaban cada vez conexiones a la base de datos. De esta manera cada acceso a esta página web generaba 33 conexiones a la base de datos. Esto significaba unas 2178 conexiones a la DB por segundo en las horas pico.

La solución a este problema fue obtener los datos que se necesitan de la DB al inicio y colocarlos en una variable global para que puedan ser usada posteriormente por la clase anteriormente mencionada. De esta manera se pudo reducir el número de las conexiones a la DB en mas de un 60%.

5. Recomendaciones
Como conclusión de esta experiencia, que fue causada por haber logrado una de mis metas: Aumentar el trafico en uno de mis proyectos, puedo dar las siguientes recomendaciones para webs de alto trafico:

1. Las conexiones a la base de datos deben ser lo mas cortas posible. Se debe evitar llamar a otras funciones que no sean accesos a la base de datos durante una conexión:

– Abrir conexion a la DB ( mysql_connect() , mysql_select_db())
– Ejecutar query ( mysql_query() )
– Cerrar conexión de inmediato (mysql_close() )

2. En caso de que se necesiten datos de un registro o varios registros de la DB en diferentes partes de la página, se debe crear una variable global, obtener los datos desde la DB al inicio y luego usar solamente la variable global.

3. Durante el desarrollo de las páginas web se debe revisar continuamente los recursos que se usan al llamar las diferentes funciones.

4. Hacer pruebas de carga generando un trafico artificial. Esto se puede realizar con un pequeño script en PHP que escanee con alta frequencia la página a testear. Parlamente se puede analizar con un monitor el rendimiento de la base de datos y del mismo web server.

Artículos relacionados
Monitorear MySQL
Rendimiento en MySQL

Como usan los webmasters el HTML?

El blog de Google Code presenta hoy día un estudio sobre la forma que usan los desarrolladores de páginas WEB el HTML. Este estudio se basa en el análisis de 1 billón de documentos. Los resultados de este estudio se los puede leer aquí.

Lamentablemente la forma en que han presentado los resultados no es muy amigable (las gráficas no son de buena calidad y no son informativas), lo cual no permite obtener conclusiones de valor.

Yo estoy seguro que si los datos que se han obtenido en este estudio hubiesen sido elaborados de otra manera, los resultados hubiesen sido de mucho valor para los webmasters.

Interesantes formas de conseguir enlaces

Aquí les presento una pequeña lista de artículos muy interesantes y actuales sobre el tema de los enlaces:

SEO Advice: linkbait and linkbaiting

Use Link Bait to Catch Better Rankings

Search Engine Roundtable forum

If You Don’t Build Links You are Not a Real SEO (actualizado 26.01.2006)

Should I Avoid Link Exchange / Link Trading Hubs? (actualizado 26.01.2006)

Via Internetmarketing-News.de en Alemán

Del articulo de Matt me ha impresionado mucho esta nueva aplicación/herramienta para generar rápidamente aplicaciones WEB para comunidades sociales, Ning.

Entre las aplicaciones interesantes que se han generado con Ning se puede mencionar las siguientes:


Catalogo de restaurantes en Los Angeles con mapas
Catálogo de restaurantes en Los Angeles con mapas

Catálogo de DVDs
Catálogo de DVDs

Concurso de bellezas y celebridades femeninas
Concurso de bellezas y celebridades femeninas

Las bibliotecas estatales de Munich usarán RFID

La biblioteca de la ciudad de Munich será una de las primeras bibliotecas europeas que actualizará todo su sistema de préstamo de libros al sistema de RFID (Radio Frequency Identification).

Una empresa suiza instalará en las 25 bibliotecas estatales de Munich un sistema automático de préstamo y devolución de libros. Los usuarios, después de identificarse con una tarjeta RFID podrán sacar hasta 5 libros con las etiquetas RDIF en forma totalmente automática. La devolución también podrá ser realizada en forma automática en unos terminales especiales las 24 horas del día y también los fines de semana.

Se espera que el año 2009 todo el inventario de libros (unos 1,5 millones de ejemplares) de las bibliotecas de Munich quede completamente etiquetado con RFID.

Con esta media la ciudad de Munich espera ahorrar anualmente un monto de 1,5 millones de Euros.

Via heise.de

Este es un ejemplo mas de que la era de las etiquetas de identificación por radiofrecuencia ya esta en nuestras puertas.

Es interesante ver las cosas y blogs que estan apareciendo sobre este tema. Hace unos días encontre las instrucciones para construir una billetera anti RDIF en el blog de Dustin Kirk.


Billertera anti RFID
Billertera anti RFID

El top 10 de los países desde donde procede el email-spam

Este artículo de smh.com.au presenta una lista de los países de donde procede mayormente el spam:

1. Estados Unidos 24.5%
2. China (con Hong Kong) 22.3%
3. Corea del Sur 9.7%
4. Francia 5.0%
5. Canadá 3.0%
6. Brasil 2.6%
7. España 2.5%
8. Australia 2.4%
9. Taiwan 2.1%
10. Polonia 2.0%
10. Japón 2.0%
12. Alemania 1.8%

Cabe mencionar que esta lista muestra los países donde se encuentran los servidores o computadoras zombies, desde los cuales se origina el spam.

Interesante artículo sobre herramientas SEO

Philipp Lenssen ha publicado hoy día en su blog un artículo, escrito por Tadeusz Szewczyk, sobre algunas herramientas para monitorear las posición de páginas WEB en diferentes buscadores.

Las herramientas que se han analizado son todas programas para el Desktop. Además de mencionar el conocido Free Monitor For Google, describe los siguientes programas en forma detallada:

  • Advanced Web Ranking: No tiene una versión gratutia, solo una versión de prueba por 30 dias. Precio de la versión standard USD 59,00.
  • Web CEO: Tiene una versión gratuita limitada a 5 palabras clave. La versión SmallBiz cuesta USD 189,00.
  • SEO Studio: Tiene una versión gratuita y contiene un modulo para controlar el intercambio de enlaces.

El artículo concluye de que Advanced Web Ranking es la herramienta más recomendable para monitorear las posiciones en Google, y que según sean las necesidades del webmaster, como por ejemplo inscribir páginas automáticamente en buscadores y otros, también se puede usar las otras herramientas.

Google elegida como la marca más influyente en 2005

El jurado de la revista norte americana Brandchannel ha elegido a Google como la marca con mas influencia del año pasado. El jurado estaba compuesto por 2500 personas de 99 paises.

De esta manera Google le ha ganado el puesto a Apple que fue la ganadora en 2004. El tercer lugar lo ocupa Skype.


Mejores Marcas 2005 - Global
Mejores Marcas 2005 – Global
Google ya habia ocupado el primer lugar los años 2002 y 2003.

Según Brandchannel las innovaciones de Google el año pasando fueron entre otras Google Mini, Desktop Search, y Google Earth.

También dicen “se debería preguntar de que seria de la vida sin Google”, y mencionan que después de las páginas pornos, no ha habido ninguna cosa que haya infludo tanto en Internet.

Aquí los resultado para Europa y Africa


Mejores Marcas 2005 - Europa y Africa
Mejores Marcas 2005 – Europa y Africa
Y aquí los resultados para América Latina.


Mejores Marcas 2005 - America Latina
Mejores Marcas 2005 – América Latina
Lamentablemente no puedo asociar nada con la marca Corona… Hmm… Pero para que esta Google? (No solo para posicionarse, no? 🙂 ) … bueno parece ser una marca de cerveza mexicana.

Las aciones de Google cayeron este Viernes 8,5%

Las acciones de Google cayeron este viernes en forma estrepitosa en un 8,5% lo que significa una perdida de valor de nada menos que 11.000 millones de dólares.

Los analistas indican que esta caída se debería principalmente a que Google se ha negado a entregar al ministerio de Justicia de los Estados Unidos los registros de las búsquedas de una semana para palabras claves especiales (debido a la aprobación de una ley para la lucha contra la pornografía).

El valor total de las acciones de Google en la actualidad es de 118.000 millones de dólares, y la acción cerro el viernes en 399,46 dólares, lo que aun continua siendo mas del doble de su valor en Marzo 2005 (172,57 USD).

El valor total de las acciones de Google, a pesar de su caída, continua siendo inmenso, comparado con las de otras empresas como Ebay (63.000 millones), Yahoo (47.900 millones) Amazon (18.000 millones). Solamente empresas como IBM (128.000 mio.) o Microsoft (281.000 mio.) sobrepasan a Google.

Via heise.de

El futuro PR – Medición del 21.01.2006

Una de las armas más poderosas que tiene Google para mantener su supremacía en el mercado de los buscadores y mantener a raya a los spamers es la impredecibilidad.

Mientras todos esperaban la actualización del PR entre el 20 y 21 de Enero, siguiendo un ritmo periódico de 3 meses, todavía no ha pasado nada.

Ya existen blogs que están haciendo apuestas sobre la fecha de la actualización del PR y los webmasters están cada día más nerviosos esperando esta actualización.

Según mis observaciones, parece que Google ahora esta más concentrado en reorganizar su índice, y resolver los problemas de las URL’s canónicas y de las redirecciones 302 que de recalcular el PR que se muestra en la barrita verde.

Actualmente los data centers muestran resultados diferentes y todo parece todavía estar en borrador con la reorganización de bigdaddy.

En lo que se refiere al futuro PR, no ha habido grandes cambios desde la ultima medición. Se ha observado que el PR de algunas webs ha sido actualizado, pero la actualización general todavía no ha sucedido.

La medición para esta semana es la siguiente:


Medición del futuro PR - 21.01.2006

Herramienta de medición
searchengine Engine