Todas las entradas de: Max Glaser

Google ya no quiere jactarse de que es el mas grande

Según el ‘Spiegel Online’, una ejecutiva de Google, Marissa Mayer, informo que Google no dará mas informaciones sobre el tamaño de su base de datos. Es por eso que ya no aparece el numero de paginas indexadas en el buscador (ver reporte).

A pesar de todo esto, Marissa Mayer menciono que su base de datos es 3 veces mas grande que cualquiera de sus otros competidores.

Esta es la reacción a los informes de Yahoo indicando que habían indexado mas de 20.000 millones de documentos.

Cuando Larry Page y Sergei Brin comenzaron hace 7 años con el buscador solamente tenían entre 25 a 65 millones de páginas indexadas.

Yahoo también presenta su programa de búsqueda para el desktop

Después de que Google y Microsoft presentaron sus progamas de búsqueda para los PC’s, Yahoo también decidio continuar la batalla de los buscadores en las computadoras de los usuarios.

La versión beta del Yahoo! Desktop Search fue presentada a principios del 2005. Pero recientemente fue presentada la versión final.

La versión final, que es gratuita, no trae mejoras significantes de forma con relación a la versión beta. Solamente los mecanismos de búsqueda fueron significativamente mejorados, según Yahoo.

El motor de búsqueda se basa en el programa X1 de X1 Technologies y puede adicionalmente buscar en los emails, sus adjuntos y la agenda de direcciones de Outlook, Outlook express, Mozilla mail y Eudora. También soporta mas de 300 tipos adicionales de documentos.

En el momento que se arranca el programa, este genera un índice de todos los archivos de la computadora para que la búsqueda de documentos sea ágil y rápida.

Enlaces relacionados
Yahoo! Desktop Search
Google Desktop
Copernic Desktop Search

Un nuevo modelo para aplicaciones web

Todos los que vienen del área del desarrollo de aplicaciones que corren directamente en una computadora (rich applications) e incursionan en la programación de aplicaciones web, conocen muy bien el problema: La dificultad de poder hacer interactuar la aplicación con el usuario. También la falta de mantenimiento de estado entre el web server y el browser causa una infinidad de problemas y hace muy difícil la programación de sistemas interactivos.

Un interesante modelo para aliviar los problemas mencionados, llamado Ajax (Asynchronous JavaScript + XML) ha sido publicado por Jesse James Garrett en adaptive path.

Una aplicación que usa este modelo es Google Maps que permite desde la web navegar por mapas geográficos y fotos satelitales, haciendo zooms de los mapas y fotos. Además permite la busqueda de lugares en forma interactiva.

Ajax permite interacciones asincronizadas a diferencia del modelo actual, que solo permite interacciones sincronizadas.

Otros sitios que estan comenzando a usar este tipo de modelo son Orkut , Flickr o el buscador A9.

Google ya no muestra el número de páginas indexadas

Desde hoy día el motor de busqueda no muestra el número de páginas indexadas. A pesar de esto en el blog de Google se indica que ellos tienen 3 veces más páginas indexadas que los otros motores de búsqueda.

Una forma de saber cual es el numero de páginas indexadas en el data center de Google que se esta consultando es hacer la siguiente consulta. Actualmente se pude leer ‘Resultados 1 – 10 de aproximadamente 9.580.000.000 ‘.

Hace unos dias Yahoo había anunciado que el index de su buscador contenía 20.000 millones de documentos. Según Tim Mayer en el Yahoo! Blog Search, este número esta divido en 19.200 millones de páginas web, 1.600 millones de imágenes y 50 millones de archivos de audio y vídeo.

Google cumple 7 años


Google cumple 7 años

El buscador google celebra hoy (27.09.2005) 7 años. Como es costumbre de Google en todo tipo de acontecimientos importantes, lo hace mostrando un logotipo especial en la cabecera del buscador.

Los fundadores de la compañía Google, Sergey Brin y Larry Page, registraron el dominio un año antes, es decir en 1997, después de que decidieron cambiar el nombre de su proyecto, que inicialmente se llamaba backrup.

La palabra Google viene de la expresión inglesa ‘googol’, o sea, el nombre dado a la cifra ’10 elevado a 100′.

Cuando Google comenzó a operar solo tenia 25 millones de páginas indexadas y apenas tenia 10.000 consultas al día.

Actualmente el buscador tiene indexadas mas de 8.000 millones de páginas y tiene mas de 200 millones de consultas diarias.

El año pasado Google entro a la bolsa de valores y hoy registra una capitalización de mercado de US$84.000 millones, y sus ganancias netas aumentaron un 278% en 2004.

Después de su ingreso a la bolsa de valores la compañía esta avanzando con una estrategia muy agresiva tratando de abarcar otros espacios en el mercado de las nuevas tecnologías. Aqui una lista de los nuevos productos de Google:

GoogleMail – Servicio de email gratuito con 2GB de espacio
GoogleTalk – Programa para realizar llamadas telefonicas por Internet (VoIP)
Google-Earth – Programa para navegar geográficamente por todo el mundo
Picassa – Programa para organizar y compartir fotos
Desktop Search – Programa de búsqueda de archivos para computadoras
Blogger – Sistema gratuito de bitacoras

Enlaces relacionados
Logotipos festivos de Google
Los productos de Google
La historia de Google
Primeras computadoras y discos duros de Google
Como pintan escolares a Google

Origen del contenido duplicado

Según el análisis de muchos SEO’s, uno de los motivos por los cuales muchos sitios web han sido penalizados por Google últimamente (ver cambios en Google), es el ajuste de los filtros de contenido duplicado o DC (por sus siglas en inglés: duplicate content).

En los últimos meses Google ha estado trabajando intensamente en luchar contra el spam en el motor de búsqueda y ha estado aplicando diferentes filtros, como el de antigüedad, el SandBox, de catálogos, y el de contenido duplicado.

Una posibilidad de comprobar si una pagina tiene contenido duplicado es usando la herramienta copyscape . También se pueden buscar pasajes de texto de la pagina a controlar directamente en Google, colcandolos entre comillas.

Los motivos para que se genere un contenido doble son diversos y pueden ser involuntarios, motivados o por plagio.

Las principales fuentes de origen del contenido duplicado son:

1. Páginas canónicas
Este es generalmente un error del servidor Web. La página puede ser visible tanto desde la url http://www.mi-dominio.com como http://mi-dominio.com. Si es que los robots de google indexan al sitio con las dos diferentes direcciones, tarde o temprano Google penalizará a una de ellas.

Una posibilidad de evitar este tipo de contenido duplicado es redireccionar http://mi-dominio.com a la dirección estándar. Esto se puede hacer en el archivo .htaccess de la siguiente forma:

RewriteEngine On
RewriteCond %{HTTP_HOST} !^www\.mi-dominio\.com$
RewriteRule ^(.*)$ http://www. mi-dominio.com/$1 [L,R=301]

2. Shops
Los sitios que contienen shops tienen siempre una estructura similar y son muy parecidos a los catálogos web ya que son simplemente una colección de links. Por otra parte estos shops generalmente sacan la descripción de los productos directamente del fabricante o de la base de datos de los afiliados. De esta manera aparecen cientos de paginas con el mismo contenido ofreciendo el mismo producto.

Otra fuente de contenido duplicado es la presentación de diferentes modelos de un producto. En este caso las páginas varían muy poco, posiblemente solo por el número del producto.

Una forma de evitar el contenido duplicado seria usar solamente descripciones propias y colocar en cada página información adicional para evitar la similitud con otras páginas.

3. Cambios en la estructura del sitio
Muchas veces uno desea cambiar la estructura de las páginas del sitio, por ejemplo cambiando las url con variables a nombres estáticos con la ayuda de mod_rewrite. En este caso Google tiene las páginas antiguas y los robots las leen con los nuevos nombres. De esta manera se puede generar contenido duplicado.

Por este motivo, antes de hacer algún cambio de este tipo se debe estudiar a detalle las posibles consecuencias y tratar de evitar la generación de contenido duplicado. Una posibilidad seria redireccionar (301) las páginas con variables a las url’s estáticas o devolver simplemente un error 404 (page not found).

4. Plagio
Muchas veces la competencia copia pasajes o páginas enteras con el único fin de poder posicionarse mejor en los buscadores.

En este caso se debe contactar primeramente al webmaster de la página que ha plagiado el contenido y conminarlo a que la quite de su web. En otros casos también se podría recurrir al camino de los abogados.

Otra posibilidad seria refrescar el contenido plagiado y así mejorar nuevamente el propio sitio. El riesgo que se corre aquí, es que después de algún tiempo este nuevo contenido aparezca nuevamente en otras webs.

Google Earth – Viaje virtual alrededor del mundo

Google Earth es un programa para Windows que permite viajar virtualmente a cualquier parte del mundo. El programa combina fotos satelitales, mapas e informaciones sobre lugares, carreteras, etc. para mostrar un atlas geográfico de todo mundo, por el cual se puede navegar en tiempo real.


Google Earth

Google Earth permite hacer zooms de cualquier lugar del planeta, hacer giros, y mostrar las imágenes en perspectiva y en 3 dimensiones.

Las fotos satelitales tienen diferentes resoluciones. Lugares muy poblados, como ciudades grandes y lugares de interés se pueden observar con gran resolución. Mientras que la resolución de regiones poco pobladas deja bastante que desear.

También se debe hacer notar que el material satelital es un poco antiguo y data de hace unos 2 o 3 años atrás.

La versión de Google Earth que puede ser usar directamente con un Internet-Browser se llama Google Maps.

Sitios relacionados
– Homepage de Google Earth
– Version en Internet Google Maps
– Blog con fotos de Maps y Google Earth Google Sightseeing
– Visita lugares interesantes desde tu casa Visita Satelite

Podcasting

El podcasting también es otro fenómeno muy interesante que se esta popularizando mucho en Internet.

Que es un Podcast? Viene de la las palabras Ipod (el mp3 player de Apple) y broadcasting ( palabra en ingles que significa y transmisión). Un podcast es simplemente un archivo de audio que puede ser escuchado en cualquier dispositivo mp3, como por ejemplo un Ipod. Mayores informaciones sobre Podcasting se puede encontrar en Podcast en Español.

Los podcasts son distribuidos por RSS (Really Simple Syndication) desde sitios web especializados.

Los temas de los podcast pueden ser muy variados: desde un weblogger hablado, informes técnicos, hasta recetas de cocina. Cada día aparecen mas sitios de podcast y con temas inimaginables. Una lista de algunos podcasts en español se puede encontrar aquí.

Uno de los factores que ha ayudado a incrementrar la popularidad de los podcasts es la facilidad con la cual se los pueden generar. Jose Gelado explica en su blog como crear un podcast fácilmente.

La página del millón de dólares

Todo comenzó con la preocupación de un estudiante de 21 años en Inglaterra que trataba de ver la forma de financiar sus estudios sin recurrir a un préstamo.

Se le ocurrió armar una página web y vender 1 millón de pixeles, cada uno por un dólar. Alex vende bloques de un mínimo de 10×10 pixeles. La cantidad de bloques que un cliente puede comprar es ilimitada. El cliente elige el contenido del bloque y coloca un enlace a una página web. Es una forma sencilla y relativamente barata de hacer publicidad en Internet y generar trafico en los sitios.


Millon Dollar Homepage

Con esta página, Alex ha hecho historia en Internet. Pues ha demostrado que con una idea tan sencilla se puede ganar un millón de dólares. La página del millón de dólares ya se ha convertido en un clásico del Internet. Alex ya ha vendido desde el 26 de Agosto de 2005 96.700 pixels, es decir 96.700 dólares en menos de un mes.

Esta idea ya ha encontrado cientos de seguidores que quieren volverse millonarios usando el mismo principio : OneMillionPixels.com, The Million Penny Hompage, The Million Dollar Webpage, etc.

Solo falta saber si todas estas copias también llegarán a alcanzar su objetivo?

Nuevamente grandes cambios en las posiciones de Google

Hoy día hubo nuevamente un gran movimiento en los diferentes foros de discusión debido a que las posiciones en Google han cambiado drásticamente. Muchos webmasters se han mostrado desesperados por que sus sitios han perdido posiciones en forma abismal.

Aún no existe alguna expliación plausible a este nuevo cambio en el buscador de Google. Existen muchas teorías que no han podido ser comprobadas:

  • Google ha ajustado nuevamente sus filtros contra spam.
  • Páginas con una alta densidad en las palabras claves (keyword density) han sido penalizadas.
  • Paginas con contenido doble (duplicate content) han sido penalizadas.
  • Paginas que han incrementado sus backlinks desmesuradamente en un corto periodo de tiempo han sido penalizadas.
  • Se han liberado páginas del famoso sandbox, mientras otras páginas han caído en el mismo.
  • Otros aseveran que se debe a problemas en las bases de datos de Google, que ya no puede manejar correctamente la gran cantidad de datos.

Lo cierto es que cada vez se hace más difícil predecir la causa de los grandes movimientos que ocurren en forma regular (casi cada dos meses) en el buscador.