Cuidado con el final de tus URLs

Una de las preguntas recurrentes en los foros es: Cuál de las extensiónes de las URLs en las páginas web son mejor indexadas por los buscadores?

Hace unos años atrás, se decía que los buscadores indexaban con más facilidad páginas que terminaban con html, htm, php, asp, aspx ( y exactamente en ese orden).

Pero luego, con todas las mejoras que se introdujeron en los bots, especialmente en Google, la extensión de una página web ya no es importante para su indexación.

Y con el crecimiento de las webs al estilo web 2.0, las URLs perdieron su extensión, y justamente ayer se publicaba en SeoMOZ que una de sus páginas que terminaba con …/web2.0 no había sido indexada por Google, y por ese motivo se habían puesto en contacto con ellos y les habrían advertido que no deben colocar 0 al final de una URL, ya que estas páginas no son indexadas.

Hoy día, después de mucho tiempo, Matt Cutt se ha pronunciado en su blog personal sobre temas específicos de Google, mencionado que no se deben colocar al final de una URL cosas extrañas, como por ejemplo extensiones .exe, tar o números

There’s a simple way to check whether Google will crawl things with a certain filetype extension. If you do a query such as [filetype:exe] and you don’t see any urls that end directly in “.exe” then that means either 1) there are no such files on the web, which we know isn’t true for .exe, or 2) Google chooses not to crawl such pages at this time — usually because pages with that file extension have been unusually useless in the past. So for example, if you query for [filetype:tgz] or [filetype:tar], you’ll see urls such as “papers.ssrn.com/pape.tar?abstract_id” that contain “.tar” but no files that end directly in .tar. That means that you probably shouldn’t make your html pages end in .tar.

para saber qué tipo de extensiones Google si indexa, se puede hacer la siguiente consulta filetype:extensión

7 Respuestas a Cuidado con el final de tus URLs

  1. Guillem 14/6/2008 a 07:55 #

    Pues para no indexar los .0 no está mal la de resultados que saca…

    http://www.google.es/search?hl=es&q=filetype%3A0&btnG=Buscar&meta=

  2. Max Glaser 14/6/2008 a 08:20 #

    Bueno, 374.000 resultados no son muchos comparados con el numero real de páginas que deben tener la extensión .0 en todo el mundo.

    Posiblemente estas páginas han sido indexadas usando algún criterio adicional…

  3. leitzaran 15/6/2008 a 11:14 #

    Una pequeña corrección, Max:
    El segundo tipo es “htm”, y no “hml” (seguro que es un “lapsus”).
    Saludos 😉

  4. Max Glaser 15/6/2008 a 11:42 #

    leitzaran,
    Gracia por la corrección 🙂

  5. juan pablo 28/6/2008 a 16:30 #

    pues es muy llamativo lo de los numeros
    mi blog finaliza cada entrada en números y está todito indexado, tengo varias paginas finalizadas en “0” y también indexada… y tengo muy buenos posicionamiento para algunas key mas o menos peleadas…

    no termino de entender lo de los “numeros”

  6. ingreso medicina unc 1/7/2008 a 10:22 #

    ami me tomo bien la direccion ingresomedicina.com.ar/inscripcion-2008 que termina en 8. sin problemas y regresa a ver si cambio periodicamente.

    ahora, el ejemplo que das es “.0” como si fuera un “algo.o” y se abriera en programa “cero”… jaja por la extension…

    habrá que tener en cuenta 😉

  7. Max Glaser 1/7/2008 a 16:32 #

    En muchos casos Google si indexa páginas terminadas con 0 u otro numero, pero como lo dije anteriormente, debe ser por que usa algún otro criterio.