Errores 404. ¿Perjudican? Como tratar y gestionar los errores 404 de las urls.

Lo primero que siempre me he preguntado es de donde saldrán todas las urls que dan errores 404 y que nunca han existido en mi web???, y que aparecen reflejados todos estos errores en webmasters Tool.

Bueno esto tiene varias posibles respuestas. Lo primero y más evidente es que Google haya rastreado esa url en alguna parte de tu propia web, y si el enlace está mal compuesto es porque habrá un error al generarlo en la programación. O bien porque alguien te ha enlazado y este enlace esta mal.

Pero claro, esto no es viable cuando por ejemplo en mi WMT me he encontrado con hasta 100.000 urls. Que pasa? pues bien cuando se hacen cambios importantes en las urls de un site (o sin hacer ningún cambio), Google tiene un comportamiento a través del cual hacen comprobaciones probando diferentes parámetros en las urls para ver como gestiona tu servidor las urls desconocidas. Es decir que en cierto modo te ponen a prueba.

Otra posible causa, es que Google lleva tiempo rastreando Javascript y otros métodos para incrustar contenido dinámicamente, de manera que también lanzan llamadas a tu servidor probando combinaciones en la url con diferentes parámetros que pueden ir encontrando. Si nosotros intentamos evitar que Google indexe contenido, urls o lo que sea, ya se aseguran ellos de poder rastrearlo de alguna manera.

Que hacer con los 404 generados de esta manera? pues bien Google no sabe que enlaces son importantes para ti o cuales deben ser simplemente lo que son, 404. De manera que esto es una labor de gestión y chequear WMT para ver si se encuentra algún 404 que no debería serlo y arreglarlo en consecuencia.

Afectan los errores 404??

Según nos cuenta Google en su blog, los 404 es algo normal en la web, porque todas las web cambian, se genera nuevo contenido, otro se borra, otro se redirecciona, otros quedan obsoletos. Pues bien cuando una url no es alcanzable se genera un 404. De hecho es hasta aconsejable que cuando eliminemos una url o quede obsoleta devolvamos un error 404 para que Google lo tenga en cuenta. Una url que devuelve un 404 no afecta para nada al resto.

En todo esto afecta el robots.txt?

Pues si, ten en cuenta que para que Google pueda rastrear tu site tiene que ver el código de respuesta de HTTP y si esa URL está bloqueada por un archivo robots.txt, no será posible rastrearla y ver el código de respuesta.

Redirigir los 404 con 301

Es posible que a veces un usuario escribe mal la url de una página en vez de pedroventura.com/blog_programacion han puesto pedroventura.com/blog-programacion. Con lo que se genera un error 404 y es simplemente porque el usuario, o el enlace que me han hecho esta mal copiado.
Para evitar devolver un 404 lo mejor es redireccionar esa página de error con un 301 a la url correcta, así nos aseguramos que el tráfico a esa página no se pierde y evitamos mostrar al usuario una página de error.

Decorar los 404

A parte de lo que he explicado anteriormente de redirigir al usuario, habrá ocasiones en que las urls no se puedan gestionar automáticamente con redirecciones 301. En este caso lo más sensato es ayudar al usuario a seguir navegando por nuestro site y evitar que se marche. Manteniendo la visita y ofreciendo contenidos de interés para éste.
Lo que se suele hacer es preparar una página de errores siguiendo el mismo look&feel que todo el site. En esta página podemos procesar la url que se ha solicitado e intentar buscar en la base de datos que contenidos similares podemos ofrecerle.
Ten en cuenta que a pesar de que se devuelva un 404 siempre se puede seguir mostrando contenido, pudiendo personalizar y customizar una pagina de error 404 como queramos.

También es muy aconsejable incluir un buscador en la página de error 404 customizada.Esto es una técnica que se lleva haciendo mucho tiempo.

Que no es aconsejable!!

Redirigir todas las URL desconocidas a la página principal en lugar de devolver códigos 404. Esto puede ser perjudicial a la hora de comprender e indexar el sitio, así que se recomienda devolver los códigos de respuesta correctos para el contenido que no existe.

Errores 404 leves

Además de devolver un código 404 en respuesta a una solicitud de una página inexistente, el servidor también muestra una página 404. Pero cuando se modifica el mensaje que muestra la pagina 404 es cuando se genera un 404 leve, porque el contenido de la página no está relacionado en modo alguno con la respuesta devuelta por el servidor.
El hecho de que aparezca un mensaje 404 de archivo no encontrado en una página no significa que esa página sea 404

5 opiniones en “Errores 404. ¿Perjudican? Como tratar y gestionar los errores 404 de las urls.”

  1. Muchas gracias por la explicación, la verdad que esto de los errores 404 me trae de cabeza y quiero darles una salida lo más pronto posible, que me redirijan al sitio o algo así.

  2. Soft 404 no es eso, al contrario!
    Es cuando la pagina devuelve un html que parece ser un error, pero el codigo de respuesta fue 200.
    Google los toma como 404, por ende los ignora

    Saludos

  3. Estimado, actualmente administro un site (IIS) del cual google posee algunas paginas que no existen, para lo que necesito realizar un redireccionamiento 301 a estas paginas que arrojan error 404, mi idea es realizar una pagina personalizada para el error 404 la cual redireccione de manera automatica (redireccionamiento 301) al home, con algo como esto

    página 404 personalizada

    o con JavaScript

    Response.Status=”301 Moved Permanently” Response.AddHeader “Location”, ” http://www.nuevositio.com/inicio.asp”

    es posible?

  4. Alguién sabe el código que hay que poner para que deje de ser un error leve?, es decir en la página 404 qué código hay que añadir o metaetiqueta para que los buscadores no la rastreen más. Gracias!

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *