Fantaisie des moteurs de recherche ?

iSimon

Membre actif
J'ai fait en sorte que sur mon site, le visiteur soit redirigé automatiquement sur la page principale en cas d'erreur 404. Je ne voulais pas que les visiteurs subissent le "Not Found" traditionnel.
Mais le problème (si s'en est un) c'est que les moteurs de recherche inventent des pages web... Un exemple avec Altavista qui m'a pondu cette adresse :
<http://www.cinerepliques.net/erotisch_inf/TOP10/sec.underground.htm>
Alors qu'aucun de ces répertoires n'existe. Sans parler de la page.
Yahoo procède aussi comme ça, il m'invente des pages...
Comment dois-je procéder pour que ces moteurs de recherche arrêtent d'inventer des adresses ? L'exemple que j'ai donné montre que ça peut être parfois négatif :D
 
iSimon a dit:
Je ne voulais pas que les visiteurs subissent le "Not Found" traditionnel.

Pourquoi ?! :confused:

Je trouve ça étrange de vouloir éviter de montrer une page d'erreur 404... ça ne rend pas plus clair la navigation sur ton site dans le cas où il y aurait une erreur puisque l'internaute ne se rendrait pas forcément compte qu'il y a eu une erreur.

Par contre, si j'étais toi, je ferais plutôt quelque chose du genre :
- page d'erreur 404 avec texte clair et précis pour dire qu'il y a eu erreur.
- redirection après 5 - 10 secondes vers la page d'accueil (utilisation des balises <meta>)
- rajout de cette ligne dans ta page d'erreur 404 (pour éviter que les robots ne l'indexent) :
<meta name="Robots" content="noindex, follow">
 
molgow a dit:
Pourquoi ?! :confused:

Je trouve ça étrange de vouloir éviter de montrer une page d'erreur 404... ça ne rend pas plus clair la navigation sur ton site dans le cas où il y aurait une erreur puisque l'internaute ne se rendrait pas forcément compte qu'il y a eu une erreur.
La plupart du temps, les erreurs 404 ne sont pas du fait du visiteur et ce dernier n'en à rien à tirer. Parfois, ça le fait même fuire. Pour ce qui est de détecter les erreurs, j'ai accès au log de mon serveur donc je peux les détecter moi même.
Ce que je vais faire c'est un simple message d'erreur sur la page d'accueil si il y a eu une erreur, comme ça, pas de page intermédiaire. Ils pourront être au courant tout en continuant de naviguer.
molgow a dit:
Par contre, si j'étais toi, je ferais plutôt quelque chose du genre :
- page d'erreur 404 avec texte clair et précis pour dire qu'il y a eu erreur.
- redirection après 5 - 10 secondes vers la page d'accueil (utilisation des balises <meta>)
- rajout de cette ligne dans ta page d'erreur 404 (pour éviter que les robots ne l'indexent) :
<meta name="Robots" content="noindex, follow">
Le problème sera le même avec les moteurs de recherche... Ils pourront donner n'importe quelle adresse qu'il feront correspondre à ma page d'accueil étant donné qu'il n'indexeront pas la page intermédiaire avec l'erreur.
Y-a-t-il un moyen de signifier aux moteurs de recherche qu'une erreur 404 s'est produite sans pour autant afficher la page standard d'Apache ?
 
iSimon a dit:
Le problème sera le même avec les moteurs de recherche... Ils pourront donner n'importe quelle adresse qu'il feront correspondre à ma page d'accueil étant donné qu'il n'indexeront pas la page intermédiaire avec l'erreur.
Y-a-t-il un moyen de signifier aux moteurs de recherche qu'une erreur 404 s'est produite sans pour autant afficher la page standard d'Apache ?

Non justement pas.
Les moteurs n'indexeront pas ta page 404 (grâce à la balise meta qui indique noindex), par contre les robots suivront les liens et indexeront ta page d'accueil.
C'est exactement ce que tu voudrais il me semble.
 
molgow a dit:
Non justement pas.
Les moteurs n'indexeront pas ta page 404 (grâce à la balise meta qui indique noindex), par contre les robots suivront les liens et indexeront ta page d'accueil.
C'est exactement ce que tu voudrais il me semble.

Tu es sur qu'il n'indexeront pas la page d'accueil avec la fausse adresse ?
 
Si tu mets cette ligne :
<meta name="Robots" content="noindex, follow">
sur ta page d'erreur 404, c'est sûr qu'ils ne l'indexeront pas.