Autoriser ou bloquer l'accès aux robots sur votre site
Pour ce faire, vous aurez besoin d'un fichier robots.txt, alors voici pour vous ,la présentation du fichier robots.txt...
Le fichier robots.txt est un fichier texte contenant des commandes à destination des robots d'indexation des moteurs de recherche afin de leur préciser les pages qui peuvent ou ne peuvent pas être indexées. Ainsi tout moteur de recherche commence l'exploration d'un site web en cherchant le fichier robots.txt à la racine du site.
Le fichier robots.txt (écrit en minuscules et au pluriel) est un fichier ASCII se trouvant à la racine du site et pouvant contenir les commandes suivantes :
- User-Agent : permet de préciser le robot concerné par les directives suivantes. La valeur * signifie "tous les moteurs de recherche".
- Disallow : permet d'indiquer les pages à exclure de l'indexation. Chaque page ou chemin à exclure doit être sur une ligne à part et doit commencer par /. La valeur / seule signifie "toutes les pages du site".
Le fichier robots.txt ne doit contenir aucune ligne vide !
Voici des exemples de fichier robots.txt :
Exclusion de toutes les pages :
User-Agent: *
Disallow: /
Lire la suite
|