Comment interdire efficacement l'araignée de Sogou d'explorer le contenu de votre site web?

Méthode 1 : Utilisation du fichier robots.txt

Pour empêcher l'araignée Sogou de parcourir le contenu de votre site Web, vous pouvez le faire en créant un fichier robots.txt. Ajoutez le contenu suivant dans le fichier :

User-agent: Sogou web spider

Disallow: /

User-agent: sogou spider

Disallow: /

User-agent: *

Disallow:

Comme il n'est pas sûr s'il s'agit de la toile d'araignée de Sogou ou du robot araignée Sogou, deux lignes ont été écrites. Les autres moteurs de recherche mentionnent généralement le nom de leur araignée dans des articles pertinents, mais ce n'est pas le cas pour Sogou, ce qui montre également son caractère. Après avoir téléversé le fichier dans le répertoire racine du site, il prendra effet. Cependant, il est important de noter que l'araignée Sogou ne respecte parfois pas le protocole du fichier robots.txt, il est donc possible de continuer à la parcourir malgré l'interdiction.

Méthode 2 : Utilisation du fichier .htaccess

En complément du fichier robots.txt, il est possible de créer un nouveau fichier .htaccess. Nommez le fichier .htaccess et ajoutez le contenu suivant à l'intérieur :

#bloquer l'araignée

order allow,deny

#Blocage Sogou

deny from 220.181.125.71

deny from 220.181.125.68

deny from 220.181.125.69

deny from 220.181.94.235

deny from 220.181.94.233

deny from 220.181.94.236

refuser de 220.181.19.84

autoriser tout

"+lt;/LIMIT>"

Téléchargez ce fichier dans le répertoire racine du site Web. Les adresses IP répertoriées sont des araignées sougous, elles changent fréquemment. Si de nouvelles adresses IP apparaissent, vous pouvez les ajouter à tout moment.