Wie kann man die Sogou-Spider effektiv daran hindern, den Inhalt Ihrer Website zu durchsuchen?
Methode 1: Verwendung der robots.txt-Datei
Um zu verhindern, dass der Sogou-Spider Ihren Website-Inhalt durchsucht, können Sie dies durch das Erstellen einer robots.txt-Datei erreichen. Fügen Sie folgenden Inhalt in die Datei ein:
User-agent: Sogou Web-Spider
Disallow: /
User-agent: sogou-Spider
Disallow: /
User-agent: *
Disallow:
Da es nicht sicher ist, ob es sich um den sogou-Spider oder den Sogou Web-Spider handelt, wurden zwei Zeilen geschrieben. Andere Suchmaschinen geben normalerweise in entsprechenden Artikeln ihren Spider-Namen an, aber Sogou tut dies nicht, was auch seine Eigenheiten zeigt. Nachdem Sie die Datei in das Stammverzeichnis Ihrer Website hochgeladen haben, wird sie wirksam. Beachten Sie jedoch, dass der Sogou-Spider manchmal nicht dem Protokoll der robots.txt-Datei folgt und daher trotz Verbots weiterhin durchsuchen kann.
Methode 2: Verwendung der .htaccess-Datei
In Verbindung mit der robots.txt-Datei können Sie eine weitere .htaccess-Datei erstellen. Der Dateiname lautet .htaccess und der Inhalt lautet wie folgt:
#blockieren von Spidern
Order Allow,Deny
#Sogou blockieren
Deny from 220.181.125.71
Deny from 220.181.125.68
Deny from 220.181.125.69
Deny from 220.181.94.235
Deny from 220.181.94.233
Deny from 220.181.94.236
deny from 220.181.19.84
allow from all
</LIMIT>
将该文件上传到网站的根目录。其中列出的IP地址都是搜狗蜘蛛的,因其经常更换,如果有新的IP地址,可以随时补充进去。