下载·安博体育(中国)官方网站;,久久精品国产AV麻豆色欲,女子自慰喷潮a片免费观看

技術(shù)頻道 - 網(wǎng)站運營

屏蔽百度蜘蛛或某一爬蟲的四種方法

作者:admin 時間:2017-6-10 11:33:14 瀏覽:

今天看到群里有人說被一俄羅斯爬蟲一天內(nèi)訪問網(wǎng)站幾千次，想屏蔽它，其實，類似這樣的問題解決方案網(wǎng)上有不少文章，屏蔽俄羅斯爬蟲跟屏蔽百度蜘蛛的原理是一樣的，可以通過如下四種方法來處理。

1、robots.txt屏蔽百度或某一爬蟲抓取

打開robots.txt，在開頭加入如下語句（以百度蜘蛛為例）：

User-agent: baiduspider
Disallow: /

代碼分析，首先要知道該爬蟲的名稱，如百度爬蟲是Baiduspider，Google爬蟲是Googlebot，360搜索爬蟲是360Spider，你可以通過各大搜索引擎蜘蛛爬蟲UA匯總來獲取爬蟲的名稱，例如，微軟必應(yīng)的蜘蛛UA是：

"Mozilla/5.0 (compatible; bingbot/2.0; +http://www.bing.com/bingbot.htm)"

我們就可以知道它的爬蟲名稱為bingbot。

2、robots Meta標(biāo)簽屏蔽百度或某一爬蟲抓取

如果是針對某一個頁面屏蔽百度蜘蛛或某一爬蟲抓取，那么可以通過Meta標(biāo)簽來實現(xiàn)。代碼如下：

這是屏蔽所有蜘蛛爬蟲抓取該頁面的寫法，如果只屏蔽某個爬蟲，可以把"robots"改為特定的爬蟲名稱，爬蟲名稱可以通過上面方法1中提及的辦法獲得。例如想只屏蔽微軟必應(yīng)的蜘蛛抓取該頁，則可以寫成：

3、.htaccess屏蔽百度或某一爬蟲抓取

一些可惡的爬蟲并不遵循robots規(guī)則，那么我們還可以通過.htaccess來屏蔽它，代碼如下（以百度蜘蛛為例）：

RewriteEngine on
RewriteCond %{HTTP_USER_AGENT} ^.*Baiduspider.* [NC]
RewriteRule .* - [F]

如果是Apache服務(wù)器，可以修改配置文件 httpd.conf ，這樣寫( /var/www/html 是根目錄)：

<Directory "/var/www/html">
...

SetEnvIfNoCase User-Agent ^.*Baiduspider.* bad_bot

Order Allow,Deny
Allow from all
Deny from env=bad_bot

...
</Directory>

如果是Nginx服務(wù)器，可以修改配置文件( 默認(rèn)是 nginx.conf )，這樣寫：

Server{
...
location / {
    if ($http_user_agent !~ Baiduspider) {
      return 403;
    }
}
...
}

4、通過IP屏蔽百度或某一爬蟲抓取

我們還可以通過分析日志，獲得爬蟲的IP地址，然后從服務(wù)器防火墻屏蔽該IP，不過爬蟲通常有很多IP，我們可以屏蔽爬蟲的IP段。

不過此方法沒有前面幾個方法實用，較少人這樣操作。

標(biāo)簽: 百度蜘蛛 爬蟲

※ 網(wǎng)站速度慢？試試網(wǎng)站自動優(yōu)化工具 ※

相關(guān)文章

海外服務(wù)器2.8折
CN2直連大陸

25元搶購

恒創(chuàng)科技

立即咨詢 >

卡卡網(wǎng)

贊助商

分類目錄

贊助商

最新文章

搜索

技術(shù)頻道 - 網(wǎng)站運營

屏蔽百度蜘蛛或某一爬蟲的四種方法

1、robots.txt屏蔽百度或某一爬蟲抓取

2、robots Meta標(biāo)簽屏蔽百度或某一爬蟲抓取

3、.htaccess屏蔽百度或某一爬蟲抓取

4、通過IP屏蔽百度或某一爬蟲抓取

標(biāo)簽: 百度蜘蛛 爬蟲

卡卡網(wǎng)

贊助商

分類目錄

贊助商

最新文章

搜索

技術(shù)頻道 - 網(wǎng)站運營

屏蔽百度蜘蛛或某一爬蟲的四種方法

1、robots.txt屏蔽百度或某一爬蟲抓取

2、robots Meta標(biāo)簽屏蔽百度或某一爬蟲抓取

3、.htaccess屏蔽百度或某一爬蟲抓取

4、通過IP屏蔽百度或某一爬蟲抓取

標(biāo)簽: 百度蜘蛛 爬蟲

1、robots.txt屏蔽百度或某一爬蟲抓取

2、robots Meta標(biāo)簽屏蔽百度或某一爬蟲抓取

3、.htaccess屏蔽百度或某一爬蟲抓取

4、通過IP屏蔽百度或某一爬蟲抓取

標(biāo)簽: 百度蜘蛛爬蟲