主頁(yè) > 知識(shí)庫(kù) > 如何禁止網(wǎng)站內(nèi)容被搜索引擎收錄的幾種方法講解

如何禁止網(wǎng)站內(nèi)容被搜索引擎收錄的幾種方法講解

熱門標(biāo)簽:阿里云 使用U盤裝系統(tǒng) 檢查注冊(cè)表項(xiàng) 智能手機(jī) 網(wǎng)站建設(shè) 百度競(jìng)價(jià)點(diǎn)擊價(jià)格的計(jì)算公式 硅谷的囚徒呼叫中心 美圖手機(jī)

通常做網(wǎng)站的目標(biāo)就是讓搜索引擎收錄,擴(kuò)大推廣面,但是如果你的網(wǎng)站涉及個(gè)人隱私或者機(jī)密性非公開(kāi)的網(wǎng)頁(yè)而需要禁止搜索引擎收錄抓取的話,該如何操作呢?比如淘寶網(wǎng)就是禁止搜索引擎收錄的一個(gè)例子,本文將教你幾種做法來(lái)實(shí)現(xiàn)屏蔽或禁止搜索引擎收錄抓取網(wǎng)站的內(nèi)容。

搜索引擎蜘蛛不斷爬行互聯(lián)網(wǎng),如果我們網(wǎng)站沒(méi)有做出禁止搜索引擎收錄的操作,很容易就會(huì)被搜索引擎收錄。那么下面介紹一下怎么樣禁止搜索引擎收錄網(wǎng)站內(nèi)容。

第一種、robots.txt方法

搜索引擎默認(rèn)的遵守robots.txt協(xié)議(不排除某些耍流氓的引擎),創(chuàng)建robots.txt文本文件放至網(wǎng)站根目錄下,編輯代碼如下:

User-agent: *
Disallow: /

通過(guò)以上代碼,即可告訴搜索引擎不要抓取采取收錄本網(wǎng)站,注意慎用如上代碼:這將禁止所有搜索引擎訪問(wèn)網(wǎng)站的任何部分。

如果只禁止百度搜索引擎收錄抓取網(wǎng)頁(yè)

1、編輯robots.txt文件,設(shè)計(jì)標(biāo)記為:

User-agent: Baiduspider
Disallow: /

以上robots文件將實(shí)現(xiàn)禁止所有來(lái)自百度的抓取。

這里說(shuō)一下百度的user-agent,Baiduspider的user-agent是什么?

百度各個(gè)產(chǎn)品使用不同的user-agent:

  • 產(chǎn)品名稱 對(duì)應(yīng)user-agent
  • 無(wú)線搜索 Baiduspider
  • 圖片搜索 Baiduspider-image
  • 視頻搜索 Baiduspider-video
  • 新聞搜索 Baiduspider-news
  • 百度搜藏 Baiduspider-favo
  • 百度聯(lián)盟 Baiduspider-cpro
  • 商務(wù)搜索 Baiduspider-ads
  • 網(wǎng)頁(yè)以及其他搜索 Baiduspider

你可以根據(jù)各產(chǎn)品不同的user-agent設(shè)置不同的抓取規(guī)則,以下robots實(shí)現(xiàn)禁止所有來(lái)自百度的抓取但允許圖片搜索抓取/image/目錄:

User-agent: Baiduspider
Disallow: /

User-agent: Baiduspider-image
Allow: /image/

請(qǐng)注意:Baiduspider-cpro和Baiduspider-ads抓取的網(wǎng)頁(yè)并不會(huì)建入索引,只是執(zhí)行與客戶約定的操作,所以不遵守robots協(xié)議,這個(gè)就需要和百度的人聯(lián)系才能解決了。

如何只禁止Google搜索引擎收錄抓取網(wǎng)頁(yè),方法如下:

編輯robots.txt文件,設(shè)計(jì)標(biāo)記為:

User-agent: googlebot
Disallow: /

第二種、網(wǎng)頁(yè)代碼方法

在網(wǎng)站首頁(yè)代碼<head>與</head>之間,加入<meta name="robots" content="noarchive">代碼,此標(biāo)記禁止搜索引擎抓取網(wǎng)站并顯示網(wǎng)頁(yè)快照。

在網(wǎng)站首頁(yè)代碼<head>與</head>之間,加入<meta name="Baiduspider" content="noarchive">即可禁止百度搜索引擎抓取網(wǎng)站并顯示網(wǎng)頁(yè)快照。

在網(wǎng)站首頁(yè)代碼<head>與</head>之間,加入<meta name="googlebot" content="noarchive">即可禁止谷歌搜索引擎抓取網(wǎng)站并顯示網(wǎng)頁(yè)快照。

另外當(dāng)我們的需求很怪異的時(shí)候,比如下面這幾種情況:

1. 網(wǎng)站已經(jīng)加了robots.txt,還能在百度搜索出來(lái)?

因?yàn)樗阉饕嫠饕龜?shù)據(jù)庫(kù)的更新需要時(shí)間。雖然Baiduspider已經(jīng)停止訪問(wèn)您網(wǎng)站上的網(wǎng)頁(yè),但百度搜索引擎數(shù)據(jù)庫(kù)中已經(jīng)建立的網(wǎng)頁(yè)索引信息,可能需要數(shù)月時(shí)間才會(huì)清除。另外也請(qǐng)檢查您的robots配置是否正確。如果您的拒絕被收錄需求非常急迫,也可以通過(guò)投訴平臺(tái)反饋請(qǐng)求處理。

2. 希望網(wǎng)站內(nèi)容被百度索引但不被保存快照,我該怎么做?

Baiduspider遵守互聯(lián)網(wǎng)meta robots協(xié)議。您可以利用網(wǎng)頁(yè)meta的設(shè)置,使百度顯示只對(duì)該網(wǎng)頁(yè)建索引,但并不在搜索結(jié)果中顯示該網(wǎng)頁(yè)的快照。和robots的更新一樣,因?yàn)樗阉饕嫠饕龜?shù)據(jù)庫(kù)的更新需要時(shí)間,所以雖然您已經(jīng)在網(wǎng)頁(yè)中通過(guò)meta禁止了百度在搜索結(jié)果中顯示該網(wǎng)頁(yè)的快照,但百度搜索引擎數(shù)據(jù)庫(kù)中如果已經(jīng)建立了網(wǎng)頁(yè)索引信息,可能需要二至四周才會(huì)在線上生效。

3. 希望被百度索引,但是不保存網(wǎng)站快照,如下代碼解決:

<meta name="Baiduspider" content="noarchive">

4. 如果要禁止所有的搜索引擎保存你網(wǎng)頁(yè)的快照,那么代碼就是下面的:

<meta name="robots" content="noarchive">

下面列出一些常用的代碼組合:

  • <META NAME="ROBOTS" CONTENT="INDEX,FOLLOW">:可以抓取本頁(yè),而且可以順著本頁(yè)繼續(xù)索引別的鏈接
  • <META NAME="ROBOTS" CONTENT="NOINDEX,FOLLOW">:不許抓取本頁(yè),但是可以順著本頁(yè)抓取索引別的鏈接
  • <META NAME="ROBOTS" CONTENT="INDEX,NOFOLLOW">:可以抓取本頁(yè),但是不許順著本頁(yè)抓取索引別的鏈接
  • <META NAME="ROBOTS" CONTENT="NOINDEX,NOFOLLOW">:不許抓取本頁(yè),也不許順著本頁(yè)抓取索引別的鏈接

總結(jié)

以上就是這篇文章的全部?jī)?nèi)容了,希望本文的內(nèi)容對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,謝謝大家對(duì)腳本之家的支持。如果你想了解更多相關(guān)內(nèi)容請(qǐng)查看下面相關(guān)鏈接

標(biāo)簽:煙臺(tái) 山南 湖北 懷化 湘潭 黃山 賀州 通遼

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《如何禁止網(wǎng)站內(nèi)容被搜索引擎收錄的幾種方法講解》,本文關(guān)鍵詞  ;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問(wèn)題,煩請(qǐng)?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無(wú)關(guān)。
  • 相關(guān)文章
  • 收縮
    • 微信客服
    • 微信二維碼
    • 電話咨詢

    • 400-1100-266