技術(shù)頻道導(dǎo)航
HTML/CSS
.NET技術(shù)
IIS技術(shù)
PHP技術(shù)
Js/JQuery
Photoshop
Fireworks
服務(wù)器技術(shù)
操作系統(tǒng)
網(wǎng)站運(yùn)營(yíng)

贊助商

分類目錄

贊助商

最新文章

搜索

SEO: 使用 rel=canonical 為類似網(wǎng)頁(yè)或重復(fù)網(wǎng)頁(yè)指定權(quán)威網(wǎng)頁(yè)

作者:admin    時(shí)間:2018-7-19 10:53:27    瀏覽:

如果你對(duì)  rel=canonical  還未曾了解,那么請(qǐng)先看一看下面這條語(yǔ)句:

 link標(biāo)簽

<link>標(biāo)簽應(yīng)該知道吧,它是放在<head>里面的一個(gè)元素標(biāo)記,該標(biāo)簽定義文檔與外部資源的關(guān)系。而rel<link>標(biāo)簽里面的一個(gè)屬性,canonical則是rel的屬性值。

好了,現(xiàn)在進(jìn)入正題,說明 rel=canonical 的重要性以及如何使用該屬性。

使用 rel=canonical 為類似網(wǎng)頁(yè)或重復(fù)網(wǎng)頁(yè)指定權(quán)威網(wǎng)頁(yè)

如果你的某一個(gè)網(wǎng)頁(yè)可通過多個(gè)網(wǎng)址訪問,或者你的不同網(wǎng)頁(yè)包含類似內(nèi)容(例如,某個(gè)網(wǎng)頁(yè)既有移動(dòng)版,又有桌面版),那么你應(yīng)明確告知搜索引擎哪個(gè)網(wǎng)址是該網(wǎng)頁(yè)的權(quán)威網(wǎng)址(權(quán)威網(wǎng)址)。否則,搜索引擎就會(huì)替您做出選擇,或會(huì)將這兩個(gè)版本視為完全等同,這可能會(huì)導(dǎo)致出現(xiàn)一些不當(dāng)?shù)男袨椤?/p>

請(qǐng)注意,雖然建議你為重復(fù)的網(wǎng)址或版本指定權(quán)威網(wǎng)頁(yè),但搜索引擎可能會(huì)出于各種原因(例如性能或內(nèi)容)通過算法來選擇一個(gè)不同的網(wǎng)頁(yè)作為權(quán)威網(wǎng)頁(yè)。

為什么我的網(wǎng)站上會(huì)有類似網(wǎng)頁(yè)/重復(fù)網(wǎng)頁(yè)?

你的網(wǎng)站上可能會(huì)有多個(gè)不同的網(wǎng)址指向同一個(gè)網(wǎng)頁(yè),或者在不同網(wǎng)址上有重復(fù)網(wǎng)頁(yè)或非常類似的網(wǎng)頁(yè),這是有正當(dāng)理由的。以下是最常見的原因:

為了支持多種設(shè)備類型:

https://example.com/news/koala-rampage
https://m.example.com/news/koala-rampage
https://amp.example.com/news/koala-rampage

為了為諸如搜索參數(shù)或會(huì)話 ID 之類的內(nèi)容啟用動(dòng)態(tài)網(wǎng)址:

https://www.example.com/products?category=dresses&color=green
https://example.com/dresses/cocktail?gclid=ABCD
https://www.example.com/dresses/green/greendress.html

當(dāng)你將同一篇博文同時(shí)放在多個(gè)版塊中時(shí),你的博客系統(tǒng)會(huì)自動(dòng)保存多個(gè)網(wǎng)址。

https://blog.example.com/dresses/green-dresses-are-awesome/
https://blog.example.com/green-things/green-dresses-are-awesome/

你的服務(wù)器已配置為針對(duì) www/非 www http/https 變體提供相同的內(nèi)容:

http://example.com/green-dresses
https://example.com/green-dresses
http://www.example.com/green-dresses

你在相應(yīng)博客上提供的要轉(zhuǎn)載到其他網(wǎng)站上的內(nèi)容與這些網(wǎng)域中的原有內(nèi)容完全重復(fù)或部分重復(fù):

https://news.example.com/green-dresses-for-every-day-155672.html(轉(zhuǎn)載博文)
https://blog.example.com/dresses/green-dresses-are-awesome/3245/(原始博文)

具體細(xì)節(jié)

當(dāng)搜索引擎將某個(gè)網(wǎng)站編入索引時(shí),它會(huì)嘗試確定此網(wǎng)站的每個(gè)網(wǎng)頁(yè)中涵蓋的主題。如果爬蟲在同一網(wǎng)站上發(fā)現(xiàn)了多個(gè)似乎包含相同內(nèi)容的網(wǎng)頁(yè),則會(huì)選擇它認(rèn)為最完整且實(shí)用的那個(gè)網(wǎng)頁(yè),并將其標(biāo)記為權(quán)威網(wǎng)頁(yè)。為了節(jié)省你網(wǎng)站的抓取預(yù)算,爬蟲會(huì)經(jīng)常抓取權(quán)威網(wǎng)頁(yè),而不會(huì)頻繁地抓取重復(fù)網(wǎng)頁(yè)。因此,如果你不告知爬蟲哪個(gè)網(wǎng)頁(yè)是權(quán)威網(wǎng)頁(yè),并且決定將一個(gè)不同的網(wǎng)頁(yè)(與爬蟲所選的網(wǎng)頁(yè)不同)作為權(quán)威網(wǎng)頁(yè),那么爬蟲便可能不會(huì)經(jīng)常將你費(fèi)心費(fèi)力地更新的網(wǎng)頁(yè)編入索引或在搜索結(jié)果中顯示該網(wǎng)頁(yè)。

爬蟲會(huì)使用你網(wǎng)站上的權(quán)威網(wǎng)頁(yè)作為網(wǎng)站內(nèi)容的黃金標(biāo)準(zhǔn)對(duì)網(wǎng)站內(nèi)容和質(zhì)量進(jìn)行評(píng)估,搜索引擎搜索結(jié)果通常亦會(huì)指向權(quán)威網(wǎng)頁(yè),除非某個(gè)重復(fù)網(wǎng)頁(yè)明顯與用戶的查詢更相符:例如,如果用戶使用的是移動(dòng)設(shè)備,那么即使桌面版網(wǎng)頁(yè)被標(biāo)記為權(quán)威網(wǎng)頁(yè),搜索結(jié)果也可能會(huì)指向移動(dòng)版網(wǎng)頁(yè)。

搜索引擎會(huì)根據(jù)許多因素(或“信號(hào)”)來選擇權(quán)威網(wǎng)頁(yè),例如網(wǎng)頁(yè)是通過 http 還是 https 提供;用戶聲明的首選網(wǎng)域;網(wǎng)頁(yè)質(zhì)量;站點(diǎn)地圖中是否顯示了相應(yīng)網(wǎng)址;以及任何“rel=canonical”標(biāo)簽。你不能強(qiáng)制搜索引擎將哪個(gè)網(wǎng)頁(yè)選作權(quán)威網(wǎng)頁(yè),但可通過使用下文中所述的一種或多種方法來影響它的選擇。

為什么一定要指定權(quán)威網(wǎng)頁(yè)

在一組重復(fù)網(wǎng)頁(yè)/類似網(wǎng)頁(yè)中明確選擇權(quán)威網(wǎng)頁(yè)可滿足您的諸多需求,具體如下所示:

  • 指定您希望用戶在搜索結(jié)果中看到的網(wǎng)址。你可能希望用戶通過 https://www.example.com/dresses/green/greendress.html(而非 https://example.com/dresses/cocktail?gclid=ABCD)訪問你的綠色禮服商品頁(yè)。
  • 整合類似網(wǎng)頁(yè)或重復(fù)網(wǎng)頁(yè)的鏈接信號(hào)。明確選擇權(quán)威網(wǎng)頁(yè)可幫助搜索引擎將它們?cè)诟鱾€(gè)網(wǎng)址(例如,指向它們的鏈接)上找到的信息整合到一個(gè)首選網(wǎng)址上。也就是說,從其他網(wǎng)站指向 http://example.com/dresses/cocktail?gclid=ABCD 的鏈接會(huì)與指向 https://www.example.com/dresses/green/greendress.html 的鏈接整合。
  • 簡(jiǎn)化單個(gè)商品/主題的跟蹤指標(biāo)。當(dāng)多個(gè)網(wǎng)址都提供某個(gè)特定的內(nèi)容片段時(shí),獲取此內(nèi)容的綜合指標(biāo)的難度會(huì)更大。
  • 管理轉(zhuǎn)載內(nèi)容。 如果你是為了將內(nèi)容發(fā)布到其他網(wǎng)域而對(duì)其進(jìn)行轉(zhuǎn)載,那您就需要將網(wǎng)頁(yè)排名整合到首選網(wǎng)址。
  • 避免花費(fèi)時(shí)間抓取重復(fù)網(wǎng)頁(yè)。你肯定希望搜索引擎能夠最大限度地發(fā)現(xiàn)你網(wǎng)站的價(jià)值,因此最好讓它花費(fèi)時(shí)間抓取你網(wǎng)站上的新網(wǎng)頁(yè)(或更新后的網(wǎng)頁(yè)),而不是抓取相同網(wǎng)頁(yè)的桌面版和移動(dòng)版。

常用的三種方法指定權(quán)威網(wǎng)頁(yè)

1、rel=canonical <link> 標(biāo)記

在所有重復(fù)網(wǎng)頁(yè)的代碼中分別添加一個(gè) <link> 標(biāo)記,并使其指向權(quán)威網(wǎng)頁(yè)。

優(yōu)點(diǎn):

  • 可以映射無限多個(gè)重復(fù)網(wǎng)頁(yè)。

缺點(diǎn):

  • 可能會(huì)導(dǎo)致網(wǎng)頁(yè)大小增加。
  • 在大型網(wǎng)站或網(wǎng)址經(jīng)常改變的網(wǎng)站上維護(hù)映射可能會(huì)比較復(fù)雜。
  • 僅適用于 HTML 網(wǎng)頁(yè),不適用于 PDF 之類的文件(在這種情況下,你可以使用 rel=canonical HTTP 標(biāo)頭)。

2、rel=canonical HTTP 標(biāo)頭

在你的網(wǎng)頁(yè)響應(yīng)中發(fā)送 rel=canonical 標(biāo)頭。

優(yōu)點(diǎn):

  • 不會(huì)導(dǎo)致網(wǎng)頁(yè)大小增加。
  • 可以映射無限多個(gè)重復(fù)網(wǎng)頁(yè)。

缺點(diǎn):

  • 在大型網(wǎng)站或網(wǎng)址經(jīng)常改變的網(wǎng)站上維護(hù)映射可能會(huì)比較復(fù)雜。

3、301重定向

使用 301 重定向告知搜索定期,重定向網(wǎng)址是比給定網(wǎng)址更佳的版本。請(qǐng)僅在棄用重復(fù)網(wǎng)頁(yè)時(shí)使用此方法。

具體方法

若想為重復(fù)網(wǎng)址或重復(fù)網(wǎng)頁(yè)/類似網(wǎng)頁(yè)指定權(quán)威網(wǎng)址,請(qǐng)選擇下列方法之一。

使用 rel="canonical" 鏈接標(biāo)記

你可在網(wǎng)頁(yè)標(biāo)頭中使用 <link> 標(biāo)記來指明某個(gè)網(wǎng)頁(yè)與另一個(gè)網(wǎng)頁(yè)重復(fù)的情況。

假設(shè)你想將 https://example.com/dresses/green-dresses 設(shè)為權(quán)威網(wǎng)址(即是有很多個(gè)網(wǎng)址指向該內(nèi)容),那么你可通過執(zhí)行以下步驟將此網(wǎng)址指定為權(quán)威網(wǎng)址:

1、使用 rel="canonical" link 元素標(biāo)記所有重復(fù)的網(wǎng)頁(yè)。將屬性為 rel="canonical"<link> 元素添加到重復(fù)網(wǎng)頁(yè)的 <head> 部分中,并使其指向權(quán)威網(wǎng)頁(yè),如下所示:

<link rel="canonical" href="https://example.com/dresses/green-dresses" />

2、如果權(quán)威網(wǎng)頁(yè)有對(duì)應(yīng)的移動(dòng)版變體,請(qǐng)為其添加 rel="alternate" 鏈接,并使其指向此網(wǎng)頁(yè)的移動(dòng)版:

<link rel="alternate" media="only screen and (max-width: 640px)" href="http://m.example.com/dresses/green-dresses">

使用 rel="canonical" HTTP 標(biāo)頭

如果你能配置自己的服務(wù)器,則可使用 rel="canonical" HTTP 標(biāo)頭(而非 HTML 標(biāo)記)為非 HTML 文檔(例如 PDF 文件)指明權(quán)威網(wǎng)址。

例如,如果你通過多個(gè)網(wǎng)址顯示某個(gè) PDF 文件,則可為重復(fù)的網(wǎng)址返回如下 rel="canonical" HTTP 標(biāo)頭,以將該 PDF 文件的權(quán)威網(wǎng)址告知爬蟲:

Link: <http://www.example.com/downloads/white-paper.pdf>; rel="canonical"

對(duì)于 rel="canonical" link 元素,請(qǐng)使用絕對(duì)路徑(而非相對(duì)路徑)。
建議使用的結(jié)構(gòu):https://www.example.com/dresses/green/greendresss.html
不建議使用的結(jié)構(gòu):/dresses/green/greendress.html

對(duì)已停用的網(wǎng)址使用 301 重定向

如果你想移除現(xiàn)有的重復(fù)網(wǎng)頁(yè),但需要確保在停用舊網(wǎng)址之前順利完成遷移,請(qǐng)使用此方法。

假定用戶可通過以下幾種方式訪問您的網(wǎng)頁(yè):

https://example.com/home
https://home.example.com
https://www.example.com

你可從這些網(wǎng)址中挑選一個(gè)作為權(quán)威網(wǎng)址,并使用 301 重定向?qū)碜云渌W(wǎng)址的流量引導(dǎo)至你的首選網(wǎng)址。服務(wù)器端 301 重定向是確保將用戶和搜索引擎定向到正確網(wǎng)頁(yè)的最佳方式。301 狀態(tài)代碼表示相應(yīng)網(wǎng)頁(yè)已永久地遷移到新位置。

無論使用哪種方法,都請(qǐng)務(wù)必遵守如下常規(guī)指南

  • 請(qǐng)勿使用 robots.txt 文件進(jìn)行權(quán)威化。
  • 請(qǐng)勿使用網(wǎng)址移除工具進(jìn)行權(quán)威化:它會(huì)從搜索結(jié)果中移除相應(yīng)網(wǎng)址的所有版本。
  • 請(qǐng)勿使用相同或不同的權(quán)威化方法為同一網(wǎng)頁(yè)指定不同的權(quán)威網(wǎng)址(例如,請(qǐng)勿既在站點(diǎn)地圖中為某個(gè)網(wǎng)頁(yè)指定了一個(gè)權(quán)威網(wǎng)址,又使用 rel="canonical" 為同一網(wǎng)頁(yè)指定了一個(gè)不同的權(quán)威網(wǎng)址)。
  • 請(qǐng)勿將 noindex 用作一種可防止選擇權(quán)威網(wǎng)頁(yè)的方法。此指令旨在從索引中排除網(wǎng)頁(yè),而不是管理對(duì)權(quán)威網(wǎng)頁(yè)的選擇。
  • 使用 hreflang 標(biāo)記時(shí),請(qǐng)務(wù)必指定權(quán)威網(wǎng)頁(yè)。指定一個(gè)采用同一語(yǔ)言的權(quán)威網(wǎng)頁(yè);如果沒有這樣的權(quán)威網(wǎng)頁(yè),則需指定一個(gè)采用最佳替代語(yǔ)言的權(quán)威網(wǎng)頁(yè)。

優(yōu)先選擇 HTTPS(而非 HTTP)作為權(quán)威網(wǎng)址

搜索引擎會(huì)優(yōu)先選擇 HTTPS 網(wǎng)頁(yè)(而非等效的 HTTP 網(wǎng)頁(yè))作為權(quán)威網(wǎng)址,除非存在如下問題或沖突信號(hào):

  • HTTPS 網(wǎng)頁(yè)的 SSL 證書無效。
  • HTTPS 網(wǎng)頁(yè)包含不安全的關(guān)聯(lián)功能(圖片除外)。
  • HTTPS 網(wǎng)頁(yè)會(huì)將用戶重定向至 HTTP 網(wǎng)頁(yè)或會(huì)通過 HTTP 網(wǎng)頁(yè)重定向用戶。
  • HTTPS 網(wǎng)頁(yè)包含指向 HTTP 網(wǎng)頁(yè)的 rel="canonical" 鏈接。

雖然搜索引擎在默認(rèn)情況下會(huì)優(yōu)先選擇 HTTPS 網(wǎng)頁(yè)(而非 HTTP 網(wǎng)頁(yè)),但你可通過執(zhí)行以下任一操作來確保此行為始終都會(huì)發(fā)生:

  • 添加從 HTTP 網(wǎng)頁(yè)指向 HTTPS 網(wǎng)頁(yè)的重定向。
  • 添加從 HTTP 網(wǎng)頁(yè)指向 HTTPS 網(wǎng)頁(yè)的 rel="canonical" 鏈接。

為防止搜索引擎誤將 HTTP 網(wǎng)頁(yè)選為權(quán)威網(wǎng)頁(yè),你應(yīng)避免以下幾種做法:

  • 使用有誤的 SSL 證書和 HTTPS-HTTP 重定向。這會(huì)非常容易導(dǎo)致搜索引擎優(yōu)先選擇 HTTP,即使實(shí)施 HSTS 也無法替換這種強(qiáng)烈的偏好設(shè)置。
  • 在站點(diǎn)地圖或 hreflang 條目中包含 HTTP 網(wǎng)頁(yè)(而不是 HTTPS 版本)。
  • 為錯(cuò)誤的主機(jī)版本實(shí)施 SSL/TLS 證書:例如,在 example.com 上為 www.example.com 提供證書。該證書必須與你的完整網(wǎng)站網(wǎng)址匹配,或者必須是可用于同一網(wǎng)域上多個(gè)子網(wǎng)域的通配證書。

你可能對(duì)以下文章也感興趣

x
  • 站長(zhǎng)推薦
/* 左側(cè)顯示文章內(nèi)容目錄 */