技術頻道導航
HTML/CSS
.NET技術
IIS技術
PHP技術
Js/JQuery
Photoshop
Fireworks
服務器技術
操作系統(tǒng)
網(wǎng)站運營

贊助商

分類目錄

贊助商

最新文章

搜索

SEO: 使用 rel=canonical 為類似網(wǎng)頁或重復網(wǎng)頁指定權威網(wǎng)頁

作者:admin    時間:2018-7-19 10:53:27    瀏覽:

如果你對  rel=canonical  還未曾了解,那么請先看一看下面這條語句:

 link標簽

<link>標簽應該知道吧,它是放在<head>里面的一個元素標記,該標簽定義文檔與外部資源的關系。而rel<link>標簽里面的一個屬性,canonical則是rel的屬性值。

好了,現(xiàn)在進入正題,說明 rel=canonical 的重要性以及如何使用該屬性。

使用 rel=canonical 為類似網(wǎng)頁或重復網(wǎng)頁指定權威網(wǎng)頁

如果你的某一個網(wǎng)頁可通過多個網(wǎng)址訪問,或者你的不同網(wǎng)頁包含類似內容(例如,某個網(wǎng)頁既有移動版,又有桌面版),那么你應明確告知搜索引擎哪個網(wǎng)址是該網(wǎng)頁的權威網(wǎng)址(權威網(wǎng)址)。否則,搜索引擎就會替您做出選擇,或會將這兩個版本視為完全等同,這可能會導致出現(xiàn)一些不當?shù)男袨椤?/p>

請注意,雖然建議你為重復的網(wǎng)址或版本指定權威網(wǎng)頁,但搜索引擎可能會出于各種原因(例如性能或內容)通過算法來選擇一個不同的網(wǎng)頁作為權威網(wǎng)頁。

為什么我的網(wǎng)站上會有類似網(wǎng)頁/重復網(wǎng)頁?

你的網(wǎng)站上可能會有多個不同的網(wǎng)址指向同一個網(wǎng)頁,或者在不同網(wǎng)址上有重復網(wǎng)頁或非常類似的網(wǎng)頁,這是有正當理由的。以下是最常見的原因:

為了支持多種設備類型:

https://example.com/news/koala-rampage
https://m.example.com/news/koala-rampage
https://amp.example.com/news/koala-rampage

為了為諸如搜索參數(shù)或會話 ID 之類的內容啟用動態(tài)網(wǎng)址:

https://www.example.com/products?category=dresses&color=green
https://example.com/dresses/cocktail?gclid=ABCD
https://www.example.com/dresses/green/greendress.html

當你將同一篇博文同時放在多個版塊中時,你的博客系統(tǒng)會自動保存多個網(wǎng)址。

https://blog.example.com/dresses/green-dresses-are-awesome/
https://blog.example.com/green-things/green-dresses-are-awesome/

你的服務器已配置為針對 www/非 www http/https 變體提供相同的內容:

http://example.com/green-dresses
https://example.com/green-dresses
http://www.example.com/green-dresses

你在相應博客上提供的要轉載到其他網(wǎng)站上的內容與這些網(wǎng)域中的原有內容完全重復或部分重復:

https://news.example.com/green-dresses-for-every-day-155672.html(轉載博文)
https://blog.example.com/dresses/green-dresses-are-awesome/3245/(原始博文)

具體細節(jié)

當搜索引擎將某個網(wǎng)站編入索引時,它會嘗試確定此網(wǎng)站的每個網(wǎng)頁中涵蓋的主題。如果爬蟲在同一網(wǎng)站上發(fā)現(xiàn)了多個似乎包含相同內容的網(wǎng)頁,則會選擇它認為最完整且實用的那個網(wǎng)頁,并將其標記為權威網(wǎng)頁。為了節(jié)省你網(wǎng)站的抓取預算,爬蟲會經(jīng)常抓取權威網(wǎng)頁,而不會頻繁地抓取重復網(wǎng)頁。因此,如果你不告知爬蟲哪個網(wǎng)頁是權威網(wǎng)頁,并且決定將一個不同的網(wǎng)頁(與爬蟲所選的網(wǎng)頁不同)作為權威網(wǎng)頁,那么爬蟲便可能不會經(jīng)常將你費心費力地更新的網(wǎng)頁編入索引或在搜索結果中顯示該網(wǎng)頁。

爬蟲會使用你網(wǎng)站上的權威網(wǎng)頁作為網(wǎng)站內容的黃金標準對網(wǎng)站內容和質量進行評估,搜索引擎搜索結果通常亦會指向權威網(wǎng)頁,除非某個重復網(wǎng)頁明顯與用戶的查詢更相符:例如,如果用戶使用的是移動設備,那么即使桌面版網(wǎng)頁被標記為權威網(wǎng)頁,搜索結果也可能會指向移動版網(wǎng)頁。

搜索引擎會根據(jù)許多因素(或“信號”)來選擇權威網(wǎng)頁,例如網(wǎng)頁是通過 http 還是 https 提供;用戶聲明的首選網(wǎng)域;網(wǎng)頁質量;站點地圖中是否顯示了相應網(wǎng)址;以及任何“rel=canonical”標簽。你不能強制搜索引擎將哪個網(wǎng)頁選作權威網(wǎng)頁,但可通過使用下文中所述的一種或多種方法來影響它的選擇。

為什么一定要指定權威網(wǎng)頁

在一組重復網(wǎng)頁/類似網(wǎng)頁中明確選擇權威網(wǎng)頁可滿足您的諸多需求,具體如下所示:

  • 指定您希望用戶在搜索結果中看到的網(wǎng)址。你可能希望用戶通過 https://www.example.com/dresses/green/greendress.html(而非 https://example.com/dresses/cocktail?gclid=ABCD)訪問你的綠色禮服商品頁。
  • 整合類似網(wǎng)頁或重復網(wǎng)頁的鏈接信號。明確選擇權威網(wǎng)頁可幫助搜索引擎將它們在各個網(wǎng)址(例如,指向它們的鏈接)上找到的信息整合到一個首選網(wǎng)址上。也就是說,從其他網(wǎng)站指向 http://example.com/dresses/cocktail?gclid=ABCD 的鏈接會與指向 https://www.example.com/dresses/green/greendress.html 的鏈接整合。
  • 簡化單個商品/主題的跟蹤指標。當多個網(wǎng)址都提供某個特定的內容片段時,獲取此內容的綜合指標的難度會更大。
  • 管理轉載內容。 如果你是為了將內容發(fā)布到其他網(wǎng)域而對其進行轉載,那您就需要將網(wǎng)頁排名整合到首選網(wǎng)址。
  • 避免花費時間抓取重復網(wǎng)頁。你肯定希望搜索引擎能夠最大限度地發(fā)現(xiàn)你網(wǎng)站的價值,因此最好讓它花費時間抓取你網(wǎng)站上的新網(wǎng)頁(或更新后的網(wǎng)頁),而不是抓取相同網(wǎng)頁的桌面版和移動版。

常用的三種方法指定權威網(wǎng)頁

1、rel=canonical <link> 標記

在所有重復網(wǎng)頁的代碼中分別添加一個 <link> 標記,并使其指向權威網(wǎng)頁。

優(yōu)點:

  • 可以映射無限多個重復網(wǎng)頁。

缺點:

  • 可能會導致網(wǎng)頁大小增加。
  • 在大型網(wǎng)站或網(wǎng)址經(jīng)常改變的網(wǎng)站上維護映射可能會比較復雜。
  • 僅適用于 HTML 網(wǎng)頁,不適用于 PDF 之類的文件(在這種情況下,你可以使用 rel=canonical HTTP 標頭)。

2、rel=canonical HTTP 標頭

在你的網(wǎng)頁響應中發(fā)送 rel=canonical 標頭。

優(yōu)點:

  • 不會導致網(wǎng)頁大小增加。
  • 可以映射無限多個重復網(wǎng)頁。

缺點:

  • 在大型網(wǎng)站或網(wǎng)址經(jīng)常改變的網(wǎng)站上維護映射可能會比較復雜。

3、301重定向

使用 301 重定向告知搜索定期,重定向網(wǎng)址是比給定網(wǎng)址更佳的版本。請僅在棄用重復網(wǎng)頁時使用此方法。

具體方法

若想為重復網(wǎng)址或重復網(wǎng)頁/類似網(wǎng)頁指定權威網(wǎng)址,請選擇下列方法之一。

使用 rel="canonical" 鏈接標記

你可在網(wǎng)頁標頭中使用 <link> 標記來指明某個網(wǎng)頁與另一個網(wǎng)頁重復的情況。

假設你想將 https://example.com/dresses/green-dresses 設為權威網(wǎng)址(即是有很多個網(wǎng)址指向該內容),那么你可通過執(zhí)行以下步驟將此網(wǎng)址指定為權威網(wǎng)址:

1、使用 rel="canonical" link 元素標記所有重復的網(wǎng)頁。將屬性為 rel="canonical"<link> 元素添加到重復網(wǎng)頁的 <head> 部分中,并使其指向權威網(wǎng)頁,如下所示:

<link rel="canonical" href="https://example.com/dresses/green-dresses" />

2、如果權威網(wǎng)頁有對應的移動版變體,請為其添加 rel="alternate" 鏈接,并使其指向此網(wǎng)頁的移動版:

<link rel="alternate" media="only screen and (max-width: 640px)" href="http://m.example.com/dresses/green-dresses">

使用 rel="canonical" HTTP 標頭

如果你能配置自己的服務器,則可使用 rel="canonical" HTTP 標頭(而非 HTML 標記)為非 HTML 文檔(例如 PDF 文件)指明權威網(wǎng)址。

例如,如果你通過多個網(wǎng)址顯示某個 PDF 文件,則可為重復的網(wǎng)址返回如下 rel="canonical" HTTP 標頭,以將該 PDF 文件的權威網(wǎng)址告知爬蟲:

Link: <http://www.example.com/downloads/white-paper.pdf>; rel="canonical"

對于 rel="canonical" link 元素,請使用絕對路徑(而非相對路徑)。
建議使用的結構:https://www.example.com/dresses/green/greendresss.html
不建議使用的結構:/dresses/green/greendress.html

對已停用的網(wǎng)址使用 301 重定向

如果你想移除現(xiàn)有的重復網(wǎng)頁,但需要確保在停用舊網(wǎng)址之前順利完成遷移,請使用此方法。

假定用戶可通過以下幾種方式訪問您的網(wǎng)頁:

https://example.com/home
https://home.example.com
https://www.example.com

你可從這些網(wǎng)址中挑選一個作為權威網(wǎng)址,并使用 301 重定向將來自其他網(wǎng)址的流量引導至你的首選網(wǎng)址。服務器端 301 重定向是確保將用戶和搜索引擎定向到正確網(wǎng)頁的最佳方式。301 狀態(tài)代碼表示相應網(wǎng)頁已永久地遷移到新位置。

無論使用哪種方法,都請務必遵守如下常規(guī)指南

  • 請勿使用 robots.txt 文件進行權威化。
  • 請勿使用網(wǎng)址移除工具進行權威化:它會從搜索結果中移除相應網(wǎng)址的所有版本。
  • 請勿使用相同或不同的權威化方法為同一網(wǎng)頁指定不同的權威網(wǎng)址(例如,請勿既在站點地圖中為某個網(wǎng)頁指定了一個權威網(wǎng)址,又使用 rel="canonical" 為同一網(wǎng)頁指定了一個不同的權威網(wǎng)址)。
  • 請勿將 noindex 用作一種可防止選擇權威網(wǎng)頁的方法。此指令旨在從索引中排除網(wǎng)頁,而不是管理對權威網(wǎng)頁的選擇。
  • 使用 hreflang 標記時,請務必指定權威網(wǎng)頁。指定一個采用同一語言的權威網(wǎng)頁;如果沒有這樣的權威網(wǎng)頁,則需指定一個采用最佳替代語言的權威網(wǎng)頁。

優(yōu)先選擇 HTTPS(而非 HTTP)作為權威網(wǎng)址

搜索引擎會優(yōu)先選擇 HTTPS 網(wǎng)頁(而非等效的 HTTP 網(wǎng)頁)作為權威網(wǎng)址,除非存在如下問題或沖突信號:

  • HTTPS 網(wǎng)頁的 SSL 證書無效。
  • HTTPS 網(wǎng)頁包含不安全的關聯(lián)功能(圖片除外)。
  • HTTPS 網(wǎng)頁會將用戶重定向至 HTTP 網(wǎng)頁或會通過 HTTP 網(wǎng)頁重定向用戶。
  • HTTPS 網(wǎng)頁包含指向 HTTP 網(wǎng)頁的 rel="canonical" 鏈接。

雖然搜索引擎在默認情況下會優(yōu)先選擇 HTTPS 網(wǎng)頁(而非 HTTP 網(wǎng)頁),但你可通過執(zhí)行以下任一操作來確保此行為始終都會發(fā)生:

  • 添加從 HTTP 網(wǎng)頁指向 HTTPS 網(wǎng)頁的重定向。
  • 添加從 HTTP 網(wǎng)頁指向 HTTPS 網(wǎng)頁的 rel="canonical" 鏈接。

為防止搜索引擎誤將 HTTP 網(wǎng)頁選為權威網(wǎng)頁,你應避免以下幾種做法:

  • 使用有誤的 SSL 證書和 HTTPS-HTTP 重定向。這會非常容易導致搜索引擎優(yōu)先選擇 HTTP,即使實施 HSTS 也無法替換這種強烈的偏好設置。
  • 在站點地圖或 hreflang 條目中包含 HTTP 網(wǎng)頁(而不是 HTTPS 版本)。
  • 為錯誤的主機版本實施 SSL/TLS 證書:例如,在 example.com 上為 www.example.com 提供證書。該證書必須與你的完整網(wǎng)站網(wǎng)址匹配,或者必須是可用于同一網(wǎng)域上多個子網(wǎng)域的通配證書。

你可能對以下文章也感興趣

x