|
|
|
|
|
如果你對 rel=canonical
還未曾了解,那么請先看一看下面這條語句:
<link>
標簽應該知道吧,它是放在<head>
里面的一個元素標記,該標簽定義文檔與外部資源的關系。而rel
是<link>
標簽里面的一個屬性,canonical
則是rel
的屬性值。
好了,現(xiàn)在進入正題,說明 rel=canonical
的重要性以及如何使用該屬性。
如果你的某一個網(wǎng)頁可通過多個網(wǎng)址訪問,或者你的不同網(wǎng)頁包含類似內容(例如,某個網(wǎng)頁既有移動版,又有桌面版),那么你應明確告知搜索引擎哪個網(wǎng)址是該網(wǎng)頁的權威網(wǎng)址(權威網(wǎng)址)。否則,搜索引擎就會替您做出選擇,或會將這兩個版本視為完全等同,這可能會導致出現(xiàn)一些不當?shù)男袨椤?/p>
請注意,雖然建議你為重復的網(wǎng)址或版本指定權威網(wǎng)頁,但搜索引擎可能會出于各種原因(例如性能或內容)通過算法來選擇一個不同的網(wǎng)頁作為權威網(wǎng)頁。
你的網(wǎng)站上可能會有多個不同的網(wǎng)址指向同一個網(wǎng)頁,或者在不同網(wǎng)址上有重復網(wǎng)頁或非常類似的網(wǎng)頁,這是有正當理由的。以下是最常見的原因:
https://example.com/news/koala-rampage
https://m.example.com/news/koala-rampage
https://amp.example.com/news/koala-rampage
https://www.example.com/products?category=dresses&color=green
https://example.com/dresses/cocktail?gclid=ABCD
https://www.example.com/dresses/green/greendress.html
https://blog.example.com/dresses/green-dresses-are-awesome/
https://blog.example.com/green-things/green-dresses-are-awesome/
http://example.com/green-dresses
https://example.com/green-dresses
http://www.example.com/green-dresses
https://news.example.com/green-dresses-for-every-day-155672.html(轉載博文)
https://blog.example.com/dresses/green-dresses-are-awesome/3245/(原始博文)
當搜索引擎將某個網(wǎng)站編入索引時,它會嘗試確定此網(wǎng)站的每個網(wǎng)頁中涵蓋的主題。如果爬蟲在同一網(wǎng)站上發(fā)現(xiàn)了多個似乎包含相同內容的網(wǎng)頁,則會選擇它認為最完整且實用的那個網(wǎng)頁,并將其標記為權威網(wǎng)頁。為了節(jié)省你網(wǎng)站的抓取預算,爬蟲會經(jīng)常抓取權威網(wǎng)頁,而不會頻繁地抓取重復網(wǎng)頁。因此,如果你不告知爬蟲哪個網(wǎng)頁是權威網(wǎng)頁,并且決定將一個不同的網(wǎng)頁(與爬蟲所選的網(wǎng)頁不同)作為權威網(wǎng)頁,那么爬蟲便可能不會經(jīng)常將你費心費力地更新的網(wǎng)頁編入索引或在搜索結果中顯示該網(wǎng)頁。
爬蟲會使用你網(wǎng)站上的權威網(wǎng)頁作為網(wǎng)站內容的黃金標準對網(wǎng)站內容和質量進行評估,搜索引擎搜索結果通常亦會指向權威網(wǎng)頁,除非某個重復網(wǎng)頁明顯與用戶的查詢更相符:例如,如果用戶使用的是移動設備,那么即使桌面版網(wǎng)頁被標記為權威網(wǎng)頁,搜索結果也可能會指向移動版網(wǎng)頁。
搜索引擎會根據(jù)許多因素(或“信號”)來選擇權威網(wǎng)頁,例如網(wǎng)頁是通過 http 還是 https 提供;用戶聲明的首選網(wǎng)域;網(wǎng)頁質量;站點地圖中是否顯示了相應網(wǎng)址;以及任何“rel=canonical
”標簽。你不能強制搜索引擎將哪個網(wǎng)頁選作權威網(wǎng)頁,但可通過使用下文中所述的一種或多種方法來影響它的選擇。
在一組重復網(wǎng)頁/類似網(wǎng)頁中明確選擇權威網(wǎng)頁可滿足您的諸多需求,具體如下所示:
在所有重復網(wǎng)頁的代碼中分別添加一個 <link>
標記,并使其指向權威網(wǎng)頁。
優(yōu)點:
缺點:
rel=canonical
HTTP 標頭)。在你的網(wǎng)頁響應中發(fā)送 rel=canonical
標頭。
優(yōu)點:
缺點:
使用 301 重定向告知搜索定期,重定向網(wǎng)址是比給定網(wǎng)址更佳的版本。請僅在棄用重復網(wǎng)頁時使用此方法。
若想為重復網(wǎng)址或重復網(wǎng)頁/類似網(wǎng)頁指定權威網(wǎng)址,請選擇下列方法之一。
你可在網(wǎng)頁標頭中使用 <link>
標記來指明某個網(wǎng)頁與另一個網(wǎng)頁重復的情況。
假設你想將 https://example.com/dresses/green-dresses 設為權威網(wǎng)址(即是有很多個網(wǎng)址指向該內容),那么你可通過執(zhí)行以下步驟將此網(wǎng)址指定為權威網(wǎng)址:
1、使用 rel="canonical"
link 元素標記所有重復的網(wǎng)頁。將屬性為 rel="canonical"
的 <link>
元素添加到重復網(wǎng)頁的 <head>
部分中,并使其指向權威網(wǎng)頁,如下所示:
<link rel="canonical" href="https://example.com/dresses/green-dresses" />
2、如果權威網(wǎng)頁有對應的移動版變體,請為其添加 rel="alternate"
鏈接,并使其指向此網(wǎng)頁的移動版:
<link rel="alternate" media="only screen and (max-width: 640px)" href="http://m.example.com/dresses/green-dresses">
如果你能配置自己的服務器,則可使用 rel="canonical"
HTTP 標頭(而非 HTML 標記)為非 HTML 文檔(例如 PDF 文件)指明權威網(wǎng)址。
例如,如果你通過多個網(wǎng)址顯示某個 PDF 文件,則可為重復的網(wǎng)址返回如下 rel="canonical"
HTTP 標頭,以將該 PDF 文件的權威網(wǎng)址告知爬蟲:
Link: <http://www.example.com/downloads/white-paper.pdf>; rel="canonical"
對于 rel="canonical"
link 元素,請使用絕對路徑(而非相對路徑)。
建議使用的結構:https://www.example.com/dresses/green/greendresss.html
不建議使用的結構:/dresses/green/greendress.html
如果你想移除現(xiàn)有的重復網(wǎng)頁,但需要確保在停用舊網(wǎng)址之前順利完成遷移,請使用此方法。
假定用戶可通過以下幾種方式訪問您的網(wǎng)頁:
https://example.com/home
https://home.example.com
https://www.example.com
你可從這些網(wǎng)址中挑選一個作為權威網(wǎng)址,并使用 301 重定向將來自其他網(wǎng)址的流量引導至你的首選網(wǎng)址。服務器端 301 重定向是確保將用戶和搜索引擎定向到正確網(wǎng)頁的最佳方式。301 狀態(tài)代碼表示相應網(wǎng)頁已永久地遷移到新位置。
rel="canonical"
為同一網(wǎng)頁指定了一個不同的權威網(wǎng)址)。搜索引擎會優(yōu)先選擇 HTTPS 網(wǎng)頁(而非等效的 HTTP 網(wǎng)頁)作為權威網(wǎng)址,除非存在如下問題或沖突信號:
rel="canonical"
鏈接。雖然搜索引擎在默認情況下會優(yōu)先選擇 HTTPS 網(wǎng)頁(而非 HTTP 網(wǎng)頁),但你可通過執(zhí)行以下任一操作來確保此行為始終都會發(fā)生:
rel="canonical"
鏈接。為防止搜索引擎誤將 HTTP 網(wǎng)頁選為權威網(wǎng)頁,你應避免以下幾種做法: