|
|
|
|
|
如果你對(duì) rel=canonical
還未曾了解,那么請(qǐng)先看一看下面這條語(yǔ)句:
<link>
標(biāo)簽應(yīng)該知道吧,它是放在<head>
里面的一個(gè)元素標(biāo)記,該標(biāo)簽定義文檔與外部資源的關(guān)系。而rel
是<link>
標(biāo)簽里面的一個(gè)屬性,canonical
則是rel
的屬性值。
好了,現(xiàn)在進(jìn)入正題,說明 rel=canonical
的重要性以及如何使用該屬性。
如果你的某一個(gè)網(wǎng)頁(yè)可通過多個(gè)網(wǎng)址訪問,或者你的不同網(wǎng)頁(yè)包含類似內(nèi)容(例如,某個(gè)網(wǎng)頁(yè)既有移動(dòng)版,又有桌面版),那么你應(yīng)明確告知搜索引擎哪個(gè)網(wǎng)址是該網(wǎng)頁(yè)的權(quán)威網(wǎng)址(權(quán)威網(wǎng)址)。否則,搜索引擎就會(huì)替您做出選擇,或會(huì)將這兩個(gè)版本視為完全等同,這可能會(huì)導(dǎo)致出現(xiàn)一些不當(dāng)?shù)男袨椤?/p>
請(qǐng)注意,雖然建議你為重復(fù)的網(wǎng)址或版本指定權(quán)威網(wǎng)頁(yè),但搜索引擎可能會(huì)出于各種原因(例如性能或內(nèi)容)通過算法來選擇一個(gè)不同的網(wǎng)頁(yè)作為權(quán)威網(wǎng)頁(yè)。
你的網(wǎng)站上可能會(huì)有多個(gè)不同的網(wǎng)址指向同一個(gè)網(wǎng)頁(yè),或者在不同網(wǎng)址上有重復(fù)網(wǎng)頁(yè)或非常類似的網(wǎng)頁(yè),這是有正當(dāng)理由的。以下是最常見的原因:
https://example.com/news/koala-rampage
https://m.example.com/news/koala-rampage
https://amp.example.com/news/koala-rampage
https://www.example.com/products?category=dresses&color=green
https://example.com/dresses/cocktail?gclid=ABCD
https://www.example.com/dresses/green/greendress.html
https://blog.example.com/dresses/green-dresses-are-awesome/
https://blog.example.com/green-things/green-dresses-are-awesome/
http://example.com/green-dresses
https://example.com/green-dresses
http://www.example.com/green-dresses
https://news.example.com/green-dresses-for-every-day-155672.html(轉(zhuǎn)載博文)
https://blog.example.com/dresses/green-dresses-are-awesome/3245/(原始博文)
當(dāng)搜索引擎將某個(gè)網(wǎng)站編入索引時(shí),它會(huì)嘗試確定此網(wǎng)站的每個(gè)網(wǎng)頁(yè)中涵蓋的主題。如果爬蟲在同一網(wǎng)站上發(fā)現(xiàn)了多個(gè)似乎包含相同內(nèi)容的網(wǎng)頁(yè),則會(huì)選擇它認(rèn)為最完整且實(shí)用的那個(gè)網(wǎng)頁(yè),并將其標(biāo)記為權(quán)威網(wǎng)頁(yè)。為了節(jié)省你網(wǎng)站的抓取預(yù)算,爬蟲會(huì)經(jīng)常抓取權(quán)威網(wǎng)頁(yè),而不會(huì)頻繁地抓取重復(fù)網(wǎng)頁(yè)。因此,如果你不告知爬蟲哪個(gè)網(wǎng)頁(yè)是權(quán)威網(wǎng)頁(yè),并且決定將一個(gè)不同的網(wǎng)頁(yè)(與爬蟲所選的網(wǎng)頁(yè)不同)作為權(quán)威網(wǎng)頁(yè),那么爬蟲便可能不會(huì)經(jīng)常將你費(fèi)心費(fèi)力地更新的網(wǎng)頁(yè)編入索引或在搜索結(jié)果中顯示該網(wǎng)頁(yè)。
爬蟲會(huì)使用你網(wǎng)站上的權(quán)威網(wǎng)頁(yè)作為網(wǎng)站內(nèi)容的黃金標(biāo)準(zhǔn)對(duì)網(wǎng)站內(nèi)容和質(zhì)量進(jìn)行評(píng)估,搜索引擎搜索結(jié)果通常亦會(huì)指向權(quán)威網(wǎng)頁(yè),除非某個(gè)重復(fù)網(wǎng)頁(yè)明顯與用戶的查詢更相符:例如,如果用戶使用的是移動(dòng)設(shè)備,那么即使桌面版網(wǎng)頁(yè)被標(biāo)記為權(quán)威網(wǎng)頁(yè),搜索結(jié)果也可能會(huì)指向移動(dòng)版網(wǎng)頁(yè)。
搜索引擎會(huì)根據(jù)許多因素(或“信號(hào)”)來選擇權(quán)威網(wǎng)頁(yè),例如網(wǎng)頁(yè)是通過 http 還是 https 提供;用戶聲明的首選網(wǎng)域;網(wǎng)頁(yè)質(zhì)量;站點(diǎn)地圖中是否顯示了相應(yīng)網(wǎng)址;以及任何“rel=canonical
”標(biāo)簽。你不能強(qiáng)制搜索引擎將哪個(gè)網(wǎng)頁(yè)選作權(quán)威網(wǎng)頁(yè),但可通過使用下文中所述的一種或多種方法來影響它的選擇。
在一組重復(fù)網(wǎng)頁(yè)/類似網(wǎng)頁(yè)中明確選擇權(quán)威網(wǎng)頁(yè)可滿足您的諸多需求,具體如下所示:
在所有重復(fù)網(wǎng)頁(yè)的代碼中分別添加一個(gè) <link>
標(biāo)記,并使其指向權(quán)威網(wǎng)頁(yè)。
優(yōu)點(diǎn):
缺點(diǎn):
rel=canonical
HTTP 標(biāo)頭)。在你的網(wǎng)頁(yè)響應(yīng)中發(fā)送 rel=canonical
標(biāo)頭。
優(yōu)點(diǎn):
缺點(diǎn):
使用 301 重定向告知搜索定期,重定向網(wǎng)址是比給定網(wǎng)址更佳的版本。請(qǐng)僅在棄用重復(fù)網(wǎng)頁(yè)時(shí)使用此方法。
若想為重復(fù)網(wǎng)址或重復(fù)網(wǎng)頁(yè)/類似網(wǎng)頁(yè)指定權(quán)威網(wǎng)址,請(qǐng)選擇下列方法之一。
你可在網(wǎng)頁(yè)標(biāo)頭中使用 <link>
標(biāo)記來指明某個(gè)網(wǎng)頁(yè)與另一個(gè)網(wǎng)頁(yè)重復(fù)的情況。
假設(shè)你想將 https://example.com/dresses/green-dresses 設(shè)為權(quán)威網(wǎng)址(即是有很多個(gè)網(wǎng)址指向該內(nèi)容),那么你可通過執(zhí)行以下步驟將此網(wǎng)址指定為權(quán)威網(wǎng)址:
1、使用 rel="canonical"
link 元素標(biāo)記所有重復(fù)的網(wǎng)頁(yè)。將屬性為 rel="canonical"
的 <link>
元素添加到重復(fù)網(wǎng)頁(yè)的 <head>
部分中,并使其指向權(quán)威網(wǎng)頁(yè),如下所示:
<link rel="canonical" href="https://example.com/dresses/green-dresses" />
2、如果權(quán)威網(wǎng)頁(yè)有對(duì)應(yīng)的移動(dòng)版變體,請(qǐng)為其添加 rel="alternate"
鏈接,并使其指向此網(wǎng)頁(yè)的移動(dòng)版:
<link rel="alternate" media="only screen and (max-width: 640px)" href="http://m.example.com/dresses/green-dresses">
如果你能配置自己的服務(wù)器,則可使用 rel="canonical"
HTTP 標(biāo)頭(而非 HTML 標(biāo)記)為非 HTML 文檔(例如 PDF 文件)指明權(quán)威網(wǎng)址。
例如,如果你通過多個(gè)網(wǎng)址顯示某個(gè) PDF 文件,則可為重復(fù)的網(wǎng)址返回如下 rel="canonical"
HTTP 標(biāo)頭,以將該 PDF 文件的權(quán)威網(wǎng)址告知爬蟲:
Link: <http://www.example.com/downloads/white-paper.pdf>; rel="canonical"
對(duì)于 rel="canonical"
link 元素,請(qǐng)使用絕對(duì)路徑(而非相對(duì)路徑)。
建議使用的結(jié)構(gòu):https://www.example.com/dresses/green/greendresss.html
不建議使用的結(jié)構(gòu):/dresses/green/greendress.html
如果你想移除現(xiàn)有的重復(fù)網(wǎng)頁(yè),但需要確保在停用舊網(wǎng)址之前順利完成遷移,請(qǐng)使用此方法。
假定用戶可通過以下幾種方式訪問您的網(wǎng)頁(yè):
https://example.com/home
https://home.example.com
https://www.example.com
你可從這些網(wǎng)址中挑選一個(gè)作為權(quán)威網(wǎng)址,并使用 301 重定向?qū)碜云渌W(wǎng)址的流量引導(dǎo)至你的首選網(wǎng)址。服務(wù)器端 301 重定向是確保將用戶和搜索引擎定向到正確網(wǎng)頁(yè)的最佳方式。301 狀態(tài)代碼表示相應(yīng)網(wǎng)頁(yè)已永久地遷移到新位置。
rel="canonical"
為同一網(wǎng)頁(yè)指定了一個(gè)不同的權(quán)威網(wǎng)址)。搜索引擎會(huì)優(yōu)先選擇 HTTPS 網(wǎng)頁(yè)(而非等效的 HTTP 網(wǎng)頁(yè))作為權(quán)威網(wǎng)址,除非存在如下問題或沖突信號(hào):
rel="canonical"
鏈接。雖然搜索引擎在默認(rèn)情況下會(huì)優(yōu)先選擇 HTTPS 網(wǎng)頁(yè)(而非 HTTP 網(wǎng)頁(yè)),但你可通過執(zhí)行以下任一操作來確保此行為始終都會(huì)發(fā)生:
rel="canonical"
鏈接。為防止搜索引擎誤將 HTTP 網(wǎng)頁(yè)選為權(quán)威網(wǎng)頁(yè),你應(yīng)避免以下幾種做法: