2009年2月,Google、雅虎 、微軟共同發(fā)布了一個新的標簽:canonical,用于解決網(wǎng)址規(guī)范化的問題。當我們的同一個頁面可以通過多個URL來訪問的時候,可以通過canonical標簽來實現(xiàn)訪問最規(guī)范化的網(wǎng)址。
一. Canonical是什么?
canonical標簽是一種告訴搜索引擎您要在搜索結果中顯示哪個版本的URL的方法。使用canonical標簽可以防止由于相同(或非常相似)或“重復”內(nèi)容出現(xiàn)在多個URL上而引起的問題。
這種重復的內(nèi)容可能是多種形式出現(xiàn)的,包括:
1. 可在URL中添加或不添加“ www”前綴的網(wǎng)頁
2. 可通過“ HTTP”和“ HTTPS”協(xié)議訪問網(wǎng)頁
3. 同一樣目下的多個列表頁。
如果出現(xiàn)多個不同的URL地址訪問到的頁面都是首頁,這時就可以使用canonical標簽來規(guī)范首頁網(wǎng)址,假設統(tǒng)一規(guī)范為https://example.com,這時就需要在其他3個頁面head標簽內(nèi)加上下面的一段代碼:
<link rel=”canonical” href=”https://example.com”>
二. 如何正確使用Canonical?
1. 確定首選域
就像上面舉例一樣,我們常常會遇到這個問題,特別是一個帶www,一個不帶www的網(wǎng)址。通常最簡單的方法是通過301重定向來確定我們的首選域;如果在能力或技術限制的情況下,使用canonical標簽來規(guī)范首選域網(wǎng)址也是一個好的方法。
建議:能通過301重定向確定首選域,最好使用重定向比較好;迫不得已的情況下,才使用canonical來實現(xiàn)。
2. 動態(tài)URL與偽靜態(tài)URL
有的時候我們會遇到這樣的一種情況,就是同樣的一個網(wǎng)頁有多個訪問入口,雖然頁面已經(jīng)經(jīng)過了偽靜態(tài)化處理,但是很容易造成一個頁面對應多個入口的情況,一個是自身動態(tài)URL,另一個是偽靜態(tài)化處理過的靜態(tài)URL,這時可以通過canonical標簽來規(guī)范網(wǎng)頁。
3. 含有參數(shù)的URL
很多網(wǎng)站,特別是大型網(wǎng)站,會對網(wǎng)頁設置一些跟蹤參數(shù),通過不同的路徑訪問,同一頁面會出現(xiàn)多個版本的URL,這時也可以通過canonical標簽來規(guī)范網(wǎng)址。
4. 商城B2C網(wǎng)站
很多商城網(wǎng)站的產(chǎn)品很多都相似,甚至只是商品顏色不同,但內(nèi)容完全相同,這會導致高度的重復頁面。針對這種情況,我們也可以使用canonical標簽來規(guī)范網(wǎng)頁。
三. Canonical標簽的作用
1. 使用canonical標簽使網(wǎng)址規(guī)范化;
2. 避免內(nèi)容重復頁面,使搜索引擎收錄更準確;
3. 集中傳遞頁面權重。
四. Canonical標簽的常見問題
1. 所有搜索引擎都會認可canonical標簽嗎?
不是,這個標簽只是一種建議,不是指令。雖然搜索引擎蜘蛛會在很大程度上參考這個標簽,但是不一定百分之百遵守,特別是百度。搜索引擎還是會參考其他情況來判斷。這可以防止站長有可能把標簽里指定的規(guī)范化網(wǎng)址寫錯。
2. Canonical標簽里是寫絕對地址還是相對地址?
都可以,但通常建議使用絕對地址。
3. 兩個頁面內(nèi)容不同,能使用Canonical標簽嗎?
指定的規(guī)范化網(wǎng)址上的內(nèi)容,與其他使用這個標簽的非規(guī)范化網(wǎng)址內(nèi)容要完全相同或高度相似,否則很有可能會不起作用。而使用301重定向沒有這個限制。如果錯誤使用canonical標簽,一旦搜索引擎發(fā)現(xiàn)網(wǎng)站上有一個canonical標簽有問題,很有可能整個網(wǎng)站上所有的此標簽都不會得到信任。