盡管理論上,只要給蜘蛛足夠的時間,就能爬上整個網(wǎng)絡(luò)。但是在實(shí)際工作中,蜘蛛的寬帶資源,時間并不是無限的,也不可能完成所有的頁面。其實(shí)最大的搜索引擎只是爬行和收錄互聯(lián)網(wǎng)的一小部分。搜索引擎優(yōu)化人員要想收錄更多的頁面,就必須想方設(shè)法吸引蜘蛛來抓取。既然不能抓取所有頁面,蜘蛛要做的就是盡量抓取重要頁面。
哪些頁面被認(rèn)為更重要?影響因素有幾個。鄭州seo將從以下幾個方面進(jìn)行闡述:
第一,網(wǎng)站和頁面的權(quán)重。
高質(zhì)量、高資質(zhì)的網(wǎng)站被認(rèn)為權(quán)重較高,這類網(wǎng)站上的頁面爬行深度也會較高,因此會有更多的內(nèi)頁被收錄。
第二,頁面更新。
蜘蛛每次爬行都會存儲頁面數(shù)據(jù)。如果第二次爬行發(fā)現(xiàn)頁面和第一次收錄的一模一樣,說明頁面沒有更新,蜘蛛會在多次爬行后了解頁面更新的頻率,蜘蛛不需要經(jīng)常爬行。如果頁面內(nèi)容經(jīng)常更新,蜘蛛會更頻繁地訪問這個頁面,頁面上的新鏈接自然會被蜘蛛更快地跟蹤和抓取。
第三,導(dǎo)入鏈接。
無論是外部鏈接還是同一個網(wǎng)站的內(nèi)部鏈接,蜘蛛都必須導(dǎo)入鏈接進(jìn)入頁面,否則蜘蛛根本沒有機(jī)會知道頁面的存在。高質(zhì)量的導(dǎo)入鏈接往往會增加頁面上導(dǎo)出鏈接的爬行深度。
第四,點(diǎn)擊首頁的距離。
一般而言,網(wǎng)站上權(quán)重最高的是首頁,大多數(shù)外部鏈接都指向首頁,蜘蛛訪問最頻繁的也是首頁。點(diǎn)擊離首頁越近,頁面權(quán)重越高,被蜘蛛抓取的機(jī)會越大。
URL結(jié)構(gòu)。
頁面權(quán)重是收錄迭代計算后才知道的,那么上面說的頁面權(quán)重高有利于被抓取。搜索引擎蜘蛛在抓取之前怎么知道這個頁面的權(quán)重?因此蜘蛛要做出預(yù)測,除了鏈接、與首頁的距離、歷史數(shù)據(jù)等因素外,短、淺的URL也可能被直觀地認(rèn)為在網(wǎng)站上的權(quán)重相對較高。