AV女忧色导航,亚洲成A人片在线播放器,日本免费一二三区中文,蜜臀久久久久精品久久久,好看AV中文字幕在线观看,av小说在线观看

企業(yè)網(wǎng)站建設(shè) · 首選XSLCMS

輕量級無多余代碼,執(zhí)行效率高速度快,靈活擴(kuò)展,多語言站點(diǎn)支持,生成靜態(tài),全站SEO優(yōu)化,響應(yīng)式自適應(yīng)各終端!

了解更多 加入我們
intro-image

什么是搜索引擎蜘蛛抓取份額?怎樣節(jié)省抓取份額?

作者:東莞網(wǎng)站建設(shè)    來源:東莞網(wǎng)絡(luò)公司     發(fā)布時(shí)間:2017-07-11    瀏覽量:10

什么是搜索引擎蜘蛛抓取份額?怎樣節(jié)省抓取份額?


什么是搜索引擎蜘蛛抓取份額?

顧名思義,抓取份額是搜索引擎蜘蛛花在一個(gè)網(wǎng)站上的抓取頁面的總的時(shí)間上限。對于特定網(wǎng)站,搜索引擎蜘蛛花在這個(gè)網(wǎng)站上的總時(shí)間是相對固定的,不會無限制地抓取網(wǎng)站所有頁面。

抓取份額的英文Google用的是crawl budget,直譯是爬行預(yù)算,我覺得不太能說明是什么意思,所以用抓取份額表達(dá)這個(gè)概念。

抓取份額是由什么決定的呢?這牽扯到抓取需求和抓取速度限制。


抓取需求

抓取需求,crawl demand,指的是搜索引擎“想”抓取特定網(wǎng)站多少頁面。

決定抓取需求的主要有兩個(gè)因素。一是頁面權(quán)重,網(wǎng)站上有多少頁面達(dá)到了基本頁面權(quán)重,搜索引擎就想抓取多少頁面。二是索引庫里頁面是否太久沒更新了。說到底還是頁面權(quán)重,權(quán)重高的頁面就不會太久不更新。

頁面權(quán)重和網(wǎng)站權(quán)重又是息息相關(guān)的,提高網(wǎng)站權(quán)重,就能使搜索引擎愿意多抓取頁面。


抓取速度限制

搜索引擎蜘蛛不會為了抓取更多頁面,把人家網(wǎng)站服務(wù)器拖垮,所以對某個(gè)網(wǎng)站都會設(shè)定一個(gè)抓取速度的上限,crawl rate limit,也就是服務(wù)器能承受的上限,在這個(gè)速度限制內(nèi),蜘蛛抓取不會拖慢服務(wù)器、影響用戶訪問。

服務(wù)器反應(yīng)速度夠快,這個(gè)速度限制就上調(diào)一點(diǎn),抓取加快,服務(wù)器反應(yīng)速度下降,速度限制跟著下降,抓取減慢,甚至停止抓取。

所以,抓取速度限制是搜索引擎“能”抓取的頁面數(shù)。


抓取份額是由什么決定的?

抓取份額是考慮抓取需求和抓取速度限制兩者之后的結(jié)果,也就是搜索引擎“想”抓,同時(shí)又“能”抓的頁面數(shù)。

網(wǎng)站權(quán)重高,頁面內(nèi)容質(zhì)量高,頁面夠多,服務(wù)器速度夠快,抓取份額就大。


小網(wǎng)站沒必要擔(dān)心抓取份額

小網(wǎng)站頁面數(shù)少,即使網(wǎng)站權(quán)重再低,服務(wù)器再慢,每天搜索引擎蜘蛛抓取的再少,通常至少也能抓個(gè)幾百頁,十幾天怎么也全站抓取一遍了,所以幾千個(gè)頁面的網(wǎng)站根本不用擔(dān)心抓取份額的事。數(shù)萬個(gè)頁面的網(wǎng)站一般也不是什么大事。每天幾百個(gè)訪問要是能拖慢服務(wù)器,SEO就不是主要需要考慮的事了。


大中型網(wǎng)站可能需要考慮抓取份額

幾十萬頁以上的大中型網(wǎng)站,可能要考慮抓取份額夠不夠的問題。

抓取份額不夠,比如網(wǎng)站有1千萬頁面,搜索引擎每天只能抓幾萬個(gè)頁面,那么把網(wǎng)站抓一遍可能需要幾個(gè)月,甚至一年,也可能意味著一些重要頁面沒辦法被抓取,所以也就沒排名,或者重要頁面不能及時(shí)被更新。

要想網(wǎng)站頁面被及時(shí)、充分抓取,首先要保證服務(wù)器夠快,頁面夠小。如果網(wǎng)站有海量高質(zhì)量數(shù)據(jù),抓取份額將受限于抓取速度,提高頁面速度直接提高抓取速度限制,因而提高抓取份額。


企業(yè)網(wǎng)站建設(shè)談怎樣節(jié)省抓取份額?

當(dāng)然首先是降低頁面文件大小,提高服務(wù)器速度,優(yōu)化數(shù)據(jù)庫,降低抓取時(shí)間。

然后,盡量避免上面列出的浪費(fèi)抓取份額的東西。有的是內(nèi)容質(zhì)量問題,有的是網(wǎng)站結(jié)構(gòu)問題,如果是結(jié)構(gòu)問題,最簡單的辦法是robots文件禁止抓取,但多少會浪費(fèi)些頁面權(quán)重,因?yàn)闄?quán)重只進(jìn)不出。


某些情況下使用鏈接nofollow屬性可以節(jié)省抓取份額。小網(wǎng)站,由于抓取份額用不完,加nofollow是沒有意義的。大網(wǎng)站,nofollow是可以在一定程度上控制權(quán)重流動和分配的,精心設(shè)計(jì)的nofollow會使無意義頁面權(quán)重降低,提升重要頁面權(quán)重。搜索引擎抓取時(shí)會使用一個(gè)URL抓取列表,里面待抓URL是按頁面權(quán)重排序的,重要頁面權(quán)重提升,會先被抓取,無意義頁面權(quán)重可能低到搜索引擎不想抓取。


相關(guān)文章推薦

渝中区| 萨嘎县| 五台县| 宣武区| 增城市| 宁化县| 昌乐县| 新民市| 新建县| 武平县| 虎林市| 吉首市| 林西县| 大田县| 阿克陶县| 文安县| 鄯善县| 子洲县| 海宁市| 荣昌县| 渝北区| 汕头市| 呼和浩特市| 句容市| 武宁县| 敦煌市| 彭州市| 舒兰市| 武夷山市| 绥化市| 慈溪市| 新干县| 安化县| 泰宁县| 电白县| 黎川县| 太仓市| 英德市| 肇源县| 白玉县| 贵溪市|