關(guān)于搜索引擎蜘蛛對(duì)網(wǎng)站頁面爬行規(guī)律的一點(diǎn)分享

標(biāo)簽： | 作者：眾騰網(wǎng)絡(luò) | VISITORS:1003 | 來源：m.xuanshao.cn

MAR
2022

　　當(dāng)網(wǎng)站有了蜘蛛來訪，你的網(wǎng)站頁面才有被收錄的可能，而搜索引擎蜘蛛會(huì)來爬行我們網(wǎng)站的html代碼，然后把數(shù)據(jù)拆分為標(biāo)題、摘要、頭圖、正文等結(jié)構(gòu)化數(shù)據(jù)，帶回給搜索引擎的服務(wù)器，進(jìn)行篩選放入數(shù)據(jù)庫，接下來是關(guān)于搜索引擎蜘蛛對(duì)網(wǎng)站頁面爬行規(guī)律的一點(diǎn)分享。【網(wǎng)站優(yōu)化】

　　現(xiàn)在的網(wǎng)站數(shù)量以百億計(jì)算，每個(gè)頁面都有快照備份是不現(xiàn)實(shí)的，所以搜索引擎蜘蛛會(huì)優(yōu)勝劣汰，就像是有探路的先鋒，有主力的部隊(duì)，有功能之分，其實(shí)并沒有高低權(quán)重之分。

　　搜索引擎蜘蛛對(duì)網(wǎng)站內(nèi)頁的爬行規(guī)律：

　　搜索引擎蜘蛛主要由收錄與快照兩種蜘蛛構(gòu)成，通常123IP開頭的是收錄蜘蛛，220IP開頭的是快照蜘蛛，我們通過這兩種蜘蛛的日志訪問情況，基本上能判斷出這個(gè)網(wǎng)站在搜索引擎看來是不是一個(gè)優(yōu)質(zhì)的網(wǎng)站。

　　1、內(nèi)容有質(zhì)量的頁面：新發(fā)一篇文章后，通常是123開頭的蜘蛛先行，然后220開頭的蜘蛛后行，接著當(dāng)天或隔1-2天，快照就會(huì)有更新。

　　2、404頁面爬取規(guī)律：當(dāng)網(wǎng)站刪除了幾篇已收錄的內(nèi)頁訪問變成404后，123開頭的蜘蛛來爬取時(shí)，一般發(fā)現(xiàn)兩次404后，搜索引擎蜘蛛就不會(huì)來了。

　　3、文章內(nèi)容劣質(zhì)頁面：如果是用文章生成器生成的拼湊文章，排版亂無可讀性，123開頭的蜘蛛來了一次以后就沒有再來了。

　　那么搜索引擎蜘蛛爬行真正的邏輯應(yīng)該是：123開頭蜘蛛打沖鋒，對(duì)網(wǎng)頁內(nèi)容進(jìn)行篩選，以便減少不必要的服務(wù)器資源浪費(fèi);220開頭蜘蛛一般在123蜘蛛篩選過后才進(jìn)入，如果網(wǎng)頁內(nèi)容實(shí)在劣質(zhì)，220開頭的蜘蛛不會(huì)造訪;對(duì)于已經(jīng)收錄快照的頁面，是220開頭直接來訪。

　　最后得出的結(jié)論如下：

　　1、123開頭的IP是收錄蜘蛛，所謂收錄蜘蛛是指搜索引擎蜘蛛造訪后，搜索引擎后端會(huì)通過一系列判定手段，如反作弊處理、原創(chuàng)度檢測(cè)等等，決定是否能夠可以收錄，是否可以牽引網(wǎng)頁快照蜘蛛到訪。

　　2、220開頭的IP是快照蜘蛛，當(dāng)快收錄蜘蛛檢測(cè)網(wǎng)頁通過了收錄標(biāo)準(zhǔn)之后，通過快照蜘蛛生成結(jié)構(gòu)化數(shù)據(jù)，進(jìn)入倒排索引，這個(gè)時(shí)候的網(wǎng)頁才有快照，才能被用戶搜索到。

　　所以每次快照更新前，收錄蜘蛛、快照蜘蛛均有造訪，而收錄蜘蛛與快照蜘蛛訪問比率一般不超過2:1，如果收錄蜘蛛出現(xiàn)次數(shù)遠(yuǎn)遠(yuǎn)大于快照蜘蛛，說明網(wǎng)頁的內(nèi)容還不過關(guān)。

轉(zhuǎn)載聲明：本文由桂林眾騰網(wǎng)絡(luò)原創(chuàng)文章
轉(zhuǎn)載請(qǐng)注明來源： http://zt-web.com/shows.php?id=861

上一篇：遭遇搜索引擎K站，為什么要多上站長(zhǎng)交流論壇?

教您如何給網(wǎng)站添加搜索引擎推送功能增加網(wǎng)站收錄：下一篇

相關(guān)新聞

你的網(wǎng)站布局設(shè)定方法靠譜嗎？

有一種“奇怪的”現(xiàn)象會(huì)經(jīng)常的看到“很多設(shè)計(jì)師沒有辦法...
觀桂林名牌產(chǎn)品企業(yè)的網(wǎng)站所感

現(xiàn)在正在啟動(dòng)2014年度廣西名牌產(chǎn)品申報(bào)工作的階段，...
在互聯(lián)網(wǎng)上創(chuàng)業(yè)的前景分析

在互聯(lián)網(wǎng)上創(chuàng)業(yè)與線下市場(chǎng)中創(chuàng)業(yè)（傳統(tǒng)創(chuàng)業(yè)）有著很大的...
如何減少客戶跳出網(wǎng)站的概率

網(wǎng)站主要的目的是為了吸引潛在客戶，實(shí)現(xiàn)展示企業(yè)宣傳企...
怎么樣填寫內(nèi)容才能獲得好的流量

很多客戶在填充完網(wǎng)站內(nèi)容后，很關(guān)心網(wǎng)站內(nèi)容能不能由百...
公司有網(wǎng)站還缺少一個(gè)重要的網(wǎng)站編輯員

公司在制作專業(yè)的網(wǎng)站后，網(wǎng)站設(shè)計(jì)及程序都由專業(yè)的網(wǎng)絡(luò)...
制作網(wǎng)站如何突出網(wǎng)站的主題

網(wǎng)站制作時(shí)主題需要突出，企業(yè)是做旅游的、做產(chǎn)品的、做...
企業(yè)網(wǎng)站制作完成后的內(nèi)容準(zhǔn)備細(xì)則

很多企業(yè)站經(jīng)營(yíng)者都會(huì)抱怨企業(yè)網(wǎng)站制作完成后，企業(yè)網(wǎng)站...
簡(jiǎn)述公司網(wǎng)站與網(wǎng)絡(luò)營(yíng)銷的距離

企業(yè)制作完成網(wǎng)站只是公司業(yè)務(wù)向網(wǎng)絡(luò)業(yè)務(wù)延伸第一步，后...

日本特交大片免费观看-日本无卡码免费一区二区三区-日本无吗中文字幕免费婷婷-日本无套-网址黄色-网站一级片

關(guān)于搜索引擎蜘蛛對(duì)網(wǎng)站頁面爬行規(guī)律的一點(diǎn)分享