搜索引擎收錄原理
搜索引擎收錄原理
1.頁面收錄流程
在互聯(lián)網(wǎng)中,URL是每個(gè)頁面的入口地址,搜索引擎蜘蛛程序就是通過URL抓取到頁面的。搜索引擎蜘蛛程序從URL列表出發(fā),通過URL抓取并存儲(chǔ)頁面;同時(shí),提取原始頁面中的URL資源并加入到URL列表中。如此不斷地循環(huán),就可以從互聯(lián)網(wǎng)中獲取足夠多的頁面。
URL是頁面的入口,而域名則是網(wǎng)站的入口。搜索引擎蜘蛛程序通過域名進(jìn)入網(wǎng)站,從而展開對(duì)網(wǎng)站頁面的抓取。換而言之,搜索引擎要在互聯(lián)網(wǎng)上抓取到頁面的首要任務(wù)就是建立一個(gè)足夠大的域名列表,再通過域名進(jìn)入相應(yīng)的網(wǎng)站,從而抓取網(wǎng)站中的頁面。
而對(duì)于網(wǎng)站來說,如果想要被搜索引擎收錄,首要條件就是加入搜索引擎的域名列表。下面向讀者介紹兩種常用的加入搜索引擎域名列表的方法。
第一,利用搜索引擎提供的網(wǎng)站登錄入口,向搜索引擎提交網(wǎng)站域名,例如Google的網(wǎng)站登錄地址是https://www.google.com/intl/zh-CN/webmasters/#?modal_active=none,可在此提交自己的網(wǎng)站域名。對(duì)于提交的域名列表,搜索引擎只會(huì)定期進(jìn)行更新。因此,這種做法比較被動(dòng),從域名提交到網(wǎng)站被收錄花費(fèi)的時(shí)間也比較長。
第二,通過與外部網(wǎng)站建立鏈接關(guān)系,使搜索引擎可以通過外部網(wǎng)站發(fā)現(xiàn)我們的網(wǎng)站,從而實(shí)現(xiàn)對(duì)網(wǎng)站的收錄。這種做法的主動(dòng)權(quán)掌握在我們自己的手里(只要我們擁有足夠多高質(zhì)量的鏈接即可),縣域收錄速度也比向搜索引擎主動(dòng)提交要快得多。根據(jù)外部鏈接的數(shù)量、質(zhì)量及相關(guān)性,一般情況下,2-7天左右就會(huì)被搜索引擎收錄。
2.頁面收錄原理
通過上面的介紹,相信讀者已經(jīng)掌握了網(wǎng)站被搜索引擎收錄的方法。然而,怎樣才能提高網(wǎng)站中頁面被收錄的數(shù)量呢?要回答這個(gè)問題,就要先了解搜索引擎收錄頁面的工作原理。
如果把網(wǎng)站頁面組成的集合看作是一個(gè)有向圖,從指定的頁面出發(fā),沿著頁面中的鏈接,按照某種特定的策略對(duì)網(wǎng)站中的頁面進(jìn)行遍歷。不停地從URL列表中移出已經(jīng)訪問過的URL,并存儲(chǔ)原始頁面,同時(shí)提取原始頁面中的URL信息;再將URL分為域名及部URL兩大類,同時(shí)判斷資源為止。經(jīng)過這些工作,搜索引擎就可以建立龐大的域名列表、頁面URL列表并存儲(chǔ)足夠多的原始頁面。
3.頁面收錄方式
上面已經(jīng)介紹了搜索引擎收錄頁面的流程及原理。然而,在互聯(lián)網(wǎng)數(shù)以億計(jì)的頁面中,搜索引擎怎樣才能從中抓取到相對(duì)重要的頁面呢?這就是涉及搜索引擎的頁面收錄方式。
頁面收錄方式是指搜索引擎抓取頁面時(shí)所使用的策略,是為了能在互聯(lián)網(wǎng)中篩選出相對(duì)重要的信息。頁面收錄方式的制定取決于搜索引擎對(duì)網(wǎng)站結(jié)構(gòu)的理解。如果使用相冊(cè)的抓取策略,搜索引擎在同樣的時(shí)間內(nèi)可以在某一網(wǎng)站中抓取到更多的頁面資源,則會(huì)在該網(wǎng)站上停留更長的時(shí)間,收錄的頁面數(shù)自然也就更多。因此,加深對(duì)搜索引擎頁面收錄方式的認(rèn)識(shí),有利于為網(wǎng)站建立友好的結(jié)構(gòu),提高頁面被收錄的數(shù)量。
>>廣度優(yōu)先
如果把整個(gè)網(wǎng)站看作是一棵樹,首頁就是根,每個(gè)頁面就是葉子。廣度優(yōu)先是一種橫向的頁面抓取方式,先從樹的較淺層開始抓取頁面,直至抓取完同層次的所有頁面后才進(jìn)入下一層。因此,在對(duì)網(wǎng)站進(jìn)行優(yōu)化時(shí),我們應(yīng)該把網(wǎng)站中相對(duì)重要的信息展示在層次較淺的頁面上(例如,在首頁上推薦一些熱門產(chǎn)品或者內(nèi)容)。反過來,通過廣度優(yōu)先的抓取方式,搜索引擎就可以優(yōu)先抓取到網(wǎng)站中相對(duì)重要的頁面。(高端網(wǎng)站建設(shè))
首先,搜索引擎從網(wǎng)站首頁出發(fā),抓取首頁上所有鏈接指向的頁面,形成頁面集合A,并解析出集合A中所有頁面的鏈接;再跟蹤這些鏈接抓取下一層的頁面,形成頁面集合B;就這樣遞歸地從線層頁面中解析出鏈接,從而抓取深層頁面,直至滿足了某個(gè)設(shè)定的條件才停止抓取進(jìn)程。
>>深度優(yōu)先
與廣度優(yōu)先的抓取方式相反,深度優(yōu)先首先跟蹤線層頁面中的某一鏈接逐步抓取深層頁面,直至抓取完最深層的頁面后才返回淺層頁面再跟蹤其另一鏈接,繼續(xù)向深層頁面抓取,這是一種頁面,這樣就能滿足更多用戶的需求。
建站流程
-
網(wǎng)站需求
-
網(wǎng)站策劃方案
-
頁面設(shè)計(jì)風(fēng)格
-
確認(rèn)交付使用
-
資料錄入優(yōu)化
-
程序設(shè)計(jì)開發(fā)
-
后續(xù)跟蹤服務(wù)
-
聯(lián)系電話
010-60259772
熱門標(biāo)簽
- 網(wǎng)站建設(shè)
- 食品網(wǎng)站建設(shè)
- 微信小程序開發(fā)
- 小程序開發(fā)
- 無錫網(wǎng)站建設(shè)
- 研究所網(wǎng)站建設(shè)
- 沈陽網(wǎng)站建設(shè)
- 廊坊網(wǎng)站建設(shè)
- 鄭州網(wǎng)站建設(shè)
- 婚紗攝影網(wǎng)站建設(shè)
- 手機(jī)端網(wǎng)站建設(shè)
- 高校網(wǎng)站制作
- 天津網(wǎng)站建設(shè)
- 教育網(wǎng)站建設(shè)
- 品牌網(wǎng)站建設(shè)
- 政府網(wǎng)站建設(shè)
- 北京網(wǎng)站建設(shè)
- 網(wǎng)站設(shè)計(jì)
- 網(wǎng)站制作
最新文章
推薦新聞
更多行業(yè)-
數(shù)據(jù)通信系統(tǒng)的基本組成部分
通信的基本形式是在發(fā)送方與接收方之間建立一個(gè)傳輸信息的通道,通信是把信...
2014-07-28 -
網(wǎng)站建設(shè)涉及的方面有很多
北京網(wǎng)站建設(shè)涉及的方面有很多,代碼沒有高低端之分, 通過學(xué)習(xí)本課程。還...
2012-09-17 -
如何從外鏈及友鏈引進(jìn)流量
網(wǎng)站制作公司尚品中國:一直都不懂“內(nèi)容為王,外鏈為皇&rd...
2012-05-08 -
全文檢索搜索引擎策略
北京網(wǎng)站設(shè)計(jì)公司尚品中國:全文檢索搜索引擎是目前全球搜索引擎的主流部分...
2012-09-02 -
網(wǎng)站建設(shè)時(shí)影響關(guān)鍵詞優(yōu)化的因素有哪些?
網(wǎng)站建設(shè)中影響關(guān)鍵詞優(yōu)化的因素有哪些?關(guān)鍵詞優(yōu)化是指對(duì)企業(yè)網(wǎng)站中的關(guān)鍵...
2021-11-08 -
企業(yè)怎么才能做好一個(gè)合格的網(wǎng)站
隨著網(wǎng)絡(luò)時(shí)代的進(jìn)化,新的網(wǎng)絡(luò)營銷理念不斷蛻變,一時(shí)間網(wǎng)絡(luò)媒體,自媒體營...
2020-01-13
預(yù)約專業(yè)咨詢顧問溝通!
免責(zé)聲明
非常感謝您訪問我們的網(wǎng)站。在您使用本網(wǎng)站之前,請(qǐng)您仔細(xì)閱讀本聲明的所有條款。
1、本站部分內(nèi)容來源自網(wǎng)絡(luò),涉及到的部分文章和圖片版權(quán)屬于原作者,本站轉(zhuǎn)載僅供大家學(xué)習(xí)和交流,切勿用于任何商業(yè)活動(dòng)。
2、本站不承擔(dān)用戶因使用這些資源對(duì)自己和他人造成任何形式的損失或傷害。
3、本聲明未涉及的問題參見國家有關(guān)法律法規(guī),當(dāng)本聲明與國家法律法規(guī)沖突時(shí),以國家法律法規(guī)為準(zhǔn)。
4、如果侵害了您的合法權(quán)益,請(qǐng)您及時(shí)與我們,我們會(huì)在第一時(shí)間刪除相關(guān)內(nèi)容!
聯(lián)系方式:010-60259772
電子郵件:394588593@qq.com