搜索引擎算法定義
獲得網(wǎng)站網(wǎng)頁(yè)資料,建立數(shù)據(jù)庫(kù)并提供查詢的系統(tǒng),我們都可以把它叫做搜索引擎。搜索引擎的數(shù)據(jù)庫(kù)是依靠一個(gè)叫“網(wǎng)絡(luò)機(jī)器人(crawlers)”或叫“網(wǎng)絡(luò)蜘蛛(Spider)”的軟件,通過(guò)網(wǎng)絡(luò)上的各種鏈接自動(dòng)獲取大量網(wǎng)頁(yè)信息內(nèi)容,并按一定的規(guī)則分析整理形成的。Google、百度都是比較典型的搜索引擎系統(tǒng)。為了更好的服務(wù)網(wǎng)絡(luò)搜索,搜索引擎的分析整理規(guī)則---即搜索引擎算法是變化的。
某搜索引擎排名的計(jì)算公式
*leScore=(KWUsageScore*0.3)+(DomainStrength*0.25)+(InboundLinkScore*0.25)+(UserData*0.1)+(ContentQualityScore*0.1)+(ManualBoosts)–(Automated&ManualPenalties)
翻譯:
*分?jǐn)?shù)=(相關(guān)關(guān)鍵詞分?jǐn)?shù)X0.3)+(域名權(quán)重X0.25)+(外鏈分?jǐn)?shù)X0.25)+(用戶數(shù)據(jù)X0.1)+(內(nèi)容質(zhì)量分?jǐn)?shù)X0.1)+(人工加分)-(自動(dòng)或人工降分)
公式中的因子分析
從公式中我們可以清楚的知道,影響pagerank分?jǐn)?shù)的因素依次是“相關(guān)關(guān)鍵詞”、“域名”、“外鏈”、“用戶數(shù)據(jù)”、“內(nèi)容質(zhì)量”以及“人工干預(yù)”六個(gè)方面。那么又是哪些因素影響到了這幾個(gè)方面呢?
一、關(guān)鍵詞分?jǐn)?shù)
1.網(wǎng)頁(yè)title中關(guān)鍵詞的處理
2.H標(biāo)簽(h1-h6)中關(guān)鍵詞的處理
3.文本內(nèi)容中關(guān)鍵詞的密度
4.外鏈中關(guān)鍵詞的選擇
5.域名中的關(guān)鍵詞
二、域名權(quán)重
1.域名注冊(cè)前的歷史問(wèn)題
2.域名注冊(cè)時(shí)間的長(zhǎng)短
3.外鏈網(wǎng)站的權(quán)重
4.外鏈、給出鏈接的相關(guān)度
5.是否使用歷史、鏈接形式
三、外鏈分?jǐn)?shù)
1.鏈接域名權(quán)重
2.是否錨文本
3.鏈接數(shù)量/鏈接權(quán)重(PR或其他參數(shù))
4.外鏈網(wǎng)頁(yè)的主題相關(guān)度
5.鏈接的時(shí)間
四、用戶數(shù)據(jù)
1.搜索引擎結(jié)果頁(yè)面(SERPs)的點(diǎn)擊率
2.用戶在網(wǎng)頁(yè)上呆的時(shí)間
3.域名或URL搜索量
4.訪問(wèn)量及其他*可以監(jiān)測(cè)到的數(shù)據(jù)(工具條、GA等)
五、內(nèi)容質(zhì)量分?jǐn)?shù)
1.內(nèi)容的相關(guān)度
2.內(nèi)容的原創(chuàng)性
3.內(nèi)容的獨(dú)特性
4.內(nèi)容的搶先性和長(zhǎng)效性
六、人工干預(yù)
1.*投票人員干預(yù)
2.關(guān)鍵詞人工加(扣)分
3.機(jī)器算法干預(yù)
此外須知道的是,在抓取網(wǎng)頁(yè)的時(shí)候,搜索引擎蜘蛛一般有兩種策略:廣度優(yōu)先和深度優(yōu)先。
評(píng)論:這些是淺顯的算法,真正的商業(yè)引擎像google,百度每時(shí)每刻都在進(jìn)行算法研究,所以頂級(jí)的商業(yè)秘密我們是無(wú)法詳細(xì)的了解的。