搜索引擎可以說是目前所有互聯(lián)網(wǎng)應用技術含量最高 的一種,盡管其應用形式非常簡單:用戶輸入查詢詞,搜索引擎返回搜索結果。但是要為以億計數(shù)的互聯(lián)網(wǎng)用戶提供準確快速的搜索結果,里面包含了很多技術手段。總的來說,搜索引擎技術所希望達到的目標可以歸納為:更全、更快、更準。
所謂”更全“,是從其索引的網(wǎng)頁數(shù)量而言的,目前任意一個商業(yè)搜索引擎索引網(wǎng)頁的覆蓋范圍都只占了互聯(lián)網(wǎng)頁面的一部分,可以通過提高網(wǎng)絡爬蟲相關技術來達到此目標。
”更快“這個目標則貫穿于搜索引擎的大多數(shù)技術方向,比如索引相關技術、緩存等技術的提出都是直接為了達到此目的。而其他很多技術也間接為此服務,即使是健在式海量云存儲平臺 ,也是為了能夠處理海量的數(shù)據(jù),以達到對”更全“和”更快“這兩個目標的響應和支持。
在這3個目標中,如何使得搜索結果”更準“是最為關鍵的目標。無論是排序技術也好,還是鏈接分析技術也好,抑或是用戶研究等技術,最終都是為了使搜索結果更加準確,以此增強用戶體驗。對于一個搜索引擎來說,達到”更全“與”更快“可以使其不落后于同類產(chǎn)品,但是如果能夠做到”更準“,則能夠構建核心競爭力能力。