搜集資料:
1、首先搜索引擎會建立一個網(wǎng)頁地圖(Webmap),再使用網(wǎng)頁抓取程序(Robot)根據(jù)網(wǎng)頁地圖來抓取(Crawl)網(wǎng)頁,儲存到搜索數(shù)據(jù)庫中。
2、接下來會利用索引技術(shù)(Index)將數(shù)據(jù)做編號廣告排名儲存,同時搜索技術(shù)也會利用一些相關(guān)技術(shù)將不好的網(wǎng)站(Spam)去除。
雅虎將搜索結(jié)果進行廣告排名:
1、當使用者輸入一個搜索詞查詢時,搜索引擎會用這個搜索詞到搜索數(shù)據(jù)庫中比對,并且經(jīng)過一些相關(guān)度的運算之后,依照相關(guān)程度將網(wǎng)頁做廣告排名,相關(guān)度高的排在前面。
2、相關(guān)度的運算,除了判別網(wǎng)站名稱或敘述內(nèi)容中有符合搜索詞的搜索結(jié)果,運算程序還會根據(jù)該網(wǎng)頁被連結(jié)的次數(shù)等相關(guān)分數(shù)來計算,相關(guān)程度的高低是由搜索引擎程序運算雅虎廣告排名,根據(jù)各種因素復合計算出來,并非絕對的單一因素。
更新網(wǎng)頁數(shù)據(jù):
雅虎廣告排名數(shù)據(jù)庫每天都會進行部分數(shù)據(jù)的更新,由于數(shù)據(jù)庫龐大,所有數(shù)據(jù)完全更新大約需要2到3個月的時間。
相關(guān)文章:
如何讓雅虎收錄我的網(wǎng)頁