第二,在百度搜索引擎中對某些站點降權(quán)或去除的目的主要是反spam(或者叫反垃圾),反spam的唯一目的是提高用戶搜索體驗。百度反spam對所有網(wǎng)站一視同仁,不會因為任何網(wǎng)站是百度的客戶或合作伙伴而降低懲罰標(biāo)準(zhǔn),也不會因為任何網(wǎng)站與競爭對手合作或停止與百度的合作而加重懲罰。在百度中,有權(quán)限參與網(wǎng)站降權(quán)處理的只有了了幾人,他們每一個都是極端的搜索愛好者,他們也有完全的自主權(quán)和獨立性,不用關(guān)心處理哪個網(wǎng)站會影響流量或收入,不用給任何部門、任何同事或任何網(wǎng)站面子,他們唯一關(guān)心的是用戶搜索體驗。
第三,搜索引擎優(yōu)化行為對用戶體驗的破壞程度是線性分布的,百度反spam是機器自動識別和人工識別互補的體系。既然有識別就有判斷的閾值,無論是自動識別還是人工識別,無論把閾值定在哪里,那些閾值附近的優(yōu)化行為判斷總是容易引起爭議的。在所有支持中文的搜索引擎中,百度也許已經(jīng)是反spam做得最努力的,但中國網(wǎng)民在百度的搜索體驗仍然每天被spam嚴(yán)重破壞1500萬次以上(spam網(wǎng)頁出現(xiàn)在搜索結(jié)果前10名)。因為中文spam面廣量多,因為百度反spam打擊也面廣量多,即使閾值附近的爭議網(wǎng)址只占很少的幾個百分點,也可能導(dǎo)致每天有幾十個網(wǎng)站有資格對于被懲罰表示異議,這不是百度愿意看到的,但現(xiàn)實點說,無法指望短時間內(nèi)大幅度減少這種問題,也無法指望能人工一一回復(fù)每個提出異議的網(wǎng)站。
另外,對于加入百度搜索聯(lián)盟并且達到一定搜索量的網(wǎng)站,我們有一個優(yōu)待政策:在發(fā)現(xiàn)自己被降權(quán)后可以申請立即復(fù)查一次,如果復(fù)查發(fā)現(xiàn)網(wǎng)站上已沒有spam 行為,則可以安排盡快取消降權(quán)。但這個權(quán)利只能用一次,一旦該網(wǎng)站在例行檢查、網(wǎng)友舉報、或不定期復(fù)查中被再次發(fā)現(xiàn)spam,那么無論誰也救不了它了。
caoz:hao123的發(fā)展思路是什么?第一,如果想加入新站點,目前是什么政策?據(jù)說收費了?費率多少?第二,以前被收錄的站點會不會有政策處理上的變化?這是他們很關(guān)心的問題。
9238:
詳細(xì)的發(fā)展思路是商業(yè)機密,我不能在此公開。但可以回答你一個具體的問題,所謂hao123已改為收費登錄那是假的,每個頻道只是賣少量廣告(百度對廣告的控制極嚴(yán),沒有在hao123原有基礎(chǔ)上增加任何flash或banner,每個頻道廣告鏈接原則上不超過5個,不達到一定質(zhì)量要求的網(wǎng)站即使廣告也不賣給它,負(fù)責(zé)hao123用戶體驗的員工對廣告有一票否決權(quán)),但現(xiàn)在肯定沒有全面收費,今后的一段時間內(nèi)也沒有這個打算。以前被收錄的站點不會有處理策略的變化,hao123的用戶體驗或者被收錄網(wǎng)站的質(zhì)量是挑選和更新的唯一標(biāo)準(zhǔn)。
caoz:百度mp3搜索的策略與mp3音樂站長群的矛盾如何化解
9238:
迄今為止百度的mp3信息幾乎都是從百度的網(wǎng)頁庫中提取出來的,而百度的spider一直遵守國際通行的robots協(xié)議,不愿意被百度收錄mp3信息的站長只要寫一句robots協(xié)議就能阻止百度spider再收集信息(以前收集的信息需要等一段時間被更新后才消失),在百度的用戶幫助信息中提供了詳細(xì)的robots協(xié)議寫作教程:http://www.baidu.com/search/robots.html
caoz:不知道百度對故意重復(fù)的定義是什么,比如donews首頁的標(biāo)題,有大量的IT重復(fù)出現(xiàn),是否算做故意重復(fù)呢?又比如前幾天突然被降權(quán)的 9flash.com。他在頁面里所重復(fù)的“flash”關(guān)鍵詞,是不是屬于“故意”面向搜索引擎做的呢?我們可以這么測試一下,把“flash展現(xiàn)的電影”和 “電影”兩個詞比較,可以等同嗎?不等同說明flash這個詞在這里,是必要修飾詞,把“flash音樂”和“音樂”兩個詞比較,可以等同嗎?不等同說明 flash這個詞在這里,是個必要的修飾詞,下面的不用解釋了,我覺得這個其實很容易理解,如果在對方站點里出現(xiàn)的某些關(guān)鍵詞在該站點的內(nèi)容和連接表述中,屬于必要修飾詞,并且該關(guān)鍵詞所出現(xiàn)的段落和連接有其正確的表述價值,那么這種重復(fù),就不能說是“故意重復(fù)”,我不知道百度認(rèn)同否?
9238:
反spam的唯一目的是提高用戶搜索體驗。我們不會為了反spam而反spam,不會對所有違反規(guī)則的網(wǎng)站施加相同的懲罰,關(guān)鍵在于,用戶查看某個關(guān)鍵詞的搜索結(jié)果時,你的網(wǎng)站對用戶是否有價值、這個價值所否值得你排在那個位置?
即使donews對IT重復(fù)了,如果在IT這個關(guān)鍵詞的搜結(jié)果中沒有排在非常不該排的位置,沒有對用戶搜索體驗造成明顯破壞,那么理想狀態(tài)下 donews仍不會受懲罰。9flash如果只對flash關(guān)鍵詞優(yōu)化,那么不太容易受到懲罰,但如果對電影關(guān)鍵詞優(yōu)化,那么很容易受到懲罰。
明白的說,網(wǎng)站spam與否是網(wǎng)站的自由,百度無權(quán)干涉也沒興趣理睬,但如果哪個網(wǎng)站的行為或效果破壞了中國網(wǎng)民在百度搜索的體驗,那么百度也有升級算法、降權(quán)、直至拒絕收錄這個網(wǎng)站的權(quán)利和興趣。其實各位站長完全沒必要把百度怎么想當(dāng)一回事,站長們只要把百度的搜索用戶當(dāng)一回事就行了,只要你的網(wǎng)站對用戶有搜索價值,百度急著升級算法把你排到合適的位置都來不及呢,哪里敢把你降權(quán)什么的呢。
caoz: 故意制造大量鏈接指向某一網(wǎng)址的行為。
我覺得這個條款簡直可以讓所有的站點納入作弊的范疇。
百度有個聯(lián)盟,把代碼投放到千萬個站點上,算不算“故意制造大量連接指向某一網(wǎng)址”?這個是個玩笑,但是事實是,所有的站長,特別是那些沒有能力做大幅度廣告預(yù)算的個人站點,他們的網(wǎng)絡(luò)推廣途徑的重要步驟,就是和大量的不同站點交換連接,交換連接,不就是“故意制造大量鏈接指向某一網(wǎng)址的行為”嗎?這是其一。如果我做了一個站點,我又申請了blog,我又申請了donews,我又申請了什么什么,我又泡論壇,那么我肯定會把我的站點連接放在每個我能放網(wǎng)絡(luò)連接的地方告訴大家,比如論壇簽名檔,比如blog的連接,比如donews個人介紹,等等,有沒有搜索引擎我都會這么干,站長怎么發(fā)展流量?坐等嗎?這是其二。商業(yè)公司要發(fā)新聞稿,公關(guān)稿,網(wǎng)絡(luò)時代了,網(wǎng)絡(luò)媒體也很重視,一個稿子發(fā)新浪搜狐網(wǎng)易千龍?zhí)鞓O等等等等,每個稿子上都會有這個公司的連接,又是故意制造大量連接指向同一網(wǎng)址。這是其三。請百度的朋友解釋一下,怎么叫“不故意制造大量連接呢”,做好站點,放在那里,等別人連接或者干脆不要外部鏈接,也許只有國家政府機關(guān)的網(wǎng)站會這樣。
9238:上一個回答也能用在這里吧?誰愛做鏈接就做吧,但別針對與自己網(wǎng)站內(nèi)容不相關(guān)的關(guān)鍵詞做,即使相關(guān)的關(guān)鍵詞,也別排到特別不合適的位置去。其實,百度能自動過濾不少可疑鏈接,所以某些制造鏈接的行為根本不會受到懲罰,因為對排名不會有任何影響。
caoz:有鏈接指向作弊網(wǎng)站的網(wǎng)站,負(fù)連帶責(zé)任,也會被認(rèn)為是作弊
這個最狠,簡直是連坐,大清朝倒臺后好象就不興這個了。不過互連網(wǎng)本身就是由大量的連接組成的,這個方式搞下去,恐怕是人人自危吧,我這么說吧,A站作弊(證據(jù)確鑿,驗明正身),B站上不巧給A站做了連接,那么B站被認(rèn)為是作弊,那么C站上偏偏也給B站做了連接,得,既然B站已經(jīng)被認(rèn)定也是作弊,道理同樣,C站指向作弊站點,也是作弊,D站又有C站連接,慘了,這么連下去,和百度的Spider沒啥區(qū)別(相當(dāng)于倒過來爬);洪桐縣里沒好人,互聯(lián)網(wǎng)上沒好站,大家彼此彼此。
其實百度真要這么搞也可以,每天公布一個封殺作弊站點列表,并給相關(guān)連接站點一天的取消連接的準(zhǔn)備期,這樣站長們就會每天上來看誰是最新的倒霉蛋,看看在不在自己站點的友情鏈接里,并且用最短的時間和對方劃清界限!消除連接,以免殃及自身不是。
9238:
這條規(guī)則,是針對某些擁有一大批域名互相鏈接作弊的人。從百度中降權(quán)或消失對于每個中文網(wǎng)站都是大事,我們不會輕易的批量懲罰的,事實上只有在對某些網(wǎng)站之間的關(guān)系相當(dāng)有把握時才會激活這個懲罰規(guī)則,而且,雖然批量鏈接作弊是機器自動識別的,但識別出的每一個網(wǎng)站在被正式懲罰前都會經(jīng)過人工驗證,幾乎不可能誤殺。
普通的友情鏈接再多也不會受懲罰,但僅限鏈接所用文字是合適的網(wǎng)站名,如果用關(guān)鍵詞做鏈接,則很容易被識別為spam。