第二,在百度搜索引擎中對(duì)某些站點(diǎn)降權(quán)或去除的目的主要是反spam(或者叫反垃圾),反spam的唯一目的是提高用戶(hù)搜索體驗(yàn)。百度反spam對(duì)所有網(wǎng)站一視同仁,不會(huì)因?yàn)槿魏尉W(wǎng)站是百度的客戶(hù)或合作伙伴而降低懲罰標(biāo)準(zhǔn),也不會(huì)因?yàn)槿魏尉W(wǎng)站與競(jìng)爭(zhēng)對(duì)手合作或停止與百度的合作而加重懲罰。在百度中,有權(quán)限參與網(wǎng)站降權(quán)處理的只有了了幾人,他們每一個(gè)都是極端的搜索愛(ài)好者,他們也有完全的自主權(quán)和獨(dú)立性,不用關(guān)心處理哪個(gè)網(wǎng)站會(huì)影響流量或收入,不用給任何部門(mén)、任何同事或任何網(wǎng)站面子,他們唯一關(guān)心的是用戶(hù)搜索體驗(yàn)。
第三,搜索引擎優(yōu)化行為對(duì)用戶(hù)體驗(yàn)的破壞程度是線(xiàn)性分布的,百度反spam是機(jī)器自動(dòng)識(shí)別和人工識(shí)別互補(bǔ)的體系。既然有識(shí)別就有判斷的閾值,無(wú)論是自動(dòng)識(shí)別還是人工識(shí)別,無(wú)論把閾值定在哪里,那些閾值附近的優(yōu)化行為判斷總是容易引起爭(zhēng)議的。在所有支持中文的搜索引擎中,百度也許已經(jīng)是反spam做得最努力的,但中國(guó)網(wǎng)民在百度的搜索體驗(yàn)仍然每天被spam嚴(yán)重破壞1500萬(wàn)次以上(spam網(wǎng)頁(yè)出現(xiàn)在搜索結(jié)果前10名)。因?yàn)橹形膕pam面廣量多,因?yàn)榘俣确磗pam打擊也面廣量多,即使閾值附近的爭(zhēng)議網(wǎng)址只占很少的幾個(gè)百分點(diǎn),也可能導(dǎo)致每天有幾十個(gè)網(wǎng)站有資格對(duì)于被懲罰表示異議,這不是百度愿意看到的,但現(xiàn)實(shí)點(diǎn)說(shuō),無(wú)法指望短時(shí)間內(nèi)大幅度減少這種問(wèn)題,也無(wú)法指望能人工一一回復(fù)每個(gè)提出異議的網(wǎng)站。
另外,對(duì)于加入百度搜索聯(lián)盟并且達(dá)到一定搜索量的網(wǎng)站,我們有一個(gè)優(yōu)待政策:在發(fā)現(xiàn)自己被降權(quán)后可以申請(qǐng)立即復(fù)查一次,如果復(fù)查發(fā)現(xiàn)網(wǎng)站上已沒(méi)有spam 行為,則可以安排盡快取消降權(quán)。但這個(gè)權(quán)利只能用一次,一旦該網(wǎng)站在例行檢查、網(wǎng)友舉報(bào)、或不定期復(fù)查中被再次發(fā)現(xiàn)spam,那么無(wú)論誰(shuí)也救不了它了。
caoz:hao123的發(fā)展思路是什么?第一,如果想加入新站點(diǎn),目前是什么政策?據(jù)說(shuō)收費(fèi)了?費(fèi)率多少?第二,以前被收錄的站點(diǎn)會(huì)不會(huì)有政策處理上的變化?這是他們很關(guān)心的問(wèn)題。
9238:
詳細(xì)的發(fā)展思路是商業(yè)機(jī)密,我不能在此公開(kāi)。但可以回答你一個(gè)具體的問(wèn)題,所謂hao123已改為收費(fèi)登錄那是假的,每個(gè)頻道只是賣(mài)少量廣告(百度對(duì)廣告的控制極嚴(yán),沒(méi)有在hao123原有基礎(chǔ)上增加任何flash或banner,每個(gè)頻道廣告鏈接原則上不超過(guò)5個(gè),不達(dá)到一定質(zhì)量要求的網(wǎng)站即使廣告也不賣(mài)給它,負(fù)責(zé)hao123用戶(hù)體驗(yàn)的員工對(duì)廣告有一票否決權(quán)),但現(xiàn)在肯定沒(méi)有全面收費(fèi),今后的一段時(shí)間內(nèi)也沒(méi)有這個(gè)打算。以前被收錄的站點(diǎn)不會(huì)有處理策略的變化,hao123的用戶(hù)體驗(yàn)或者被收錄網(wǎng)站的質(zhì)量是挑選和更新的唯一標(biāo)準(zhǔn)。
caoz:百度mp3搜索的策略與mp3音樂(lè)站長(zhǎng)群的矛盾如何化解
9238:
迄今為止百度的mp3信息幾乎都是從百度的網(wǎng)頁(yè)庫(kù)中提取出來(lái)的,而百度的spider一直遵守國(guó)際通行的robots協(xié)議,不愿意被百度收錄mp3信息的站長(zhǎng)只要寫(xiě)一句robots協(xié)議就能阻止百度spider再收集信息(以前收集的信息需要等一段時(shí)間被更新后才消失),在百度的用戶(hù)幫助信息中提供了詳細(xì)的robots協(xié)議寫(xiě)作教程:
caoz:不知道百度對(duì)故意重復(fù)的定義是什么,比如donews首頁(yè)的標(biāo)題,有大量的IT重復(fù)出現(xiàn),是否算做故意重復(fù)呢?又比如前幾天突然被降權(quán)的 9flash.com。他在頁(yè)面里所重復(fù)的“flash”關(guān)鍵詞,是不是屬于“故意”面向搜索引擎做的呢?我們可以這么測(cè)試一下,把“flash展現(xiàn)的電影”和 “電影”兩個(gè)詞比較,可以等同嗎?不等同說(shuō)明flash這個(gè)詞在這里,是必要修飾詞,把“flash音樂(lè)”和“音樂(lè)”兩個(gè)詞比較,可以等同嗎?不等同說(shuō)明 flash這個(gè)詞在這里,是個(gè)必要的修飾詞,下面的不用解釋了,我覺(jué)得這個(gè)其實(shí)很容易理解,如果在對(duì)方站點(diǎn)里出現(xiàn)的某些關(guān)鍵詞在該站點(diǎn)的內(nèi)容和連接表述中,屬于必要修飾詞,并且該關(guān)鍵詞所出現(xiàn)的段落和連接有其正確的表述價(jià)值,那么這種重復(fù),就不能說(shuō)是“故意重復(fù)”,我不知道百度認(rèn)同否?
9238:
反spam的唯一目的是提高用戶(hù)搜索體驗(yàn)。我們不會(huì)為了反spam而反spam,不會(huì)對(duì)所有違反規(guī)則的網(wǎng)站施加相同的懲罰,關(guān)鍵在于,用戶(hù)查看某個(gè)關(guān)鍵詞的搜索結(jié)果時(shí),你的網(wǎng)站對(duì)用戶(hù)是否有價(jià)值、這個(gè)價(jià)值所否值得你排在那個(gè)位置?
即使donews對(duì)IT重復(fù)了,如果在IT這個(gè)關(guān)鍵詞的搜索結(jié)果中沒(méi)有排在非常不該排的位置,沒(méi)有對(duì)用戶(hù)搜索體驗(yàn)造成明顯破壞,那么理想狀態(tài)下 donews仍不會(huì)受懲罰。9flash如果只對(duì)flash關(guān)鍵詞優(yōu)化,那么不太容易受到懲罰,但如果對(duì)電影關(guān)鍵詞優(yōu)化,那么很容易受到懲罰。
明白的說(shuō),網(wǎng)站spam與否是網(wǎng)站的自由,百度無(wú)權(quán)干涉也沒(méi)興趣理睬,但如果哪個(gè)網(wǎng)站的行為或效果破壞了中國(guó)網(wǎng)民在百度搜索的體驗(yàn),那么百度也有升級(jí)算法、降權(quán)、直至拒絕收錄這個(gè)網(wǎng)站的權(quán)利和興趣。其實(shí)各位站長(zhǎng)完全沒(méi)必要把百度怎么想當(dāng)一回事,站長(zhǎng)們只要把百度的搜索用戶(hù)當(dāng)一回事就行了,只要你的網(wǎng)站對(duì)用戶(hù)有搜索價(jià)值,百度急著升級(jí)算法把你排到合適的位置都來(lái)不及呢,哪里敢把你降權(quán)什么的呢。
caoz: 故意制造大量鏈接指向某一網(wǎng)址的行為。
我覺(jué)得這個(gè)條款簡(jiǎn)直可以讓所有的站點(diǎn)納入作弊的范疇。
百度有個(gè)聯(lián)盟,把代碼投放到千萬(wàn)個(gè)站點(diǎn)上,算不算“故意制造大量連接指向某一網(wǎng)址”?這個(gè)是個(gè)玩笑,但是事實(shí)是,所有的站長(zhǎng),特別是那些沒(méi)有能力做大幅度廣告預(yù)算的個(gè)人站點(diǎn),他們的網(wǎng)絡(luò)推廣途徑的重要步驟,就是和大量的不同站點(diǎn)交換連接,交換連接,不就是“故意制造大量鏈接指向某一網(wǎng)址的行為”嗎?這是其一。如果我做了一個(gè)站點(diǎn),我又申請(qǐng)了blog,我又申請(qǐng)了donews,我又申請(qǐng)了什么什么,我又泡論壇,那么我肯定會(huì)把我的站點(diǎn)連接放在每個(gè)我能放網(wǎng)絡(luò)連接的地方告訴大家,比如論壇簽名檔,比如blog的連接,比如donews個(gè)人介紹,等等,有沒(méi)有搜索引擎我都會(huì)這么干,站長(zhǎng)怎么發(fā)展流量?坐等嗎?這是其二。商業(yè)公司要發(fā)新聞稿,公關(guān)稿,網(wǎng)絡(luò)時(shí)代了,網(wǎng)絡(luò)媒體也很重視,一個(gè)稿子發(fā)新浪搜狐網(wǎng)易千龍?zhí)鞓O等等等等,每個(gè)稿子上都會(huì)有這個(gè)公司的連接,又是故意制造大量連接指向同一網(wǎng)址。這是其三。請(qǐng)百度的朋友解釋一下,怎么叫“不故意制造大量連接呢”,做好站點(diǎn),放在那里,等別人連接或者干脆不要外部鏈接,也許只有國(guó)家政府機(jī)關(guān)的網(wǎng)站會(huì)這樣。
9238:上一個(gè)回答也能用在這里吧?誰(shuí)愛(ài)做鏈接就做吧,但別針對(duì)與自己網(wǎng)站內(nèi)容不相關(guān)的關(guān)鍵詞做,即使相關(guān)的關(guān)鍵詞,也別排到特別不合適的位置去。其實(shí),百度能自動(dòng)過(guò)濾不少可疑鏈接,所以某些制造鏈接的行為根本不會(huì)受到懲罰,因?yàn)閷?duì)排名不會(huì)有任何影響。
caoz:有鏈接指向作弊網(wǎng)站的網(wǎng)站,負(fù)連帶責(zé)任,也會(huì)被認(rèn)為是作弊
這個(gè)最狠,簡(jiǎn)直是連坐,大清朝倒臺(tái)后好象就不興這個(gè)了。不過(guò)互連網(wǎng)本身就是由大量的連接組成的,這個(gè)方式搞下去,恐怕是人人自危吧,我這么說(shuō)吧,A站作弊(證據(jù)確鑿,驗(yàn)明正身),B站上不巧給A站做了連接,那么B站被認(rèn)為是作弊,那么C站上偏偏也給B站做了連接,得,既然B站已經(jīng)被認(rèn)定也是作弊,道理同樣,C站指向作弊站點(diǎn),也是作弊,D站又有C站連接,慘了,這么連下去,和百度的Spider沒(méi)啥區(qū)別(相當(dāng)于倒過(guò)來(lái)爬);洪桐縣里沒(méi)好人,互聯(lián)網(wǎng)上沒(méi)好站,大家彼此彼此。
其實(shí)百度真要這么搞也可以,每天公布一個(gè)封殺作弊站點(diǎn)列表,并給相關(guān)連接站點(diǎn)一天的取消連接的準(zhǔn)備期,這樣站長(zhǎng)們就會(huì)每天上來(lái)看誰(shuí)是最新的倒霉蛋,看看在不在自己站點(diǎn)的友情鏈接里,并且用最短的時(shí)間和對(duì)方劃清界限!消除連接,以免殃及自身不是。
9238:
這條規(guī)則,是針對(duì)某些擁有一大批域名互相鏈接作弊的人。從百度中降權(quán)或消失對(duì)于每個(gè)中文網(wǎng)站都是大事,我們不會(huì)輕易的批量懲罰的,事實(shí)上只有在對(duì)某些網(wǎng)站之間的關(guān)系相當(dāng)有把握時(shí)才會(huì)激活這個(gè)懲罰規(guī)則,而且,雖然批量鏈接作弊是機(jī)器自動(dòng)識(shí)別的,但識(shí)別出的每一個(gè)網(wǎng)站在被正式懲罰前都會(huì)經(jīng)過(guò)人工驗(yàn)證,幾乎不可能誤殺。
普通的友情鏈接再多也不會(huì)受懲罰,但僅限鏈接所用文字是合適的網(wǎng)站名,如果用關(guān)鍵詞做鏈接,則很容易被識(shí)別為spam。