信息分類學(xué)是網(wǎng)站開發(fā)人員的好伙伴,它可以幫助我們達(dá)成在設(shè)計網(wǎng)站時需要考慮的兩個非常重要卻又容易忽視的目的:用戶滿意度和投資回報程度。如果在設(shè)計時對信息分類考慮較少甚至不予考慮,那么就算效率再高的搜索引擎也難以圓滿實現(xiàn)這兩個目的。
盡管近些年來搜索引擎技術(shù)越來越先進(jìn),但在互聯(lián)網(wǎng)上的信息搜索不論成功與否仍然存在問題。使用過搜索引擎的人都有過這樣的體驗,有時候你什么結(jié)果也搜索不到,而有時候你會得到上百萬條搜索結(jié)果。實際上,第二種結(jié)果更加難以處理,要想從百萬條搜索結(jié)果中找到你真正需要的信息,簡直是大海撈針。而目前互聯(lián)網(wǎng)的蓬勃發(fā)展正在不斷加重這種信息冗余的問題。就算是在信息量較少的企業(yè)內(nèi)部網(wǎng)中,如果網(wǎng)站在開發(fā)前沒有經(jīng)過認(rèn)真規(guī)劃,同樣會出現(xiàn)上述問題。
在互聯(lián)網(wǎng)出現(xiàn)以前,公眾獲取信息或知識的一個主要途徑就是圖書館。借助專業(yè)的信息檢索,圖書管理員知道如何通過布爾邏輯、加號、減號以及其他符號完成復(fù)雜的查詢工作。這種復(fù)雜的查詢依賴于對信息架構(gòu)的正確分類和明確標(biāo)記。但是當(dāng)互聯(lián)網(wǎng)興起時,人們認(rèn)為解決信息查詢問題的方法就是將大量信息一股腦的拋到這個信息高速路上,而沒有考慮該如何組織這些信息。
這種局面造就了搜索引擎,這個在整個互聯(lián)網(wǎng)上辛苦搜集信息的工具。不幸的是,我們中的大多數(shù)人都沒有受過圖書管理方面的培訓(xùn),無法準(zhǔn)確告訴搜索引擎我們所需信息的關(guān)鍵詞。而互聯(lián)網(wǎng)在經(jīng)過幾年的迅速發(fā)展后,在我們面前的互聯(lián)網(wǎng)已經(jīng)成為了一個無邊無際的電子信息海洋。它帶給我們的好處就是超級豐富的信息量。然而由于沒有良好的內(nèi)容結(jié)構(gòu),我們無法在這些信息內(nèi)容中快速找到所需信息,甚至根本就找不到所需信息,更糟的是也許我們找到的只是一堆不需要的東西,而我們卻還在這堆垃圾中挑來揀去的尋找根本沒有的東西。
缺乏結(jié)構(gòu)性帶來的問題
無結(jié)構(gòu)性的互聯(lián)網(wǎng)內(nèi)容帶來的問題無法用量化的標(biāo)準(zhǔn)來說明,因為借助搜索引擎,搜索者很少知道為什么會搜到這個結(jié)果或者這個信息來源何處。因此,我們將網(wǎng)絡(luò)內(nèi)容缺乏結(jié)構(gòu)性帶來的各種問題總結(jié)如下:
不成功的搜索所浪費(fèi)的時間。
由于搜索者無法找到所需信息,因此信息收集存儲的投資回報很低,比如數(shù)據(jù)倉庫和內(nèi)容管理。
由于不完整或者不精確的信息造成的決策失誤。
不成功的搜索給搜索者帶來的不良體驗會破壞公司形象、公司與客戶/合伙人間的關(guān)系,以及內(nèi)部人員的關(guān)系。
分類學(xué)給網(wǎng)站開發(fā)帶來的益處
生命科學(xué)家用分類學(xué)將所有的生物進(jìn)行有組織的分類。圖書管理學(xué)家和信息科學(xué)家們也將這種技術(shù)和方法用于信息搜索和數(shù)據(jù)檢索。借助于這種技術(shù)和方法,我們可以開發(fā)一種網(wǎng)絡(luò)分類框架,將先前無法快速訪問的容轉(zhuǎn)換為具有結(jié)構(gòu)性的Web內(nèi)容以便于訪問。
分類學(xué)牽扯到網(wǎng)站開發(fā)的很多方面,比如網(wǎng)站設(shè)計、內(nèi)容管理以及網(wǎng)站內(nèi)容的搜索過程。下面讓我們具體來看看分類學(xué)是如何給這些方面帶來益處的。
分類學(xué)給網(wǎng)站設(shè)計帶來的益處
分類學(xué)具有兩個方面:結(jié)構(gòu)分類和視圖分類。網(wǎng)站設(shè)計所涉及的更多的是視圖分類,它通過將信息按主題分組達(dá)到將網(wǎng)站內(nèi)容邏輯化的目的。在利用外觀分類實施網(wǎng)站設(shè)計時,我們可以利用直觀的組織和標(biāo)識來建立一個有效的網(wǎng)站導(dǎo)航系統(tǒng)。當(dāng)網(wǎng)站內(nèi)容被合理的組織并有了清晰明了的標(biāo)識后,網(wǎng)站訪問者就可以輕松的導(dǎo)航和定位所需內(nèi)容,這種體驗可以有效提高訪客的回頭率。
分類學(xué)給網(wǎng)站內(nèi)容管理帶來的益處
圖書館根據(jù)美國國會圖書館分類系統(tǒng)(Library of Congress Classification System)或者杜威圖書分類系統(tǒng)(Dewey Decimal System)對書籍和雜志進(jìn)行組織。每一項都用一系列標(biāo)準(zhǔn)屬性來標(biāo)記,比如圖書編目號碼、主標(biāo)題、標(biāo)題和作者等等。然后,這些書籍和雜志可以放心地入庫,以后可用人工或計算機(jī)化的卡片編目來方便地檢索。
同樣,企業(yè)也可用結(jié)構(gòu)分類來組織其信息資源如文檔、網(wǎng)頁等等。結(jié)構(gòu)分類提供了一個層次化的分類系統(tǒng),它基于一個已經(jīng)定義好的范圍和背景。在內(nèi)容管理過程中,可采用結(jié)構(gòu)分類的標(biāo)準(zhǔn)術(shù)語來統(tǒng)一分類及標(biāo)記信息資源。在內(nèi)容管理工作流中,內(nèi)容管理員通過提供一個層次化的類別列表以推行分類結(jié)構(gòu)。
最終的結(jié)果就是,企業(yè)或公司范圍內(nèi)的所有信息都存儲到一個內(nèi)容管理系統(tǒng)中,而且每項信息都與一個或多個類別相關(guān)聯(lián)。之后就可通過一個視圖分類或者搜索引擎,在網(wǎng)上更有效地檢索這些分類信息資源,這和傳統(tǒng)的圖書館檢索并沒有多大的區(qū)別。內(nèi)容管理系統(tǒng)最終的目標(biāo)就是使企業(yè)的內(nèi)容達(dá)到最大的可用性。因此將結(jié)構(gòu)分類集成到內(nèi)容管理過程中,就能改進(jìn)內(nèi)容管理系統(tǒng)的可用性。
分類學(xué)給網(wǎng)站搜索帶來的益處
無論視圖分類還是結(jié)構(gòu)分類,在網(wǎng)站搜索過程的不同階段都會被涉及。搜索執(zhí)行之前,搜索引擎首先要遍歷一個目標(biāo)范圍的內(nèi)容,并為其建立索引。有的搜索引擎如Autonomy,可利用結(jié)構(gòu)分類的方法通過對一個示范性的文檔集進(jìn)行分析來學(xué)習(xí)每個類別的特征。這種學(xué)習(xí)能力有助于對搜索結(jié)果的相關(guān)性進(jìn)行精細(xì)的調(diào)節(jié)。
索執(zhí)行期間,結(jié)構(gòu)分類可以通過網(wǎng)站的多級分層結(jié)構(gòu)作為視圖分類顯示出來,就像Yahoo的目錄列表那樣。站點(diǎn)訪問者可瀏覽每個類別的Web內(nèi)容列表,或者向下深入到某個更具體的類別,再在該類別的范圍中執(zhí)行一次搜索。例如,他們可進(jìn)入Computers & Internet → Software → Natural Language Processing類別后再執(zhí)行搜索。
搜索執(zhí)行后,搜索結(jié)果可根據(jù)一個或多個由系統(tǒng)定義的結(jié)構(gòu)分類進(jìn)行組織。例如,Convera’s RetrievalWare可采取多種方式對搜索結(jié)果進(jìn)行分類,比如按國家、語言或者主題等。這種分類能力顯著緩解了信息汪洋的問題。你不再需要在返回的大量結(jié)果中逐個尋找所需的內(nèi)容,只需按國家、語言或者主題等等進(jìn)行篩選。例如,在Yahoo上搜索"content management system"會返回3790000個結(jié)果(2003年4月20日的搜索結(jié)果)。如果按主題對它們進(jìn)行分類,比如按"最佳操作"、"工具"等等,就能快速找到最佳結(jié)果。
在Web搜索過程中全面集成分類學(xué),可提供更有效的搜索體驗。這將顯著減少因搜索失敗或查找錯誤信息所浪費(fèi)的時間,從而可確保一個有效的決策過程。