當前位置:工程項目OA系統(tǒng) > 泛普各地 > 河北O(jiān)A系統(tǒng) > 石家莊OA系統(tǒng) > 石家莊OA信息化
搜索:非結構化信息管理的核心
在過去的10年,我們經過了由信息匱乏到信息過量的轉變。在銷售額過30億的企業(yè),或市級以上主要政府機構,擁有的IT系統(tǒng)數(shù)量一般會超過10個。這些系統(tǒng)中的信息,包括結構化數(shù)據(jù),也包括非結構化信息,如多格式的文檔、郵件、網(wǎng)頁等。根據(jù)調查,85%的信息是非結構化的,每三個月增加一倍。在因特網(wǎng)上,每天增加7百萬張新網(wǎng)頁。
知識工作者,面臨著尋找信息的挑戰(zhàn)。根據(jù)調查,知識工作者每天30%的工作時間,用于收集信息;72%的管理者認為,知識沒有在他們的組織得到重復利用。從這些異構、繁雜、豐富的內容中,準確、快速地找到自己所需要的信息,減少信息搜尋時間,能夠創(chuàng)造巨大的價值。
非結構化信息管理的應用熱點
知識管理,有不同的應用點。這些應用點的設計開發(fā),已經考慮了怎么幫助用戶更好地獲取他所需要的知識。
1) 門戶。門戶應用的核心在于展現(xiàn)和集成。企業(yè)內部所擁有的信息系統(tǒng)的數(shù)量在增多,導致用戶需要登錄和瀏覽多個系統(tǒng),會浪費時間,亦會耽誤工作事項的及時處理。門戶可以將多個系統(tǒng)的應用點集中在一個界面上。所以,集成是門戶的應用重點。門戶的第二個應用重點是:怎么能夠高效、快捷、多樣、美觀地對內容進行展現(xiàn),減少程序設計量和改版工作量。
2) 文檔管理。文檔的價值,重在重用。無論是記載了既往的經驗、訣竅、心得、數(shù)據(jù)的工作文檔,還是承載了規(guī)范、方法、工具的工作模版,如果能夠供后來者使用,都能帶來效益和效率的提高。文檔管理亦是知識管理的基礎所在。它看似簡單,但如果以高水準的要求看待文檔管理,并不是容易做的水準高、做的持久。
3) 協(xié)同。要點在知識與業(yè)務過程結合。無論是辦公自動化系統(tǒng)中的文檔,或是營銷系統(tǒng)中的文檔管理,還是產品數(shù)據(jù)管理中的文檔管理,都是將文檔與業(yè)務的運作結合起來,在具體業(yè)務的經營管理中,同步進行知識管理。
4) 社區(qū)。重在隱性知識向顯性知識的轉化。隨著Web 2.0應用的普及化,博客、論壇、問題庫、圈子、人脈網(wǎng)絡等在大型企業(yè)內部的應用,亦逐步增多。由此,企業(yè)的社區(qū)不僅僅是論壇這一個應用。社區(qū),促進了隱性知識向顯性知識的轉化。
5) E-learning系統(tǒng)。也是企業(yè)知識管理的應用重點之一,使得受制于講師、空間、時間的面授培訓,變成用戶來點播使用的基于網(wǎng)絡的培訓。對于知識性的培訓來說,這不僅有品質的保障,而且大大降低了成本。
上述這些不同的應用,外加企業(yè)內部建設的業(yè)務類、管理類系統(tǒng),帶來了信息量的膨脹,異構的數(shù)據(jù)。用戶如何從這些系統(tǒng)中獲取所需的信息,所費的時間越來越多。
如何幫助用戶更好地獲取信息?
與企業(yè)內部應用相比,互聯(lián)網(wǎng)站對提高用戶友好性、提高用戶點擊量,傾注的熱情更多。所積累的諸多經驗,形成了系列規(guī)則和約定俗稱的規(guī)范,值得企業(yè)內部知識管理系統(tǒng)學習借鑒。
1) 屬性的廣泛應用。無論是行業(yè)、產品類別、廠商類別等,還是新聞、首頁、置頂、標紅等,這些屬性,作為目錄的補充,其應用使得前臺展現(xiàn)的緯度更加多元化,也使得計算能力得到節(jié)約。
2) Tag的應用。作為Web 2.0應用的符號性應用之一,Tag使得信息分類的顆粒度變得更小、更個性化、更長尾化。
3) 關聯(lián)性的應用。關聯(lián)性效果好的話,可以有效地幫助用戶獲取他所需要的信息,可以增加用戶訪問某一網(wǎng)站或應用系統(tǒng)的點擊量。當用戶在瀏覽某篇文章的時候,系統(tǒng)自動給出與該篇文章相關度高的其他文章的列表,或者給出與此文章相關的內容分類、內容屬性或Tag,可以有效地提高用戶獲取信息的系統(tǒng)友好性。
4) 信息展現(xiàn)方式的改進。將頁面分解為版式、模塊、樣式、信息來源,每塊都可以自定義,這樣使得頁面的樣式改變不需要重寫程序,效率大大提高。
5) 用戶自定義。有了目錄、多樣的屬性、Tag、模版作為基礎,用戶可以自定義自己所關心、所偏愛的內容、樣式,使得系統(tǒng)界面及內容能夠個性化。
上述方法的使用,可以幫助系統(tǒng)管理員,方便地從業(yè)務的視角,來幫助用戶獲取知識。
搜索:信息展現(xiàn)的核心應用
對用戶來說,企業(yè)級搜索所提供的服務,與公眾類搜索引擎類似。在企業(yè)內部部署后,其提供的核心價值在于:
1) 搜索的準確性。專業(yè)的企業(yè)級搜索軟件基于自己的算法,可幫助用戶更準確地找到與其關心的關鍵詞相匹配的內容。當搜索用戶并不熟悉的專業(yè)內容時,軟件所提供的搜索結果,比目錄、屬性甚至人工推薦更值得信賴。搜索準確性,除依賴于搜索算法外,也依賴于分詞技術。比如搜索“制造業(yè)商業(yè)智能”,搜索軟件能夠根據(jù)專業(yè)的詞庫將其分解為制造業(yè)和商業(yè)智能兩個詞對內容進行精確搜索。搜索準確性,也依賴于附件搜索技術,即對常見的文本處理文檔,能夠進行索引和搜索。
2) 內容自動分類、摘要和關鍵詞的自動提取。如果人工對大量的內容進行入庫處理,如標注分類、屬性、Tag、提取摘要,質量依賴人工監(jiān)控,不穩(wěn)定。每個編輯人員,每天處理的內容在250篇。隨著信息量的增多,內容入庫的成本也在增加。用技術實現(xiàn)內容自動分類,關鍵詞和摘要的自動提取,使得編輯人員的工作從人工入庫變?yōu)閷C器分類結果的審核。這樣,既可以兼具機器分類和人工分類的優(yōu)勢,又可以幫助提高效率節(jié)約入庫成本,。
依賴于上述兩個核心應用點,面向用戶端,在門戶系統(tǒng)、文檔管理系統(tǒng)、業(yè)務系統(tǒng)、社區(qū)系統(tǒng)、在線培訓系統(tǒng)等知識管理系統(tǒng)中,靈活地使用屬性、Tag、關聯(lián)性、信息展現(xiàn)方式、用戶自定義等,可以使得用戶獲取信息的效率和質量得到非常大的提高。
1) 搜索結果展現(xiàn)方式的多樣化??砂磿r間、相關度等排序;用戶或管理員可配置搜索選項。從而將豐富內容的威力,充分地發(fā)揮出來。
2) 推出高質量的推送服務。根據(jù)用戶的特點,如性別、區(qū)域、行業(yè)、職業(yè)、興趣、愛好等,向用戶提供推送服務。如暢享網(wǎng)所經營的、面向機構用戶的商務資訊庫KNET中,就提供“我所關注的競爭對手”、“我所關注的客戶”“我所關注的行業(yè)”、“我關注的管理知識”、“我所關注的信息化知識”等推送服務。
3) 提高單用戶的訪問量。搜索結果頁,可以實現(xiàn)實時的推送,即用戶在瀏覽某一內容時,系統(tǒng)自動匹配及推送他可能關心的其他內容。亦可以提供動態(tài)的相關分類或關鍵詞,為用戶動態(tài)提供相關的數(shù)據(jù)、文章、人員、應用系統(tǒng)等。這可以大大提高單用戶訪問單一系統(tǒng)的點擊量。在很多情況下,這可以幫助用戶更迅速、更準確地定位他所需要的內容。
4) 結構化數(shù)據(jù)與非結構化信息的關聯(lián)。將非結構化信息與結構化數(shù)據(jù),關聯(lián)起來。在用戶搜索非結構的文章時,可以將結構化的相關數(shù)據(jù)、人員、訂單等展示給用戶。當用戶搜索結構化的數(shù)據(jù)、人員、訂單、財務、材料等數(shù)據(jù)時,可將非結構化的文件展示給用戶。
建立高質量搜索系統(tǒng)的難點
從當前的應用實踐來看,建立高質量的企業(yè)級搜索系統(tǒng),有如下值得關注的難點:
1) 軟件的選擇或開發(fā)。搜索軟件是高質量搜索系統(tǒng)的基礎所在。從技術來源上說,自己開發(fā)搜索軟件,因為面臨算法、性能等技術難題,可行性小。采用商品化的搜索軟件,是可行辦法。需要從市場上不多的專業(yè)搜索軟件中,選擇合適的搜索軟件。
2) 搜索結果展示。搜索結果是為了讓搜索的目標用戶能夠在最短的時間內找到最準確的內容,同時,給用戶提供更多相關性的內容,挖掘用戶的潛在需求,增加搜索的易用性,例如,相關的搜索詞,相關的文章、相關的關鍵詞等等。展示的頁面要做到簡潔、友好,必須在用戶調研的基礎上不斷的完善和改進。
3) 專業(yè)詞庫的建立。建立企業(yè)級搜索系統(tǒng)的機構,對搜索的準確性比一般機構有更高的要求。搜索引擎自帶的詞庫,不足以勝任對搜索準確性的高要求。根據(jù)自身機構的專業(yè)特點,建立分級、分類的專業(yè)詞庫,是基礎的、繁雜的、長期的、高價值的工作。
4) 搜索軟件的實施。搜索軟件提供的是搜索和分類兩個核心應用點。如何充分地應用兩個核心應用點,進行用戶搜索頁、搜索結果頁、文章閱讀頁的設計?如何提供與用戶自身個性化特點相匹配的內容的推送服務,從而提高用戶獲取信息的效率和主動性?從而使得搜索在非結構化信息的應用系統(tǒng)中無處不在,大大提高系統(tǒng)的用戶友好性。這都依賴于對搜索軟件的有效的實施。
作者:孟凡強、朱洪濤,其中朱洪濤為暢享網(wǎng)市場經理。暢享網(wǎng)是經營商務知識和人脈網(wǎng)絡的第一互聯(lián)網(wǎng)平臺。
- 1從九點連線談創(chuàng)新及對石家莊OA信息化的再思考(by AMT 夏敬華)
- 2InterOP Stack新一代平臺互操作技術:InterOP Stack技術概覽
- 3圖書出版企業(yè)的信息化建設
- 4泛普協(xié)同OA辦公軟件的信息資源共享
- 5XML Web Services Security
- 6面向服務的應用集成——EAI和Web服務
- 7[原創(chuàng)]K運營
- 8無SOAP的Web服務,第一部分
- 9企業(yè)核心能力的經濟學含義
- 10“低價狂人”欒潤峰:有理想的冒險才值得
- 11組織學習的五個子系統(tǒng)
- 12當軟件變成服務時
- 13Web服務設計師,第4部分:基于付費Web服務:術語
- 14W3C發(fā)表WSDL 1.2規(guī)范
- 15看APQC如何實施和考評石家莊OA信息化?(by AMT 石家莊OA信息化研究小組)
- 16創(chuàng)造性的Intranet:Factors for Corporate Knowledge Creation
- 17Web Services Interoperability and SOAP
- 18石家莊泛普OA辦公軟件的用戶界面定制
- 19關于資料收集的一些心得(by AMT 羅贊)
- 20石家莊OA信息化的“三四五六七”(by AMT 石家莊OA信息化小組)
- 21[理論] 如何根據(jù)業(yè)務過程選擇知識應用模式?(夏敬華)
- 22中小企業(yè)如何化解經濟危機
- 23追問石家莊OA信息化(高麗華)
- 24微軟展示新版互聯(lián)網(wǎng)服務MSN 8.0
- 25Web Service Case Study: 事務性Web服務
- 26Web服務內幕,第3部分:Apache和Microsoft -- 良好的合作
- 27Building an ASP.NET Web Service
- 28從Web Services中訪問服務器變量
- 29如何使用Visual Studio .NET和Office XP創(chuàng)建和部署XML Web Service
- 30石家莊OA信息化的價值和挑戰(zhàn)
成都公司:成都市成華區(qū)建設南路160號1層9號
重慶公司:重慶市江北區(qū)紅旗河溝華創(chuàng)商務大廈18樓