天津OA信息化――支撐企業(yè)核心競(jìng)爭(zhēng)力

　　知識(shí)管理與搜索引擎　　近10年，以信息為基礎(chǔ)的組織或知識(shí)型企業(yè)煥發(fā)勃勃生機(jī)，創(chuàng)造和傳播知識(shí)已經(jīng)成為檢驗(yàn)企業(yè)核心能力的關(guān)鍵要素，知識(shí)的創(chuàng)造和應(yīng)用能力成為不折不扣的企業(yè)核心競(jìng)爭(zhēng)力的強(qiáng)力支撐。　　知識(shí)管理，是針對(duì)知識(shí)本身的，包括對(duì)知識(shí)的創(chuàng)造、獲取、加工、存儲(chǔ)、傳播和應(yīng)用的管理。對(duì)于企業(yè)而言，知識(shí)除儲(chǔ)存于員工的大腦中外，還根植于企業(yè)長(zhǎng)期積累的各種文檔，以及其他應(yīng)用系統(tǒng)的數(shù)據(jù)當(dāng)中。如何在企業(yè)龐雜的信息數(shù)據(jù)中挖掘出知識(shí)，則需要選擇相關(guān)的工具，企業(yè)知識(shí)搜索引擎則是其中之一。　　針對(duì)企業(yè)知識(shí)搜索引擎的應(yīng)用需求，來(lái)自于龍卷風(fēng)科技設(shè)計(jì)開(kāi)發(fā)的The Information Retrieval Management System R3 (IRMS R3)，希望透過(guò)IRMS R3的開(kāi)發(fā)平臺(tái)，讓搜索引擎技術(shù)能對(duì)企業(yè)知識(shí)管理應(yīng)用提供更多的支持。　　數(shù)據(jù)整合　　企業(yè)內(nèi)部的知識(shí)存在于各種信息載體當(dāng)中，如辦公文檔（MSOffice PDF等文件）、企業(yè)網(wǎng)站、員工論壇、OA、CRM等應(yīng)用系統(tǒng)數(shù)據(jù)。針對(duì)企業(yè)中龐雜的非結(jié)構(gòu)文檔，各種應(yīng)用復(fù)雜的數(shù)據(jù)存儲(chǔ)方式，IRMS R3中提出了虛擬數(shù)據(jù)庫(kù)層 (Data Virtualization Layer)的概念。　　IRMS R3中虛擬數(shù)據(jù)庫(kù)層的構(gòu)思與該系統(tǒng)其它階層采用的平臺(tái)開(kāi)發(fā)理念是一致的。在這個(gè)底層，虛擬數(shù)據(jù)庫(kù)層分為數(shù)據(jù)提取層（Data Source Composer）和文件解析層(Data Extraction Layer)，兩個(gè)組件來(lái)協(xié)同進(jìn)行各種復(fù)雜的數(shù)據(jù)存儲(chǔ)格式的解析。　　其中，數(shù)據(jù)提取層（Data Source Composer）能分析在各種文件管理系統(tǒng)、內(nèi)容管理系統(tǒng)（Documentum、FileNET等）或其它信息處理軟件（IBM Notes、MSExchange、各種DBMS等）中所找到的分布式數(shù)據(jù)庫(kù)數(shù)據(jù)。將企業(yè)內(nèi)部的各個(gè)異構(gòu)數(shù)據(jù)環(huán)境整合起來(lái)，使得企業(yè)知識(shí)搜索引擎可以覆蓋企業(yè)內(nèi)部所有的知識(shí)載體，讓價(jià)值信息無(wú)一漏網(wǎng)。　　而文件解析層則能分析各種文件格式（TXT、 MS Office、PDF、EML、ZIP等），并對(duì)這些文件的各種屬性進(jìn)行提取，從而提供使用者可以通過(guò)文件屬性，文件內(nèi)容等多個(gè)維度定位需要的文檔，獲取信息，并將其轉(zhuǎn)化為知識(shí)。　　為了適應(yīng)不同企業(yè)更復(fù)雜的數(shù)據(jù)環(huán)境，這兩個(gè)階層提供靈活的擴(kuò)展性，都可以通過(guò)簡(jiǎn)單的程序開(kāi)發(fā)來(lái)支持企業(yè)內(nèi)部獨(dú)特的數(shù)據(jù)存儲(chǔ)方式及文檔格式。像龍卷風(fēng)數(shù)據(jù)索引系統(tǒng)(Indexing System)和標(biāo)準(zhǔn)的檢索組件(Standard Retrieval Components)都經(jīng)過(guò)特別設(shè)計(jì)，能滿足以雙字節(jié)字符集(如繁簡(jiǎn)中文，日文等)格式或存有多國(guó)語(yǔ)系文件的跨國(guó)企業(yè)知識(shí)搜索引擎的需求。　　同時(shí)，IRMS R3符合行業(yè)標(biāo)準(zhǔn)、松散耦合的開(kāi)放式的組件設(shè)計(jì)，能隨時(shí)加入有新功能的組件或其它廠商的組件，從而強(qiáng)化系統(tǒng)功能。　　信息總線技術(shù) 　　IRMS R3中信息總線 (Info Bus) 在整個(gè)信息平臺(tái)具有承先啟后的關(guān)鍵地位。一方面，它和底層的虛擬數(shù)據(jù)層整合，各種數(shù)據(jù)源會(huì)統(tǒng)一經(jīng)過(guò)虛擬數(shù)據(jù)層的分析，并將取得的內(nèi)容統(tǒng)一存放到信息總線上。同時(shí)，對(duì)于上層的IR組件模塊(搜尋引擎模塊、自然語(yǔ)言處理模塊、自動(dòng)分類模塊等)而言，信息總線則扮演信息提供者的角色，統(tǒng)一將透過(guò)虛擬數(shù)據(jù)層粹取出來(lái)的數(shù)據(jù)進(jìn)行集中管理，并提供各IR組件取用。如此一來(lái)，各個(gè)IR組件不需負(fù)擔(dān)數(shù)據(jù)源分析的工作，直接讀取信息總線上的數(shù)據(jù)，即可輕易取得各種異構(gòu)數(shù)據(jù)源的內(nèi)容。　　值得注意的是，IRMS R3 的信息總線并不是單純的數(shù)據(jù)儲(chǔ)存點(diǎn)。為配合信息檢索(Information Retrieval)的信息處理需求，R3的信息總線是被設(shè)計(jì)成一個(gè)隊(duì)列式(Queue)的儲(chǔ)存架構(gòu)。一開(kāi)始，所有從虛擬數(shù)據(jù)層取得的數(shù)據(jù)會(huì)先被置放在隊(duì)列儲(chǔ)存中心(Queue Store)集中管理。等到上層的各個(gè)IR組件要開(kāi)始處理數(shù)據(jù)時(shí)，在隊(duì)列儲(chǔ)存中心(Queue Store)的資料會(huì)被移轉(zhuǎn)到處理儲(chǔ)存中心(Process Store)。這樣可以確保原始數(shù)據(jù)的內(nèi)容選取以及內(nèi)容分析可同時(shí)并行。最后，當(dāng)各個(gè)IR組件完成所需的數(shù)據(jù)分析，數(shù)據(jù)會(huì)被統(tǒng)一搬移到歷史儲(chǔ)存中心(History Store)，方便將來(lái)如果有個(gè)別IR組件需要重新讀取數(shù)據(jù)內(nèi)容時(shí)，直接讀取位于歷史儲(chǔ)存中心的數(shù)據(jù)，即可取得完整的數(shù)據(jù)內(nèi)容。　　知識(shí)地圖和關(guān)鍵詞檢索　　Delphi Group曾經(jīng)做過(guò)的一份調(diào)查顯示，一般人最希望的知識(shí)管理工具，「搜索引擎」和「自動(dòng)分類」排名在前十名之中。因此，企業(yè)內(nèi)若要讓知識(shí)的利用率提高，提供完整的信息檢索工具是必然的工作，但必須了解　　導(dǎo)覽(Navigation) + 搜索(Search) = 完整的信息檢索方式　　因此，對(duì)于企業(yè)知識(shí)搜索引擎而言，單純的關(guān)鍵詞檢索僅能提供對(duì)已知關(guān)鍵詞匯下的查詢，而構(gòu)建企業(yè)知識(shí)地圖對(duì)于知識(shí)搜索則是十分必要的。　　IRMS R3中的自動(dòng)分類組件提供了以機(jī)器自動(dòng)學(xué)習(xí)技術(shù)為基礎(chǔ)的內(nèi)容/消息分類器(Content/Message classifier)，可將暨有的內(nèi)容或消息分類到預(yù)先定義的目錄樹(shù)中，或是更進(jìn)一步的透過(guò)訓(xùn)練機(jī)制來(lái)做分類工作。基于IRMS R3的自動(dòng)分類組件構(gòu)建企業(yè)知識(shí)地圖，使得使用者結(jié)合導(dǎo)覽+搜索的完整信息檢索方式，更快更準(zhǔn)確的在企業(yè)信息數(shù)據(jù)中發(fā)現(xiàn)所需知識(shí)，以便應(yīng)用，開(kāi)拓創(chuàng)造思維。　　同時(shí)，IRMS R3提供最新的導(dǎo)覽式動(dòng)態(tài)分類服務(wù)，它整合了全文檢索(Full-Text Search)以及自動(dòng)分類(Auto-Classification)的兩大信息檢索技術(shù)，提供使用者一個(gè)完整的信息檢索應(yīng)用情境。　　IRMS R3 導(dǎo)覽式動(dòng)態(tài)分類服務(wù)將分類與搜索接口進(jìn)行了完美的結(jié)合，使用者除了可以利用全文檢索取得符合查詢條件的結(jié)果集并且逐一瀏覽，還能夠進(jìn)一步實(shí)時(shí)的取得該查詢集合對(duì)應(yīng)于整個(gè)信息分類（知識(shí)地圖）的分布情況。使用者可以在最短時(shí)間內(nèi)了解整個(gè)查詢結(jié)果集合的特性及分布情況，同時(shí)也能有效率地從眾多數(shù)據(jù)集合中篩選出切合自己需要的目標(biāo)信息。　　　　Java/MS COM Model 　　　　●相關(guān)鏈接● 　　企業(yè)級(jí)搜索引擎的特點(diǎn) 　　企業(yè)網(wǎng)絡(luò)基礎(chǔ)設(shè)施的逐步完善，企業(yè)業(yè)務(wù)系統(tǒng)和應(yīng)用系統(tǒng)紛紛上馬，導(dǎo)致企業(yè)積累的信息資源迅速膨脹，甚至出現(xiàn)了諸如“拯救被信息淹沒(méi)的企業(yè)”這樣的呼吁。于是，企業(yè)級(jí)搜索引擎的發(fā)展日益引人注目。與互聯(lián)網(wǎng)搜索引擎相比較，企業(yè)級(jí)搜索引擎具有以下特點(diǎn)：　　GB級(jí)索引數(shù)據(jù)量　　面向企業(yè)本身的數(shù)據(jù)或與企業(yè)相關(guān)的數(shù)據(jù)，索引庫(kù)規(guī)模在GB級(jí)，數(shù)據(jù)量至多以千萬(wàn)條計(jì)。　　多源異構(gòu)數(shù)據(jù)類型　　多源異構(gòu)的復(fù)雜數(shù)據(jù)結(jié)構(gòu)，結(jié)構(gòu)化（關(guān)系型數(shù)據(jù)庫(kù)）、非結(jié)構(gòu)化（HTML、Office系列、文檔文件系統(tǒng)和郵件系統(tǒng)等）和半結(jié)構(gòu)化（XML等）數(shù)據(jù)資源；以文本、數(shù)值以及多媒體形式存在的數(shù)據(jù)資源，可能分布在不同介質(zhì)的載體和操作管理平臺(tái)上。　　數(shù)據(jù)實(shí)時(shí)更新　　企業(yè)內(nèi)部的搜索結(jié)果往往關(guān)系到企業(yè)的運(yùn)營(yíng)與決策，因此必須實(shí)時(shí)反應(yīng)企業(yè)信息更新，動(dòng)態(tài)更新索引，保證數(shù)據(jù)一致性。　　內(nèi)容相關(guān)性　　數(shù)據(jù)源中相互鏈接的程度不高，只能是基于內(nèi)容的相關(guān)性排序。　　嚴(yán)格的安全性　　做為企業(yè)級(jí)搜索引擎應(yīng)能夠繼承數(shù)據(jù)庫(kù)原有的安全機(jī)制，更要能讓用戶在其訪問(wèn)權(quán)限范圍內(nèi)返回相應(yīng)的查詢結(jié)果。　　全面搜索　　衡量搜索引擎性能的指標(biāo)之一是查全率（Recall），即檢索出的相關(guān)結(jié)果與網(wǎng)絡(luò)資源庫(kù)中所有相關(guān)結(jié)果的比率?；ヂ?lián)網(wǎng)搜索引擎無(wú)法做到全面搜索，因?yàn)槿魏我粋€(gè)搜索引擎服務(wù)商都無(wú)法窮盡互聯(lián)網(wǎng)上的每個(gè)網(wǎng)頁(yè)。而企業(yè)級(jí)搜索引擎在某些應(yīng)用中，是不允許有所遺漏的檢索。　　準(zhǔn)確搜索　　衡量搜索引擎性能的另一個(gè)指標(biāo)是查準(zhǔn)率（Precision），即檢索出的相關(guān)結(jié)果與檢索出的所有結(jié)果的比率?；ヂ?lián)網(wǎng)搜索引擎受到海量數(shù)據(jù)（TB級(jí)甚至更高）和龐大用戶數(shù)的限制，相對(duì)而言，企業(yè)級(jí)搜索引擎在提高信息檢索結(jié)果的精度上，可以走得更遠(yuǎn)。　　對(duì)一個(gè)檢索系統(tǒng)來(lái)講，查全率和查準(zhǔn)率不可能兩全其美，目前有的企業(yè)級(jí)搜索引擎通過(guò)提供更加復(fù)雜細(xì)致的檢索選項(xiàng)和檢索表達(dá)式，或者是提供一些可調(diào)節(jié)的系統(tǒng)參數(shù)，來(lái)部分滿足兩全其美的需求。　　個(gè)性化檢索　　基于智能代理技術(shù)（Intelligent Agents Technology）的信息過(guò)濾和個(gè)性化服務(wù)。

發(fā)布：2007-03-25 09:51 編輯：泛普軟件 · xiaona [打印此頁(yè)] [關(guān)閉]

相關(guān)欄目：

1重慶OA信息化

2成都OA信息化

3貴陽(yáng)OA信息化

4西安OA信息化

5武漢OA信息化

6北京OA信息化

7廣州OA信息化

8深圳OA信息化

9南京OA信息化

10沈陽(yáng)OA信息化

11長(zhǎng)春OA信息化

12福州OA信息化

相關(guān)文章：

1辦公室OA系統(tǒng)計(jì)劃管理技術(shù)特色

2如何選擇天津OA信息化戰(zhàn)略

3高建華：從韋爾奇到天津OA信息化

4世界天津OA信息化之父斯威比先生答記者問(wèn)

5成功實(shí)施天津OA信息化的“三維九端”標(biāo)準(zhǔn)

6天津OA信息化實(shí)施手記

7國(guó)內(nèi)外企業(yè)天津OA信息化研究綜述（二）

8讓知識(shí)真正變成利潤(rùn)！

9如何培養(yǎng)知識(shí)型企業(yè)員工的忠誠(chéng)度

10知識(shí)編碼的幾種形式

11企業(yè)天津OA信息化的激勵(lì)機(jī)制

12中小企業(yè)天津OA信息化的策略分析

13天津OA信息化基本理念

14管理「遺忘」，企業(yè)迷惘

15天津OA信息化的起點(diǎn)

16基于運(yùn)營(yíng)情景的“呼叫中心天津OA信息化”

17深藍(lán)助力建設(shè)知識(shí)型政府應(yīng)急呼叫中心

18“以人為本”的信息管理(下)

19泛普OA辦公系統(tǒng)之財(cái)務(wù)管理精髓

20協(xié)同OA軟件，一個(gè)致力于軟件開(kāi)發(fā)的品牌

21泛普OA軟件金融行業(yè)整體解決方案優(yōu)勢(shì)

22彼得.圣吉博士“對(duì)話中國(guó)”活動(dòng)通知

23螞蟻管理知識(shí)的啟示

24天津OA信息化實(shí)施的第三條道路

25現(xiàn)代辦公通過(guò)辦公自動(dòng)化系統(tǒng)(OA)所帶來(lái)的優(yōu)勢(shì)

26六大秘訣打造學(xué)習(xí)型組織

27構(gòu)建戰(zhàn)略性SOA平臺(tái)(下)(AMT研究院周瑛編譯)

28知識(shí)分享的重要性

29顯性天津OA信息化的核心問(wèn)題：競(jìng)爭(zhēng)情報(bào)收集

30獲獎(jiǎng)?wù)撐模ㄈ泉?jiǎng)）：學(xué)習(xí)型組織的企業(yè)文化培養(yǎng)

上一篇：天津OA信息化：企業(yè)效益提升篇

下一篇：天津OA信息化之認(rèn)知一致性框架（AMT研究院趙靜編譯）

天津OA系統(tǒng)

天津OA軟件

天津OA新聞動(dòng)態(tài)

天津OA信息化

天津OA快博

天津OA行業(yè)資訊

天津軟件開(kāi)發(fā)公司

天津門(mén)禁系統(tǒng)

天津物業(yè)管理軟件

天津倉(cāng)庫(kù)管理軟件

天津餐飲管理軟件

天津網(wǎng)站建設(shè)公司

聯(lián)系方式

成都公司：成都市成華區(qū)建設(shè)南路160號(hào)1層9號(hào)

重慶公司：重慶市江北區(qū)紅旗河溝華創(chuàng)商務(wù)大廈18樓

咨詢：400-8352-114

加微信，免費(fèi)獲取試用系統(tǒng)

QQ在線咨詢

電話咨詢：
4008352114

QQ在線咨詢

天津OA信息化――支撐企業(yè)核心競(jìng)爭(zhēng)力

泛普天津OA信息化其他應(yīng)用