監(jiān)理公司管理系統(tǒng) | 工程企業(yè)管理系統(tǒng) | OA系統(tǒng) | ERP系統(tǒng) | 造價(jià)咨詢管理系統(tǒng) | 工程設(shè)計(jì)管理系統(tǒng) | 甲方項(xiàng)目管理系統(tǒng) | 簽約案例 | 客戶案例 | 在線試用
X 關(guān)閉

非結(jié)構(gòu)化數(shù)據(jù)管理與知識提煉

申請免費(fèi)試用、咨詢電話:400-8352-114

   隨著互聯(lián)時(shí)代的到來,企業(yè)面對的信息呈現(xiàn)爆炸式增長,據(jù)Forrest Research的統(tǒng)計(jì)資料表明,其中20%左右的信息有效地存儲在了各種類型的結(jié)構(gòu)化數(shù)據(jù)庫中,但是還有80%非結(jié)構(gòu)化信息分散在組織的整個(gè)業(yè)務(wù)過程及外部環(huán)境中。如何有效管理大量的非結(jié)構(gòu)化數(shù)據(jù),同時(shí)在此基礎(chǔ)上抽取、提煉出對組織決策有輔助作用的知識,是現(xiàn)在所有學(xué)習(xí)型組織的基本要求。
  非結(jié)構(gòu)化數(shù)據(jù)管理目的是在組織現(xiàn)有的分散應(yīng)用環(huán)境下,把原來分散的部門和組織,通過系統(tǒng)的集成使其相互關(guān)聯(lián),形成廣泛的、相互關(guān)聯(lián)的組織應(yīng)用環(huán)境。它在組織系統(tǒng)的構(gòu)架層次上,為組織的信息流建立了一個(gè)跨越多種分散的、內(nèi)部和外部的信息處理過程的系統(tǒng)鏈,完全淡化了傳統(tǒng)的內(nèi)外部分界。

  如何實(shí)現(xiàn)有效非結(jié)構(gòu)化數(shù)據(jù)管理

  針對當(dāng)前組織的需求,非結(jié)構(gòu)化數(shù)據(jù)管理首先是要支持廣泛的數(shù)據(jù)源(結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)),包括erp系統(tǒng)、Lotus Notes、數(shù)據(jù)庫、文字處理和表格文件等。通過從后臺系統(tǒng)(如數(shù)據(jù)庫、ERP等)抽取業(yè)務(wù)信息、建立索引并映射到基于Internet和Intranet的內(nèi)容。
  其次,非結(jié)構(gòu)化數(shù)據(jù)管理必須有一個(gè)強(qiáng)大的、可擴(kuò)展的系統(tǒng)用于存儲和組織數(shù)據(jù)。由于后端結(jié)構(gòu)數(shù)據(jù)庫或者文件系統(tǒng)是動態(tài)的、異構(gòu)的,這意味著自動抽取數(shù)據(jù)源并遞交給桌面是一種非常復(fù)雜的連接,需要一種靈活的、可擴(kuò)展的信息抽取機(jī)制和個(gè)性化的界面定制工具。

  知識管理系統(tǒng)的架構(gòu)

  數(shù)據(jù)集成、應(yīng)用集成和知識集成是非結(jié)構(gòu)化數(shù)據(jù)管理從低到高的三個(gè)不同層面。知識集成實(shí)現(xiàn)將組織已建立的非結(jié)構(gòu)化數(shù)據(jù)庫,按照業(yè)界先進(jìn)的信息采集、信息分類算法,通過系統(tǒng)自身對信息的理解,將信息依照用戶的需求,充分有效地集成為整體。而后通過系統(tǒng)提供的前端工具,為用戶提供所需主題、類別的相關(guān)信息,建立每個(gè)系統(tǒng)用戶的個(gè)人檔案,實(shí)現(xiàn)信息個(gè)人化、信息提示、信息檢索等對信息利用的所有功能。

 



  實(shí)現(xiàn)上圖所示功能,系統(tǒng)也必須具有知識檢索引擎、知識聚類模塊和用戶管理模塊。

 



  知識檢索引擎實(shí)現(xiàn)概念分析、內(nèi)容提取、概念模式識別、相關(guān)度計(jì)算、全文檢索等關(guān)鍵工作。知識聚類模塊負(fù)責(zé)提供諸如自動分類、自動信息群識別等功能。用戶管理模塊提供用戶自動建檔、檔案搜尋、檔案分析、檔案實(shí)時(shí)自動更新等功能,實(shí)現(xiàn)用戶信息個(gè)人定制。

  知識提煉技術(shù)特點(diǎn)

  作為知識管理系統(tǒng)的關(guān)鍵是分類算法,以及基于算法之上的知識提供途徑和手段。隨著技術(shù)不斷的發(fā)展,分類算法現(xiàn)已比較成熟,實(shí)際應(yīng)用比較廣泛的有兩種分類算法:基于內(nèi)容分類和關(guān)鍵詞分類。關(guān)鍵詞的分類基本都是以空間向量模型為算法基礎(chǔ),國內(nèi)外都有很成熟的產(chǎn)品,如Verity、Excalibur和TRS等。而近年來,基于內(nèi)容的分類方法也得到了長足的進(jìn)步,出現(xiàn)了Autonomy為代表的商業(yè)化產(chǎn)品。內(nèi)容分類以貝葉斯概率理論和神經(jīng)元網(wǎng)絡(luò)為核心,可以識別與文字頻率相匹配的自然文本模式及與特定概念相關(guān)的術(shù)語。然后,識別出在一組非結(jié)構(gòu)化信息中出現(xiàn)頻率高的模式,相應(yīng)地確定某特定主題的概率百分比。然后對文檔中的主要概念進(jìn)行編碼,因此就可以自動根據(jù)文本進(jìn)行搜索、分發(fā)等活動。

  結(jié)論

  總之,組織所面臨的是怎樣將上述技術(shù)結(jié)合起來,從而有效地管理知識、提煉知識的問題,而這更主要地依賴于組織所要吸取的知識的類型。構(gòu)建一個(gè)知識管理系統(tǒng)的難度差別極大。通過組合運(yùn)用電子郵件、BBS和文檔管理技術(shù),你可以創(chuàng)建一個(gè)相當(dāng)基本的知識管理系統(tǒng)。更為復(fù)雜的設(shè)計(jì)方案將起始于一個(gè)網(wǎng)絡(luò)瀏覽器類型的用戶界面,該界面是基于網(wǎng)絡(luò)系統(tǒng)體系的;再下一層便是所謂的概念分類層,就是用于區(qū)分和確認(rèn)各種知識的條目分類的系統(tǒng)。
  同時(shí),知識提煉將重新塑造關(guān)于競爭和價(jià)值評估的基本信念。將現(xiàn)有的和新出現(xiàn)的技術(shù)進(jìn)行創(chuàng)造性組合,并能為企業(yè)創(chuàng)造效益的知識提煉應(yīng)具有以下特征:
  智能模式匹配:應(yīng)該能夠理解知識內(nèi)容的上下文情境。例如,它應(yīng)該能區(qū)分出醫(yī)療系統(tǒng)和金融證券的差別。 

 
  培訓(xùn)官:今天,你們應(yīng)該掌握火腿的烤制。我的計(jì)算機(jī)里面有非常詳細(xì)的錄像培訓(xùn)資料,內(nèi)容涵蓋從小豬繁育到人體對蛋白質(zhì)的吸收。如果需要加班,公司提供晚餐——你們自己做的火腿。
  完全個(gè)性化:應(yīng)當(dāng)能夠根據(jù)用戶的知識背景和經(jīng)驗(yàn)對知識進(jìn)行整理組織,按照用戶的習(xí)慣與思想目標(biāo)推送信息。
  靈活性:應(yīng)能處理任何形式的知識,包括不同主題、結(jié)構(gòu)和媒介,能將知識主題、內(nèi)容按照用戶的需求以自定義格式輸出到相應(yīng)媒介。
  后控系統(tǒng)智能:了解它的所有用戶和系統(tǒng)內(nèi)所貯存的知識,隨著時(shí)間的流逝,它為使用者提供知識的能力應(yīng)因此而不斷提高。
  主動性:應(yīng)能推斷出用戶的知識需求,并能超出用戶所表達(dá)的需求對關(guān)聯(lián)的知識作出提議。
  將來的知識管理技術(shù)應(yīng)當(dāng)建立在此基礎(chǔ)上,即有更便于瀏覽與體現(xiàn)知識的視覺工具;更強(qiáng)大方便的自動化“無聲”知識監(jiān)控手段,能完全實(shí)現(xiàn)信息源的隨時(shí)添加;添加信息庫群體評價(jià)的機(jī)制以及更高級的能從無法圖形化的音像等信息源挖掘知識的工具。盡管知識管理技術(shù)還有一段很長的路要走,但它所帶來的效益值得人們普遍關(guān)注。
發(fā)布:2007-03-25 09:53    編輯:泛普軟件 · xiaona    [打印此頁]    [關(guān)閉]
相關(guān)文章:
天津OA系統(tǒng)
聯(lián)系方式

成都公司:成都市成華區(qū)建設(shè)南路160號1層9號

重慶公司:重慶市江北區(qū)紅旗河溝華創(chuàng)商務(wù)大廈18樓

咨詢:400-8352-114

加微信,免費(fèi)獲取試用系統(tǒng)

QQ在線咨詢