監(jiān)理公司管理系統(tǒng) | 工程企業(yè)管理系統(tǒng) | OA系統(tǒng) | ERP系統(tǒng) | 造價(jià)咨詢管理系統(tǒng) | 工程設(shè)計(jì)管理系統(tǒng) | 甲方項(xiàng)目管理系統(tǒng) | 簽約案例 | 客戶案例 | 在線試用
X 關(guān)閉

知識(shí)資源計(jì)劃(二)——企業(yè)天津OA信息化新平臺(tái)(AMT研究院 袁磊 編譯)

申請(qǐng)免費(fèi)試用、咨詢電話:400-8352-114

AMTeam.org

知識(shí)資源計(jì)劃是一種管理方法,同時(shí)也是一種可運(yùn)行的信息系統(tǒng)。在知識(shí)資源計(jì)劃中主要涉及知識(shí)表示、知識(shí)存儲(chǔ)、知識(shí)發(fā)現(xiàn)和知識(shí)使用支撐組件等關(guān)鍵技術(shù),以下對(duì)這四方面的關(guān)鍵技術(shù)進(jìn)行簡要分析。

1、 知識(shí)表示技術(shù)

人類對(duì)知識(shí)的認(rèn)識(shí)和獲取經(jīng)歷了一個(gè)漫長的過程。知識(shí)最原始的記載形式是信號(hào),從信號(hào)到數(shù)據(jù)再到信息直到知識(shí)。在信息科學(xué)中,數(shù)據(jù)定義為事物、概念或指令的一種形式化的表示形式,以適合于用人工或自然的方法進(jìn)行通信、解釋或處理。信息是數(shù)據(jù)表達(dá)的客觀事實(shí)。在上世紀(jì)四十年代,香農(nóng)(Shannon)研究了信息的數(shù)學(xué)本質(zhì),用熵的概念來研究信息的容量,以比特為信息的度量單位,開辟了信息研究的新篇章。知識(shí)則是經(jīng)過加工和改造過的信息。所以說,知識(shí)與信號(hào)、數(shù)據(jù)、信息之間密不可分,它們是四個(gè)不同層次的概念,其中信號(hào)是最底層,然后是數(shù)據(jù)、信息,知識(shí)位于最上層。它們四者的區(qū)別如表1所示:

表1 信號(hào)、數(shù)據(jù)、信息和知識(shí)的區(qū)別

名稱

特征

示例

信號(hào)

物理特征表示

紅燈、綠燈……

數(shù)據(jù)

未經(jīng)處理的原始材料

張三、男、26歲……

信息

有意義的數(shù)據(jù)

SOS……

知識(shí)

具有一定目的的信息,并能導(dǎo)致一定的行動(dòng)

緊急警報(bào)à開始營救行動(dòng)

知識(shí)可以認(rèn)為是在實(shí)踐中應(yīng)用并證實(shí)一個(gè)有組織的概念或框架時(shí)產(chǎn)生的結(jié)果,由一個(gè)包含語義信息的特征集以及與之相關(guān)的約束和規(guī)則集組成。知識(shí)表示則是描述這些結(jié)果所作的一組約定并易于被計(jì)算機(jī)接受和處理的一種表現(xiàn)形式。而知識(shí)表示方式常常取決于人類知識(shí)的結(jié)構(gòu)及其機(jī)制。從工程的角度,知識(shí)被理解為有助于解決問題的可復(fù)用的模式化的信息,一般的表示形式為:概念、規(guī)則、規(guī)律、模式、約束和可視化。這些知識(shí)可以直接提供給決策者,用于輔助決策過程,或者提供給領(lǐng)域?qū)<?,修正己有的知識(shí)體系,也可以作為新的知識(shí)存儲(chǔ)到應(yīng)用系統(tǒng)的知識(shí)存儲(chǔ)機(jī)構(gòu)中,例如專家系統(tǒng)、規(guī)則庫等。

知識(shí)表示領(lǐng)域的核心是解決如何進(jìn)行信息的編碼并以推理計(jì)算模型加以利用。傳統(tǒng)的知識(shí)表達(dá)模式有謂詞邏輯方法、框架表示方法、產(chǎn)生式規(guī)則、狀態(tài)空間搜索方式、語義網(wǎng)絡(luò)、腳本方法、過程式方法、直接表示法、面向?qū)ο蟮闹R(shí)表示方法等。近幾年,由于將本體引入知識(shí)工程領(lǐng)域,知識(shí)表示領(lǐng)域又出現(xiàn)了一些新的方法。近年,有專家認(rèn)為知識(shí)表示由三個(gè)主要部分組成:邏輯、本體和計(jì)算。邏輯提供了通過邏輯運(yùn)算從現(xiàn)有知識(shí)演繹出新的邏輯描述的功能;計(jì)算則是指確定一個(gè)描述是否能夠從給定描述演繹得出的過程。Ontology本體是自然事物及其關(guān)系的研究,在知識(shí)表示中又被稱為形式化本體和計(jì)算本體,是某個(gè)領(lǐng)域事物的符號(hào)描述,方便知識(shí)共享和重用的實(shí)現(xiàn)。

2、 知識(shí)存儲(chǔ)——知識(shí)庫系統(tǒng)技術(shù)

知識(shí)庫系統(tǒng)是近十幾年發(fā)展起來的一個(gè)綜合性方向,它是目前知識(shí)存儲(chǔ)領(lǐng)域主要的技術(shù)。由于知識(shí)庫系統(tǒng)技術(shù)集成了知識(shí)表示、知識(shí)獲取及問題求解等人工智能領(lǐng)域的最新成果,它又和數(shù)據(jù)庫緊密地結(jié)合在一起。因此,知識(shí)庫系統(tǒng)廣泛應(yīng)用于設(shè)計(jì)、決策、診斷、控制、教學(xué)等領(lǐng)域,并成為人們研究的熱點(diǎn)。

對(duì)于知識(shí)庫系統(tǒng)的定義,目前還沒有統(tǒng)一的形式化描述。一般地,知識(shí)庫系統(tǒng)是一個(gè)完整的系統(tǒng),它是以知識(shí)庫為核心的,包含人、硬件和軟件的各種資源,用于實(shí)現(xiàn)知識(shí)共享的系統(tǒng)。知識(shí)庫是經(jīng)過合理組織的關(guān)于某一特定領(lǐng)域的陳述型知識(shí)和過程型知識(shí)的集合,知識(shí)通過一定的表示,存儲(chǔ)在知識(shí)庫中。知識(shí)庫與傳統(tǒng)的數(shù)據(jù)庫不同,知識(shí)庫不但包含大量的簡單事實(shí),還包括了用于推理及問題求解的條件和規(guī)則。

知識(shí)庫系統(tǒng)實(shí)現(xiàn)需要解決知識(shí)表示、知識(shí)使用和知識(shí)獲取及發(fā)現(xiàn)三個(gè)關(guān)鍵技術(shù)問題,即知識(shí)采用什么形式表示,使計(jì)算機(jī)能對(duì)之進(jìn)行處理,并以一種人類能理解的方式將處理結(jié)果告知人們。知識(shí)利用則是指利用知識(shí)庫中的知識(shí)進(jìn)行推理,從而得出結(jié)論的過程。知識(shí)獲取及發(fā)現(xiàn)是指從知識(shí)源獲得知識(shí)來建造知識(shí)庫,并可以從已有的知識(shí)庫中發(fā)現(xiàn)新的知識(shí)。

圖1 知識(shí)庫系統(tǒng)運(yùn)作流程

3、 知識(shí)發(fā)現(xiàn)技術(shù)

知識(shí)發(fā)現(xiàn)的研究始于從數(shù)據(jù)庫中發(fā)現(xiàn)有用模式這一概念,并先后具有不同的術(shù)語,如數(shù)據(jù)開采、知識(shí)提取、信息發(fā)現(xiàn)、數(shù)據(jù)模式處理以及數(shù)據(jù)庫中的知識(shí)發(fā)現(xiàn)。簡言之,知識(shí)發(fā)現(xiàn)就是在信息環(huán)境下,從大量現(xiàn)有的或歷史的數(shù)據(jù)集合中提取可信的、新穎的、有效的并能被人理解的模式的處理過程。它的應(yīng)用對(duì)象是大型數(shù)據(jù)庫、文檔庫或知識(shí)庫,目標(biāo)是發(fā)現(xiàn)數(shù)據(jù)庫中規(guī)律性的知識(shí)。

一般來說,知識(shí)發(fā)現(xiàn)分為六個(gè)步驟:數(shù)據(jù)清理、集成、選擇、挖掘、模式評(píng)價(jià)和知識(shí)展現(xiàn)。數(shù)據(jù)清理可以消除噪聲和不一致的數(shù)據(jù),使數(shù)據(jù)信息均一化;數(shù)據(jù)集成是將各種數(shù)據(jù)組合在一起;數(shù)據(jù)選擇是從知識(shí)庫中檢索與分析任務(wù)相關(guān)的數(shù)據(jù);數(shù)據(jù)變化將數(shù)據(jù)統(tǒng)一變換成適合于挖掘的形式;數(shù)據(jù)挖掘是知識(shí)發(fā)現(xiàn)的核心部分,使用智能方法提取數(shù)據(jù)模式;模式評(píng)價(jià)是根據(jù)某種興趣度度量,識(shí)別表示知識(shí)真正有趣的模式;知識(shí)展現(xiàn)是使用可視化的方法將挖掘得來的模式展現(xiàn)給用戶。

表2 知識(shí)發(fā)現(xiàn)的分類

任務(wù)

對(duì)象

方法

1、  分類或預(yù)測(cè)模型發(fā)現(xiàn);

2、  數(shù)據(jù)總結(jié)、聚類、關(guān)聯(lián)規(guī)則發(fā)現(xiàn);

3、  序列模式發(fā)現(xiàn);

4、  依賴關(guān)系和依賴模型發(fā)現(xiàn);

5、  異常和趨勢(shì)發(fā)現(xiàn);

1、  關(guān)系型數(shù)據(jù)庫;

2、  面向?qū)ο髷?shù)據(jù)庫;

3、  空間數(shù)據(jù)庫;

4、  時(shí)態(tài)數(shù)據(jù)庫;

5、  文本數(shù)據(jù)庫;

6、  多媒體數(shù)據(jù)庫;

7、  Web/Internet

1、   機(jī)器學(xué)習(xí)方法(決策樹、規(guī)則歸納學(xué)習(xí)、基于事例學(xué)習(xí)、遺傳酸法等);

2、   統(tǒng)計(jì)方法(多元回歸、自回歸、貝耶寺判別、費(fèi)歇爾判別、非參數(shù)判別等);

3、   神經(jīng)網(wǎng)絡(luò)方法、數(shù)據(jù)庫方法;

4、   可視化

4、知識(shí)使用支撐組件技術(shù)

海量數(shù)據(jù)、信息爆炸和異構(gòu)的分布性知識(shí),極大的阻礙了人們對(duì)知識(shí)的利用,對(duì)知識(shí)的創(chuàng)新也無法通過知識(shí)資源計(jì)劃的組織來實(shí)現(xiàn)。既然知識(shí)資源計(jì)劃是一個(gè)可執(zhí)行可操作的系統(tǒng),所以,要將相應(yīng)的方法以及具體的需求加以實(shí)現(xiàn)必須由支撐組件技術(shù)提供支持。如前文所述,知識(shí)資源的使用分為兩大部分:知識(shí)集成與知識(shí)共享。知識(shí)集成和知識(shí)共享之間存在互相依賴的關(guān)系,集成的目的為了共享,共享又能促進(jìn)知識(shí)的更全面的集成。

知識(shí)集成旨在通過共享標(biāo)準(zhǔn)的綜合數(shù)字信息來實(shí)現(xiàn)資源的高效組織,將分散的知識(shí)元素依據(jù)一定的邏輯規(guī)則有機(jī)結(jié)合在一起,使知識(shí)有序化、層次化,從而高效的利用信息資源,實(shí)現(xiàn)知識(shí)共享,有利于知識(shí)創(chuàng)新。知識(shí)共享是建立在知識(shí)集成的基礎(chǔ)之上的,通過集成,實(shí)現(xiàn)異構(gòu)系統(tǒng)之間的信息標(biāo)準(zhǔn)的統(tǒng)一,加強(qiáng)系統(tǒng)的問題求解能力,實(shí)現(xiàn)知識(shí)處理系統(tǒng)間的互操作性。

目前,對(duì)知識(shí)集成的研究主要分為四大方向:結(jié)構(gòu)化集成、基于特征的集成、模型驅(qū)動(dòng)集成、面向?qū)ο蟮募?。其中所使用的支撐技術(shù)還是以基于不同開發(fā)平臺(tái)的網(wǎng)絡(luò)組件技術(shù)為主,如基于J2EE平臺(tái)的EJB技術(shù),基于Microsoft的COM技術(shù),以及基于.NET平臺(tái)的Web Service技術(shù)等,這些技術(shù)都存在一個(gè)共同的問題:盡管它們都號(hào)稱能夠?qū)崿F(xiàn)跨平臺(tái)使用,但是異構(gòu)平臺(tái)的集成性能不是很好,例如, 使用Java開發(fā)的EJB組件很難在Microsoft的平臺(tái)上使用。

 

發(fā)布:2007-03-25 09:52    編輯:泛普軟件 · xiaona    [打印此頁]    [關(guān)閉]
相關(guān)文章:
天津OA系統(tǒng)
聯(lián)系方式

成都公司:成都市成華區(qū)建設(shè)南路160號(hào)1層9號(hào)

重慶公司:重慶市江北區(qū)紅旗河溝華創(chuàng)商務(wù)大廈18樓

咨詢:400-8352-114

加微信,免費(fèi)獲取試用系統(tǒng)

QQ在線咨詢