當前位置:工程項目OA系統(tǒng) > 泛普各地 > 湖北O(jiān)A系統(tǒng) > 武漢OA系統(tǒng) > 武漢OA信息化
武漢OA信息化的基本XML和RDF技術(六):使用Versa的RDF查詢
知識管理的基本XML和RDF技術(六):使用Versa的RDF查詢
Uche Ogbuji(uche.ogbuji@fourthought.com)
首席顧問,F(xiàn)ourthought, Inc.
2002 年 4 月
Uche Ogbuji 繼續(xù)討論一種 RDF 查詢語言,該語言比他迄今為止所討論的基本 API
要更為復雜得多。它是下幾篇問題跟蹤器專欄文章中要建立的中間件的基礎。
到現(xiàn)在為止,在對人們可能怎樣使用和查詢問題跟蹤器 RDF
元數(shù)據(jù)的簡短討論中,我們使用了簡單而基本的查詢
API?,F(xiàn)在我們轉(zhuǎn)向一種更為強大的查詢語言。這將有助于編寫更清晰的中間件代碼,也將提供合并巨型模型(比如好幾篇專欄文章以前所演示的 WordNet
模型)所需的性能。
Versa:RDF 查詢語言
Versa 是一種開放 RDF
查詢語言,它基于開發(fā)人員對能夠在其它應用程序中使用的 RDF 工具這種典型的需要。它是一種不僅僅具有 RDF 世界觀的產(chǎn)品。Versa 著重于 RDF
模型的節(jié)點和圓弧而不是將其看作三元部分的集合。它提供核心數(shù)據(jù)模型以及一組非常豐富的用于靈活查詢的函數(shù)和原語。因為 Versa 大量使用函數(shù),它有時給人一種類
LISP 的感覺。Versa 也提供如完全的布爾邏輯和集合運算、傳遞運算、聚合、子串匹配以及其它核心數(shù)據(jù)類型操作之類的功能,許多其它 RDF
查詢系統(tǒng)都不具有這些功能。我是最初的 Versa 規(guī)范的作者之一。
Versa 的核心是匹配模型圖中模式的遍歷表達式。下面是遍歷表達式的一個示例。
all() - rdf:type -> *
all() 函數(shù)返回模型中所有資源的集合。根據(jù) RDF 模型的約定畫法,這意味著它返回所有的橢圓和圓?。ǖ环祷鼐匦危?。- 和 -> 記號形成遍歷運算符,它表示您希望沿著來自每個資源的特定圓弧遍歷。在這個例子中,該圓弧是 rdf:type。* 表示您想要該遍歷的所有端點。實際上,該遍歷表達式返回具有 rdf:type 謂詞的所有語句的對象。
作為一個示例,讓我們來看前一篇專欄文章中的樣本 RDF 問題跟蹤器實例,下面的清單 1 重復了該實例。
清單 1:
http://www.w3.org/1999/02/22-rdf-syntax-ns#">
http://www.w3.org/2000/01/rdf-schema#">
http://www.daml.org/2001/03/daml+oil#">
http://purl.org/dc/elements/1.1/">
http://xmlns.com/foaf/0.1/">
DESIGNTIMESP="19516">DESIGNTIMESP="4657">DESIGNTIMESP="18513">http://rdfinference.org/schemata/issue-tracker/">
DESIGNTIMESP="19516">DESIGNTIMESP="4657">DESIGNTIMESP="18513">http://rdfinference.org/schemata/issue-tracker/">
DESIGNTIMESP="4657">DESIGNTIMESP="18513">http://rdfinference.org/schemata/issue-tracker/">
DESIGNTIMESP="19516">DESIGNTIMESP="4657">DESIGNTIMESP="18513">http://rdfinference.org/schemata/issue-tracker/">
DESIGNTIMESP="4657">DESIGNTIMESP="18513">http://rdfinference.org/schemata/issue-tracker/">
DESIGNTIMESP="18513">http://rdfinference.org/schemata/issue-tracker/">
DESIGNTIMESP="19516">DESIGNTIMESP="4657">DESIGNTIMESP="18513">http://rdfinference.org/schemata/issue-tracker/">
DESIGNTIMESP="4657">DESIGNTIMESP="18513">http://rdfinference.org/schemata/issue-tracker/">
DESIGNTIMESP="18513">http://rdfinference.org/schemata/issue-tracker/">
DESIGNTIMESP="4657">DESIGNTIMESP="18513">http://rdfinference.org/schemata/issue-tracker/">
DESIGNTIMESP="19516">DESIGNTIMESP="4657">DESIGNTIMESP="18513">http://rdfinference.org/schemata/issue-tracker/">
DESIGNTIMESP="4657">DESIGNTIMESP="18513">http://rdfinference.org/schemata/issue-tracker/">
DESIGNTIMESP="18513">http://rdfinference.org/schemata/issue-tracker/">
DESIGNTIMESP="4657">DESIGNTIMESP="18513">http://rdfinference.org/schemata/issue-tracker/">
DESIGNTIMESP="18513">http://rdfinference.org/schemata/issue-tracker/">
DESIGNTIMESP="19516">DESIGNTIMESP="4657">DESIGNTIMESP="18513">http://rdfinference.org/schemata/issue-tracker/">
DESIGNTIMESP="4657">DESIGNTIMESP="18513">http://rdfinference.org/schemata/issue-tracker/">
DESIGNTIMESP="18513">http://rdfinference.org/schemata/issue-tracker/">
DESIGNTIMESP="4657">DESIGNTIMESP="18513">http://rdfinference.org/schemata/issue-tracker/">
DESIGNTIMESP="18513">http://rdfinference.org/schemata/issue-tracker/">
http://rdfinference.org/ril/issue-tracker/">
]>
xmlns:rdfs="&rdfs;"
xmlns:daml="&daml;"
xmlns:rit="&rit;"
xmlns:it="⁢"
xmlns:dc="&dc;"
xmlns:foaf="&foaf;"
xmlns="⁢"
>
如果我們對該模型運行這一查詢,我們將得到一列資源(因為 rdf:type 語句的對象是資源)。如果我們正在使用一個可以有文字和資源對象的謂詞,結果將是一列文字和資源。要使用 4Suite 測試它(有關 4Suite 的詳細信息,請參閱以前的專欄文章),可以將清單 1 復制到文件 issues.rdf,然后在命令行中執(zhí)行用紅色突出顯示的命令:
$4versa --rdf-file=issues.rdf "all() - rdf:type -> *"
:::
Using cDomlette
Executing Query:
all() - rdf:type -> *
With
nsMapping of:
vtrav --> http://rdfinference.org/versa/0/2/traverse/
xml --> http://www.w3.org/XML/1998/namespace
vsort
--> http://rdfinference.org/versa/0/2/sort/
rdfs
--> http://www.w3.org/2000/01/rdf-schema#
rit
--> http://rdfinference.org/schemata/issue-tracker/
it --> http://rdfinference.org/schemata/issue-tracker/
rdf --> http://www.w3.org/1999/02/22-rdf-syntax-ns#
foaf --> http://xmlns.com/foaf/0.1/
versa -->
http://rdfinference.org/versa/0/2/
None -->
http://rdfinference.org/schemata/issue-tracker/
daml --> http://www.daml.org/2001/03/daml+oil#
以簡單 XML 形式表示的產(chǎn)生的資源列表是用粗體顯示的。該命令的其它輸出只是為您提供一些信息。它回顯正在被執(zhí)行的 Versa 查詢,并顯示引擎知道的名稱空間聲明。為了方便用戶,4versa 自動抓取源文件根元素內(nèi)的所有名稱空間聲明。
細述遍歷
通常,遍歷表達式的格式如下:
list-expression - list-expression -> boolean-expression
列表表達式是返回一列資源或可以被轉(zhuǎn)換成一列資源的結果的任何表達式。因此,任何返回單個資源(rdf:type)的表達式都會被轉(zhuǎn)換成具有單個輸入項的列表類型。您已經(jīng)看到過縮寫成如 rdf:type 的形式和稱為限定名稱(或 QNames)形式的 RDF URI。通過將第一部分擴展成 URI 庫(例如 rdf 變成 http://www.w3.org/1999/02/22-rdf-syntax-ns#)然后同第二部分連接,將它們轉(zhuǎn)換成完整的 URI。這樣,rdf:type 就變成了 http://www.w3.org/1999/02/22-rdf-syntax-ns#type。Versa 也允許您以完整、冗長和詳細地方式拼寫出 URI,這意味著您可以直接編寫 @"http://www.w3.org/1999/02/22-rdf-syntax-ns#type"。例如:
all() - @"http://www.w3.org/1999/02/22-rdf-syntax-ns#type" -> *
遍歷表達式的第三部分是布爾表達式。我已經(jīng)向您演示了如何使用 * 選擇所有對象。您也可以對結果做更多的選擇。例如,要獲取模型中資源的所有日期特性,您可以使用:
all() - dc:date -> *
它產(chǎn)生:
要選擇特定日期,您可以編寫:
all() - dc:date -> eq("2001-04-20")
eq 函數(shù)將參數(shù)同上下文比較,如果它們相同,就返回 true。Versa 中上下文的思想類似于 XPath 中上下文的思想,但是更簡單。在 Versa 中,上下文是一個在對表達式求值時考慮的單一值??梢允褂命c符號直接訪問上下文。也可以使用 eq 函數(shù)比較兩個顯式參數(shù),因此上面的內(nèi)容可以按如下編寫:
all() - dc:date -> eq(., "2001-04-20")
在遍歷表達式的第三部分中,上下文是第一和第二部分的部分結果之一。例如,在上面,將每個對象都同“2001-04-20”比較,最后的結果是比較值為 true 的對象列表,在這個示例中:
這一看起來明顯的查詢在確定某個特定值是否是模型時十分有用。例如,如果您在上面的示例中用“2001-03-15”替換“2002-04-20”,那么結果將是一個空列表。當然您可以使用遍歷表達式做更多的事情。例如,要檢索三月份所有日期的資源,您可以編寫:
all() - dc:date -> contains("-03-")
它產(chǎn)生:
向后遍歷
獲得具有特定日期的資源可能更有用。要做到這一點,您需要向后操作,從
dc:date 圓弧所對應的日期到主題資源。Versa 以向后遍歷的形式提供這一操作。例如:
"2001-03-04" <- dc:date - *
返回所有日期為“2001-03-04”的資源:
向后遍歷的形式是:
list-expression <- list-expression - boolean-expression
其工作方式與向前遍歷十分類似。這兩種遍歷都可以鏈接,這樣就可以獲取日期為“2001-03-04”的所有資源的標題:
("2001-03-04" <- dc:date - *) - dc:title -> *
它產(chǎn)生:
分配財富
到目前為止,所有查詢都返回單一值。通常,您可能希望一次返回多個值。Versa
使用列表操作實現(xiàn)這一點,列表操作運行在遍歷表達式的結果之上。處理列表的一個常用函數(shù)是
distribute,它對列表中的每項使用一個或多個表達式。結果是列表的一個列表。可以使用如 list(rit:i2001030423,
rit:i2001042003) 這樣的表達式在 Versa
中直接表達列表,該表達式是兩個資源的列表。下面的表達式獲得這些問題中每個問題的標題和日期:
distribute(list(rit:i2001030423,rit:i2001042003),".-dc:title->*",".-dc:date->*")
它產(chǎn)生列表的列表:
distribute 函數(shù)的第一個參數(shù)是一個列表。依次獲取列表中的每一項。第二個和后續(xù)的參數(shù)為字符串,它們被當作子查詢。使用上下文的當前列表項對它們進行動態(tài)求值(如同前面所討論的一樣,通過使用點來引用)。
可以對遍歷表達式的結果(它們是列表)使用該技術。再舉最后一個例子,我將解釋如何使用 Versa 中的一個特殊快捷函數(shù)。type 函數(shù)檢索給定 RDF 類型(就象用 rdf:type 謂詞表達那樣)的所有資源。要獲取所有已經(jīng)提交問題的人的標識和姓名,可以編寫:
distribute(type(it:Issue)-dc:creator->*,".",".-foaf:name->*")
請注意,您可以在子表達式中直接使用上下文,而無須使之成為另一個表達式的一部分。結果是:
這里有一個棘手的細節(jié)。.-foaf:name->* 子表達式產(chǎn)生的字符串在列表中,但由 . 子表達式產(chǎn)生的資源卻不在其中。這是因為遍歷操作符總返回列表,即使結果中只有一個或沒有項時也是如此。由于我們知道在我們的模型中,我們僅僅期望每個人的資源只有一個單一名稱,所以我們無論如何總是忽略列表的最低一級。Versa 提供數(shù)據(jù)轉(zhuǎn)換函數(shù),其中之一是 string 函數(shù),它將其參數(shù)轉(zhuǎn)換成字符串。通過獲取列表的第一(或唯一的)項的字符串值來轉(zhuǎn)換列表。因此,
distribute(type(it:Issue)-dc:creator->*,".","string(.-foaf:name->*)")
消除了遍歷子表達式周圍的無關列表并產(chǎn)生以下結果:
結束語
在本文中,我解釋了
Versa 的基礎知識。如果您掌握了它,那么您立即可以使用它來高效地工作。Versa
有多得多的功能,但是它們大部分是以專門的函數(shù)的形式出現(xiàn),通過使用它們,您將迅速獲得經(jīng)驗。參考資料一節(jié)列舉了更多關于 Versa
的參考資料。在下一篇專欄文章里,我將解釋如何使 Versa 滿足到目前為止在本系列中討論的所有查詢需要。
參考資料
有關 Versa 的更詳盡的教程,請參閱 Versa by example 文檔。
在 Versa 0.2 規(guī)范草案找到所有關于 Versa 的詳細信息。
Dave Beckett 的詳盡的 RDF 參考資料指南包含到其它 RDF 查詢語言的鏈接。
IBM 提供專業(yè)服務以幫助組織實現(xiàn)門戶網(wǎng)站、知識和內(nèi)容管理解決方案。
IBM 的知識管理雜志包括該領域內(nèi)的許多技術主題。
Uche Ogbuji 是 Fourthought Inc. 的顧問兼共同創(chuàng)始人,該公司是專為企業(yè)知識管理提供 XML 解決方案的軟件供應商和顧問。Fourthought 開發(fā)了 4Suite,它是 XML、RDF 和知識管理應用程序的開放源碼平臺。Ogbuji 先生是一位出生于尼日利亞的計算機工程師和作家,他現(xiàn)在在美國科羅拉多州博耳德(Boulder)生活和工作??梢酝ㄟ^ uche.ogbuji@fourthought.com 與 Ogbuji 先生聯(lián)系。
瀏覽:知識管理的基本XML和RDF技術(一)
知識管理的基本XML和RDF技術(二)
知識管理的基本XML和RDF技術(三)
知識管理的基本XML和RDF技術(四)
知識管理的基本XML和RDF 技術(五)
- 1武漢OA信息化與業(yè)務流程重組
- 2如何規(guī)劃實時內(nèi)容管理
- 3武漢OA信息化(美國)雜志網(wǎng)站
- 4內(nèi)容管理將成為下一輪銀行業(yè)管理競爭焦點
- 5以武漢OA信息化提升品質(zhì)
- 6信息與圖像管理協(xié)會(AIIM)——企業(yè)內(nèi)容管理(ECM)站點
- 7商業(yè)新世界中的“武漢OA信息化”
- 8內(nèi)容管理系列(三):是文檔管理還是內(nèi)容管理?(AMT研究院 倪娜)
- 9企業(yè)武漢OA信息化
- 10武漢新港建設投資開發(fā)集團有限公司OA辦公系統(tǒng)
- 11武漢OA信息化資料
- 12武漢OA信息化的十項原則(達文波特 T·H·Davenport/顧信文譯)
- 13團隊營銷三劍客,是一個實戰(zhàn)型專業(yè)的營銷平臺
- 14[推薦] 如何選擇武漢OA信息化戰(zhàn)略?(Morten T. Hansen,Nitin Nohria和Thomas Tie
- 15認識武漢OA信息化系統(tǒng)模型,把握武漢OA信息化系統(tǒng)實質(zhì)(BY AMT 夏敬華)
- 16下一個信息化關鍵是內(nèi)容管理?
- 17OA辦公軟件的“設計器”與”報表管理“說明
- 18OA辦公系統(tǒng)產(chǎn)品功能需要全面化
- 19內(nèi)容管理技術在廣電行業(yè)的應用(上)
- 20Gartner:企業(yè)內(nèi)容管理的成功模式(AMT 編譯整理)
- 21KPMG的2000年武漢OA信息化研究報告(英文)
- 22協(xié)同OA軟件采用領先的B/S(瀏覽器/服務器)操作方式
- 23CrownPeak公司為美國憲法網(wǎng)站提供內(nèi)容管理系統(tǒng)
- 24武漢OA信息化的成功典范
- 25收購Aptrix有助于IBM的WEB內(nèi)容管理
- 26業(yè)內(nèi)人士如何在網(wǎng)上快速地查到資料?(by AMT 武漢OA信息化研究小組)
- 27武漢CRM廠商的一致要求,使用泛普軟件PaaS平臺
- 28武漢OA信息化導入實例—以經(jīng)濟部技術處ITIS為例
- 29ERP的新內(nèi)容-武漢OA信息化(by AMT 陳兵兵)
- 30企業(yè)OA系統(tǒng)實現(xiàn)業(yè)務目標的關鍵成功因素-店量
成都公司:成都市成華區(qū)建設南路160號1層9號
重慶公司:重慶市江北區(qū)紅旗河溝華創(chuàng)商務大廈18樓