當(dāng)前位置:工程項(xiàng)目OA系統(tǒng) > 泛普各地 > 黑龍江OA系統(tǒng) > 哈爾濱OA系統(tǒng) > 哈爾濱OA快博
XML與面向Web的數(shù)據(jù)挖掘技術(shù)
申請(qǐng)免費(fèi)試用、咨詢電話:400-8352-114
文章來(lái)源:泛普軟件面向Web的數(shù)據(jù)挖掘
Web上有海量的數(shù)據(jù)信息,怎樣對(duì)這些數(shù)據(jù)進(jìn)行復(fù)雜的應(yīng)用成了現(xiàn)今數(shù)據(jù)庫(kù)技術(shù)的研究熱點(diǎn)。數(shù)據(jù)挖掘就是從大量的數(shù)據(jù)中發(fā)現(xiàn)隱含的規(guī)律性的內(nèi)容,解決數(shù)據(jù)的應(yīng)用質(zhì)量問(wèn)題。充分利用有用的數(shù)據(jù),廢棄虛偽無(wú)用的數(shù)據(jù),是數(shù)據(jù)挖掘技術(shù)的最重要的應(yīng)用。相對(duì)于Web的數(shù)據(jù)而言,傳統(tǒng)的數(shù)據(jù)庫(kù)中的數(shù)據(jù)結(jié)構(gòu)性很強(qiáng),即其中的數(shù)據(jù)為完全結(jié)構(gòu)化的數(shù)據(jù),而Web上的數(shù)據(jù)最大特點(diǎn)就是半結(jié)構(gòu)化。所謂半結(jié)構(gòu)化是相對(duì)于完全結(jié)構(gòu)化的傳統(tǒng)數(shù)據(jù)庫(kù)的數(shù)據(jù)而言。顯然,面向Web的數(shù)據(jù)挖掘比面向單個(gè)數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)挖掘要復(fù)雜得多。
1.異構(gòu)數(shù)據(jù)庫(kù)環(huán)境
數(shù)據(jù)庫(kù)研究的角度出發(fā),Web網(wǎng)站上的信息也可以看作一個(gè)數(shù)據(jù)庫(kù),一個(gè)更大、更復(fù)雜的數(shù)據(jù)庫(kù)。Web上的每一個(gè)站點(diǎn)就是一個(gè)數(shù)據(jù)源,每個(gè)數(shù)據(jù)源都是異構(gòu)的,因而每一站點(diǎn)之間的信息和組織都不一樣,這就構(gòu)成了一個(gè)巨大的異構(gòu)數(shù)據(jù)庫(kù)環(huán)境。如果想要利用這些數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘,首先,必須要研究站點(diǎn)之間異構(gòu)數(shù)據(jù)的集成問(wèn)題,只有將這些站點(diǎn)的數(shù)據(jù)都集成起來(lái),提供給用戶一個(gè)統(tǒng)一的視圖,才有可能從巨大的數(shù)據(jù)資源中獲取所需的東西。其次,還要解決Web上的數(shù)據(jù)查詢問(wèn)題,因?yàn)槿绻璧臄?shù)據(jù)不能很有效地得到,對(duì)這些數(shù)據(jù)進(jìn)行分析、集成、處理就無(wú)從談起。
2.半結(jié)構(gòu)化的數(shù)據(jù)結(jié)構(gòu)
Web上的數(shù)據(jù)與傳統(tǒng)的數(shù)據(jù)庫(kù)中的數(shù)據(jù)不同,傳統(tǒng)的數(shù)據(jù)庫(kù)都有一定的數(shù)據(jù)模型,可以根據(jù)模型來(lái)具體描述特定的數(shù)據(jù)。而Web上的數(shù)據(jù)非常復(fù)雜,沒(méi)有特定的模型描述,每一站點(diǎn)的數(shù)據(jù)都各自獨(dú)立設(shè)計(jì),并且數(shù)據(jù)本身具有自述性和動(dòng)態(tài)可變性。因而,Web上的數(shù)據(jù)具有一定的結(jié)構(gòu)性,但因自述層次的存在,從而是一種非完全結(jié)構(gòu)化的數(shù)據(jù),這也被稱之為半結(jié)構(gòu)化數(shù)據(jù)。半結(jié)構(gòu)化是Web上數(shù)據(jù)的最大特點(diǎn)。
3.解決半結(jié)構(gòu)化的數(shù)據(jù)源問(wèn)題
Web數(shù)據(jù)挖掘技術(shù)首要解決半結(jié)構(gòu)化數(shù)據(jù)源模型和半結(jié)構(gòu)化數(shù)據(jù)模型的查詢與集成問(wèn)題。解決Web上的異構(gòu)數(shù)據(jù)的集成與查詢問(wèn)題,就必須要有一個(gè)模型來(lái)清晰地描述Web上的數(shù)據(jù)。針對(duì)Web上的數(shù)據(jù)半結(jié)構(gòu)化的特點(diǎn),尋找一個(gè)半結(jié)構(gòu)化的數(shù)據(jù)模型是解決問(wèn)題的關(guān)鍵所在。除了要定義一個(gè)半結(jié)構(gòu)化數(shù)據(jù)模型外,還需要一種半結(jié)構(gòu)化模型抽取技術(shù),即自動(dòng)地從現(xiàn)有數(shù)據(jù)中抽取半結(jié)構(gòu)化模型的技術(shù)。面向Web的數(shù)據(jù)挖掘必須以半結(jié)構(gòu)化模型和半結(jié)構(gòu)化數(shù)據(jù)模型抽取技術(shù)為前提。
XML與Web數(shù)據(jù)挖掘技術(shù)
XML為基礎(chǔ)的新一代WWW環(huán)境是直接面對(duì)Web數(shù)據(jù)的,不僅可以很好地兼容原有的Web應(yīng)用,而且可以更好地實(shí)現(xiàn)Web中的信息共享與交換。XML可看作一種半結(jié)構(gòu)化的數(shù)據(jù)模型,可以很容易地將XML的文檔描述與關(guān)系數(shù)據(jù)庫(kù)中的屬性一對(duì)應(yīng)起來(lái),實(shí)施精確地查詢與模型抽取。
1.XML的產(chǎn)生與發(fā)展
XML(eXtensibleMarkupLanguage)是由萬(wàn)維網(wǎng)協(xié)會(huì)(W3C)設(shè)計(jì),特別為Web應(yīng)用服務(wù)的SGML(StandardGeneralMarkupLanguage)的一個(gè)重要分支??偟膩?lái)說(shuō),XML是一種中介標(biāo)示語(yǔ)言(Meta-markupLanguage),可提供描述結(jié)構(gòu)化資料的格式,詳細(xì)來(lái)說(shuō),XML是一種類似于HTML,被設(shè)計(jì)用來(lái)描述數(shù)據(jù)的語(yǔ)言。XML提供了一種獨(dú)立的運(yùn)行程序的方法來(lái)共享數(shù)據(jù),它是用來(lái)自動(dòng)描述信息的一種新的標(biāo)準(zhǔn)語(yǔ)言,它能使計(jì)算機(jī)通信把Internet的功能由信息傳遞擴(kuò)大到人類其他多種多樣的活動(dòng)中去。XML由若干規(guī)則組成,這些規(guī)則可用于創(chuàng)建標(biāo)記語(yǔ)言,并能用一種被稱作分析程序的簡(jiǎn)明程序處理所有新創(chuàng)建的標(biāo)記語(yǔ)言,正如HTML為第一個(gè)計(jì)算機(jī)用戶閱讀Internet文檔提供一種顯示方式一樣,XML也創(chuàng)建了一種任何人都能讀出和寫(xiě)入的世界語(yǔ)。XML解決了HTML不能解決的兩個(gè)Web問(wèn)題,即Internet發(fā)展速度快而接入速度慢的問(wèn)題,以及可利用的信息多,但難以找到自己需要的那部分信息的問(wèn)題。XML能增加結(jié)構(gòu)和語(yǔ)義信息,可使計(jì)算機(jī)和服務(wù)器即時(shí)處理多種形式的信息。因此,運(yùn)用XML的擴(kuò)展功能不僅能從Web服務(wù)器下載大量的信息,還能大大減少網(wǎng)絡(luò)業(yè)務(wù)量。
XML中的標(biāo)志(TAG)是沒(méi)有預(yù)先定義的,使用者必須要自定義需要的標(biāo)志,XML是能夠進(jìn)行自解釋(SelfDescribing)的語(yǔ)言。XML使用DTD(DocumentTypeDefinition文檔類型定義)來(lái)顯示這些數(shù)據(jù),XSL(eXtensibleStyleSheetLanguage)是一種來(lái)描述這些文檔如何顯示的機(jī)制,它是XML的樣式表描述語(yǔ)言。XSL的歷史比HTML用的CSS(層疊式樣式表CascadingStyleSheets)還要悠久,XSL包括兩部分:一個(gè)用來(lái)轉(zhuǎn)換XML文檔的方法;一個(gè)用來(lái)格式化XML文檔的方法。XLL(eXtensibleLinkLanguage)是XML連接語(yǔ)言,它提供XML中的連接,與HTML中的類似,但功能更強(qiáng)大。使用XLL,可以多方向連接,且連接可以存在于對(duì)象層級(jí),而不僅僅是頁(yè)面層級(jí)。由于XML能夠標(biāo)記更多的信息,所以它就能使用戶很輕松地找到他們需要的信息。利用XML,Web設(shè)計(jì)人員不僅能創(chuàng)建文字和圖形,而且還能構(gòu)建文檔類型定義的多層次、相互依存的系統(tǒng)、數(shù)據(jù)樹(shù)、元數(shù)據(jù)、超鏈接結(jié)構(gòu)和樣式表。
2.XML的主要特點(diǎn)
正是XML的特點(diǎn)決定了其卓越的性能表現(xiàn)。XML作為一種標(biāo)記語(yǔ)言,有許多特點(diǎn):
(1)簡(jiǎn)單。XML經(jīng)過(guò)精心設(shè)計(jì),整個(gè)規(guī)范簡(jiǎn)單明了,它由若干規(guī)則組成,這些規(guī)則可用于創(chuàng)建標(biāo)記語(yǔ)言,并能用一種常常稱作分析程序的簡(jiǎn)明程序處理所有新創(chuàng)建的標(biāo)記語(yǔ)言。XML能創(chuàng)建一種任何人都能讀出和寫(xiě)入的世界語(yǔ),這種創(chuàng)建世界語(yǔ)的功能叫做統(tǒng)一性功能。如XML創(chuàng)建的標(biāo)記總是成對(duì)出現(xiàn),以及依靠稱作統(tǒng)一代碼的新的編碼標(biāo)準(zhǔn)。
(2)開(kāi)放。XML是SGML在市場(chǎng)上有許多成熟的軟件可用來(lái)幫助編寫(xiě)、管理等,開(kāi)放式標(biāo)準(zhǔn)XML的基礎(chǔ)是經(jīng)過(guò)驗(yàn)證的標(biāo)準(zhǔn)技術(shù),并針對(duì)網(wǎng)絡(luò)做最佳化。眾多業(yè)界頂尖公司,與W3C的工作群組并肩合作,協(xié)助確保交互作業(yè)性,支持各式系統(tǒng)和瀏覽器上的開(kāi)發(fā)人員、作者和使用者,以及改進(jìn)XML標(biāo)準(zhǔn)。XML解釋器可以使用編程的方法來(lái)載入一個(gè)XML的文檔,當(dāng)這個(gè)文檔被載入以后,用戶就可以通過(guò)XML文件對(duì)象模型來(lái)獲取和操縱整個(gè)文檔的信息,加快了網(wǎng)絡(luò)運(yùn)行速度。
(3)高效且可擴(kuò)充。支持復(fù)用文檔片斷,使用者可以發(fā)明和使用自己的標(biāo)簽,也可與他人共享,可延伸性大,在XML中,可以定義無(wú)限量的一組標(biāo)注。XML提供了一個(gè)標(biāo)示結(jié)構(gòu)化資料的架構(gòu)。一個(gè)XML組件可以宣告與其相關(guān)的資料為零售價(jià)、營(yíng)業(yè)稅、書(shū)名、數(shù)量或其它任何數(shù)據(jù)元素。隨著世界范圍內(nèi)的許多機(jī)構(gòu)逐漸采用XML標(biāo)準(zhǔn),將會(huì)有更多的相關(guān)功能出現(xiàn):一旦鎖定資料,便可以使用任何方式透過(guò)電纜線傳遞,并在瀏覽器中呈現(xiàn),或者轉(zhuǎn)交到其他應(yīng)用程序做進(jìn)一步的處理。XML提供了一個(gè)獨(dú)立的運(yùn)用程序的方法來(lái)共享數(shù)據(jù),使用DTD,不同的組中的人就能夠使用共同的DTD來(lái)交換數(shù)據(jù)。你的應(yīng)用程序可以使用這個(gè)標(biāo)準(zhǔn)的DTD來(lái)驗(yàn)證你接受到的數(shù)據(jù)是否有效,你也可以使用一個(gè)DTD來(lái)驗(yàn)證你自己的數(shù)據(jù)。
(4)國(guó)際化。標(biāo)準(zhǔn)國(guó)際化,且支持世界上大多數(shù)文字。這源于依靠它的統(tǒng)一代碼的新的編碼標(biāo)準(zhǔn),這種編碼標(biāo)準(zhǔn)支持世界上所有以主要語(yǔ)言編寫(xiě)的混合文本。在HTML中,就大多數(shù)字處理而言,一個(gè)文檔一般是用一種特殊語(yǔ)言寫(xiě)成的,不管是英語(yǔ),還是日語(yǔ)或阿拉伯語(yǔ),如果用戶的軟件不能閱讀特殊語(yǔ)言的字符,那么他就不能使用該文檔。但是能閱讀XML語(yǔ)言的軟件就能順利處理這些不同語(yǔ)言字符的任意組合。因此,XML不僅能在不同的計(jì)算機(jī)系統(tǒng)之間交換信息,而且能跨國(guó)界和超越不同文化疆界交換信息。
3.XML在Web數(shù)據(jù)挖掘中的應(yīng)用
XML已經(jīng)成為正式的規(guī)范,開(kāi)發(fā)人員能夠用XML的格式標(biāo)記和交換數(shù)據(jù)。XML在三層架構(gòu)上為數(shù)據(jù)處理提供了很好的方法。使用可升級(jí)的三層模型,XML可以從存在的數(shù)據(jù)中產(chǎn)生出來(lái),使用XML結(jié)構(gòu)化的數(shù)據(jù)可以從商業(yè)規(guī)范和表現(xiàn)形式中分離出來(lái)。數(shù)據(jù)的集成、發(fā)送、處理和顯示是下面過(guò)程中的每一個(gè)步驟:
促進(jìn)XML應(yīng)用的是那些用標(biāo)準(zhǔn)的HTML無(wú)法完成的Web應(yīng)用。這些應(yīng)用從大的方面講可以被分成以下四類:需要Web客戶端在兩個(gè)或更多異質(zhì)數(shù)據(jù)庫(kù)之間進(jìn)行通信的應(yīng)用;試圖將大部分處理負(fù)載從Web服務(wù)器轉(zhuǎn)到Web客戶端的應(yīng)用;需要Web客戶端將同樣的數(shù)據(jù)以不同的瀏覽形式提供給不同的用戶的應(yīng)用;需要智能Web代理根據(jù)個(gè)人用戶的需要裁減信息內(nèi)容的應(yīng)用。顯而易見(jiàn),這些應(yīng)用和Web的數(shù)據(jù)挖掘技術(shù)有著重要的聯(lián)系,基于Web的數(shù)據(jù)挖掘必須依靠它們來(lái)實(shí)現(xiàn)。
XML給基于Web的應(yīng)用軟件賦予了強(qiáng)大的功能和靈活性,因此它給開(kāi)發(fā)者和用戶帶來(lái)了許多好處。比如進(jìn)行更有意義的搜索,并且Web數(shù)據(jù)可被XML唯一地標(biāo)識(shí)。沒(méi)有XML,搜索軟件必須了解每個(gè)數(shù)據(jù)庫(kù)是如何構(gòu)建的,但這實(shí)際上是不可能的,因?yàn)槊總€(gè)數(shù)據(jù)庫(kù)描述數(shù)據(jù)的格式幾乎都是不同的。由于不同來(lái)源數(shù)據(jù)的集成問(wèn)題的存在,現(xiàn)在搜索多樣的不兼容的數(shù)據(jù)庫(kù)實(shí)際上是不可能的。XML能夠使不同來(lái)源的結(jié)構(gòu)化的數(shù)據(jù)很容易地結(jié)合在一起。軟件代理商可以在中間層的服務(wù)器上對(duì)從后端數(shù)據(jù)庫(kù)和其它應(yīng)用處來(lái)的數(shù)據(jù)進(jìn)行集成。然后,數(shù)據(jù)就能被發(fā)送到客戶或其他服務(wù)器做進(jìn)一步的集合、處理和分發(fā)。XML的擴(kuò)展性和靈活性允許它描述不同種類應(yīng)用軟件中的數(shù)據(jù),從描述搜集的Web頁(yè)到數(shù)據(jù)記錄,從而通過(guò)多種應(yīng)用得到數(shù)據(jù)。同時(shí),由于基于XML的數(shù)據(jù)是自我描述的,數(shù)據(jù)不需要有內(nèi)部描述就能被交換和處理。利用XML,用戶可以方便地進(jìn)行本地計(jì)算和處理,XML格式的數(shù)據(jù)發(fā)送給客戶后,客戶可以用應(yīng)用軟件解析數(shù)據(jù)并對(duì)數(shù)據(jù)進(jìn)行編輯和處理。使用者可以用不同的方法處理數(shù)據(jù),而不僅僅是顯示它。XML文檔對(duì)象模式(DOM)允許用腳本或其他編程語(yǔ)言處理數(shù)據(jù),數(shù)據(jù)計(jì)算不需要回到服務(wù)器就能進(jìn)行。XML可以被利用來(lái)分離使用者觀看數(shù)據(jù)的界面,使用簡(jiǎn)單靈活開(kāi)放的格式,可以給Web創(chuàng)建功能強(qiáng)大的應(yīng)用軟件,而原來(lái)這些軟件只能建立在高端數(shù)據(jù)庫(kù)上。另外,數(shù)據(jù)發(fā)到桌面后,能夠用多種方式顯示。
XML還可以通過(guò)以簡(jiǎn)單開(kāi)放擴(kuò)展的方式描述結(jié)構(gòu)化的數(shù)據(jù),XML補(bǔ)充了HTML,被廣泛地用來(lái)描述使用者界面。HTML描述數(shù)據(jù)的外觀,而XML描述數(shù)據(jù)本身。由于數(shù)據(jù)顯示與內(nèi)容分開(kāi),XML定義的數(shù)據(jù)允許指定不同的顯示方式,使數(shù)據(jù)更合理地表現(xiàn)出來(lái)。本地的數(shù)據(jù)能夠以客戶配置、使用者選擇或其他標(biāo)準(zhǔn)決定的方式動(dòng)態(tài)地表現(xiàn)出來(lái)。CSS和XSL為數(shù)據(jù)的顯示提供了公布的機(jī)制。通過(guò)XML,數(shù)據(jù)可以粒狀地更新。每當(dāng)一部分?jǐn)?shù)據(jù)變化后,不需要重發(fā)整個(gè)結(jié)構(gòu)化的數(shù)據(jù)。變化的元素必須從服務(wù)器發(fā)送給客戶,變化的數(shù)據(jù)不需要刷新整個(gè)使用者的界面就能夠顯示出來(lái)。但在目前,只要一條數(shù)據(jù)變化了,整一頁(yè)都必須重建。這嚴(yán)重限制了服務(wù)器的升級(jí)性能。XML也允許加進(jìn)其他數(shù)據(jù),比如預(yù)測(cè)的溫度。加入的信息能夠進(jìn)入存在的頁(yè)面,不需要瀏覽器重新發(fā)一個(gè)新的頁(yè)面。XML應(yīng)用于客戶需要與不同的數(shù)據(jù)源進(jìn)行交互時(shí),數(shù)據(jù)可能來(lái)自不同的數(shù)據(jù)庫(kù),它們都有各自不同的復(fù)雜格式。但客戶與這些數(shù)據(jù)庫(kù)間只通過(guò)一種標(biāo)準(zhǔn)語(yǔ)言進(jìn)行交互,那就是XML。由于XML的自定義性及可擴(kuò)展性,它足以表達(dá)各種類型的數(shù)據(jù)。客戶收到數(shù)據(jù)后可以進(jìn)行處理,也可以在不同數(shù)據(jù)庫(kù)間進(jìn)行傳遞??傊?,在這類應(yīng)用中,XML解決了數(shù)據(jù)的統(tǒng)一接口問(wèn)題。但是,與其他的數(shù)據(jù)傳遞標(biāo)準(zhǔn)不同的是,XML并沒(méi)有定義數(shù)據(jù)文件中數(shù)據(jù)出現(xiàn)的具體規(guī)范,而是在數(shù)據(jù)中附加TAG來(lái)表達(dá)數(shù)據(jù)的邏輯結(jié)構(gòu)和含義。這使XML成為一種程序能自動(dòng)理解的規(guī)范。
XML應(yīng)用于將大量運(yùn)算負(fù)荷分布在客戶端,即客戶可根據(jù)自己的需求選擇和制作不同的應(yīng)用程序以處理數(shù)據(jù),而服務(wù)器只須發(fā)出同一個(gè)XML文件。如按傳統(tǒng)的“Client/Server”工作方式,客戶向服務(wù)器發(fā)出不同的請(qǐng)求,服務(wù)器分別予以響應(yīng),這不僅加重服務(wù)器本身的負(fù)荷,而且網(wǎng)絡(luò)管理者還須事先調(diào)查各種不同的用戶需求以做出相應(yīng)不同的程序,但假如用戶的需求繁雜而多變,則仍然將所有業(yè)務(wù)邏輯集中在服務(wù)器端是不合適的,因?yàn)榉?wù)器端的編程人員可能來(lái)不及滿足眾多的應(yīng)用需求,也來(lái)不及跟上需求的變化,雙方都很被動(dòng)。應(yīng)用XML則將處理數(shù)據(jù)的主動(dòng)權(quán)交給了客戶,服務(wù)器所作的只是盡可能完善、準(zhǔn)確地將數(shù)據(jù)封裝進(jìn)XML文件中,正是各取所需、各司其職。XML的自解釋性使客戶端在收到數(shù)據(jù)的同時(shí)也理解數(shù)據(jù)的邏輯結(jié)構(gòu)與含義,從而使廣泛、通用的分布式計(jì)算成為可能。
XML還被應(yīng)用于網(wǎng)絡(luò)代理,以便對(duì)所取得的信息進(jìn)行編輯、增減以適應(yīng)個(gè)人用戶的需要。有些客戶取得數(shù)據(jù)并不是為了直接使用而是為了根據(jù)需要組織自己的數(shù)據(jù)庫(kù)。比方說(shuō),教育部門要建立一個(gè)龐大的題庫(kù),考試時(shí)將題庫(kù)中的題目取出若干組成試卷,再將試卷封裝進(jìn)XML文件,接下來(lái)在各個(gè)學(xué)校讓其通過(guò)一個(gè)過(guò)濾器,濾掉所有的答案,再發(fā)送到各個(gè)考生面前,未經(jīng)過(guò)濾的內(nèi)容則可直接送到老師手中,當(dāng)然考試過(guò)后還可以再傳送一份答案匯編。此外,XML文件中還可以包含進(jìn)諸如難度系數(shù)、往年錯(cuò)誤率等其他相關(guān)信息,這樣只需幾個(gè)小程序,同一個(gè)XML文件便可變成多個(gè)文件傳送到不同的用戶手中。
結(jié)束語(yǔ)
面向Web的數(shù)據(jù)挖掘是一項(xiàng)復(fù)雜的技術(shù),由于Web數(shù)據(jù)挖掘比單個(gè)數(shù)據(jù)倉(cāng)庫(kù)的挖掘要復(fù)雜的多,因而面向Web的數(shù)據(jù)挖掘成了一個(gè)難以解決的問(wèn)題。而XML的出現(xiàn)為解決Web數(shù)據(jù)挖掘的難題帶來(lái)了機(jī)會(huì)。由于XML能夠使不同來(lái)源的結(jié)構(gòu)化的數(shù)據(jù)很容易地結(jié)合在一起,因而使搜索多樣的不兼容的數(shù)據(jù)庫(kù)能夠成為可能,從而為解決Web數(shù)據(jù)挖掘難題帶來(lái)了希望。XML的擴(kuò)展性和靈活性允許XML描述不同種類應(yīng)用軟件中的數(shù)據(jù),從而能描述搜集的Web頁(yè)中的數(shù)據(jù)記錄。同時(shí),由于基于XML的數(shù)據(jù)是自我描述的,數(shù)據(jù)不需要有內(nèi)部描述就能被交換和處理。作為表示結(jié)構(gòu)化數(shù)據(jù)的一個(gè)工業(yè)標(biāo)準(zhǔn),XML為組織、軟件開(kāi)發(fā)者、Web站點(diǎn)和終端使用者提供了許多有利條件。相信在以后,隨著XML作為在Web上交換數(shù)據(jù)的一種標(biāo)準(zhǔn)方式的出現(xiàn),面向Web的數(shù)據(jù)挖掘?qū)?huì)變得非常輕松。
來(lái)源:編輯之家
- 12005年Linux發(fā)展趨勢(shì)
- 2中小企業(yè)UPS方案按需選
- 3銀行中間業(yè)務(wù)平臺(tái)分析及實(shí)現(xiàn)
- 4企業(yè)實(shí)行電子商務(wù)外包優(yōu)劣分析
- 5數(shù)字紙張技術(shù)及其應(yīng)用前景
- 6利用數(shù)據(jù)可視化工具降低導(dǎo)航風(fēng)險(xiǎn)
- 7實(shí)現(xiàn)安全Samba的六種簡(jiǎn)單途徑
- 8誰(shuí)為SOA理念埋單?
- 9日企的本地化的信息系統(tǒng)建設(shè)
- 10大型企業(yè)可以從小型企業(yè)學(xué)到什么?
- 11SAN孤島互聯(lián)四項(xiàng)缺陷需避免
- 12小型和中型IT公司管理案例分析
- 13IT揭開(kāi)管理傷疤:波司登集團(tuán)ERP實(shí)施經(jīng)驗(yàn)
- 14“維客”世界中的隱性“把關(guān)人”
- 15構(gòu)成哈爾濱OA軟件的技術(shù)是什么?
- 16“無(wú)線”模式也可繞道快行
- 17中小企業(yè)VoIP部署指南
- 18加密技術(shù)的方方面面
- 19移動(dòng)互聯(lián)網(wǎng)產(chǎn)業(yè)推動(dòng)商業(yè)企業(yè)OA軟件大發(fā)展
- 20PDM開(kāi)發(fā)與應(yīng)用層次分析
- 21入侵檢測(cè):2004年出現(xiàn)的4種新后門技術(shù)
- 22萬(wàn)邦藥業(yè)IT舊債是否真的難還
- 23企業(yè)信息門戶商業(yè)功能和服務(wù)的雙軌
- 24IT項(xiàng)目需要足夠重視操作階段
- 25協(xié)同OA更好的為公司業(yè)務(wù)發(fā)展提供支撐和服務(wù)
- 26管理信息系統(tǒng)應(yīng)對(duì)企業(yè)進(jìn)行戰(zhàn)略管理
- 27如何做需求開(kāi)發(fā)?
- 28企業(yè)級(jí)應(yīng)用軟件發(fā)展攻略
- 29怎樣衡量一個(gè)OA系統(tǒng)是否成功呢?
- 30下一代網(wǎng)絡(luò)分組話音接入的實(shí)現(xiàn)
成都公司:成都市成華區(qū)建設(shè)南路160號(hào)1層9號(hào)
重慶公司:重慶市江北區(qū)紅旗河溝華創(chuàng)商務(wù)大廈18樓