監(jiān)理公司管理系統(tǒng) | 工程企業(yè)管理系統(tǒng) | OA系統(tǒng) | ERP系統(tǒng) | 造價(jià)咨詢管理系統(tǒng) | 工程設(shè)計(jì)管理系統(tǒng) | 甲方項(xiàng)目管理系統(tǒng) | 簽約案例 | 客戶案例 | 在線試用
X 關(guān)閉

數(shù)字圖書(shū)館與Internet的對(duì)比分析

申請(qǐng)免費(fèi)試用、咨詢電話:400-8352-114

數(shù)字化革命和Internet的發(fā)展帶來(lái)了經(jīng)濟(jì)、貿(mào)易、信息傳播的全球化??墒牵琁nternet在全 世界范圍內(nèi)迅猛發(fā)展,網(wǎng)上龐大的數(shù)字化信息和人們獲取信息之間的矛盾日益突出,據(jù)權(quán)威機(jī)構(gòu)統(tǒng)計(jì),網(wǎng)上約有數(shù)十億的網(wǎng)頁(yè),并且這一數(shù)字還在不斷增長(zhǎng),而如何 有效利用如此龐大的信息技術(shù)的水平卻遠(yuǎn)遠(yuǎn)落后于信息增長(zhǎng)的速度。而且,由于Internet上的信息資源很大程度上處于混亂無(wú)序狀態(tài),大大影響了信息利用 的效率,從而造成對(duì)網(wǎng)上巨大信息資源以及網(wǎng)絡(luò)互聯(lián)和帶寬的極大浪費(fèi)。         

 1 Internet在資源利用上存在的主要問(wèn)題          (1)查找困難。查找困難的根本原因在于信息倉(cāng)儲(chǔ)中的數(shù)字化信息缺乏良好的組織結(jié)構(gòu),這恰如一個(gè)沒(méi)有合理的分類(lèi)體系,不進(jìn)行嚴(yán)格編目控制,缺乏統(tǒng)一的主題 詞表的圖書(shū)館,館藏再豐富也無(wú)異于一座堆放資料的倉(cāng)庫(kù)。         

 (2)互操作問(wèn)題。Internet上的信息資源是由分布在各處的各種各樣的信息倉(cāng)儲(chǔ)構(gòu)成的,每個(gè)倉(cāng)儲(chǔ)都是一個(gè)相對(duì)獨(dú)立的信息空間,具有各自的信 息組織方式和處理方式,具有不同權(quán)限保護(hù)收費(fèi)政策。用戶的信息需求往往也需要查詢多個(gè)倉(cāng)儲(chǔ)才能滿足。在網(wǎng)絡(luò)環(huán)境下,用戶要了解每一個(gè)倉(cāng)儲(chǔ)的特性并掌握其檢 索技術(shù),這無(wú)疑是一項(xiàng)沉重的負(fù)擔(dān)。         

 (3)大規(guī)模分布數(shù)據(jù)的操作。目前,Internet已成為一個(gè)全球的信息網(wǎng)絡(luò)系統(tǒng),網(wǎng)上的信息量達(dá)到了空前的規(guī)模,而且還在不斷增長(zhǎng),它們廣泛 分布在網(wǎng)絡(luò)的各個(gè)角落,在處理和檢索這些網(wǎng)絡(luò)信息時(shí)必須充分考慮信息的分布性和超大規(guī)模,于是在分布式數(shù)據(jù)集合上采用不同的方法進(jìn)行檢索也成為Web信息 檢索的一個(gè)重要挑戰(zhàn)。在過(guò)去的信息檢索研究中,人們提出過(guò)多種不同的檢索方法,例如,使用不同的檢索模型、語(yǔ)言學(xué)資源、參數(shù)設(shè)置或不同的信息空間等方法得 到的檢索結(jié)果也各不相同。而且每種方法不一定對(duì)每個(gè)查詢都能起到最佳性能,有時(shí)得到的檢索結(jié)果往往還具有很大的互補(bǔ)性。尤其是在一個(gè)數(shù)據(jù)集合中對(duì)不同的數(shù) 據(jù)子集分別進(jìn)行檢索時(shí),這種互補(bǔ)現(xiàn)象尤其明顯。這時(shí)也需要通過(guò)對(duì)不同檢索數(shù)據(jù)集合的結(jié)果合并,得到在整個(gè)數(shù)據(jù)集上的結(jié)果,并提交給用戶。這是分布式信息檢 索的一個(gè)必要而重要的環(huán)節(jié)。最近,清華大學(xué)張敏等人提出了按位加權(quán)插入合并算法。雖然這種方法在一定程度上突破了傳統(tǒng)方法對(duì)分布數(shù)據(jù)集結(jié)果合并的綜合效果 總是低于使用集中數(shù)據(jù)集檢索的性能局限,但不能從根本上改變?cè)贗nternet中,由于海量數(shù)據(jù)的多樣性和分布性所帶來(lái)的大規(guī)模分布數(shù)據(jù)的操作所帶來(lái)的一 系列問(wèn)題。         

(4)搜索引擎的主要問(wèn)題。在信息多元化的發(fā)展趨勢(shì)下,信息收錄完備性、檢全率、檢準(zhǔn)率、檢索功能和用戶檢索界面等方面還存在許多不足。搜索引擎發(fā) 展的主要問(wèn)題是信息收錄的完備性不夠、檢全與檢準(zhǔn)都不理想,檢索功能單一。如何提高信息檢索的檢準(zhǔn)率及完善和用戶間的交互功能成為了搜索引擎的新問(wèn)題。         

  (5)Internet網(wǎng)絡(luò)擁堵。中國(guó)互聯(lián)網(wǎng)正在穩(wěn)步發(fā)展,網(wǎng)民成倍增長(zhǎng),用戶的上網(wǎng)時(shí)間也持續(xù)增加,于是用戶上網(wǎng)時(shí)常常會(huì)碰到網(wǎng)絡(luò)擁堵問(wèn)題,原因是:用 戶分散在各個(gè)地方,他們隨時(shí)會(huì)使用Internet,此時(shí)網(wǎng)絡(luò)組件很難控制和處理這些流量到達(dá)的分布和大小,從而導(dǎo)致網(wǎng)絡(luò)服務(wù)質(zhì)量的下降。          

2 數(shù)字圖書(shū)館技術(shù)的先進(jìn)性         

 數(shù)字圖書(shū)館與目前的互聯(lián)網(wǎng)相比,在提供信息資源技術(shù)上有很大的優(yōu)勢(shì),具體有以下幾方面:         

2.1 資源內(nèi)容的組織方式不同         

數(shù)字圖書(shū)館的資源內(nèi)容是按照用戶需求挑選出來(lái)的具有高度價(jià)值的知識(shí)信息,它經(jīng)過(guò)分類(lèi)、編輯、整理、加工等方法,以受教育者易于接受的形式提供給用 戶,是一種有很大增值價(jià)值的、有序的知識(shí)庫(kù)。而Internet上的資源內(nèi)容是無(wú)序的,上網(wǎng)信息的內(nèi)容魚(yú)龍混雜,良莠不齊。        

  數(shù)字圖書(shū)館將資源分為元數(shù)據(jù)庫(kù)和對(duì)象數(shù)據(jù)庫(kù)。元數(shù)據(jù)是描述和管理對(duì)象數(shù)據(jù)的數(shù)據(jù),對(duì)象數(shù)據(jù)是指數(shù)字化的文本、圖片、聲音、影像等數(shù)據(jù)。元數(shù)據(jù)要集中在數(shù)字 圖書(shū)館中心的超大規(guī)模的服務(wù)器上,對(duì)象數(shù)據(jù)庫(kù)則分布式存放在各地的資源點(diǎn)內(nèi)。當(dāng)用戶查詢時(shí),中心高度系統(tǒng)通過(guò)元數(shù)據(jù)調(diào)度各個(gè)對(duì)象數(shù)據(jù)庫(kù)中的數(shù)據(jù)供用戶使 用。         

2.2 資源內(nèi)容標(biāo)引方法不同         

目前,Internet上提供的信息資源有的也經(jīng)過(guò)一定的標(biāo)引,但標(biāo)引深度以文獻(xiàn)條目為主,大多數(shù)全文文獻(xiàn)則是不經(jīng)標(biāo)引上網(wǎng)。在有用戶請(qǐng)求時(shí)由 Internet搜索引擎按每種文獻(xiàn)的前50~200進(jìn)行關(guān)鍵詞抽取,并與查詢請(qǐng)求匹配得出結(jié)果,其查全率、查準(zhǔn)率都有問(wèn)題。數(shù)字圖書(shū)館的資源標(biāo)引則深入 到文獻(xiàn)內(nèi)容,對(duì)每一數(shù)據(jù)對(duì)象使用標(biāo)準(zhǔn)通用置標(biāo)語(yǔ)言/可擴(kuò)展置標(biāo)語(yǔ)言(SGML/XML)進(jìn)行置標(biāo),并抽取元數(shù)據(jù)組織元數(shù)據(jù)庫(kù)。SGML/XML是信息處理 的國(guó)際標(biāo)準(zhǔn),是用來(lái)定義具有特殊目的的標(biāo)記語(yǔ)言,它在文件的保護(hù)、交換、共用、整合、安全、擴(kuò)展、長(zhǎng)級(jí)等方面的應(yīng)用都是其標(biāo)準(zhǔn)化所無(wú)法比擬的。          

2.3 檢索效果不同         

數(shù)字圖書(shū)館由于進(jìn)行了上述工作,使各資源庫(kù)之間實(shí)現(xiàn)跨庫(kù)無(wú)縫鏈接成為可能,只要采用合適的查詢引擎及中間件,用戶就能夠通過(guò)瀏覽器方便、迅速地找到 所需要的內(nèi)容。目前,數(shù)字圖書(shū)館大都采用分布式檢索,在此系統(tǒng)中,圖書(shū)館服務(wù)器和各個(gè)對(duì)象服務(wù)器是分布式分布的,且各個(gè)服務(wù)器上的數(shù)據(jù)庫(kù)要求可以是異構(gòu)

的,數(shù)據(jù)對(duì)象被封裝分布在各個(gè)服務(wù)器中,然后依據(jù)需求采用中間件來(lái)提供服務(wù)。而Internet上的信息網(wǎng)則不同,它沒(méi)有經(jīng)過(guò)加工、標(biāo)引,各種資源 雜亂無(wú)章,用戶在檢索信息時(shí)需要對(duì)一個(gè)個(gè)網(wǎng)站進(jìn)行訪問(wèn)。在使用檢索引擎檢索信息時(shí),如同大海撈針一樣,既慢又不全。         

3 數(shù)字圖書(shū)館的發(fā)展前景         

數(shù)字的信息化已經(jīng)成為歷史發(fā)展的必然趨勢(shì),而數(shù)字圖書(shū)館是未來(lái)圖書(shū)館發(fā)展的大趨勢(shì),從信息方面來(lái)講,必然有數(shù)字存儲(chǔ)海量化和信息的標(biāo)準(zhǔn)化兩個(gè)方面。 Internet的無(wú)國(guó)界特性使得數(shù)字圖書(shū)館的合作空間無(wú)限擴(kuò)大,全球性合作成為可能,并且逐步實(shí)現(xiàn)人才、技術(shù)、設(shè)施、資源等多方面的合作,在關(guān)鍵技術(shù)上 互通有無(wú),最終實(shí)現(xiàn)全球數(shù)字一體化。

發(fā)布:2007-03-30 15:51    編輯:泛普軟件 · xiaona    [打印此頁(yè)]    [關(guān)閉]
相關(guān)文章: