當前位置:工程項目OA系統(tǒng) > 學校OA管理系統(tǒng) > 相關系統(tǒng) > 圖書館管理系統(tǒng)
圖書館與網(wǎng)絡信息資源編目
【內(nèi)容提要】著重論述了圖書館對網(wǎng)絡信息資源編目的必要性、可行性,以及編目工具——元數(shù)據(jù)DC、MARC和可擴展標識語言XML,介紹了目前國際圖書館界在這方面取得的進展。
【摘 要 題】圖書情報工作論壇
1.對網(wǎng)絡信息資源編目的必要性
圖書館對網(wǎng)絡信息資源進行編目的意義在于:一是把網(wǎng)絡信息資源及其服務有機地納入到圖書館服務中來,這意味著圖書館利用網(wǎng)絡信息資源補充已有館藏和提高圖書館滿足讀者信息需求的能力;二是運用和移植圖書館學、情報學在組織文獻信息和書目控制文獻的研究成果和實踐經(jīng)驗,提高網(wǎng)絡信息資源的有序化程度。
1.1隨著數(shù)字化革命的深入和Internet的飛速發(fā)展,網(wǎng)絡信息資源呈現(xiàn)出幾何級數(shù)量增長,據(jù)國外最新研究結果表明,因特網(wǎng)上可編索引的網(wǎng)頁已超過10億頁,僅此一項,其增長規(guī)模已超越了現(xiàn)有的非網(wǎng)絡資源,信息資源從內(nèi)容到形式都發(fā)生了質(zhì)的變化。網(wǎng)絡信息資源同非網(wǎng)絡資源相比,具有地理上分散、組織上無序、數(shù)據(jù)類型多、變幻多端的特點。
無序擴張的網(wǎng)絡信息資源,一方面使網(wǎng)上信息包羅萬象,良莠不齊,信息分布、信息組合錯綜復雜,信息污染嚴重;另一方面,廣大用戶,即信息的需求者,面對如此浩瀚的信息海洋,無法快捷地獲取自己所需的信息,對檢索和獲取信息的低效感到無奈。解決二者之間的矛盾,為用戶提供便利的信息獲取途徑和方法,就圖書館而言,最為有效的方法即是將網(wǎng)絡信息資源納入圖書館的服務當中,對其進行編目管理。
1.2網(wǎng)絡中存在著巨大數(shù)字化信息,用戶要想快速準確地檢索到所需信息,就需要一個機構能夠承擔起網(wǎng)絡信息的整序工作。目前,以網(wǎng)絡搜尋為目的的搜索引擎的出現(xiàn)(如國外的Yahoo、infoseek、altavista,國內(nèi)的網(wǎng)易、搜狐等),雖然在浩如煙海的網(wǎng)絡資源中起到了一定的導航作用,由于其處理方式是通過自動調(diào)用程序在網(wǎng)際網(wǎng)絡上選取網(wǎng)頁,然后使用全文檢索的技術,以自動拆字詞作為索引的方式,建立其數(shù)據(jù)庫作為檢索的基礎,這種方式的不足之處在于其查全率高,但查準率低,以及缺乏一致性的用戶界面。檢索出的篇目太多,有時甚至有成千上萬篇,而其中真正有用的信息并不多。
這種情況下,圖書館應發(fā)揮自己的職業(yè)優(yōu)勢,圖書館對非網(wǎng)絡信息資源的編目已有了豐富的經(jīng)驗,將其應用于網(wǎng)絡信息資源的編目將起到事倍功半的效果,由圖書館對網(wǎng)絡信息資源進行選擇、加工、整理,對網(wǎng)絡上的各種信息進行篩選、過濾、描述、標引,以便于查尋的方式把有價值的信息提供給用戶,這是利用網(wǎng)絡資源最為有效的途徑之一。
2.網(wǎng)絡信息資源編目的可行性
盡管網(wǎng)絡信息資源具有增長迅速、數(shù)量巨大、流動性大、穩(wěn)定性小的特點,它與非網(wǎng)絡信息資源仍具有共性,可以這樣比喻,整個因特網(wǎng)就像一個巨大的圖書館,各個網(wǎng)站就是種類不同的圖書,而每一個網(wǎng)頁就是圖書中的一頁,共性的存在,是對網(wǎng)絡信息資源進行編目的前提條件。
美國OCLC(Online Computer Library Center)對網(wǎng)絡信息資源的編目進行了有益的嘗試,并且取得了重大的進展。OCLC從1991年開始就致力于應用計算機技術對因特網(wǎng)上的資源進行精心篩選和標引。通過試驗,證實了MARC和AACR2可適用于網(wǎng)絡信息資源,同時提出了修改完善MARC建議,在USMARC中新增加了856字段—電子網(wǎng)址和索取字段。由于MARC本身的局限性,如結構復雜、著錄項目過于煩瑣,要求專業(yè)性強,要受過專門訓練的編目員來做等等,雖保證了著錄的精確性,但著錄速度慢,工作效率低,無法滿足海量的網(wǎng)絡資源的整序需求。
于是人們開始轉(zhuǎn)向研究一種新的著錄項目,一種用以描述網(wǎng)絡信息資源的格式和工具。“元數(shù)據(jù)”這一概念被及時推出,元數(shù)據(jù)的產(chǎn)生為網(wǎng)絡信息資源的組織提供了重要手段。到目前為止,世界上已開發(fā)出并付諸使用的元數(shù)據(jù)有許多種,如都柏林核心元數(shù)據(jù)(Dublin Core)、頻道定義格式(CDF)、藝術作品描述目錄(CDWA)、資源描述框架(RDF)等等。
有了高效實用的網(wǎng)絡信息描述工具以后,針對網(wǎng)絡信息資源編目的特殊性,1998年8月OCLC研究署向研究顧問委員會提交了 CORC(Cooperative Online Resource Catalog)計劃的構想,這一計劃嘗試將傳統(tǒng)的圖書館編目規(guī)則與技術—文獻信息的選擇、描述、標引及利用等運用于網(wǎng)絡信息的存取,OCLC于2000年7月正式推出了CORC產(chǎn)品,并向美國和全世界推廣。CORC與商業(yè)的搜索引擎不同之處在于它有人工干預,網(wǎng)絡資源是由圖書館員挑選的,它的目標是將傳統(tǒng)的圖書館編目技術與先進的計算機技術相結合形成一個新系統(tǒng),能夠明顯優(yōu)于現(xiàn)有的搜索引擎。
3.編目工具
圖書館員一向以善于組織信息著稱,我們曾經(jīng)有效地完成了印刷型資料的編目組織工作,當然有能力完成網(wǎng)絡信息資源編目的使命。
目前圖書館界對網(wǎng)絡信息資源編目的工具以MARC和DC為主,對網(wǎng)絡信息資源進行著錄的格式應是基于XML的DC描述。
3.1MARC
MARC格式是美國國會圖書館從1963年開始研究應用計算機對圖書進行編目的工具,1971年,美國國家標準局將USMARC確定為美國國家標準,1977年,國際圖聯(lián)(IFLA)發(fā)布UNIMARC格式,中國根據(jù)UNIMARC的框架體系和內(nèi)容,結合中國的特點編制了CNMARC。
MARC是用于描述、存儲、交換、控制和檢索的一套機讀書目數(shù)據(jù)標準,它開始主要是針對印刷型書本的描述,對網(wǎng)絡信息資源進行編目,是通過在MARC中增加856字段,即“電子資源地址與存取”,并采用5XX字段記錄資源格式的方法來進行的。它的數(shù)據(jù)結構嚴密,能很好地描述電子信息,尤其是在檢索點的選取原則上,能確保其數(shù)據(jù)元索組成具有統(tǒng)一性,有利于資源交換。此外,這種經(jīng)過編目人員過濾、篩選過的信息,確保了數(shù)據(jù)描述的可靠性、完全性和精確性。
856字段主要記錄被著錄的數(shù)字對象或與之相關的其它電子資源的存儲地址和存取方式,是可重復、必備字段,包含27個子字段。專業(yè)水準的分類和準確的記錄這兩大特色將使其能在Internet中占有一席之地。但用MARC格式編目Internet的成本相當高,由于網(wǎng)絡信息地址時常更改,為了維護856 字段鏈接的有效性,需要耗費相當多的財力、人力和時間,編目的速度遠遠跟不上網(wǎng)絡信息資源增長的速度,因此這種高成本的編目方式只適用于編目一些最重要的網(wǎng)絡資源。
3.2DC
目前對因特網(wǎng)上的信息資源編目用
得最多的著錄工具是DC(Dublin Core)——都柏林核心,它是一項描述信息資源的國際標準,1995年3月在俄亥俄州的都柏林核心研討會上,52位來自圖書館、計算機和網(wǎng)絡方面的學者和專家共同探討了基于網(wǎng)絡信息資源的描述問題,創(chuàng)建了都柏林核心集。
DC包含15個元素,依據(jù)其所描述內(nèi)容的類別和范圍可分為三組:a、對資源內(nèi)容的描述;b.對知識產(chǎn)權的描述;c、對外部屬性的描述。對資源內(nèi)容描述類包括:Title、Subject、Description、Source、Language、Relation、Coverage。對知識產(chǎn)權的描述包括:Creator、Publisher、Contributor、Rights。對外部屬性的描述包括:Date、Type、Format、 Identifier。
DC同MARC相比具有以下優(yōu)點:
· 格式簡單且易于使用:因它只有15個元素,易于理解,適合各種背景的人群使用。
· 具有通用性:15個元素可自由選用及重復使用,元素的含義不因其是否嵌入所描述的資源而受到影響。它支持任何內(nèi)容的資源描述,使得跨學科的語義描述有了可操作性。
· 具有兼容性:DC通過RDF框架形成了資源描述的基礎,對基于WEB的元數(shù)據(jù)提供了靈活的語法基礎,如可內(nèi)嵌入HTML、XML語言,各種瀏覽器均支持它。
· 具有可擴展性:可根據(jù)實際情況,通過使用限定詞能夠?qū)崿F(xiàn)擴展描述的方法。
第七次都柏林核心研討會后,對DC進行了重大改進,DC與MARC之間映射更加一致,接近一一對應于MARC的許多字段,有利于將DC元數(shù)據(jù)記錄集成到圖書館原有的基于MARC的OPAC系統(tǒng)。
3.2XML
圖書館在對網(wǎng)絡信息資源編目過程中,采用DC作為網(wǎng)絡信息資源的著錄工具、XML文檔結構作為著錄格式是使網(wǎng)絡信息資源有序化的理想模式。
XML是一種區(qū)別于HTML和SGML的可擴展標識語言,它不象SGML那樣復雜,又能象HTML那樣可在WEB上傳送,它已廣泛應用于互聯(lián)網(wǎng)上。XML是一種類似于HTML,被設計用來描述數(shù)據(jù)的語言,XML提供了一種獨立的運行程序的方法來共享數(shù)據(jù),它是用于自動描述信息的一種新的標準語言,它能使計算機通信把Internet的功能由信息傳遞擴大到人類其他多種多樣的活動中去。XML由若干規(guī)則組成,這些規(guī)則可用于創(chuàng)建標識語言,正如HTML為第一個計算機用戶閱讀Internet文檔提供一種顯示方法一樣,XML也創(chuàng)建了一種任何人都能讀出和寫入的世界語。
XML作為新的一代網(wǎng)絡語言,它具有良好的可擴展性,它允許各個不同的行業(yè)根據(jù)自己獨特的需要制定自己的一套標記;它還具有良好的自描述性,能夠描述信息本身的含義甚至它們之間的關系;它遵循嚴格的語法要求,增加了網(wǎng)頁的文檔的可讀性和可維護性,提高了瀏覽器的時間空間效率;它便于不同系統(tǒng)之間信息的傳輸,XML是一種非常理想的網(wǎng)際語言。
XML文檔最好以一個XML聲明作為開始,一個完整的聲明是這樣的:
附圖
下面是一個基于XML的DC描述的一個例子,
<?XML version="1.0" encoding="GB2312" standalone="no"?>
<論文>
<HEAD>
<Title>Dublin Core形式書目</Title>
……
<BODY>
<dc:Title>Internet環(huán)境下電子化圖書館信息管理系統(tǒng)</dc:Title>
<dc:Creator>林雪英</dc:Creator>
<dc:Subject>圖書館信息管理</dc:Subject>
<dc:Description>…</dc:Description>
<dc:Date>2002—5--?</dc:Date>
<dc:Type>學術論文</dc:Type>
<dc:Source>http://www.fjinfo.gov.cn/publicat/qbts/004/18.htm</dc:Source>
<dc:Language>Chi</dc:Language>
<dc:Relation>福建科技</dc:Relation>
<dc:Rights>http://www.fjinfo.gov.cn</dc:Rights>
</BODY>
</論文>
每個著錄項目均為可選項目,可重復標記,數(shù)據(jù)是可變長的,書目信息與全文版電子資源的鏈接是通過<dc:Source>……</dc:Source>來實現(xiàn)的。
4.圖書館對網(wǎng)絡信息資源進行編目的現(xiàn)狀
網(wǎng)絡資源編目既然是傳統(tǒng)文獻編目在網(wǎng)絡環(huán)境下的延伸,而網(wǎng)絡資源又具有數(shù)量大、增長快、穩(wěn)定性小的特點,實行聯(lián)機合作編目是理所當然的必由之路。在這方面,美國做出了有益的嘗試。美國的OCLC在積其數(shù)十年合作編目豐富經(jīng)驗的基礎上,順應網(wǎng)絡信息資源發(fā)展的趨勢,及時推出“合作聯(lián)機資源目錄”——Cooperative Online Resources Catalog,即CORC構想。
4.1CORC的概況。它的目的是在自動化編目工具與圖書館合作有機結合的基礎上,建設共享的網(wǎng)絡資源數(shù)據(jù)庫。目前它已建立4個數(shù)據(jù)庫:資源記錄數(shù)據(jù)庫、規(guī)范數(shù)據(jù)庫、尋路器數(shù)據(jù)庫、杜威十進分類法數(shù)據(jù)庫,其中資源記錄數(shù)據(jù)庫相當于一般的書目數(shù)據(jù)庫,以Dublin Core或MARC形式提供網(wǎng)絡信息,尋路器數(shù)據(jù)庫則以網(wǎng)頁形式揭示網(wǎng)絡資源的書目信息及其與資源的超文本鏈接。
4.2 CORC的功能。
· 快速生成書目記錄。圖書館利用CORC編目時,只需根據(jù)編目人員提供的URL,系統(tǒng)會自動搜索、獲取相關域名的網(wǎng)頁,為相關網(wǎng)頁及其所有鏈接生成一系列的資源記錄,而且可定向獲取具有EAD與TEI頭標的網(wǎng)頁,并自動生成書目記錄,CORC工具在獲取某一網(wǎng)址后,能自動過濾出關鍵概念與關鍵詞作為索引詞。
· 自動標引分類法類號和主題詞。CORC安裝了豐富的機助編目工具,如杜威十進分類法、美國國會圖書館標題表、美國國家醫(yī)學圖書館標題表等,以減輕編目人員的標引工作強度。
· 通過合作與機器協(xié)助的方法維護記錄的URL(統(tǒng)一資源定位器)。在CORC系統(tǒng)中,由成員館分擔維護URL,當用戶的記錄包含無效的URL時,CORC的自動鏈接維護工具會通過“狀態(tài)屏幕”及時通知用戶,由用戶進行核查、更正,從而保證了URL的正確性。
4.3CORC的啟示。
目前,國內(nèi)許多有實力的圖書館已經(jīng)開始對網(wǎng)絡信息資源加以收集、整理加工,開始了對網(wǎng)絡資源編目的有益的探索,但是同時存在著分散、不統(tǒng)一的特點,作為發(fā)達國家的美國,合作聯(lián)機編目已走在我
們的前面,我們的問題不再是如何對網(wǎng)絡信息資源進行編目,尋找什么樣的工具編目,而是應該直接與國際接軌,充分利用CORC系統(tǒng)這一先進的工具。
5.結束語
網(wǎng)絡信息的極大豐富,給圖書館的工作帶來了新的機遇和挑戰(zhàn),也給圖書館員帶來了新的工作內(nèi)涵,它使我們不斷地補充新知識、接受新生事物,采用新的編目工具組織新的信息。在對網(wǎng)絡信息資源進行組織整理方面,圖書館應是大有可為的,圖書館有知識、經(jīng)驗都很豐富的編目人員,有一套切實可行的工作方法。目前,對網(wǎng)絡信息編目,圖書館界正在進行如火如荼的研究,相信無論是用MARC或是DC,是用XML或是HTML,圖書館這在方面的工作將會做得越來越完善、越來越科學。
【責任編輯】宋雅范
【參考文獻】
1、盧共平.圖書館與網(wǎng)絡信息資源的組織管理.http://www.libnet.sh.cn/magzine/00-06
2、郭瑞華.對網(wǎng)絡信息資源著錄項目和著錄格式的研究.圖書館建設,2002(1),55-57頁
3、吳萬曄.OCLC的CORC系統(tǒng)對我國虛擬圖書館發(fā)展的啟示.情報雜志,2002(8),86-89頁
4、王紹平.合作編目—網(wǎng)絡資源書目控制的必由之路.http://www.lib.sjtu.edu.cn/chinese/teaching&research
5、方小容.網(wǎng)絡信息資源編目與CORC系統(tǒng).現(xiàn)代圖書情報技術,2002(2)65-68頁
6、吳開華等.數(shù)字圖書館元數(shù)據(jù)研究.圖書館學、信息科學、資料工作,2002(8),27-30
7、吳建中.網(wǎng)絡資源的組織與整理.http://www.kingsy.net/library/expert/wjz
8、Internet環(huán)境下電子化圖書館信息管理系統(tǒng).http://www.fjinfo.gov.cn/publicat/qbts/004/18.htm
- 1汽車圖書館書香滿校園
- 2高校圖書館的信息營銷策略
- 3秦安蜜桃進入上海廣東超市直銷
- 4智慧圖書館開通什么業(yè)務?
- 5輕松借閱便捷管理 "圖書館ATM"走進中國[圖]
- 6圖書館管理系統(tǒng)特點介紹
- 7上海:國家圖書館二期暨國家數(shù)字圖書館正式建成開館
- 8市民有望申請“個人數(shù)字圖書館”
- 9黑馬太陽神直銷戰(zhàn)略分析
- 10圖書館管理系統(tǒng)帶來的使用便利
- 11公共圖書館數(shù)字化與網(wǎng)絡化發(fā)展中的問題及對策
- 12圖書館數(shù)字化應用現(xiàn)狀
- 13書香惹人醉 科技顯魅力——天水市圖書館見聞
- 14 中國圖書館學會年會在蘭召開
- 154項目入圍數(shù)字圖書館特色資源庫建設
- 16江蘇初步實現(xiàn)公共圖書館數(shù)字信息資源共建共享
- 17黑龍江圖書館提供“政府信息”查詢和咨詢服務
- 18直銷巨頭加速四川圈地 安利發(fā)出首份直銷員證
- 19國家圖書館二期新館開館 《四庫全書》首次展出
- 20做好網(wǎng)絡環(huán)境下少兒圖書館的讀者活動工作
- 21網(wǎng)絡型電子期刊編目原則
- 22五糧液覬覦直銷
- 23文化部《公共圖書館建設標準》《文化館建設用地指標》答記者問
- 24鳳凰號攜數(shù)字圖書館上天 帶去人類對火星問候
- 25打破直銷傳統(tǒng)!戴爾電腦正式進駐沃爾瑪
- 26中科院數(shù)字圖書館豎時代億信“認證墻”
- 27昌平圖書館9月起可刷“一卡通”
- 28建設智慧圖書館需要注意什么?
- 29惠普在京發(fā)布教育機及圖書館解決方案
- 30廈門海滄消防建成網(wǎng)上電子圖書館
成都公司:成都市成華區(qū)建設南路160號1層9號
重慶公司:重慶市江北區(qū)紅旗河溝華創(chuàng)商務大廈18樓