【内容提要】文章在分析图书馆数字资源典藏管理存在问题的基础上,通过总结国外数字资源典藏管理政策,提出图书馆数字资源典藏管理应制定数字资源组织中的规范控制政策、典藏保护和存取政策及权限控制政策。
【摘 要 题】信息资源建设与管理
【关 键 词】图书馆/数字资源/典藏管理/管理政策
【正 文】
图书馆数字资源典藏管理是1个新的复杂问题。笔者检索了国内3大数据库,发现专门讨论图书馆数字资源典藏管理的文章很少,这说明,目前图情部门对数字资源典藏管理尚未引起足够的重视,这不能不说是1种遗憾。就国内现状来看,有些大型馆对数字资源典藏管理还是比较重视的,都有1定的管理方法、管理制度,虽然不1定科学,但至少体现出重视管理的思想。就国外现状来看,世界各国在数字资源典藏管理方面的研究和实践已经取得长足进展,1些国家通过立法予以保证,进行应用性部署,积累大量的知识和经验。充分了解国外进展,学习别国经验,开展国际合作,对于推动我国图书馆数字资源典藏管理的规范,具有重要意义。本文正是基于分析我国图书馆数字资源典藏管理存在的问题,在总结国外数字资源典藏管理相关立法的基础上,研究我国图书馆数字资源典藏管理的对策。
1 我国图书馆数字资源典藏管理存在的问题
1.1 典藏摄取过程中的典藏权问题
“摄取”是指对数字资源进行典藏管理时,从资源拥有者那里获得或接收要典藏的数字资源过程。从知识产权管理的角度,典藏过程中首先面临的问题是,图书馆是否获得对数字资源进行收集、复制、存储和传播的权力,即所谓对数字资源的典藏权。典藏权不仅涉及直接的内容数据,还涉及两类相关数据:(1)与内容数据的典藏和使用相关的“元数据”;(2)支撑典藏系统运行的软件及硬件、资源组织体系、利用与链接环境等有效利用内容数据“复原”技术的数据服务。数字资源典藏权与其生产方式、获取途径和资源体系制度安排相关。典藏资源的摄取方式:(1)自建数字资源,包括对馆藏文献数字化和创建自主知识产权的数字资源。依据我国著作权法第22条第8款规定,对有版权的馆藏资源应合法地数字化,合法取得典藏权。但仍存在对数字资源典藏管理权和对外服务权受限问题。(2)外采数字资源,指图书馆通过采购获得数字资源的使用权,但它只具有网络使用权。这涉及3个问题:永久使用权;采购合同范式;协同合作典藏。 (3)呈缴数字资源,指依据国家法律形式规定数字资源生产者向国家指定图书馆免费呈缴的数字资源,即包括电子出版物,也包括职务作品版权拥有者向单位呈缴的电子版作品。对这类数字资源的典藏权,其核心问题是呈缴制度是否包括数字版本。(4)网络公开资源,指在网络上可公开使用的数字资源。这包括:在版权保护期限外的作品及按照著作权法不予保护的公共资源;开放资源,指在网络上经版权拥有者允许使用的资源,但“允许使用”在使用方式上和使用目的上存在限制[1]。
1.2 数字资源组织中的规范控制问题
所谓数字资源组织,是指对摄取的数字资源进行分析、选择、标引和处理,为数字资源提供有序化的结构,使之形成1个有机的整体。数字资源在有序化的基础上必须有足够存储空间和简单快速的存储算法,从而有利于对数字资源的快速存取。根据关联性、结构性和功能性的方法原则,在对数字资源的组织中,需要揭示数字资源的关联、层次和功能的组织,即如何反映数字资源对象间的结构和语义的内在关系,来保持数字资源对象学科的完整性,同时对数字资源进行多维整合,体现资源整合的结构性和层次性。这需要运用1定的技术手段和方法,才能使数字资源得到优化组合,取得最好的组织结构和功能。
为方便用户获取有效资源,进行资源共享,在数字资源组织时应有1个统1的标准,需要利用数据管理模块对它们整理并编制长期保存元数据,将数字资源和元数据存入长期存储系统,并根据需要维护被存储数据的持久可用性,以便使典藏资源库中组织起来的分布式海量资源在各数据库之间自由流动。规范控制是数字资源组织的关键。但遗憾的是目前还没有相应的对数字资源规范控制制定标准。现用的规范控制如:传统的文献资源规范控制采用CNMARC或UNMARC标准。MARC标准是针对纸质文献而设计的,而大量数字文献的出现,过于精细的基于RICH格式MARC标准已无法适应。DC元数据只是1种标引方式,如处理不好标引资源的存储,其功能将弱化。对如何处理针对文献种类提供特定的目次信息、期刊文献跳页、文集的页号、按文章标引等问题,远不能适应对数字资源标引需要。XML目前被广泛用于对数字资源的组织,同时作为元数据数字资源载体,在数据交换领域被广泛应用,有优异的跨平台、跨语言等特性。通过XML可将数字对象、目次信息及其标引对象有机组织在1起,方便用户与系统之间交换数据[2]。因此全面支持XML是数字资源典藏建设与应用软件之间实现无缝整合必须解决的问题。
1.3 数字资源典藏管理存储问题
随着馆藏资源建设中产生的数字对象越来越多,海量数据的生成和积累意味着馆藏知识财富的增加。但也意味着这些宝贵的馆藏记录和文档面临因技术过时和载体变质而引起损失的危险。Jeff Rothenberg指出,“‘21专家组’的研究给出了令人印象深刻的结论:目前根本无法对数字信息存储的效果做出任何保证[3]”存储问题在档案馆和图书馆表现得尤其突出,其突出问题表现在:数字对象被永久存储于物理媒体并不等于具有持久的可用性。数字图书馆联盟指出了数字对象的存储和永久性之间的1个重要区别:存储涉及1个对象的技术寿命和质量,持久性是1个更广泛的概念,包含了存储,但也指对象是否仍然在将来以任何形式存在。持久性暗含了对对象维护的概念,同时也意味着对其可访问性的持续保持[4],否则会缩短数字图书馆的平均寿命[5],降低被存储资源的可访问性。存储策略、存储框架、政策、法律等相关问题是数字资源存储中需要解决的主要问题。
1.4 数字资源典藏管理的权限控制机制问题
目前,仍然有相当1部分图书馆没有专门的典藏部门,典藏工作只是作为采编工作的1部分,即使是设立了专门典藏部门的图书馆,其典藏部门的管理工作也多是有责无权。从知识产权管理的角度,如果典藏权不明确,那么馆藏资源的调拨、分配、清点等各项工作的监督,以及协调馆藏建设与用户工作部门在馆藏资源利用上的关系等将无法进行,况且在网络环境下,典藏工作的内涵增加了,其职能也必将得到延伸,典藏管理权限的不明确将成为新时期典藏工作职能发挥的1大障碍。从以上分析已经看出,在对数字资源摄取、组织、标引、存储过程中必须获得授权才可得到典藏的权利。但数字资源涉及的权限关系比较复杂,因此有必要针对具体问题分析具体的权利归属。
2 国外数字资源典藏管理政策简介
美国法定典藏以1976年版权法和the Code of Federal Regulation为标准。版权法中407节和408节规定,在本土出版的作品1律要求典藏并符合强制典藏要求的伴随可自愿登记。美国在线作品的自愿典藏是通过电子登记与典藏递送系统CORDS完成,很多类型的电子作品可以通过它注册电子版权和进行典藏。1989年,计算机程序机器、可识别的出版“数据”,成为强制典藏的对象。但对于网络出版物美国版权法中规定“出版”与传播联系在1起,在网络上创建复本被认为是出版过程或展示的自然组成部分,而不是“出版”。存取方面的限制和在线资料的复制被定义“有限出版”,依据版权法被认为“未出版”而不强制典藏。
荷兰出版作品版权典藏法案对原版权法案进行修订,同时将网上的电子作品也包括在规定典藏范围,但是规定只限于表态作品,对于数据库,则由版权典藏机构来完成典藏。荷兰皇家图书馆(RLD)通过国家书目可以了解所有出版作品的信息,根据修正案,所有符合RLD典藏标准的网络出版物都必须被典藏。
1992年2月澳大利亚版权法评审委员会做出1项决议,建议将“图书馆资料”的概念范畴予以扩大,将电子资料包括在强制典藏范围内,但典藏的资料在存取受限的基础上可拟利用。同年国家图书馆又向联邦政府提请对版权法案典藏立法中的相关条款进行修正。1995年国家图书馆向版权法评审委员会提出对电子出版物典藏做出规定。1996年澳大利亚创建 Pandora Project,开发选择、搜索、存档网络出版物的程序,并公布1项网络出版物选择标准指南,只收录具有国家象征的电子出版物[6]。2000年澳大利亚政府实施数字议程法案,对1968年版权法案的修正考虑了互联网这样的新事物,但没有对法定典藏进行修正。
加拿大于1995年通过修订各种物理格式出版的电子出版物而颁布国家图书馆法案和国家图书馆图书典藏制度,但不包括网络出版物。国家图书馆EPPP系统通过开放存取、远程控制和在线咨询3种方式完成接受、分类和典藏网络出版物。目前网络电子出版物典藏和保存是自愿的,但存取受制于出版商[7]。
德国的自愿典藏从1998年7月开始,其选择典藏的是商业出版物、在线学位论文、期刊和大学出版物,免费存取的资料采用自动传播方式,直接由出版商传播的是成本、正式出版物、与出版物同时提交的还有出版的格式,提交的电子格式是国家图书馆基于长期存取目标规定的提交格式。
新西兰国家图书馆法案2003(The National Library of Zealand Act 2003)要求图书馆收集、保存新西兰电子文档,并提供访问服务。为了正确执行该法案,新西兰国家图书馆采取了1系列措施,包括研究建立长期保存数字资料的仓储条件等。
3 数字资源典藏管理政策及内容
3.1 数字资源典藏管理的内容及其定位
传统典藏是文献加工过程中的最后1个环节,典藏质量的高低决定着文献布局是否合理。数字化及网络化技术的发展,使传统馆藏建设发生了深刻的变化,不仅馆藏资源的概念被重新定义为“现实资源+虚拟资源[8]”,而且馆藏结构也呈现出多元化、信息化、动态化的特征。从理论上讲数字资源典藏管理就是1种馆藏数字资源的组织与管理,它包括了馆藏数字资源组织和馆藏数字资源管理两个方面。简单地说,馆藏数字资源组织就是将摄取的数字资源按照1定要求,进行合理布局、排列、保护和清点的过程;馆藏数字资源管理则是对馆藏数字资源组织的控制、调节活动,它是按照1定目标,通过馆藏资源利用效果、统计、评价等信息反馈,有效地控制馆藏资源运行的方向、速度、范围和密度,从而使馆藏系统和用户系统有序结合运转,并处于均衡饱和的最佳状态。因此,数字资源典藏管理工作定位于既是记载、验收、统计、存储、保护馆藏数字资源的技术性工作,同时又有复审、分配、清点、核查、处理馆藏数字资源的行政职能。
3.2 数字资源组织中的规范控制政策
数字资源组织政策,就是按照1定科学规则和方法,来对数字资源的特征进行描述和序化的过程,以方便用户对馆藏资源的检索和利用为目的。数字资源馆藏由“现实资源馆藏+虚拟资源馆藏”复合组成,因此数字资源馆藏政策也据此复合而成:(1)现实资源组织方法包括:按照学科内容的组织法、数据库组织法和数字资源整合工具法。(2)虚拟资源组织方法较为复杂,从数字资源组织的类型看,有1次虚拟资源组织和2次虚拟资源组织两大类。1次虚拟资源组织法包括WWW信息组织、FTP信息的组织等;2次虚拟资源组织法有导航网站、数字图书馆、搜索引擎等。但图书馆目前常用的组织方法主要为:学科导航、联机编目法、数据组织法。Calis联机编目系统已成为我国高校图书馆对数字资源组织的成功范例[9]。XML被广泛应用于对数字资源进行组织,通过XML可将数字资源、目次信息及其标引信息有机地组织在1起。据专家预测,在未来的几年里,元数据和内容标准将继续朝着以XML框架及与之相关的技术环境发展。这些发展将使得图书馆应用技术更少专门化和领域特定性 (Domain Specific)。实际上我们已经看到MARC等已经在向适应XML的方向发展,如美国国会图书馆发布的 MARCXML Schema等[10]。数字资源组织的方式有多种,各馆数字资源数量种类和服务对象不同,组织方式也要因馆而异,也就是各馆要制定具有自己个性化特色的数字资源组织政策。
元数据可以理解为“关于数据的数据或描述其它数据的数据”。元数据具有对数字对象的描述、定位、搜索、评估和选择的功能。元数据与数字对象的关系就如同书目数据与图书的关系1样,能比较完整地反映出数字对象的全貌。为了便于用户有效获取数字资源,进行资源共享,图书馆在对数字资源典藏入库时,有必要对数字资源进行标准化标引。对此,国际上制定了对数字资源的标引方法,即DC元数据。DC元数据集是元数据格式发展中比较熟悉和成功的1种,已成为对数字资源标引事实上的标准。DC元数据标准的创建,是通过对数字资源的提供者对资源属性的描述并对其内容进行缺省的标引方法,进1步保证了数字资源建设的标准化。在提供标准化标引方法的同时,数字资源库与应用软件系统也可以提供图书馆创建自己的标引方法,即系统提供标引模版,图书馆可以根据本馆的性质设计具有自己的个性特征。同时, DC元数据资源描述方案又称为网上资源的编目。由于DC元数据已被结构化,并支持字段查询,为从根本上解决网络环境下的信息资源的编目问题提供了切实有效的方法[11]。
3.3 数字资源典藏保护和存取政策
作为对数字资源管理政策的1部分,典藏保护和存取是有长期计划的。任何政策的制定必须解决对典藏资源的安全性跟踪并保证经过1段时间后资源的可存取性。这包括两个含义:1是保护政策也称安全管理政策:在制定安全管理政策时,应考虑数字资源的保护与纸质文献保护的区别。在制定对数字资源安全管理政策时,各馆应考虑本馆各因素的重要性和不可预见的灾难事故,也要考虑典藏员素质的因素。科学的安全管理政策应是1个全面的、系统的、动态的防护体系,在这个体系中对不同的因素,依据其重要性的不同分类分级分别采取不同的安全防护措施 [12]。2是存取政策,这需要解决3个问题:(1)历史遗留典藏资源如何存取和激活;(2)当前典藏资源怎样快速存取;(3)未来典藏资源如何存取及控制。这3个问题涉及潜在复杂的法律问题,在对这样的数字资源进行存取时应持慎重的态度。因此,存取政策的制定应包括:连续存取数字资源的特定策略,移植策略的不断发展及标准。数字资源存取需要在法定许可范围内进行规范操作。
3.4 数字资源典藏管理权限控制政策
数字资源典藏管理权限控制政策不同于对纸质文献的典藏规则,对数字资源典藏控制过程中涉及的法律问题包括许可授权、法律障碍及解决、技术解决方案等问题。当前最紧迫的是如何解决这几个问题:(1)如何确定数字资源的存储等级,由谁管理;(2)哪些数字对象可以被移植至永久存储;(3)数字对象如何合法对外传输;(4)呈缴数字版本典藏操作与权利如何界定;(5)如何对被典藏资源进行灾难防范与安全管理;(6)如何确定数字对象的生命周期;(7)多馆协同合作典藏系统的对外服务权限。妥善解决数字资源典藏的管理权限问题,是建立可信赖的数字资源典藏机制的基础,否则图书馆难以获得资源商和版权拥有者的积极合作,也难以形成可靠的协同合作典藏关系。就图书馆现状看,作为数字资源保存和服务机构,图书馆应该充分利用知识产权法中的合理使用与法定许可的相关规定,通过与版权所有者或拥有者签订典藏许可协议等方式保证图书馆的典藏权利,同时建立可靠的用户管理机制[13],加强对图书馆馆员和用户的法制观念,并积极解决或协助解决可能出现的侵权行为,从而建立良好的法律环境、管理机制和合作氛围。 4 结束语
在制定数字资源典藏管理政策时,国家有关部门应组织信息产业界、图书情报界和软件开发商参与讨论制定纸质资源、电子资源、各种元数据、多媒体资源能相互包容的标准,数字资源协同管理机制建立的关键在于能否发挥政策、法规和市场调节的作用,形成合理的具有互惠互利经济结算机制的数字资源利用共同体,以实现在统1的协议下,充分地满足各方对数字资源共享的
需求。
【参考文献】
[1] 宛玲,张晓林.数字资源长期保存过程中的知识产权问题分析.中国图书馆学报,2005(3)
[2] 陈文翠.数字图书馆建设中面临的技术挑战及解决方案.情报科学,2004(1)
[3] Rothenberg J.Avoiding Technological Quicksand: Finding a Viable Technical Foundation for Digital Preservation. To Council on Libraries, 1998
[4] Waters D. The Digital Library Federation: Program Agenda. A program of the Council on Library and Information Resources, 1998(6)
[5] Kahle B. Preserving the Internet. Sciencific American, 1997, 276(3)
[6] National Library of Australia. Online Australian Publications: Selection Guidelines for Archiving and Preservation by the National Library of Australia. [2005-05-25].. au/selectionguidelines.html
[7] Elizabeth Martin Management of Networked Electronic Publication: A Table of Status in Various Countries.[2005-10-28].http://www. collectionscanada.ca/obj/r7/f2/r7-100-e..pdf
[8] 顾扬.网络环境下高校图书馆典藏工作探讨.情报探索, 2004(12)
[9] 索传军.论数字馆藏管理政策.中国图书馆学报,2005(5)
[10] 吴建中.开放存取环境下的信息共享空间.国家图书馆学刊,2005(3)
[11] 郝亚玲.Metadata:数字图书馆信息资源的整序.图书馆理论与实践,2002(5)
[12] 胡英.信息安全的国家策略.计算机世界网,2003-08-03
[13] 张晓林.虚拟信息资源体系的用户管理.现代图书情报技术,2000(5)