在建设结构合理、格式规范、便于共享的档案数据库的过程中,仅仅依靠数据库理论是不能胜任的,数据库管理系统(DBMS)本质上就是管理所用的工具和平台,其数据结构、类型、内容范围等关键要素都必须依靠档案基本管理理论提供的营养来进行保障,也是我们平常所说的业务支撑。
一、档案分类理论对档案数据库的建设起着导向作用
从管理学上讲,任何管理活动,抛开其最终目的,其最基本的目的或者基本要求都是要使被管理对象有序化,档案管理的基本目的就是要使档案有序化,包括档案实体管理和信息管理的有序化。将数量庞大、内容形式复杂多样的档案有序化的具体方法很多,但最基本的方法就是分类,即“对档案总体进行分割、划分,将其分为若干层次、大小不同的部分或门类、种类、类别,然后对这些不同的部分、门类、类别等实施分别管理。”“这实质上也是人类社会所有管理活动乃至认识活动的基本方法。”正因为如此,“说得笼统一点,档案管理理论上的所有能称得上‘重大’的分歧和争论,大都围绕着分类方法展开。”①
由是,笔者将档案分类作为影响档案数据库建设的基础理论,该理论直接影响着档案数据库建设的方向。在档案理论界中逻辑主义和历史主义的分类思路得到普遍认可。逻辑主义的分类思路是根据档案的一般特征作为分类标准和依据,根据严格的形式逻辑进行划分的分类思想,比如按照保管期限、密级等进行划分。历史主义的分类思路是按照事物的现实存在状态与界线对事物进行区分的,强调根据事物的现状进行把握,尽可能接近事物的真实状态,是一种客观主义的分类思路。历史主义方法在档案实体管理领域的具体体现就是全宗原则,在分类时首先按照档案所属的全宗进行归类。逻辑主义分类思想有助于从某一具体特征进行划分,便于对档案进行多角度的灵活定位;历史主义则强调了档案来源属性这个根本特征,有助于完整理解档案内容,这也是档案数据库区别于其他文献数据库的关键要素。事实上,在档案管理的过程中这两种分类思想都是需要的,彼此是不可取代的。
一般来说,对档案的实体管理基本采用了历史主义的分类方法,大体都按全宗进行排架整理;而档案内容信息的管理则可以同时采用两种方法,一般以逻辑主义分类方法为主。在档案数据库建设中,一般是在来源单位层次上建立实体数据库,实际上是将一个全宗(一般是档案室层次)或全宗群(一般是档案馆层次)作为建库范围,同时利用视图、索引等数据库对象对内容实施逻辑管理,使档案管理理论中的“二元主义”得以在数据库建设中融合。
二、全宗原则及其理论发展对档案数据库建设发挥指导作用
档案管理基本理论认为档案的实体管理必须维护和尊重档案的本质特性,必须采用历史主义的方法,遵守全宗原则,这一思路对于档案数据库的建设具有重要的指导作用。
首先,全宗原则是档案实体分类的基本方法,是人们经过理论分析和实证研究之后得出的宝贵经验。以全宗为基本单位建设档案数据库,数据库内容反映的是一个现实的实体单位的历史记录,保证了档案数据具有一个坚实可靠的立足点,这是单纯地依靠逻辑分类方法所达不到的。
其次,采用全宗原则指导建设档案数据库,能够最大限度地维护档案的原始记录性。因为全宗作为一个独立组织或个人形成档案的全部,是一个不可分散、不可打乱混淆的有机整体,这样能够最大限度地维护和保持档案的本质特性——原始记录性,这也是档案信息在管理组织上独树一帜、不同于图书、资料、情报等文献的根本原因。档案数据库作为档案信息管理的重要工具和手段,必须服从这一更高的管理目的。良好的数据库设计可以将全宗原则的诸多思想在档案数据库建设中实现,包括全宗内部管理层次、管理联系等。像文书立卷工作中要求的“保持文件之间的历史联系”、科技档案管理中的“成套性原则”等思想都可以通过数据库的设计得以体现。
第三,依据全宗理论进行档案数据库建设,有利于数据库的建设与维护工作。按照这种思路进行档案数据库建设在多数情况下能够保证数据库的建设者、管理者、拥有者、维护者是统一的,数据库建设各方的利益是一致的,有助于保证档案数据库建设的动力、资金以及作用的发挥。
值得注意的是,虽然全宗原则是档案管理的基本原则和方法,但它并不能解决档案管理的所有问题。由于社会实践的不断发展,全宗原则面临不少新的挑战,也因此得到新的发展,这些发展对档案数据库的建设同样产生了具体的影响。
1、全宗内部档案的差异化管理需求要求建立相对独立的档案数据库。
虽然全宗原则强调一个来源单位的档案应当集中保管,但也没有忽视对同一来源档案之间的差异化管理。随着社会实践的发展,同一全宗内档案的种类、载体类型及其管理要求日益多样化、复杂化、专门化,这使得对全宗的集中统一保管难以实施。在档案实体管理范畴,同一全宗内就有可能出现纸张、照片、录音带、录像带、磁盘、光盘、缩微胶片等多种载体,其中相当一部分特殊载体的档案在保管利用上都有特殊要求,因此往往需要将其组织为一个单独的管理体系,设置专门机构,提供专门的库房和设备,虽然可以在编号系统中设置它们与全宗的关系,但在实体管理层面上已经不具有严格的不可分散性。在档案信息管理范畴,由于不同门类档案的管理差异,同一全宗内不同类别的档案也多采取分别管理的措施,比较典型的像人事档案、会计档案等由于具有不同于其他档案的管理要求,采取由人事部门、财务部门单独保管的管理方式。
与此相对应,基于全宗的档案数据库在建设时都会考虑到这些差异的存在,通过建立多媒体档案数据库来存储管理照片、录音、录像等专门载体档案,通过建立人事档案数据库、会计档案数据库对这些业务性较强的档案实施专门化管理。
2、自由来源原则为专门档案的数据库建设提供理论基础。
自由来源原则认为全宗不仅是历史性、客观性的,也可以是逻辑性的,这是对全宗理论的重大发展。像许多行业性、专业性很强的档案就要求打破传统全宗范围的限制,而按照行业或专业系统进行集中统一管理。比如城建档案、项目档案虽然破坏了各项目参与组织全宗的完整性,但却有效地维护了项目档案的完整性。在多数情况下保证后者的完整性具有更为重要的现实意义。这里的工程项目就是一个逻辑意义上的全宗单位,由此可见,全宗理论在其本身的发展过程中存在分合的演化过程,并不完全拘泥于狭义的全宗概念。
自由来源原则等理论为城建档案数据库、项目档案数据库等专门档案数据库的出现提供了理论基础。它们以逻辑全宗为单位进行创建,符合其管理要求。
三、逻辑主义分类思路适合档案数据库的内容管理
历史上最著名的逻辑主义分类方法应该就是法国国家档案馆馆长卡缪和多努坚持的事由原则,该原则在法国大革命前就应用于各国的国家档案机构,但这些国家档案机构所保管的大都是来源单一的档案,所以事由原则尚能发挥作用。但面对改革后法国国家档案馆中来源、内容、形式、种类、数量各不相同的档案,这种分类方法就显得捉襟见肘了。这两任馆长使用统一的事由原则对全部馆藏进行统一分类,即使他们根据档案复杂性的增加将事由大类由4类拓展到24类,也不能将所有档案都划分清楚。很明显,在综合性档案馆内按照统一事由原则对档案实体进行分类是典型的“刻舟求剑”的行为。但这并不能说明逻辑分类方法不能用于实体分类,而是它更多地适用于档案的内容分类。
逻辑分类法在档案数据库的内容管理中有着非常普遍的应用。我们知道,档案的实体整理必须按照其形成时的本来面貌去管理,但档案内容信息是极为丰富多彩的,人们对这些内容的需求也是多样化的,但和现实世界中档案实体的排序只能有一种一样,在数据库中我们一般通过有限的基本表来反映档案实体的记录信息。我们绝没有必要根据用户的每一个需求重建数据库,在表达逻辑需求方面,数据库拥有强大的管理手段,我们可以依据我们感兴趣的特征(或特征组合)通过索引、视图、查询等数据库对象很方便地对档案数据库进行逻辑重组,好像魔方一样,可以变换出我们需要展现的内容。比如视图在数据库理论中有个绰号叫“虚表”,就形象地表达了视图具有的逻辑力量,它可以将用户关心的属性从若干个基本表中抽取出来进行组合,满足用户的查询和使用要求。而且在计算机环境中,由于软硬件屏蔽了许多对用户无关的内容,使得用户可以像操纵基本表一样操纵视图,就好像档案实体真的是按照我们指定的特征进行分类一样。
四、电子文件管理理论为档案数据库的未来发展提供营养
电子文件管理已经成为目前档案信息化进程中不可回避的课题。电子文件是信息化环境中业务过程和业务成果的真实记录,因此保证电子文件的真实、完整、可用具有非常重要的意义。电子文件生命周期理论认为,电子文件从形成到销毁或保管是一个完整的运动过程,对电子文件生命全程的管理和监控措施应当前置到电子文件管理系统的设计之中,包括对其运动全程的状态记录。档案数据库在电子文件管理环境中如何发挥作用,需要电子文件管理理论提供支持。
与传统档案进行事后管理不同,现代文件档案管理倡导的前端控制原则要求将整个文件管理过程的目标、要求、规则等进行系统分析,将需要在文件形成阶段实现的功能尽可能进行整合。这就要求对文件数据结构的设计要考虑到整个文件管理活动的需要,实时收集需要进行前期控制的数据元素,为确保电子文件的真实可靠、完整安全、长期可读提供保障。换言之,档案数据库不能像传统方式那样,在档案文件接收完毕、文件的真实性有案可查的情况下开始数据建设,而是要在第一时间规划完毕,伴随文件生命周期进行动态跟踪,将各个环节需要记录的数据各就其位,构成一个完整的数据链条,为该文件的描述、利用、验证、保存等提供信息。美国当代著名的电子文件管理专家戴维·比尔曼指出“必须根据文件保管系统的功能需求、文件种类以及业务活动的证据性需求,提前界定著录信息。在电子文件环境中,对元数据予以明确规定,有助于设计和实施在文件生成之际自动截获元数据的系统,确保文件在转载、传输过程中相伴产生的元数据的完整。”②
紧接着的问题在于如何确定用于描述的元素,元数据理论为此提供了解决方案。元数据就是数据的数据,用于描述数据的内容(what)、覆盖范围(where, when)、质量、管理方式、数据的所有者(who)、数据的提供方式(how)等信息,是数据与数据用户之间的桥梁。元数据通过描述信息资源的属性,用于识别、评价、追踪资源,从而实现对信息资源一体化的组织和有效管理。根据对电子资源管理的需要,元数据可以分为描述型、管理型、技术型和使用型、保存型。事实上,电子文件是多种不同类型信息的一个集合概念,对于不同类型的信息形式,其描述、管理、保存方式都具有不同的属性集。元数据最基本的功能是通过数据元素集定义资源对象的各类属性,这些属性的大量实例可以表达为关系型数据库中的表,或者以XML等形式进行置标,从而能够利用数据库系统或各类应用软件进行管理。可见,以元数据为中间对象,可以利用数据库实现电子文件的有效管理。
注释:
①张辑哲:《维系之道——档案与档案管理》,北京:中国档案出版社,1995年。
②戴维·比尔曼著,王健等译:《电子证据——当代机构文件管理战略》,北京:中国人民大学出版社,1999年。