一、建立档案编研选材数据库的必要性
(一)档案编研工作实际的需要。目前,各级档案馆在进行编研选题的时候,普遍存在主观随意性较大的问题,其中一个重要原因就是没有充分了解馆藏内容,致使编研选题与馆藏内容相脱离,因而编出的编研材料价值不大、参考性不强、实用性不高。在馆藏数量巨大而且逐年上升的形势下,建立编研选材数据库,可以帮助我们深入了解馆藏档案内容,更加科学合理地确定编研选题,真实准确、齐全完整、系统丰富地选择材料进行编辑加工等工作。
(二)开展网络档案编研的前提。网络环境下,我们可以将编研选材数据库发布在网上,为编者提供材料线索。部分网络编辑系统还可提供“虚拟编辑室”,使得不同地域的编研人员共同完成同一个编研材料,这样,异地联合编研就可成为现实。同时,浏览者通过上网浏览得到所需的线索,也可以提高到档案馆进行实地查档的查档率。
(三)档案工作新形势的要求。建立编研选材数据库,为开发档案编研管理软件提供了数据支持,是档案编研工作向现代化、信息化、网络化迈进的基础。
二、建立档案编研选材数据库的形式
(一)档案文件目录数据库。就是把有研究参考价值、编研价值以及用于办展的档案的目录,按照一定的专题录入数据库,类似于我们常用的档案专题文件级目录数据库,比如我们档案馆的婚姻档案、房基地批示档案、招工档案等专题目录数据库。
(二)档案内容简介数据库。就是在目录数据库的基础上,增加档案内容简介字段,把一份文件中有价值的信息,利用主题词、关键词或内容概要等形式全部反映出来。这样不但可以检索到所需文件的题名,还可以对文件的内容进行全面的了解。
(三)档案原文检索数据库。在数据库中设置档案原文字段,档案原文的录入可分为嵌入式和链接式两种,嵌入式是直接在数据库中输入档案原文;链接式则是利用已建好的档案原文数据库,把档案原文链接到数据库中。这样当检索到所需文件后,不但可以查看档案内容概要,还可以直接打开档案原文,有用的内容可以直接下载、编辑加工利用,这样,编研工作效率就会大大提高。
从以上编研选材数据库的三种形式不难看出,建立文件目录数据库虽然简单,工作量也较少,但所含信息量也较少。比如北京市平谷区档案馆的文件级目录数据库中,一些早期形成的文件题名不很规范,不能准确全面地概括文件内容,检索利用时有些内容重要的档案就可能被遗漏。而档案全文数据库信息量大,如果没有已建好的全文检索数据库,建立这种全文数据库十分困难。随着文档一体化进程的加快,大量电子文件形成,为全文数据库的建立提供了便利。比如,目前我馆的文件目录数据库中已有条目近120万条,而且还会逐年增加,从实际出发,我觉得可以分阶段进行,首先建立文件目录数据库,然后逐渐扩充,添加内容,逐步形成档案内容简介数据库,乃至最终形成档案原文检索数据库。 三、建立档案编研选材数据库的步骤和方法
(一)对数据库的功能需求的调研。编研选材数据库一般容量较大,因此要具有较快的检索速度和较高的查全率、查准率,这样才能真正提高编研效率。将来开展网络编研是编研工作的趋势,不同的档案馆之间,档案馆、室之间,档案馆与社会有关部门之间都可以进行广泛的联合编研,因此编研选材数据库要适合在网络环境下使用,要具备较高的检索性能,便于实现数据库资源的信息共享。
(二)准备数据库材料。编研选材数据库的数据来源主要是馆藏档案和资料,现行文件中心的现行文件资料,档案室保存的档案信息,其他档案馆保存的资料,通过网络、公开出版物等途径获得的资料信息等。比如,目前我们已收集了档案馆的90多万条目录的综合数据库,基层档案室报送的30多万条的电子目录,为建立选材数据库做好了准备。
(三)数据库选型。数据库的类型有很多,比如Access、Datebase、SQL server等,一般应选择功能齐全、通用性强、兼容性能好的数据库。比如根据我馆的实际,可采用Access数据库格式,一是编研人员使用操作比较熟练,二是区档案馆、各单位档案室已建立的数据库也是这种格式,我们可以直接在原数据库上进行操作。
(四)数据库的设计。主要是设计字段和设置字段类型。根据实际需要可以设置档号、类别、文件题名、内容简介、时间、保管单位、档案原文等字段,其中要注意以下几点:
1、类别的设置是关键。可以按专题设置类别,如可以设置历史、地理、人文、自然、政治、经济、科技、教育、文化、综合类等专题。专题的设置要以实用为主,如果专题分得太多,就不容易辨别区分,不容易归类;如果专题分得太少,检索使用起来就不方便。因此,设计专题要做好广泛的调研并通过实践修改完善,也可以参考县志、百科全书的类目设置。由于类别字段较多,可以用代字或代号表示,并编制字段设计说明。
2、内容简介字段要设计成文本型。它是对文件内容进行准确、简要的概括,内容较单一的文件可以用主题词、关键词进行标注,内容较多的文件,可以编写摘要。标注内容简介是建立数据库的难点,工作量巨大不说,单就一份文件的内容来看,有的可能涉及政治、经济、文化、教育、体育等各个方面的重要信息,综合性文件可能还包含着历史、地理、自然等社会各个方面的信息,标注起来非常复杂。这就要求编研人员具备较高的判断、分析、研究能力,从一份文件材料中查找有利用价值信息,同时还要具备较好的总结、提炼、文字加工功底,全面细致准确地标注档案内容。
3、档案原文字段要设计成超级链接型。由于嵌入式档案原文所占空间较大,影响检索速度。档案的载体、类型又有文本、照片、声像等多种形式,因此,应采用超级链接方式链接档案原文。
(五)窗体界面的设计。设计窗体界面表文件,是为了方便输入文件内容简介和档案原文等字段的内容,主要设计类别、文件题名、内容简介、时间、档案原文等字段。
(六)数据库的实施。从实际情况来看,数据库的建立可以分步实施。
第一步是从原目录数据库中挑选出可用的条目,建立选材目录数据库。具体方法:可以在原数据库中设置“是否存留”和“类型”两个新的字段,然后就需要从头至尾浏览数据库,从中找出可用的条目,并在是否存留字段中标注“1”,同时在类型字段中标注应属于哪个类型,比如政治、经济、文化等类或用代号表示。数据库录入完成后,为方便使用,可以用检索工具,检索出所有“是否存留”字段中是“1”的条目,另建新库保存,也就是新建一个有用的数据库。
第二步是在新建数据库中,添加内容简介。由于填写档案内容简介的工作量非常巨大,可以有针对性、有侧重点地进行文件内容简介录入。从馆藏来看,早年形成的档案文件标题不很规范,比如革命历史档案,敌伪档案,县委、人委、革委、五大公社档案,六大区委档案、四清档案等,而这些档案又往往是编研或者办展利用的重点,可以先从这些档案入手,边调研边录入内容简介。
第三步是录入档案原文。目前我馆还没有档案原文数据库,基层档案室电子档案还没有接受进馆,只能靠我们日常积累。比如我们在编研或是办展过程中要注意积累,对已形成的电子文件、数码照片等随时链接到数据库中。