公务员期刊网 论文中心 正文

电子文件长期保存中格式管理探究

前言:想要写出一篇引人入胜的文章?我们特意为您整理了电子文件长期保存中格式管理探究范文,希望能给你带来灵感和参考,敬请阅读。

电子文件长期保存中格式管理探究

引言

在现代信息技术迅猛发展的背景下,传统纸质档案逐渐被电子档案所取代,随着电子档案的日益增多,其长期保存问题也就被提上了研究日程。但在实际的档案管理工作中,电子档案的存储格式经常出现混乱的现象,导致使用者无法有效读取这些档案。毫无疑问,电子档案的存储格式将直接决定其是否能够得到长期的保存,是否能够对其进行长期有效的管理。

一、电子文件长期保存过程中的格式管理概述

1.电子文件长期保存及格式管理概念辨析

电子文件是国家机构、社会组织或个人在履行其法定职责或处理事务过程中,通过计算机等电子设备形成、办理、传输和存储的数字格式的各种信息记录。文件格式是指电子文件在计算机等电子设备中组织和存储的编码方式。电子文件读取和编辑操作需要依靠计算机软硬件环境来完成,其存储结果表现为特定类型的格式文件,一般是以“.后缀名”的形式来体现的。目前针对不同类型的电子文件,按其格式划分,有文本文件、图像文件、音频文件、视频文件、电子邮件文件等。常见格式有XML、TXT、PDF、OFD、JPEG、MPEG等。电子文件长期保存是指档案馆或其他文件保管单位、组织机构通过采取可靠的、科学合理的方式长期维护电子文件真实、完整、有效的行为。其中关于“长期”的具体时限性,根据ISO14721:2003的规定,虑及技术变化(包括支持新载体、新数据格式)和用户群体变化对典藏信息影响的足够长的时间段,这个时间段延伸到无限未来。格式管理是指以电子文件的各种存储格式为对象,对其进行类别登记、监测、识别、转换和日常稳健性监测。[1]以保障相应格式电子文件的长期可读、可解析、可理解。

2.格式管理对于电子文件长期保存的重要性

随着计算机的普及和办公信息化的推广,日常生活与工作中产生的电子文件体量越来越庞大,而且其中许多是原生性的电子文件,并无纸质版本作为备份保存。因此不管是作为业务留痕的需要还是信息保存的必要,都使得电子文件的长期保存成为数字时代档案工作面临的一项重要挑战,而电子文件的存储格式是影响电子文件长期保存的重要因素之一。在上文中已经了解到,电子文件大多是以某种编码形式存在的,其读取要依靠计算机软硬件环境。而在目前已知的技术更新频率下,技术淘汰给电子文件带来的威胁远远大于存储载体的腐坏给其带来的挑战。也就是说,一般情况下电子文件存储载体的寿命是大于读取它的软硬件生命周期的,与延长存储载体的寿命相比,延长读取电子文件的软硬件技术寿命显得更为重要。这就使得格式管理在电子文件长期保存过程中尤为重要,只有首先保障文件格式的稳健,才能考虑电子文件的长久利用和内容管理等进一步提升的问题。

3.基于文件生命周期思想的电子文件长期保存格式管理

将传统的文件生命周期理论思想应用到电子文件的长期保存格式管理工作中,就表现为针对电子文件随着在不同阶段中所属系统形态、功能定位、使用情景等方面的差异,档案馆应当相应地将文件格式转换为最适合的格式类型。在文件的生成和业务流通阶段,电子文件的主要功能是支持单位或组织机构的业务活动,格式方面的需求是易于传递和读取,因此应当选择适用性强、普及度高的文件格式进行存储,以文本文件为例,最适合选择DOC或PDF格式。在文件的归档、存储阶段,电子文件的主要功能是保存信息、业务留痕,其管理目的是为了保障文件的长期保存和长久可用,因此应当选择高质量的存储格式以尽可能多地保全文件内容和背景数据。而到了文件的提供利用阶段,则需要输出相对低质量的文件格式,仅需要满足文件可读可用即可。如音频文件在存储时使用WAV等格式存储,目的是在输出时避免用户下载使用RM等流媒体格式进行网络播放。这些都是不同阶段电子档案功能要求导致的变化。反之,为适应不同阶段对格式的质量或管理要求,在某些可控的情形下,就可以在电子档案的生成环节提前进行格式准备。比较典型的包括在数字化电子档案生成阶段进行多版本、多格式输出。

二、电子文件长期保存过程中格式管理流程分析

就我国目前的工作实际来看,档案馆对于电子文件的管理实际上更多的是后端控制。虽然我们提倡在电子文件的管理中注重前端控制,以提高归档电子文件的质量,方便后续管理工作的开展,但在实际工作中,由于形成单位数量众多,且业务规范也未达到完全标准化,工作人员业务水平参差不齐、档案意识薄弱,因此很难保证生成电子文件的质量和规范。具体到电子文件的格式管理上,虽然已有相关国际、国家标准对归档文件格式进行了规定,但就目前的状况来看,我国档案馆对于入馆文件的格式把控还是比较宽松的。格式管理工作一般都是在电子文件提交进馆后开展。结合文件生命周期思想,从电子文件的使用情景和所处阶段出发,相应的格式管理工作具体包括以下流程。

1.接收进馆阶段的格式规范与验证

电子文件“收”的阶段,档案馆主要的格式管理工作是对各单位提交到档案馆的文件进行格式识别、验证与登记。目前各国档案馆都已颁布了归档电子文件格式的要求及标准,我国也颁布了相应推荐标准,以规范文件格式,保障进馆电子文件的质量,为电子文件的可长期保存打下坚实基础。从标准内容分析来看,在电子文件长期保存工作中,各国都一致地倾向于选择格式开放、软件依赖程度低、结构化程度高的文件格式。但由于电子文件类型繁多,因此格式也复杂多变,在提交进馆后,档案馆还需借助于数字格式登记系统对电子文件的格式进行一一把控和管理。格式登记系统可以分别从应用环境和生命周期两个视角对电子文件的具体参数和各阶段变化关系进行分析与提取,方便其长久理解与持久维护。在档案馆的归档电子文件长期保存过程中,建立格式登记系统为档案馆监测文件格式、选择适用于长期保存的文件格式,以及电子文件日常维护和监测,输出合适的格式进行提供利用都提供了极大的便利和安全保障。

2.存储与管理阶段的格式转化

在电子文件“管”和“存”的阶段,其格式管理工作主要是选择合适的格式,以保障长期甚至永久保存过程中,电子文件的可读、可用。但当确定满足长期保存需求的格式后,档案馆还需要使用格式转换技术来将电子文件转换为适合长期保存的文件格式。由于归档电子文件格式不符合标准、不适宜长期保存等情况较为普遍,因此格式转换在实际档案馆电子文件长期保存的格式管理工作中较为常用。目前电子文件的转换方式主要有以下两种:一种是直接转换方式,即由源文件格式直接转换到目标文件格式。另一种是间接转换方式,即先由源文件格式转换到某种中间文件格式,再由中间文件格式转换到目标文件格式。[2]

3.提供利用阶段的输出格式选择

在电子文件“用”的阶段,其格式管理工作主要是选择合适的格式以最小的体积和最优的内容表达提供给用户进行阅览和利用。以文本文件的输出格式选择为例:XML格式是理想的用于长期保存文本文件格式,其结构化程度非常高,且可扩展,读取不依赖特定软件,但对于一般用户来说,其高度结构化的标记语言识读起来存在一定困难,更适合用于机读或文件间的互操作。而DOC虽然是微软办公软件的特有格式,属于私有格式,但用户友好度高,识读较为简单,基本属于“所见即所得”的状态,且支持编辑操作,相比XML更适合提供给用户进行阅览和利用。因此,在格式管理时,需要从电子文件的使用情景和所处阶段出发,选取相应的最适宜格式进行选择输出。

三、电子文件长期保存过程中格式管理的策略选择

1.建立配套标准体系做好前端控制

前端控制是确保各机关电子文件真实可靠、完整归档、安全利用和长期可读的有效策略。由于电子文件具有易流失、易更改等特点,在实际管理过程中较纸质档案难度更大。因此更应注重文件形成过程中的管理和干预,来保障电子文件的真实性、可靠性、完整性和可读性。最有效的方式就是建立与现有电子文件管理标准配套的电子文件归档格式标准,组成科学、有效的标准体系,来做好电子文件长期保存的前端控制工作。电子文件长期保存的格式直接关系着电子文件的长期可读性和可用性,我国可借鉴欧美电子文件的格式标准,进一步在标准的系统性、完整性和适用性等方面加以完善,促进标准制定主体的多元化,并适当引进和采用相关的国际标准,参考和借鉴发达国家的国家标准。逐步建立起电子文件长期保存标准体系,保障电子文件长期保存这一工作的科学开展和顺利实施。

2.建设格式登记系统做好格式管理工作

一个好的格式登记系统可以帮助我们理解电子文件的数字对象结构和内容,可以指导确定特定电子文件的迁移路径。对于电子文件的长期保存格式管理具有重要的意义。因此要想科学、高效地开展电子文件长期保存的格式管理工作必须先做好建设格式登记系统。将文件的格式信息、数据信息纳入日常监测和维护中,以保障电子文件的安全性、可靠性,是电子文件长期保存的有效和必要手段。

参考文献:

[1]梁娜,张晓林.数字文件格式登记系统[J].图书情报工作,2005(11):82-86.

[2]刘越男,祁天娇.我国省级、副省级档案馆电子文件接收及管理情况的追踪调查[J].档案学讯,2014(06):10-15.

作者:王玉敏 单位:社会科学文献出版社