前言:一篇好文章的诞生,需要你不断地搜集资料、整理思路,本站小编为你收集了丰富的电子档案的概念主题范文,仅供参考,欢迎阅读并收藏。
在我国电子档案管理的理论研究与实践工作中,普遍存在名词术语概念模糊、使用混乱的现象。术语使用的不统一、不规范严重影响我国档案管理的理论研究、实践工作以及国际交流的有效开展。其中最核心的概念———电子文件与电子档案,迄今没有明确、统一的概念区分。在理论研究中较多采用“大文件观”,将两者统称为“电子文件”而不作细分;在特定的情况下,尤其是在实际工作中,则往往根据需要自行命名与区分,存在较大的随意性。业界早已明确界定并达成共识的、最基本、最常用的“文件”与“档案”概念,在信息时代却遭遇随意使用与模糊处理,并因此而衍生出“文档”、“资料”、“记录”等概念,以便在需要时备选和使用,把原本简单明了的事情推向复杂含混的泥潭。
1.1概念区分的必要性
1.1.1理论研究的需要
统一讨论的焦点,这是顺利开展理论研究的重要前提。国际上,文件和档案在不同阶段对应的术语主要有documents、records、archives。这三个术语应该如何翻译,我国档案界也尚未统一意见,其中最大的问题在于对records的翻译。主流的观点认为应该将records翻译为“文件”,但也有学者提出应该翻译为“档案”[2],更有学者提出应该翻译成其他的术语,如“记录”[3]。事实上,records一词应该如何翻译,并不仅仅是文字使用上的差别,而是折射出我国电子档案管理理论中术语概念的模糊与混乱。正是因为我国尚未明确电子文件、电子档案的概念及其实质内涵,才导致翻译时的混乱。在我国,对于电子环境中的文件和档案,人们普遍称之为称为“电子文件”,其理由是两者的界限并不像纸质文件与档案那样清楚。[4]这种说法并不完全符合实际。尽管电子档案是由电子文件转换而来的,但是两者的内涵与外延并不相同。倘若都统称为“电子文件”,则是忽略了电子档案特有的价值形态与本质特征,不利于正确认识处于生命周期不同阶段的电子文件和电子档案的不同内涵与特征;更重要的是,将电子文件与电子档案统称为“电子文件”,在学术交流与讨论中往往会出现混乱局面,不同的研究者所讲的“电子文件”,可以根据各自的理解与需要任意指代整个生命周期的不同阶段而不作明确的区分。从理论研究的角度出发,明确区分电子文件与电子档案的概念已势在必行。只有明晰这两个基本概念及其内涵,才能统一学术研究与讨论的焦点,为理论研究和发展打下良好的基础:一方面,这有利于准确地翻译与引进国外的相关理论,更好地进行国际交流与合作,为我国的理论研究提供准确而有用的参考材料;另一方面,也有利于理清全生命周期中电子文件阶段与电子档案阶段的研究重点与相关理论,明确档案学界的研究对象与研究领域,真正建立起电子档案管理的理论体系。
1.1.2实践工作的需要
明确管理边界,这是顺利开展档案工作的重要前提。处于整个生命周期连续管理过程中不同阶段的文件和档案,其管理对象、方法及过程均有所不同。但目前我国档案界的主流思想仍持只有“电子文件”、没有“电子档案”的观念。倘若统称为“电子文件”,那么我国档案部门的工作范围与管理权限就变得模糊不清,反而给档案工作自身的发展设置了思想、观念以及行动上的障碍。从实践工作的角度出发,亟需区分电子文件与电子档案的概念。这一方面有利于档案部门在分清处于不同阶段的电子文件与电子档案的内涵、管理边界、管理方法、管理系统功能要求的情况下,更好地开展核心业务;另一方面也有利于明确档案部门拓展业务边界的努力方向。档案部门针对纸质载体开展现行文件利用的成绩和事实证明,我们的确不需要通过模糊文件与档案的概念来为拓展业务提供理论支持,因为含混的逻辑永远支持不了清晰的主张。
1.2概念明晰
尽管纸质档案与电子档案的管理大不相同,但其生命周期的特征却是相似的。因此,可以参照纸质档案管理的相关概念,对不同阶段所对应的术语进行明确区分:EDMS中流通的是电子文件,其对应的英文术语为electronicdocuments,而ERMS和数字档案馆中的均为电子档案,其对应的英文术语为electronicrecords。
2电子档案管理的逻辑起点
前端控制、全程管理的管理原则主张将档案管理的工作起点尽可能地向前延伸,从“文件形成”、“系统设计”开始,把需要和可能在“文件形成阶段”实现的要求尽量在“文件形成阶段”实现,并对“文件”的整个形成过程实行管理控制。然而在实际工作中,档案部门没办法将档案管理工作延伸到“文件形成阶段”,毕竟文件形成部门有其自身的职责范围,档案部门并没有实际的管理权限去要求、控制文件如何形成。真正意义上的全程管理不仅是档案管理,而应是类似于“大文件”管理的宏观管理,或许这样才能做到前端控制。对于电子档案管理的逻辑起点,可以参照传统档案管理的方式进行思考与确认。
2.1纸质档案管理的逻辑起点
在传统纸质环境下,档案工作的开展始于文件的归档。尽管从档案的定义及其形成的客观规律看,“归档”不是文件成为档案的必经环节,譬如一份历史档案,或许它并未经过“归档”也能成为档案;但从档案管理的实际业务流程来看,归档是档案管理工作中不可或缺的环节,它标志着文件工作的完结,管理责任与权限由业务部门转移至档案部门,也意味着对文件保存价值的认定。因此,在传统纸质档案管理中,“归档”具有相对固定的时间,是明确的文件工作逻辑结点和档案管理工作逻辑起点。需要强调的是,本文所探讨的电子档案管理逻辑起点是针对实际管理流程而言的,以“归档”作为逻辑起点,并非指归档是文件成为档案的必要条件。
2.2电子档案管理的逻辑起点
按照传统意义上的归档来理解电子政务系统中的文件归档,仅指将具有保存价值的电子文件赋予档案属性并纳入档案管理范畴的过程。[15]但由于电子文件具有与纸质文件不同的特征,如不及时、全面将文件及元数据归档,很可能会造成数据的篡改、损坏或丢失。因此,档案部门有必要将归档工作前移,这样才能实现与业务系统的无缝对接,更好地维护档案真实、完整、安全。在广东省党政机关全面推广的档案管理系统中,归档被分为预归档和正式归档两个环节。在预归档阶段,业务部门按照归档要求最大范围地将文件资料及其相关元数据进行预归档,档案部门对此进行审核、鉴定,最终对具有档案价值、符合要求的电子文件进行正式归档。经过两个环节的“归档”,可以使最终形成的电子档案更加真实、全面地反映形成机关的业务活动,更好地保证档案的原始记录性。由于电子文件具有特殊性,要维护其完整性、真实性,档案部门需要在预归档阶段对电子文件进行审查与鉴定,如不符合归档条件则退回形成部门进行补充完善,系统也会显示所缺失的要素。电子文件预归档后,档案部门对预归档的电子文件具有管理权限,因为电子文件一经预归档就被固化,不可再更改,之后的任何操作都会作为审计日志内容记录下来,档案部门需要对预归档的文件进行维护与审查。在国外的理论和实践中,都强调电子档案管理系统(ERMS)通过捕获纳入具有档案价值的信息。所谓捕获(capture),是指将文件或数字对象纳入档案管理系统(ERMS),设定元数据对文件进行著录并将其置于背景之中的过程,从而使文件得到长期、恰当的管理。[6]从电子文件捕获的操作范围、时间、方式来看,捕获与传统归档有所区别,捕获的对象可以是任何电子文件,而归档的对象只是具档案保存价值的电子文件,前者的范畴大于后者,[7]且二者在实际工作中不属于线性流程关系,我们也不能笼统地把传统的归档等同于捕获。但从实质上说,文件的捕获对应于本土化的语言和管理方式也就大体相当于归档工作的预备阶段。因此,结合我国国情,并参照广东省党政机关档案管理系统建设的实际情况与成功经验,可将“预归档”看作国外的“捕获”,这样的理解更加符合我国“本土”情况,更容易将电子档案管理工作与传统档案管理工作相对应,便于明晰归档或捕获是电子档案管理工作的逻辑起点。对电子档案管理而言,其实际工作的逻辑起点与传统纸质档案管理一致,只有文件业务和管理的相关工作结束,作为文件归宿的档案管理工作才能正式开展。从实际管理权限来看,相比传统档案管理,虽然电子档案的归档时机有所提前,在实际工作中可表现为电子文件的预归档或捕获,但电子文件的预归档赋予档案部门审查与鉴定的权力,正式归档则是赋予其保存与维护的职责,因此,归档意味着文件工作的结束,也标志着档案工作的开始。
2.3明晰逻辑起点
无论是纸质档案还是电子档案,档案管理工作都是从档案部门获得实际管理权限开始的。实际中若没有相应权限,管理工作就无从开展,如把档案管理前伸到文件形成及其信息系统的设计阶段,在事实上是难以做到的。在电子政务系统中,档案部门的工作从文件预归档开始,文件在办公自动化系统(OA系统)中形成和办理之后,及时将其进行预归档或及时捕获,至此,档案部门对电子文件有了实实在在的管理权限,即便这些文件还未经过正式归档,档案工作实际已经由此展开。综上,电子政务系统中的归档可分为预归档和正式归档两部分,而结合我国实际情况,可将预归档看作国外所提出的“捕获”。与纸质档案管理相对应,档案部门从文件预归档环节开始就对其具有实际管理权限与责任,管理工作就此展开,文件工作也就此结束,因此,电子档案管理的逻辑起点仍是归档或捕获。
3全程管理与前端控制的理论反思
全程管理与前端控制已经成为业界普遍提倡和认同的原则和理论,特别是前端控制理论,更被称为“电子文件时代的新思维”。[8]“全程管理原则是指对电子文件从其产生、流转到永久保存或销毁的整个生命周期进行全过程的管理,形成一套无缝衔接、系统完整的管理链条”。“前端控制是指为了确保电子文件的完整齐全、真实可靠,档案部门和档案工作者应该在电子文件生成之初(甚至是电子文件管理系统设计之初)就对电子文件进行前期的监督与控制”。[9]
3.1全程管理与前端控制理论的不合理之处
3.1.1现实中的尴尬
无论全程管理还是前端控制,都是从档案部门的角度出发,强调要从形成阶段开始对电子文件的整个生命周期实行管理。然而,这两个理论在现实中存在一定的矛盾与尴尬:如果实现了对整个生命周期的管理,那么是将档案部门视为全过程的管理者,此时并不需要强调所谓的“前端”与“后端”,因为它们都被档案部门共同规划和管理着,应该受到同等的重视;而如果强调前端控制,则是将档案部门视为后端的管理者,在这种情况下,档案部门对前端的管理在实际上难以实现。因此,这两个理论不仅本身就存在逻辑关系上的矛盾,而且在实践中也存在难以实现的尴尬。
3.1.2实践中的不可行
InterPARES项目的主持人露西安娜•杜兰蒂教授在第十七届国际档案大会上指出,在从电子文件到电子档案的整个生命周期中,文件的形成者和档案的保管员共享管理者的角色和职责。[10]也就是说,在实践中,文件的形成者与档案的保管者各有分工、各有权职,双方在实践中并不存在谁领导谁,或者谁管理谁的情况,而是作为不同阶段的管理者,分别承担从电子文件到电子档案这一完整生命周期的管理责任。对于我国的机关档案室而言,它的工作前接文件形成部门,后接档案馆,正处于整个生命周期的“中端”。一般而言,我国机关档案室与业务部门之间是平等的业务流程和业务支持的关系,并不存在领导关系,因此档案室无权对前端的业务部门进行管理;机关档案室与档案馆之间也只有业务交接关系,无权对档案馆工作进行干预。因此,机关档案室无法实现前端控制,更无法做到全程管理,应该认清自身在整个生命周期中的枢纽地位,充分发挥“承前启后”的作用。只有各司其职,才能保证电子文件和电子档案管理全过程流畅、规范、安全。因此,在实践工作中,档案部门的职责应该是负责电子档案的管理与保存,并从整体出发,积极关注与参与相关工作,而不可能做到针对电子文件的“前端控制”,或担负起电子文件和电子档案全生命周期的“全程管理”。
3.2机关档案室在全生命周期管理中的定位
从理论和实践上看,档案部门都无法做到全程管理与前端控制,档案部门的职责是保证归档文件真实、可靠、完整、可用。机关档案室既是电子政务建设的组成部分,也是数字档案馆接收永久电子档案的直接来源,处于整个生命周期“中端”位置的它,更应该具有手明晰的定位。
3.2.1建立极具包容性的档案管理系统
对电子档案管理系统而言,与业务信息系统之间的接口是保证电子文件归档原始性的关键,只有最大限度地接收并保存形成单位所移交的文件,才能保证后续的档案管理工作正常开展,更好地发挥档案部门的作用。因此,机关档案室应建立极具包容性的档案管理系统,接收并保存前端形成的电子文件,并保证其真实性、可靠性、完整性和可用性。
3.2.2开展专业的档案管理工作
机关档案室的工作包含两个方面:一是要提供多途径的档案检索与利用服务,为机关管理和机关职能活动提供必要的档案信息支持,同时也要充分发挥专业优势,为本单位的信息化建设提出专业性的档案管理需求与意见;二是要向档案馆移交长期保存的电子档案,确保移交档案的完整性与档案管理的连续性,为档案馆工作提供必要的基础支撑。此外,当下我国的数字档案馆建设还处在起步阶段,机关档案室作为档案信息化的先行者,可以为数字档案馆的建设提供有用的实践经验与参考实例,促进数字档案馆建设工作的顺利开展。因此,对于机关档案室而言,其工作具有十分重要的枢纽作用,更应该明确自身的工作定位,确保从电子文件与电子档案管理的连续性。
3.2.3积极关注全过程管理
正如露西安娜•杜兰蒂教授所强调的:随着InterPARES研究的深入,将继续证明这样一种观点———不采取全程管理的眼光,就不可能保管电子档案。[11]而早在1997年国际档案理事会的电子档案管理指南中,也指出档案部门在电子文件、电子档案全生命周期中职责的有限性。[12]对此,我们的理解是:全程管理是一个多部门分工协作的过程,档案部门作为其中的一个重要角色应该具备整体的眼光,为全过程管理提出相应的意见与建议,积极参与电子文件相关管理规范、标准等的制定,做到“全程关注”。具体来说,机关档案室可根据档案管理的业务需求,为前端文件形成部门提出工作建议,为本单位的信息化建设提供参考意见,并为档案馆积累和输送档案。
4电子档案的真实性问题
电子档案的真实性是档案部门尤为关注的核心问题之一。电子形式载体与传统载体的巨大差异使得信息记录难以具有传统载体的稳定性和固化性,对于以维护档案原始记录性为使命的档案部门而言,这无疑带来了新的管理问题。在实际工作中,机关档案室担负着接收和整理电子文件的重要职责。在电子文件转化成为电子档案的过程中,机关档案室在保障电子文件和电子档案真实性中的作用和责任是重要而有限的。
4.1真实性的内涵
在国际上,以InterPARES项目为代表,围绕电子档案的“真实性”问题做了许多研究,对于Inter-PARES词典中“真实性”(authenticity)这一概念的定义,[13]笔者的理解是:指一份记录作为档案的可信赖性,即档案与它在文件阶段形成时的原始状态一致,没有被篡改或误用。这一理解中的“真实性”是针对档案而言的,这也与我国档案管理工作的权限与职责相符,即维护档案的原始记录性。在我国的研究中,则将“真实性”需求划分为两个方面:一是文件在形成过程中的真实,即一份文件客观反映和真实记录了机构业务活动;二是文件在形成之后的真实,表现为文件(档案)在业务活动结束之后的生命周期里未被更改,仍然保持产生时的本来面貌。[14]对应上述概念,真实性要求可分两个部分:一是形成的电子文件在移交到档案保管者那里之前是真实的,即文件的真实性,包括两层含义———文件未被篡改、损坏,以及文件内容真实性即文件所记录的内容是真实、客观的;二是对被移交到保管者那里的电子档案的真实性,在实际工作中表现为文件在业务结束被归档后,仍保持其原始面貌,即对文件真实性的维护。
4.2真实性保障的内在要求
我国研究中“真实性”所包含的两方面要求实则对应了文件形成部门与档案部门不同的管理职责。对于文件的真实性及文件内容真实性的保证,关键取决于文件形成部门,而非档案部门;对于文件原始面貌的维护才是档案部门应有的职责。保障和延续电子文件真实性的任务是由文件形成部门和档案部门共同承担的,其中,文件形成部门起决定性作用,档案部门则对“真实性”进行拷贝与维护。(1)形成部门决定文件真实性。首先,文件在生成和办理过程中是否被篡改或破坏,是前端文件形成甚至系统设计与维护的工作,并不是由档案部门决定的,档案部门负责保障归档后的文件不被篡改或破坏,而不能保证文件在形成过程中没有遭受损坏。其次,文件的内容与客观事实是否相符,更应由文件形成单位负责,绝非档案部门可以决定。如果形成单位都无法证明形成的文件是否与客观工作、事实相符,档案部门更加无法去探究前端系统中文件的可信度。因此,文件形成单位负责保证文件形成过程的真实性,档案部门不应该也无法干预这个过程。也就是说,形成单位给了档案部门怎样的文件,原则上档案部门的职责就是尽最大可能地保存其原始状态,不会因为文件的真实性有一点瑕疵而不予归档保存。形成单位提交的档案是真实的,档案部门得收,即便提交文件的内容不是完全真实的,档案部门也得保存其原始状态,因为这种不真实的电子文件依然是业务工作的真实记录。(2)档案部门维护档案真实性。虽然文件的真实性不由档案部门决定,但文件一经归档成为档案后,档案部门就有义务与责任保证归档后文件(即档案)的真实性,如在管理过程中出现档案被篡改或误用的情况,档案部门就需对此负责。从对In-terPARES项目“真实性”定义的理解出发,针对档案真实性,档案部门需要防止归档后的档案被篡改或误用,保证档案的原始状态,以维护其真实性。由此可知,拷贝电子文件的真实性,并尽最大可能为电子档案的保存提供合适的环境,维护电子档案的原始性与真实性才是档案部门的职责所在。此外,档案部门应对前端文件形成部门给予相对充分的信任,因为不仅仅只有档案需要“真实性”,文件形成单位的工作开展也同样需依赖文件的真实属性。
4.3档案部门对真实性的管理职责
总的来说,档案部门的责任在于固守档案的本质属性,维护电子档案的真实性,而非保证电子文件的真实性。并且要明确,不仅应在保存过程中维护档案真实性,还应在为用户提供检索利用时对真实性进行维护。因此,档案部门的职责实际与传统档案管理相一致:第一,在文件归档时验证其真实性,尤其是对元数据的完整性和合规性情况进行鉴定;第二,建立包容性极强的档案管理系统,以更好地在文件归档和档案移交时实现真实性的对接与拷贝,以包容性管理来维护归档文件的原始性,从而最大程度地保证归档文件的真实性;第三,在未来的保存、迁移、利用中持续地维护电子档案的原始性、真实性。
5电子档案的长期保存问题
电子档案的长期保存是档案部门和档案学界共同关注的重要问题之一。
5.1研究概况及其逻辑根源从档案学界的研究情况看,电子档案长期保存研究希望解决的关键问题是保证电子档案具有长期的真实性和可读性。电子档案载体技术的天然特性给长期真实性和可读性带来了与纸质载体全然不同的管理障碍,主要表现在对设备的依赖性、信息与载体可分离性、易更改性等方面[15]。以此为出发点,国内绕这一问题开展了较多研究,其中,从我国的具体研究主题看,现有的相关研究主要从电子档案长期保存中涉及的保存策略[16-17]、格式要求[18]、合作机制[19]、标准体系[20]、技术方案[21-22]等方面展开,同时也不乏对国外研究与实践的介绍[23-24],以及特殊形式档案信息资源长期保存问题的研究[25]。在上述研究中,目前已经形成仿真、封装、迁移、开放性描述等一系列共识性的管理策略。从总体而言,国内外档案学界对该问题的研究基本都可概括为“策略性”研究。这一研究的根源在于,使电子档案具有长期的真实性和可读性。然而深入分析这一问题的研究特点,我们可以发现,在电子档案的长期保存问题中,档案学界与档案部门实际上具有一定的职责侧重和特定的角色定位。
5.2反思档案管理工作原则在传统的和电子化的档案管理中,我们可以总结出档案管理工作的固有原则,这些原则主要体现在两个方面:一是电子档案的长期保存问题并非档案界可以独立解决的,档案部门应当突出自身的专业特色与核心职责;二是档案部门在电子档案的长期保存中,应该对电子档案的真实性、可读性实行维护性的管理。具体而言,在电子档案长期保存策略之中,仿真、封装、迁移等措施的根本性技术是由计算机技术研发领域提出、攻关和实现的,档案界则是通过对这些技术进行分析、选择和应用,来构建电子档案长期保存的适用策略,从而实现电子档案的长期保存。其中,档案界的角色是技术的选用者以及策略的研究、制定和实施者,而非关键技术的主要研发者,因此档案界对电子档案长期保存的贡献主要在于管理策略。以纸质条件为参照,我们同样可以发现相似的角色定位。在纸质档案的长期保存中,为了保证纸质档案具有长期真实性和可读性,档案部门采取的措施主要包括档案实体的物理管控以及档案文献修复工作,其目的是保证档案不被篡改、信息内容可读和档案实体存续。从根本上而言,档案部门无法决定纸张的使用寿命,因为这最终取决于造纸技术;档案部门也无法决定档案形成机构的纸张选择,因为这取决于档案形成部门业务活动的需要。在纸质档案的长期保存中,档案部门的角色与职责是在获取档案的管理权限之后,将档案放置在一定条件下进行维护性管理,其根本目标并非“绝对永久”地保存档案实体,而是通过管理性、技术性策略,尽可能地延长档案实体保存时限,使档案能够尽可能长久地为社会提供利用服务。因此,从时间和空间上看,档案部门对纸质档案长期保存的管理职责具有相对独立性,与业务部门、技术研发者之间存在明确的角色区分。电子档案的长期保存与上述情况具有本质上的相似性,在社会技术的发展中,档案部门应该以相对稳定的管理职责与管理方式来应对社会活动方式的多元化趋势,因此档案学界和档案部门都应该找到并明确档案长期保存工作的核心价值与角色定位,从而以具有学科特色的管理体系来完善实际工作。在近年国外与国际性的实践中,同样体现着这样的逻辑关系与工作原则:(1)OAIS参考模型。OAIS参考模型的制定者是美国空间数据系统咨询委员会(CCSDS),美国的ERA、英国的Cedars、加拿大的ADRI等项目都以该参考模型为电子档案长期保存研究和开发的基础。[26]档案界等保管领域并未研发出这一根本性的架构模型,而是对OAIS模型进行分析与应用,是制定管理策略的重要依据。基于OAIS的长期保存管理模式又体现着维护性的管理思想,比如OAIS模型提倡通过档案信息包进行长期保存,而使用信息包向利用者提供档案利用,从而保证档案信息包的安全、稳定。(2)Inter-PARES研究项目。InterPARES项目的开展离不开其他学科领域的参与和支持,在电子档案真实性维护与长期保存的研究过程中,该项目吸纳了来自法律、历史、计算机技术与工程、信息科学及化学等多学科的专家学者为其提供专业领域的智力与技术支持。[27]档案界从其他学科领域提供的专业知识中,选用与管理目标相契合的技术和方法,明确管理取向与管理需求,制定管理策略。(3)美国NARA云归档计划。美国NARA2014-2018财年的战略规划明确将云环境下形成和使用的档案纳入管理范畴。针对这些档案,主张研究和推进“云归档”及相关的保存策略。[28]这也反映了“维护性”的管理思想———提倡档案部门在尊重档案形成机构活动方式的前提下,以固有的档案管理原则与方法为基础,形成对前端活动方式具有适应性和包容性的管理策略,保证从既有活动交流方式中形成、固化的档案材料得到及时、有效管理。
5.3对电子档案长期保存实行维护性管理
从工作性质上看,电子档案的长期保存无疑属于档案部门的工作职责范畴;然而从更深层的内在需求上看,其工作效果却并非仅仅取决于档案部门。档案部门在电子档案的长期保存中具有相对独立的工作职责与角色定位,这不仅根植于档案工作的核心价值,也是社会分工专业化的发展需求所致。因此,在电子档案的长期保存问题中,档案部门应进一步反思自身的根本价值、固有原则、社会意义与实际边界,档案学界则应以此为基础继续开展更具专业意义的理论性与应用性研究。
6电子档案管理的双套制现状与单轨化趋势
电子档案与纸质档案的双套制归档与双轨制管理是社会发展迈向信息化时代初期的普遍做法,在主流信息载体从纸质向电子更替的过渡性时期,双套制与双轨制为档案管理提供了一种有效的解决方式。然而随着技术发展与社会活动方式变化,双套制与双轨制则显现出了一定的不适应性。
6.1双套制与双轨制面临的挑战
在档案信息化建设中,“双套制”指文件归档后纸质版本与电子版本共存,或称“双套归档”;[29]目前档案学界对“双轨制”的定义可以总结为,在文件形成、流转的全过程中,电子形式与纸质形式始终共存,这实际也意味着在文件流转的终端,也将以“双套制”进行归档,在档案管理的过程中也仍然按照“双套”执行管理,因此双轨制既是文件管理的“双轨”,也是档案管理的“双轨”。一般认为,双套制和双轨制的优势在于,对电子形式而言安全可靠,对纸质形式则便于查询利用、整合共享,二者形成互补的效果。[30]这也是双套制与双轨制得到广泛应用的内在原因。尽管如此,随着计算机技术的发展和普及,社会对于以电子形式为载体的活动方式越发适应和依赖,纸质形式逐渐成为电子形式的一种“硬拷贝”(hardcopy),双套制与双轨制从以往以纸质为主转变成为以电子为主,这就使得双套制的管理方式产生了一定的弊端:(1)资源浪费。从调研中发现,实际工作中许多单位往往会在文件阶段以电子形式形成和流转,到归档时就将电子形式的文件打印成纸质硬拷贝,再将电子版与纸质版同时归档,在档案管理过程中,需对两个版本同时进行维护;而在档案部门进行档案数字化建设时,往往由于电子版本管理不善或未予归档,而又要将纸质档案统一进行扫描,形成电子档案。在这一反复处理的过程中,实际对资源造成了不小的浪费。由于电子档案的管理不善,同时造成重复劳动和存储空间的浪费,而在电子—纸质—电子的转换过程中,期间又经历了并不必要的纸质形式阶段,直接导致纸张资源浪费,也对档案管理人员造成了更大的工作负担。因此,如果能够完善电子形式的管理手段,就能避免出现上述资源浪费的问题。(2)对档案原始性与完整性的管理失效。双套制与双轨制在管理效果上无法实现对档案真实性与完整性的有效管理。对于以电子形式形成、流转的原生电子档案而言,通过打印硬拷贝归档,实际造成了背景信息(context)的损失———无法有效保留支撑电子档案真实性、完整性的元数据。如此一来,后续对于纸质版本档案的管理,其客体对象都是原始性已经损耗的档案,这种纸质版本仅承载了档案的信息内容。对于原生电子档案而言,只有同质归档管理才能最大限度地一并保存其重要修改记录和相应的元数据,也才能最大限度地保护档案的原始性与完整性。从管理流程而言,采用完整的同质流程对电子档案进行收集、保管、利用、传输和移交,是对电子档案原始性和完整性的连续性管理。因此,对于以原生电子档案为主且具备一定条件的单位或领域而言,电子档案管理单套制和单轨制是更具适应性和有效性的管理方式。
6.2双套制与双轨制的根源分析与转变需求
双套制与双轨制的广泛推行,从其根源上而言,可以说是出于对电子形式载体原始性、稳定性的不信任,因而对电子档案采取相对谨慎的管理方式。在信息化建设早期,由于电子形式载体管理技术尚未成熟,电子档案瞬间丢失、无法找回,或篡改不可溯的现象比比皆是,相较之下,纸张的稳定性与可控性远远优于当时的电子形式载体,并且纸张的使用为人们所熟悉和信任,因此,双套制和双轨制成为档案管理中的通用方式。在后续研究中,学者们对电子档案的“原始性”问题展开了研究,提倡以“真实性”、“可靠性”等概念对纸质条件下的“原始性”进行拆解诠释,以此取代传统的“原始性”观念。[31]随着对电子档案真实性问题研究的深入,目前已经形成有效的电子档案真实性问题解决思路与实施技术,电子档案管理者与使用者对于该问题的观念也正逐渐发生变化。实际上,在社会生活的其他领域,电子形式这一虚拟化的信息载体已经得到广泛应用。比如,在银行业务、证券业务、电子商务等事务中,数字化信息早已成为业务活动中的主要甚至唯一形式,社会对于这类事务几乎不存在不信任感,对电子形式予以信任在这些领域中习以为常;会计档案管理领域也正积极开展电子档案管理单轨化的推进工作,国家发改委办公厅、财政部办公厅、国家税务总局办公厅、国家档案局办公室于2013年12月向多市、多单位通知(发改办高技[2013]3044号),要求各单位组织开展电子发票及电子会计档案综合试点工作,据了解,相关工作已经取得一定进展和成效。可见,在以电子形式为业务活动开展主要方式的领域,其对于电子形式信息的信任度较高,也更积极推动相关技术的改造和应用,推行业务全流程电子化。对于档案管理而言,随着技术发展与社会活动方式变化,对于电子形式等虚拟载体的不信任将逐渐消退,并建立起稳定的信任感。任何主流载体都不是等到真实性能够得到完全保证,且长期保存问题得到完全解决时才得以普遍使用的,社会选用一种介质作为主流信息载体往往是出于实用主义的考虑,即满足方便、快捷、可共认等基本要求即可。这其中对于载体实际也有一定的真实性和稳定性要求,不具有真实性、稳定性的载体是无法成为主流介质的。档案部门对于这种真实性和稳定性固然具有更严格的要求,然而随着电子形式日益普遍化,计算机领域也正不断完善其技术特性,从而使其更好地满足社会活动需要。因此,档案部门的专业性管理要求应该通过完善管理策略、优化管理流程、巩固管理制度、改善管理方法来实现,从循序渐进的实践中积累经验,逐步与技术部门共同建立起经过反复验证的技术管理体系与信任体系,为电子档案管理的单轨化提供支撑,从而满足原生电子档案长期真实性、完整性、易用性、可读性、安全性的要求。
6.3国际趋势———电子形式单套制归档与单轨制管理
电子档案的单套制归档与单轨制管理也正成为许多国家机构的趋势。目前,美国、澳大利亚等国家都逐渐推进电子档案的单套与单轨管理,而不再形成或接收纸质档案。(1)美国。2012年8月24日,美国总统办公室以备忘录形式,向联邦各机关由管理预算办公室(OMB)和国家档案馆与档案管理局(NARA)制定的《政府档案管理指令》,其中目标1.1和1.2要求分别对电子档案和电子邮件以电子方式实行“单套制”管理:①到2019年,联邦机关将以电子形式管理所有永久电子档案;②到2016年,联邦机关将以可利用的电子格式管理永久及定期电子邮件档案。[32](2)澳大利亚。自2011年7月起,澳大利亚国家档案馆持续敦促所有联邦政府机构向电子形式的档案管理转型,鼓励其以电子形式形成、管理和保管档案,并在必要时对接收的纸质文件进行数字化扫描,从而不再形成新的纸质档案。[33]上述实践都反映出同一趋势———当电子形式成为主流活动交流方式时,档案部门也应对电子档案实行适应性的全电子化管理。从上述国家的推行力度看来,这对于许多领域而言,既是必然的趋势,也是迫切的需求。6.4推动我国电子档案管理单轨化原生电子信息的规模化应用是社会发展历程中的一种“自然选择”结果,要最大程度地维护原生数字记录的原始性与凭证性价值,就要实现电子档案的单套制归档与单轨制管理,这也是档案信息化建设的目标之一。在我国,双套制与双轨制管理已经显示出一定弊端,许多领域的电子档案管理单轨化具有必然性与迫切性。要推动我国电子档案管理单轨化,首先应该建立起对电子形式虚拟载体的信任,其次应该加快完善管理策略、制度、流程和方法,在巩固自身理论和方法的同时,加强与其他领域的合作,从实践中积累经验,逐步完善法规体系,在必要领域尽早实现电子档案的单套制归档和单轨化管理。
7结语
关键词 云技术 电子档案 新路径
中图分类号:TP392 文献标识码:A
如何对电子文件进行安全有效地管理,以便更好地开发利用电子文件信息资源,已成为人们普遍关注的一个热点问题。云计算技术产生的背景就已经传递着云计算的最终目标是将计算、服务和应用作为一种公共设施提供给公众的信息,使人们能够像使用水、电、煤气和电话那样使用计算机资源,云技术的应用将给人们的工作生活带来前所未有的变化。
1传统电子档案存储的缺陷
1.1电子档案所依赖的载体寿命问题
电子文件归档与管理系统、数字档案馆管理系统等应用系统的研发和运行维护是很多档案部门较为头痛的工作,频繁购买复制的载体介质也会在使用时出现介质磨损问题,因为需要投入相当高的经费。
1.2电子档案所依赖的硬件技术更新问题
在电子档案保存的过程中会出现硬件和软件的技术库更新,目前多采用的是将数字信息从一种技术环境转换另一种技术环境的复制方法,总之,无论是那种方法都需软件和硬件技术更新而投入的开支。
1.3电子档案真实性、安全性的维护问题
电子档案的数据易受多方干扰,信息会被修改,从电子文件到档案的步骤要进行全过程监督和指导。另外自然灾害对档案的危害也非常大,在5・12地震中,部分地区的档案就遭受了巨大的损失,电子文件分散保管模式意味着在灾害发生后抢救档案的困难系数增加。
1.4服务于民众的便捷性问题
我国传统的电子文件一直主要实行分散异构的管理模式,这种模式下各种信息资源被分隔在不同物理空间,容易造成“信息壁垒”和“信息孤岛”问题,同时资源重复建设也带来了极大了浪费。且不利于更好地服务于民众的需求,更谈不上档案利用的便捷问题。
2云技术的概念和在电子管理领域运用的新路径
云存储技术是一个新的概念,是指“通过集群应用、网格技术或分布式文件系统等功能,将网络中大量各种不同类型的存储设备通过应用软件集合起来协同工作,共同对外提供数据存储和业务访问功能。在云计算环境下,用户观念从“购买产品”到“购买服务”转变,他们直接面对的将不再是复杂的硬件和软件,而是最终的服务,其具有以下几方面的优势:
其一,低成本经济实惠。使用云技术可以降低用户电脑的成本,因为计算机硬件都是云计算提供管理,降低维护成本。用户便可以获得快捷的服务,得到自己所需的信息。云计算的云端由成千上万台甚至更多服务器组成的集群具有无限空间,用户不再需要建立自己的数据中心,只需要向云计算服务商申请存储服务,支付较低的费用,即可享受存储服务。云计算廉价的超级存储服务能为解决未来的电子文件存储问题提供解决途径。
其二,虚拟化云加端服务。利用软件来实现硬件资源的虚拟化管理、调度及应用是云计算平台的最大特点。用户只需要一个终端,笔记本、一部手机,或者是一台带有云功能的电视机,即可通过网络服务来实现需要的数据信息。
其三,超存储能力安全可靠。云端是由成千上万台甚至更多服务器组成的集群,它具有无限的空间。云计算中,电脑的崩溃不影响数据的存储,因为云会自动备份存储数据,且数据存储集中,便于数据中心工作人员对数据统一管理,实时监测,用户数据安全可得到最大限度的保证。由于用户资源不是放在某一台物理机器上,而是放在虚拟的云端,所以即使一台或多台机器进入脱机状态,“云”也能够继续正常运行,以保障用户信息的可靠和安全。
其四,服务定制灵活便捷。在云环境下用户根据需要定制服务、应用,且不需随身携带文档,只需终端在云计算模式中,相关数据也都存在云中。当用户需要团队合作时,即使身处不同地域的团队成员也能较快实现文档合作目标。 用户将自己所需信息“一网打尽”,还不受时间、空间限制,轻松获取自己所需信息。
其五,有助于减少对计算机技术人才的依赖。电子档案保管系统的设计、运行、维护工作具有较高的技术含量,对技术人才的要求也高。云计算环境下,企业与机构无需规划自己的数据中心,所需一切都由服务商搞定。不但节省用户终端资源,还可避免软件运行维护和随时更新带来的麻烦。用户不必关心资源在哪里、如何部署,只需要把自己的需求告诉云,剩下的工作就交给云。
参考文献
[1] 杨怡.云计算环境下的安全问题浅析[J].电脑知识与技术,2009(5).
[2] 祝庆轩,桑毓域,方昀.基于云计算的档案信息资源共享模式研究[J].兰台世界,2011(7).
[3] 卞昭玲,李俐颍,刘振鹏.云计算在档案信息共享中的应用[J].兰台世界,2011(7).
[4] 胡亚南.云计算在档案信息资源管理中的应用初探[J].兰台世界,2011(3).
作为一个具有开创性、实践基础较为薄弱的规范性文件,《办法》中的一些要求和条款有多个首次和关键点,需要在贯彻落实中准确理解和重点把握。
电子档案概念的启用
信息技术在各行各业的普遍应用在我国只有十多年时间,作为信息化发展的重要产物,对电子文件、电子档案管理重要性的认识及其有效实践,时间更短,我国相关部门对电子文件管理的研究和制订一些规章标准,大多借鉴欧美信息化发展较早国家的经验和成果。基于电子文件、电子档案产生时间短,强调电子文件前端控制、全程管理的要求,中外文件档案管理体制的差异等方面原因,多年来,我国在学术研究、规章标准制订中一直使用全程电子文件、大电子文件的概念,而较少使用电子档案的概念。《办法》首次在国家行政行政管理部门的规章或标准中使用电子档案的概念,并给出了定义;“本办法所称电子档案,是指机关、团体、企事业单位和其他组织在处理公务过程中形成的对国家和社会具有保存价值并归档保存的电子文件。”从定义中可以看出,电子档案是由电子文件经过归档环节转化而来,其相关要求和基本属性跟纸质档案等传统载体档案没有根本区别,只不过具有电子属性,因此,电子档案的管理一方面要遵从电子环境下相关管理的规律和要求,另一方面,更要遵从档案管理的一般规律和基本要求。
档案移交的时间
档案移交时间的确定一直是比较敏感和纠结的问题。过去,为了方便利用传统载体档案,立档单位—直希望将其产生的档案保留在本单位时间长一些,但是,如果在立档单位保留时间过长,往往会带来库房紧张、安全隐患凸显等问题。现在,随着信息化手段的普遍应用,各单位机读目录的建立和档案数字化工作的推进,档案利用已经不是阻碍档案及时接收进馆的主要问题了。
对于电子档案而言,如果沿用过去对纸质档案等传统载体档案规定,15~20年再移交进馆,显然是不合适的,对电子档案的安全保管和长期可用都是极大的隐患。这是因为,电子档案的保存和可用特别依赖于计算机等软硬件环境,而信息技术到现在为止,仍处于高速发展期,3~5年后,其操作系统、格式软件、读取设备、存储载体等就会发生较大的技术变化,如果管理措施不能改进、技术手段不能更新,就很可能出现综合档案馆的管理系统不能读取各立档单位形成的电子档案的情况。也有些专家建议电子档案形成之后,即经过归档流程后,直接向综合档案馆移交,也就是一年移交一次。我们认为这样也不合适,这是因为,一方面,为了保证电子档案来源可靠,电子档案在移交时必须履行严格的移交接收手续,如果每个立档单位每年办理一次移交手续,对于一个综合档案馆来说,面对上百甚至将近二百个立档单位,每年都履行这样的手续,时间和精力都显得不足;另一方面,因为电子档案的接收和管理都要依赖于综合档案馆的档案信息系统,综合档案馆信息系统所要面对的是不同数据类型、不同系统产生的各式各样的电子档案,要想达到有效管理各立档单位产生的电子档案的目标,综合档案馆必须要对各立档单位产生的电子档案的情况进行调研,做好接收电子档案的设备和技术准备,才能启动电子档案接收工作,综合档案馆就需要有一定的准备时间。综合以上考虑,《办法》规定:“档案移交单位一般自电子档案形成之日起5年内向同级国家综合档案馆移交。对于有特殊要求的电子档案,可以适当延长移交时间。电子档案移交时间另行规定。”
移交与接收的流程
档案的移交与接收,不仅仅是档案实体和信息的转移,更重要的是档案管理的责任主体的变更,即从档案的生成单位——立档单位,变成档案的永久保管单位——国家综合档案馆。对于电子档案而言,因为其内容信息与载体的可分离、存储和读取对特定计算机软硬件设备的依赖、数据复制的便利等特性,电子档案在移交与接收时更需要遵循严格的工作流程,办理相关的交接手续,从源头上保证电子档案的可靠和可信。
电子档案移交与接收可采用离线或在线方式进行。不管采取何种方式,必须遵循《办法》规定的工作流程、办理必须的交接手续。电子档案移交与接收的主要流程为:档案移交单位组织电子档案数据、检验电子档案数据、移交电子档案数据,国家综合档案馆检验电子档案数据、办理交接手续、接收电子档案数据、著录保存交接信息、存储电子档案数据等。《办法》规定:“电子档案检验合格后办理交接手续,填写《电子档案移交与接收登记表》,由交接双方签字、盖章,各自留存一份;《电子档案移交与接收登记表》可采用电子形式并以电子签名方式予以确认。”
系统实现的难点
电子档案的移交与接收是必须基于一定的系统来完成的,《办法》仅仅规定了电子档案移交与接收的基本的、原则性的要求,在移交与接收工作中,还需要各级档案馆通过布置系统、配备设备、安排人员、建立制度来具体落实。
电子档案移交与接收工作是一项全新的工作,需要将信息技术融合、应用到档案管理工作中去,面临许多技术难题和挑战。为了切实做好电子档案移交与接收工作,国家电子文件管理部际联席会议办公室和国家发展改革委员会联合下达了电子文件管理试点工程项目,国家档案局牵头承担电子档案移交接收和长期保存系统建设工程项目。工程项目的主要内容是,建设电子档案接收和长期保存系统,并在上海、福建、重庆、青岛、杭州、广州6个省市档案馆及其对应的电子档案移交单位部署实施。国家档案局组织力量研究电子档案移交接收和长期保存的文件档案管理范围、管理流程、元数据方案、系统接口方案、四性检测方案等,提出系统的功能需求、设计方案、技术、软硬件配备要求等,并定制系统软件,由6个省市档案馆运行实施。试点试用一批规章和标准,形成可操作性的实施方案,验证规章和标准的合理性、可行性,提出合理化的建议。研究制订一批规章和标准,主要包括电子档案长期保存管理办法、重大建设项目电子文件管理办法、电子档案分类方案、电子文件长期保存需求规范等。在上述系统建设、规章和标准试点试用的基础上,国家档案局在全国综合档案馆推广应用该系统,进一步提高全国档案部门信息化能力。
在电子档案移交与接收工作和系统实现中,我们认为有以下难点需要组织力量研究解决。
电子档案移交数据构成要求。电子档案数据构成分两个方面,一是内容数据构成,比如文书类电子档案主要包括过程稿、签发稿、审批过程信息、元数据等,而业务类电子档案,其内容数据构成差异性就比较大,目前还没有形成统一的相关要求,需要各行业根据自身的业务特点研究提出具体规定;二是技术构成,技术构成是指电子档案体现的电子化特征,就是与信息技术相关的基本要求,如不同类型数据的格式、一“份”或一“卷”档案内容各种数据的关联方式和组织结构、电子档案数据与源系统或设备的依赖性或关联性、存储地址和方式等。
数据接口的技术实现。电子档案的移交与接收,本质上是数据从档案移交单位的档案管理系统或业务系统导出,和数据向档案馆信息系统的导入。由于当前信息化发展的标准化、规范化程度还比较低,各种办公系统、业务系统产生的电子档案,其系统类型、数据类型、设备类型种类多、差异大,如何保证档案馆信息系统能够接收所有立档单位的电子档案,并达到保持原貌、保证准确完整,是接收系统在设计开发时必须要重点解决的难题,特别是一些结构化数据,既要能够完整接收,又要保证准确读取,需要采用高技术、新手段来实现。
四性测试指标和系统实现方案。《办法》提出了在移交与接收过程中,交接双方都要进行四性测试。四性是指电子档案的准确性、完整性、可用性、安全性,《办法》里用准确性代替了常说的真实性,主要是考虑真实性涵盖的范围太大,具体指标不太好设定。而准确性主要是指在移交档案的组织和交接过程中检验档案的内容、范围的正确性及交接前后数据的一致性。《办法》附件3的填写说明对四性检验的内容进行了简单的解释,在移交与接收的实际工作中,还需要对四性的具体指标进行细化,并由系统实现自动检测。
一、现行文件和档案管理分别应用计算机技术阶段
现行文件应用计算机技术源于企业管理信息系统(MIS的建立,什么是MIS,解释不一。虽然各自的文字表述不尽相同,但有两点内涵是共同的,即其一,管理信息系统的建立是依托于企业管理职能系统,并为之服务。它一般都先从会计核算电算化开始,应用商品化的会计软件管理帐务、应收和应付帐款及固定资产核算。在会计核算电算化的基础上完成财务管理电算化,运用计算机辅助完成财务分析和编制财务计划。随后,把计算机技术扩展到采购、销售、库存及人事管理。运用计算机实现财务管理及这些管理在数据上的一体化处理,极大地提高了企业管理的效率。最后,再把计算机技术运用于生产管理,实现生产计划编制和生产指挥调度的计算机化①;其二,管理信息系统的职能主要是对正在形成的现行信息进行收集、加工及处理。
现行文件应用计算机技术是现代企业加强各项管理所需要的,是企业管理运用计算机技术的直接体现和必然结果。
档案管理应用计算机技术主要是用于档案整编、检索、统计及借阅等业务职能。主要包括:其一,用计算机编制档案检索工具。以著录项目组成档案机读目录数据库,然后按不同的要求,利用库内数据自动编制案卷目录、专题目录、分类目录等;其二,用计算机进行档案检索。按照档案著录项目中所标识的内容特征和形式特征,检索出符合不同利用者要求的档案目录及其原件;其三,用计算机对档案管理中形成的各种数据或情况,包括入库与出库数量、库存空间占有率,档案调阅、归还等进行登记与统计。
总之,在计算机技术应用于企业管理之初,现行文件和档案是各自分别运用计算机技术解决原由手工操作的各项文件管理工作。
二、现行文件和档案管理综合应用计算机技术阶段
由于现行文件和档案管理是具有承继联系的密不可分的两个阶段,所以任何一阶段应用计算机技术不仅会对另一阶段的工作带来影响,而且其系统功能的发挥也受制于另一阶段的工作状况。因此,为了实现现行文件和档案管理不同阶段文献信息资源的共享和交换,减少数据的重复输入,规范各系统的数据接口,就需要加强现行文件和档案管理综合应用计算机技术的研究,开发文档管理一体化系统软件。目前,一些企业已经自行开发或购买了文档管理一体化系统软件,进行现行文件和档案管理的综合化管理。
第二阶段不同于第一阶段的特点和难点在于,现行文件和档案自动化管理子系统之间的接口。现在各企业应用的文档管理一体化系统软件在其结构设计和功能上不尽相同。
不管企业应用的现行文件和档案计算机管理系统软件的结构与功能有怎样的差异,但它们基本上都是遵循现行文件和档案手工管理的程序和方法。计算机技术的应用仅是使原有手工管理更加规范化、系统化及效率化,并未对现行文件和档案管理基本理论产生根本影响。
三、电子文件阶段
电子文件这一概念的出现是近10年的事。1996年12月,国家科委在北京召开了全国CAD应用工程工作会议,会上宋健主任指示:这件工作要请国家技术监督局和国家档案局参加。国家档案局很重视电子文件的管理问题。1996年9月成立了“电子文件管理、归档研究领导小组”。②1998年1月9日,王刚同志在全国档案局长馆长会议的讲话上也指出:要在1997年研究制订的《计算机辅助设计电子文件应用光盘存储、归档及管理要求》试行稿国家标准的基础上,在35个企事业单位进行试点,为实现我国电子文件管理规范化和现代化探索办法和积累经验。③1998年8月11日-13日,国家档案局档案科学技术研究所召开了电子文件管理研究专家研讨会。该会的中心议题是对《电子文件归档及电子档案管理概论》和《办公自动化电子文件归档及电子档案管理方法》、《CAD电子文件光盘存储、归档与档案管理要求》两个标准的征求意见稿进行修改、补充及完善。④1998年8月18日-20日,在五洲工程设计研究院中国兵器工业第五设计研究院召开了CAD电子文件应用光盘存储技术宣讲演示会。⑤1998年8月23日,国家档案局科学技术研究所和外事办又联合承办了“电子文件归档管理国际学术研讨会”。可见,有关电子文件及其管理问题的研究与应用正在紧锣密鼓地进行。
关于什么是电子文件,美国联邦管理法规对其解释为“电子文件包括数字的、图形的及文本的信息。它可以记录在计算机能够阅读的任何一种介质上,并且符合文件的定义。”⑥国际档案理事会电子文件委员会的定义为“电子文件是一种通过数字电脑进行操作、传输或处理的文件。⑦我国《CAD电子文件光盘存储、归档与档案管理要求》GB/T17678-1999把电子文件解释为能被计算机系统识别、处理,按一定格式存储在磁带、磁盘或光盘等介质上,并可在网络上传送的数字代码序列。为了全面、准确地把握电子文件的概念,不妨从与其最临近的概念——机读文件入手。
机读文件仅指计算机识别的文件最早产生于本世纪40-50年代。这一概念经过近半个世纪的发展演变,至90年代逐渐被电子文件所代之。从机读文件到电子文件不仅仅是概念叫法的变化,而是标志着计算机技术应用于文件管理的不同发展阶段。弄清这两个阶段的差异,有助于深入认识电子文件的形成和管理特点。两者的主要区别在于以下四方面:
其一,生成环境。机读文件中的关键词是“机读”,即“能够由计算机输入装置读出的”文件。⑧所谓“读”包括两层含义:第一,通常指信息从一个存储区读到另一个存储区;第二,从某一形式的记录媒体,如磁带读出信息。⑨可见,复制和识别是机读文件的主要特点。在这一阶段,计算机读出的文件不是由计算机制成的,它源于纸质文件的输入。与机读文件不同,电子文件则包括在计算机上直接生成的文件。它是企业管理和科技开发信息化的产物,是研究和应用CIMS的必然结果。
其二,管理模式。机读文件的管理模式是模拟现行文件和档案手工管理的程序与方法,因此对原有现行文件和档案管理体系的影响是非本质性的。而电子文件的管理模式不是建立在独立的现行文件和档案的管理体系基础上,它是建立在管理手段与现代信息技术的高度结合的基础上。它要按照现代企业管理、科技开发及生产的要求重组管理体系,根据电子文件形成和作用的特点划分管理程序与方法。
其三,存在形式。机读文件的存在形式一般为磁带、磁盘及光盘等有形介质。而电子文件的存在形式则不仅包括有形介质,还可以是网络上传递的代码序列。
其四,管理者的构成。在机读文件阶段,纸质文件管理者是文献信息管理者构成的主体,而且文献信息管理者是独立的群体。而在电子文件阶段,电子文件信息管理、开发人员和载体维护人员将是文献信息管理者的构成主体,但文献信息管理者将不再是独立的群体,文献信息管理者已不能独立承担起文献信息管理职能。文献信息管理系统功能的发挥将取决于文献信息管理者、企业管理及技术开发人员的有机结合和共同努力。
电子文件是以代码形式记录于磁带、磁盘、光盘等载体,依赖计算机系统存取并可在通信网络上传输的文件。电子文件的两个基本特征:
第一,电子文件是由电子计算机生成和处理,其信息以二进制数字代码记录和表示,因此亦可称为“数字文件”。第二,电子文件是文件的一种类型,应该具有文件的各种属性,特别是要有特定的用途和效力。
从逻辑上说,电子文件是“数字信息”和“文件”两个概念的交集,它是具有文件特征的数字信息,又是以数字信息为特征的文件。
2 电子文件的种类
如同其他事物的种类划分一样,电子文件的种类也有不同的划分标准。目前,主要有以下几种划分方法:按电子文件的信息存在形式分类,可分为文本文件、数据文件、图形文件、图像文件、影像文件、声音文件、命令文件、多媒体文件、超文本文件。按文件功能分类,可分为主文件和支持性、辅、工具性文件。按文件的生成方式分类,可分为计算机系统中直接生成的原始文件和将纸质或其他载体(如胶片)文件重新录入生成的转换文件。
3 电子文件的特点
电子文件的特点有:信息的非人工识读性、系统依赖性、信息与特定载体之间的可分离性、信息的易变性、信息存储的高密度性、多种信息媒体的集成性、信息的可操作性。
电子文件管理,就是在传统档案管理经验和形式基础上,采用计算机和网络技术,结合电子文件自身的特点,有针对性地汲取文件中心、虚拟立卷等前沿档案管理理论,对电子档案实行分级或文件级的管理,对本部门、本地区形成的电子文件实行社会化、自动化、网络化管理,从而实现高效、快捷的电子档案信息管理模式。本着服务社会,有效利用的原则,发挥档案部门的管理和技术优势,相对集中地保存和管理电子文件,为电子文件形成部门提供优质、稳定、安全的存储环境和空间,为社会提供真实、准确、快捷的档案信息服务。
电子文件管理模式采取先进的技术和理念,以虚拟、开放的手段来管理电子文件档案。档案部门通过网络、计算机、图文扫描、光盘存储等技术手段对各子单位产生的电子文件信息进行集中统一的管理,并保管、存储符合电子文件形成部门要求的电子档案。电子文件形成部门(全宗构成者)以定期或不定期的方式,把日常产生的电子文件信息,用标准化的格式通过网络传递给档案部门,由档案部门进行分类、整理、编目,分别存储在档案部门主服务器相应的存储空间;在必要时,档案信息还可以脱机存储到其他更安全的介质上,并做多个备份,避免自然因素损坏和非法访问。档案管理部门对电子文件信息采取维护电子文件产生原始性的原则进行管理。档案管理部门为信息存储单位提供信息查询功能并进行用户确认,以确保档案的完整与安全。
因此,电子档案管理是由电子档案管理部门集中统一管理电子文件,对电子文件采取标准化、自动化、网络化管理,它不由文件形成部门或其他非专业部门来管理电子文件。
论文关键词:档案管理,物理管理,逻辑管理
一、档案物理管理及逻辑管理的概念
物理管理,由形见意,指事物的表象。就是说按照手工管理的方式,以档案的物质介质为管理对象,制造和使用实际可触碰到的物质性工具的管理活动,比如消毒柜、计算机、档案柜等一系列的物质工具。
逻辑,体现的是人的逻辑思维能力,逻辑思维是人类思维的规律。人们在对外围的认识过程中,借助于概念化的东西,进行自己的推理判断。逻辑思维与形象思维不同的是,它是用科学的抽象化的概念,试图去揭示事物的本质,认识现实的结果,是人类抽象思维的展示。而逻辑管理,就是在物理管理的基础上,按照人类抽象的思维方式,主要以档案的内容性的东西对对象或者为着手点,来进行对档案的管理工作。
二、档案物理管理与逻辑管理特点的区别比较
(一)管理对象
在管理对象上,档案物理管理的对象是档案的物质载体本身,而逻辑管理的对象则是档案的内容即承载的信息。虽然管理的对象不一样,但是档案的物理管理与逻辑管理却也并不是毫不相干的两个部分,他们之间也存在着相互影响和制约因素。
在物理管理占据主导地位的时代,我们的档案管理理论与管理思想主要是围绕着档案载体展开的,比较典型的是《档案管理学》与《档案保护技术学》等。传统《档案保护技术学》的基本内容包括:档案文件制成材料及其耐久性、档案文件损坏的理化因素及防护方法、档案文件损坏的生物因素及防护方法、档案文件的修复技术、档案文件的照相复制、档案馆的建筑和设备、技术图纸的保管等等,它们都属于档案物理管理的范畴。而《档案管理学》则以“实体管理”为主要线索展开。
电子档案产生之后,逻辑管理就占据了档案管理中的主导地位。虽然档案的物质介质还是存在且在未来相当长的一段时间里将继续存在,但地位却明显的不如物理管理时期了。逻辑档案管理时期,档案管理的主要思想和理论来源于档案的内容和它的内部信息。
(二)劳动特征
不论是档案的物理管理还是逻辑管理,作为人类的管理活动,它们都主要属于脑力劳动的范畴。但在具体表现上有所不同:
由于管理对象是实际的物质介质,所以档案的物理管理过程中,除了必要的脑力劳动外,管理人员也不得不进行一些与体力劳动有关的活动。也正是因为处于这样的时代,以及人们思维方式的固化,使这时期的人们更多的注重的是档案管理工作中的体力劳动部门,而忽略了在脑力劳动在管理活动中的支配地位,甚至想当然的把档案管理工作归结为简单的仓库管理类工作。但随着科学的发展,人类思想的进步,我们应该认识到,这样的想法是错误的,物理管理也应该是一种科学化的管理,传统档案保护技术学的发展,就是最好的佐证。
随着信息技术的发展与普及,脑力劳动在档案管理工作中突出地位越来越得到广泛认可。由于管理对象是档案的内容与信息,论文的格式在电子档案的逻辑管理时代,人们在档案管理活动中的脑力劳动,慢慢地转换成了计算机系统的劳动。计算机系统的程序劳动,是一种高级的脑力劳动,是人类脑力劳动的发展与延伸。
(三)方法特征
在电子档案产生之前,档案管理——无论是物理管理还是逻辑管理,都以手工管理为主要的方法特征。虽然我们有了一些档案管理工具,如密集架、提档机等等,但传统档案管理的手工管理特征仍十分明显,其工作的基本模式是:人→档案。在电子档案产生之后,电子档案的物理管理仍主要表现为手工管理方式,而电子档案的逻辑管理则改变为完全自动化的计算机及计算机网络系统的程序管理方式,其工作的基本模式是:人→计算机→档案。
(四)思维特征
物理管理与逻辑管理具有不同的思维特征。物理管理具有形象思维的思维特点,逻辑管理具有抽象思维的思维特点。形象思维解决的是管理过程中的三维空间问题,抽象思维解决的是管理过程中的信息内涵及时间问题。
在物理管理中,人们在管理过程当中更多的想到的是有形的东西,比如纸张、案卷等;而在逻辑管理中,人们反应的则是概念化的东西,比如文件名或者某方面的信息内容等。
在物理管理时代,人们的思维方式与管理理念在各方面都不得不受物理层次的制约,难以脱离形象思维的影响。在逻辑管理占主导地位的管理时期,人们在想到某些信息内容时,不会像在物理管理中那样第一时间联想到的是库房号或者案卷号等,而跳过了载体这一环节,脑袋中直接浮现出某某文件名或者具体的信息内容。管理人员只要使用检索工具,在虚拟化状态中查找并调阅想到的东西。
(五)哲学特征
档案物理管理针对的是一个现实的物质世界;档案的逻辑管理针对的是一个由概念组成的信息内容世界。虚拟档案管理哲学对传统实态档案管理哲学的超越,是建立在档案的虚拟逻辑管理对现实物理管理的超越的基础上的。
三、结束语
在档案管理工作中,档案载体与档案信息是管理工作内容的两个基本方面,或称为矛盾的两个方面。矛盾的这两个方面谁具有主导地位,谁就规定了档案管理工作的时代特征。档案载体在档案管理工作中占有主导地位时,这一时期的档案管理工作就表现出一逻辑管理为主的时代特征,我们可以称之为物理管理时代;而当档案信息在档案管理工作中占有主导地位时,这一时期的档案管理工作就表现出以逻辑管理为主的时代特征,我们可以称之为逻辑管理时代。
在以往的档案形式中,无论是从石刻档案到甲骨档案,从简策档案到纸张档案,乃至缩微档案,档案的物质载体和信息内容都是“二位一体”的。在这种情形下,本质性的信息被非本质的载体所束缚、所约束,目的性存在被工具性存在所决定,信息难以获得独立与自由,在物质载体与信息内容的矛盾关系统一体中,物质载体是矛盾的主要方面,并由此决定了当时物理管理占据主导地位,决定了人类社会的档案管理首先经历了一个漫长的物理管理时代。
参考文献
[1] 丁海斌. 论档案的逻辑管理[J]. 档案管理. 2013(03)
【关键词】电子文件;双套制;归档
一、“双套制”概念阐述
“双套制”的概念由来已久,到了电子文件管理时代,为弥补电子文件真实性、长久保存等缺陷,在文件归档环节别强调“双套制”归档。
首先,纸质环境中的“双套制”是基于档案的安全和利用的方便,要求归档文件一套按规定移交进档案馆,另一套由文件生成机构自己保存,即同样载体、异地实行备份;再后来,“双套制”归档是指保存一套纸质文件的同时,又以缩微胶片等形式予以保存另一套,即不同载体、本地或异地实行备份。到了电子环境中,“双套制”是专业针对归档保存状态而言,亦称为“双套归档”。即对同一份文件,在归档保存其纸质版本的同时,又保存一份电子版本,使两者共同处于存储和可利用的状态。
相对“双套制”还有一个“双轨制”的概念,“双轨制”是针对文件的运行处理阶段而言的,纸质文件和电子文件同步随业务流程运转,在文件进入运转程序时就形成了电子和纸质两种版本,业务人员要对同样内容的两种文件进行重复或部分重复办理。在现行期结束后,“双轨制”便导致了“双套”归档。“双轨制”包含了“双套制”,初步实现了对电子文件的全程管理,电子文件也是“原始文本”,参与相关的事务处理,如果管理过程完善,可以形成全面的元数据,也就产生了完整意义上的包括内容、结构、背景信息的电子文件。
双套制的实现,可以是对电子文件制作纸质拷贝,也可以是对纸质文件进行数字化。对于传统环境下纸质文件的数字化归档情形不在本文讨论范围之内。
二、实行“双套制”的原因
电子文件和纸质文件相互依存,两者优势互补、劣势互抵,是实行“双套制”归档的根本原因:
1.电子文件较之纸质文件的优势
相对纸质文件利用方面的种种不便和限制,电子文件具有操作的方便性,利用的高效、便捷、灵活和共享性,信息存储密度大、空间小。恰恰满足了社会对文件、档案信息的利用需求上涨,对信息的系统性、时效性要求提高的趋势,为利用者提供了纸质文件所不能及的便利,由此,电子文件的优势更加突出,使其日益普及并得到广泛认可。
2.电子文件天生固有的缺陷
这也是限制电子文件目前作为唯一的归档文件形式的可行性的根本原因。
首先,安全性:电子文件的软硬件技术设备依赖性强,设备更新换代导致的信息难以读取风险大;存储载体脆弱,稳定性和耐久性不足;信息传输过程中容易泄露。而纸质文件则因为纸张与字迹的结合,有较强的稳定性,保存时间相对也较长,安全可靠性强。
另外,法律凭证性:电子文件由于其内容和载体的可分离性,易更改,易复制,对信息的真实性和原始性构成极大威胁。如北京市档案馆对电子文件的分类管理办法中规定:当前所有OA系统中产生的电子文件只能当作传统载体的数字副本,因为电子文件还不具有足够的法律要素,对电子文件的真实性认证缺少约定,电子文件的安全性可以由技术由系统来保证,但真实性的保证和认同却不是一时能够解决的。虽然我国法律中并不排除电子文件的证据资格即可采性,但是其证明力却有待加强并通过相关制度进行完善,加上法律上对电子证据的归类不明,也导致其无法作为直接证据来使用。而纸质的内容和形式集于一身,不可分离,原始记录性强,被广泛认为是一种真实可靠的法律证据。并且法律规定:书证完全可以单独作为认定案件事实的证据,所以纸质文件的归档保存还是人们的一颗“定心丸”。
虽然从理论上,信息加密技术、签署技术、防火墙、身份认证、元数据等技术性措施可以在一定程度上弥补电子文件易更改的缺陷,但要从根本上避免电子文件易删改且不留痕迹是极其困难的。
3.目前的档案管理现状
现阶段,关于电子文件的管理,体制尚未理顺、配套机制还未形成、法律法规有待建立健全、计算机应用水平亟待提高,以及文化背景和利用习惯的根深蒂固等等诸方面,都限制着电子文件独立存在、全部取代纸质文件,出于对文件证据性的要求和长久可读的考虑,将电子文件转换成纸质版本,将延续相当一段时间。
三、“双套制”的评价
任何事物都有两面性,处于得失之间,“双套制”归档在解决已存在问题的同时也带来了新的问题。
优点是“双套制”归档融合了纸质文件和电子文件两者的优势,既可以发挥文件的高效存取检索利用功能,又可以保障档案的凭证价值和永久保存的需要。这也是文件介质转换时不可避免的现象,“双套制”中纸质副本存在的根本目的一方面是为了保证电子文件的真实性,以保证其查考凭证的法律效力,另一方面是档案记忆长久保存的保障。
缺点是“双套制”又带来了不可忽视的经济成本问题,制作成本、保管成本、人力、物力和财力,再加上电子文件高技术要求性的保管条件,使得电子文件带来的便利和迅捷等优点,在双套制庞大的纸质副本的保管成本面前大打折扣。
电子文件进行纸质备份花费的人力、物力和财力,与确保电子文件信息真实地、长久地流传下去,这两种价值,究竟哪一种更大、更值得我们追求呢?笔者认为,作为档案工作者,我们有责任、有理由为国家和社会记忆的长久流传服务。
四、“双套制”的完善和发展趋势
在现阶段,我国的电子文件管理实行“双套制”管理有其客观必然性,我们关注的焦点也应该从应否实行“双套制”转移到如何有效做好“双套制”的层面上来:
1.根据国家相应的标准规定,制定本单位档案双套制管理措施,完善电子文件归档程序和管理方法。
2.当前为了节约成本,最紧要的是精简双套制打印范围。
《电子文件归档与管理规范》(GB/T 18894-2002)规定:具有永久保存价值的文本及图形电子文件,如没有纸质等拷贝件,必须制成纸质文件或缩微品等。归档时,应同时保存文件的电子版本、纸质版本或缩微品。国家档案局《电子公文归档管理暂行办法》第7条规定:“电子公文形成单位必须将具有永久和长期保存价值的电子公文,制成纸质公文与原电子公文的存储载体一同归档,并使两者建立互连。”可见,关于双套制的范围为具有永久或长期保存价值的电子文件。具体到实施过程中,具有永久长期保管期限的电子文件要实行双套归档,短期的则可以量力而行。此外,各单位还可以根据其工作职能、文件保密与否、成本效益、文件属性、业务特点和利用需求等实际情况,来确定电子文件的双套制适用范围。
3.“双套制”实施过程别强调纸质文件和电子文件的“一一对应”。如根据北京市档案馆的规定,现阶段要切实落实“双套制”,过去强调纸质文件要进行数字化,而现在要强调电子文件形成纸质副本。
从全球来看,电子文件管理的发展历程可以归结为三个阶段:主要依存于纸质文件的电子文件管理阶段,纸质文件和电子文件“齐头并进”,脱离纸质文件上升为独立的电子文件管理系统
纵观世界各国,唯有中国仍然在全面推行“双轨制”和“双套制”模式管理电子文件。而美国、英国、德国、法国、澳大利亚、加拿大、新加坡、日本和韩国等均逐步推进或已经实现了“单轨制”与“单套制”模式,不仅与其技术成熟有关,更重要的是,在法律上认定电子文件证据的证明效力。
例如,美国国家档案与文件署对联邦政府机构档案的接收已完全实现电子化,对于相同内容的文件只接收电子文件。法律上通过扩大文件内涵,认定不管形式如何都可以作为证据,结合非歧视原则、最佳证据原则和传闻例外规则规定了电子文件的证据可采性和证明力。
加拿大国家图书与档案馆只接收电子文件进馆。加拿大的《统一电子证据法》规定电子文件系统也是电子证据的一部分,系统的真实性可以替代文件的真实性,只要生成系统是真实可靠的,电子文件即可作为证据被采纳。
历史上每一种新的记录形式产生之后,都与此前存在的记录形式有一个共存共用的阶段,逐渐取而代之。目前,纸质文件和电子文件不宜相互取代,应有机结合扬长避短,协调发展。电子文件与纸质文件管理共存的二元格局将会持续相当长时间。
但是,共存的态势将持续地处于变化之中,主要表现在双方的数量、功能方面。大的趋向是纸质文件与电子文件的此消彼长,从以纸质文件为主到基本对称再到以电子文件为主。随着理论和实践的发展完善,技术系统开发的成熟突破、相关法律的健全完备和用户的成熟,待到电子文件的局限得到根本克服、法律地位得到完全确认,纸质要逐渐向电子过渡。
参考文献
[1]王亚敏.档案“双套制”与电子文件管理探析[J].宁波工程学院学报,2009(2).
[2]季永喜.关于数字化时代档案“双套制”问题的思考[J].山东档案,2007(1).
[3]宋煦东,王阿陶.文件双套制管理之“双套制鉴定”[J].档案与建设,2006(7)
[4]李京琴.数字化时代档案双套制问题[J].机电兵船档案,2006(4).
[5]王健.电子时代“双套制”归档的新内涵[J].中国档案,2004(12).
[6]赵雪,华灿丽.电子政务系统中文件双套制保管的适用范围[J].北京档案,2004(9).
[7]冯惠玲.电子文件与纸质文件管理的共存与互动[J].中国档案,2003(12).
[8]江涛.美国电子文件档案馆(ERA)对我国电子文件保存的借鉴意义[J].兰台世界,
2006(5).
[9]国家档案局科研所邱晓威.《电子文件归档与管理规范》《电子公文归档管理暂行办法》(6号令)讲解.
基于电子健康档案在初级保健中的重要角色,本框架的提出非常及时。以患者为中心的医疗之家运动推动了电子健康档案,目的在于改进信息处理能力。然而电子健康档案目前可能无法实现这一目标。2010年,“合理使用”规定提出了奖惩措施以推动电子健康档案的使用。电子健康档案对信息的质量、全面性、时效性、可及性有影响。迈向以患者为中心的医疗之家的步伐和采用电子健康档案的需要都将会对初级保健中的信息需求和支持系统的设计产生影响。因此有必要理解信息与初级保健的关系。
图1介绍了初级保健中的五种信息危害以及它们导致信息混乱的途径。
1 信息过量 信息过量是指临床医生需要处理、整合、总结过多的信息(如纸质、口头和非口头、记忆)。初级保健医生需要将日益增加的患者问题与家庭和社区因素整合起来,同时初级保健医生的协调作用也增加了其需要处理和实践的信息。如果提倡在电子健康档案中使用复制和粘贴,通过使用模板增添无关信息或者把账单和法律保护的信息与临床治疗信息混淆,那情况会更加糟糕。
2 信息不足 信息不足是指缺少必要信息,这在初级保健中十分普遍。问题包括病历不可用、不完整或医生和患者的回忆模糊;患者可能会隐瞒一些敏感信息;有时医生的信息较为闭塞。例如一位医生为患者开了一种“新”药,但是后来才发现,患者早就服用过此药且因为副作用已停药。尽管此类信息可能存在于病历中,但是医生可能没有发现。理论上存在于病历中却不可用的信息其实相当于隐形的。
3 信息分散 信息分散是指信息位于不同地方。在初级保健过程中,所需信息可能在患者信息表
上、纸质或电子健康档案上、诊所或医院里、患者或医生的记忆中。虽然电子健康档案能减少信息分散的问题,但是有时也会使问题更糟,由于缺乏搜索方法而无法快速有效地找到信息。
4 信息冲突 当医生无法从多重信息中分辨出正确信息时便发生了信息冲突。医生经常要面对各种互相冲突的信息。例如,患者认为自己在服用某种药物,而临床档案显示为另一种药物,出院记录显示为第三种药物。
5 信息错误 当患者告知医生他/她在服用镇痛药阿司匹林但实际上在服用退热净时,或者当一位患者的信息被输入到另一位患者的档案中时,便发生了信息错误。当错误的信息进入档案中后便很难清除,医生不与患者核对信息就进行多次复制。
我们将信息过多、不足、分散、冲突和错误这五种信息危害定义为信息混乱。初级保健医生每天都会经历这些危害,大大增加了信息性错误的发生率。尽管信息混乱的概念提出与初级保健医生不谋而合,但是信息混乱的本质、影响因素及其与患者治疗结果的关系在初级保健中未被研究。临床医生、管理人员、电子健康档案程序员及规划人员也没有予以高度的重视。信息混乱带来的不仅是不便、烦恼和挫败,在实际工作中还影响医生表现,增加工作负担,降低医疗服务的安全和质量。
人类工程学有助于我们理解信息混乱。人类工程学对人类认知、身体极限及人类能力进行研究并将成果应用于工作流程、工具、信息和环境等系统设计;反过来人类工程学研究系统如何影响人类认知和身体表现。根据人类工程学,我们假设了一个初级保健中信息混乱与认知过程关系的概念框架,详见图2。
信息混乱提高了对初级保健医生的要求。由于信息过量,医生可能无法查阅所有信息,因此错过重要细节。由于信息不足、分散和冲突,初级保健医生必学通过图表、电话、对患者的进一
2 我们如何测量和量化信息混乱的因素或其产生的行为,以判断介入的成功与否?
3 何种介入能够减少信息危害、最大程度地改善情况感知、精神工作负荷和终极的患者安全?
4 有哪些途径可衡量医疗场所的情况感知?需要重新建立考量方法,因为现在并无初级保健专门的考量方法并且在患者诊疗过程中,考量情况感知具有很大的挑战性。
5 调节剂的影响的本质是什么?医生的专业知识或者患者预约能够解决信息混乱问题吗?
6 何时向初级保健医生提供何种信息才能帮其做好出诊准备及减少信息混乱?
7 诊所员工、患者及医务人员在为初级保健医生出诊准备信息时的角色各是什么?何时开始收集信息又该如何呈现?
【关键词】大数据时代 居民电子健康档案数据 采集工作
大数据时代的最大特征就是实现了海量数据的分析、处理还有应用,本文所要讨论的居民电子健康档案数据采集中就应用到了大数据处理的很多思想。居民电子健康档案建设有着重要的社会价值,但是当前由于数据采集导致的“死档案”“旧数据”等问题严重影响了其实际效益,鉴于篇幅限制,本文主要讨论数据采集的标准化和统一化工作,提高数据在整个电子健康档案建设的有效垂直流动,对采集数据进行优化和改良。
1 数据采集标准化的基本思路
居民电子健康档案是以居民健康为核心的,包含了居民个人信息、卫生服务信息两个主要信息的电子档案。因此采集的数据除了基本信息外,还有复杂而且庞大的公共卫生信息。数据标准化的思路为,使用Rational Rosc建模工具对现有的数据进行改良,将现有的卫生数据进行分类划分,形成类的层次结构,规范其数据类型和形式,从而提高数据的规范化程度,提高大数据环境下数据的可利用性。其中数据的标准化方法采用“实体/属性/值三联体”的方法,而数据的规范化表示方法则借助于《卫生信息数据元标准化规则》中的标准。并结合我国当前的卫生服务特色,加入标准中没有的类以及类的基本属性,对类进行补充。
2 数据采集标准化的具体方法
2.1 构建标准数据模型
对原有的健康档案数据模型进行优化,并抽象出实体和活动两个主题类,将居民的卫生信息抽象成八个大类分别是:实体类(个人、卫生机构、药品与材料)和活动类(医学观察、计划与干预、卫生费用、诊断与评估、危险因素)。建立基本的数据模型,并结合中国居民的卫生信息对八个大类进行精细划分,从而形成类的层次结构,并参照HL7标准规范类的属性和特征,明确数据元的定义和取值。
2.2 类的属性和规范化描述
对数据模型中的对象类进行分析,结合我国卫生领域的政策以及应用现状设置每一个对象类的某一组属性或者属性对应的数据类型。随后根据数据类型的表示形式和语义,按照国际以及国内通用的编码标准,确定数据的属性以及取值范围。结合类的属性和属性取值形式,构建包含对象类、特性、表示形式三个内容的标准化数据元。最后结合本次研究中居民电子健康档案数据的项目进行数据的标准化定义。类的属性和规范化表述的主要思想是实现类的逐级细化和实例化,并通过数据元的标准化实现了在某一特定语境下的数据采集,参照居民电子健康档案数据来说,就是将居民的个人信息和健康信息逐级细化最后结合国家卫生信息数据标准进行实例化,从而提高了数据的标准性。
2.3 数据单元和健康档案数据项的标准化
结合我国目前的医疗政策和卫生服务现状,将居民信息标准化处理。上文中提到信息共有八个大类,按照上述2.2中方法进行信息细化,例如个人信息既包含了卫生服务人员例如医生、护士、医疗机构人员信息,同时也包含了服务对象的信息。八个大类包含的信息类型繁多而且非常的复杂,因此需要对信息形成的数据单元以及类型进行标准化,假设居民信息档案一共包含了1200个数据项,按照数据项的类型以及表示形式,将1200个数据项进行归类和整理,提炼成约200个标准化数据单元。例如服务机构信息包含了50个数据项,那么按照数据类型和表示形式可以简化成20个标准化数据元。
2.4 卫生信息标准化数据元的规范
接下来就是对数据元进行规范化处理,按照概念数据模型的方法和思想,对上文中凝练出来的200个数据单元进行标准化,使用(数据元、数据元概念、特性、对象、值遇)五个元数据项对其进行标准化。具体的操作过程为:
(1)对象类的规范化,对象类为现实世界中某种事物或者规则的集合,有着明确的定义和界限,其行为以及特性遵循着相同的规则,能够加以识别并有显著的标识;
(2)特性规范化描述,是描述对象类全部个体的某种特性,从而使得对象能够被区别对待;
(3)数据元概念规范化描述,数据元概念包含了类以及类的属性,并建立两者之前的关联;
(4)值域的规范化描述,值域是关于允许值的集合;
(5)数据元则是由一个类以及特性、表示形式构成。这里以对象类中的卫生服务对象类的规范化描述为例,一个“卫生服务对象类”包含了名称、英文名称、定义、元数据类型、元数据标识符等多个元数据项目,其规范化描述则参照卫生服务标准进行约束,并给出约束的类型。
3 结语
大数据时代是数据的革命,而数据的规范化、标准化是数据采集、分析和利用的基础。当前我国卫生数据的采集多是满足小范围内的,例如单位或者部门的应用,但是大数据要求更高的数据分析和处理能力,为此我们讨论了我国居民电子健康档案数据的规范化和标准化方法。数据采集的标准化也为跨平台、快地区、跨系统的信息处理提供了基础,是实现我国卫生管理工作信息化的重要措施。本文仅从数据规范化角度分析也有着很大的局限性性,而数据采集的过程中还与数据通信、采集方式、数据采集接口、网络拓扑等等有关,各方面工作还有很多需要完善和改进的地方。
参考文献
[1]杨鹏.居民电子健康档案文档架构与数据元组的研究与实践[D].第四军医大学,2012.
[2]孙兰.基于居民电子健康档案的社区高血压管理模式研究[D].复旦大学,2013.
[3]马国强.指纹密钥及其在居民健康档案隐私保护中的应用研究[D].武汉大学,2011.