前言:一篇好文章的诞生,需要你不断地搜集资料、整理思路,本站小编为你收集了丰富的图书馆数字资源主题范文,仅供参考,欢迎阅读并收藏。
[中图分类号]G2[文献标识码]A
[文章编号]1007-4309(2012)02-0103-1.5
一、我国图书馆数字资源典藏管理存在的问题
数字资源组织中的规范控制问题。所谓数字资源组织,是指对摄取的数字资源进行分析、选择、标引和处理,为数字资源提供有序化的结构,使之形成一个有机的整体。数字资源在有序化的基础上必须有足够存储空间和简单快速的存储算法,从而有利于对数字资源的快速存取。根据关联性、结构性和功能性的方法原则,在对数字资源的组织中,需要揭示数字资源的关联、层次和功能的组织,即如何反映数字资源对象间的结构和语义的内在关系,来保持数字资源对象学科的完整性,同时对数字资源进行多维整合,体现资源整合的结构性和层次性。这需要运用一定的技术手段和方法,才能使数字资源得到优化组合,取得最好的组织结构和功能。
数字资源典藏管理存储问题。随着馆藏资源建设中产生的数字对象越来越多,海量数据的生成和积累意味着馆藏知识财富的增加。但也意味着这些宝贵的馆藏记录和文档面临因技术过时和载体变质而引起损失的危险。Jeff Rothenberg指出,“‘21专家组’的研究给出了令人印象深刻的结论:目前根本无法对数字信息存储的效果做出任何保证”存储问题在档案馆和图书馆表现得尤其突出,其突出问题表现在:数字对象被永久存储于物理媒体并不等于具有持久的可用性。数字图书馆联盟指出了数字对象的存储和永久性之间的一个重要区别:存储涉及一个对象的技术寿命和质量,持久性是一个更广泛的概念,包含了存储,但也指对象是否仍然在将来以任何形式存在。持久性暗含了对对象维护的概念,同时也意味着对其可访问性的持续保持,否则会缩短数字图书馆的平均寿命,降低被存储资源的可访问性。存储策略、存储框架、政策、法律等相关问题是数字资源存储中需要解决的主要问题。
数字资源典藏管理的权限控制机制问题。目前,仍然有相当一部分图书馆没有专门的典藏部门,典藏工作只是作为采编工作的一部分,即使是设立了专门典藏部门的图书馆,其典藏部门的管理工作也多是有责无权。从知识产权管理的角度,如果典藏权不明确,那么馆藏资源的调拨、分配、清点等各项工作的监督,以及协调馆藏建设与用户工作部门在馆藏资源利用上的关系等将无法进行,况且在网络环境下,典藏工作的内涵增加了,其职能也必将得到延伸,典藏管理权限的不明确将成为新时期典藏工作职能发挥的一大障碍。从以上分析已经看出,在对数字资源摄取、组织、标引、存储过程中必须获得授权才可得到典藏的权利。但数字资源涉及的权限关系比较复杂,因此有必要针对具体问题分析具体的权利归属。
二、数字资源典藏管理政策及内容
数字资源典藏管理的内容及其定位。传统典藏是文献加工过程中的最后一个环节,典藏质量的高低决定着文献布局是否合理。数字化及网络化技术的发展,使传统馆藏建设发生了深刻的变化,不仅馆藏资源的概念被重新定义为”现实资源+虚拟资源”,而且馆藏结构也呈现出多元化、信息化、动态化的特征。从理论上讲数字资源典藏管理就是一种馆藏数字资源的组织与管理,它包括了馆藏数字资源组织和馆藏数字资源管理两个方面。简单地说,馆藏数字资源组织就是将摄取的数字资源按照一定要求,进行合理布局、排列、保护和清点的过程;馆藏数字资源管理则是对馆藏数字资源组织的控制、调节活动,它是按照一定目标,通过馆藏资源利用效果、统计、评价等信息反馈,有效地控制馆藏资源运行的方向、速度、范围和密度,从而使馆藏系统和用户系统有序结合运转,并处于均衡饱和的最佳状态。因此,数字资源典藏管理工作定位于既是记载、验收、统计、存储、保护馆藏数字资源的技术性工作,同时又有复审、分配、清点、核查、处理馆藏数字资源的行政职能。
数字资源组织中的规范控制政策。数字资源组织政策,就是按照一定科学规则和方法,来对数字资源的特征进行描述和序化的过程,以方便用户对馆藏资源的检索和利用为目的。数字资源馆藏由”现实资源馆藏+虚拟资源馆藏”复合组成,因此数字资源馆藏政策也据此复合而成:现实资源组织方法包括:按照学科内容的组织法、数据库组织法和数字资源整合工具法。虚拟资源组织方法较为复杂,从数字资源组织的类型看,有一次虚拟资源组织和二次虚拟资源组织两大类。一次虚拟资源组织法包括WWW信息组织、FTP信息的组织等;二次虚拟资源组织法有导航网站、数字图书馆、搜索引擎等。但图书馆目前常用的组织方法主要为:学科导航、联机编目法、数据组织法。Calis联机编目系统已成为我国高校图书馆对数字资源组织的成功范例。XML被广泛应用于对数字资源进行组织,通过XML可将数字资源、目次信息及其标引信息有机地组织在一起。据专家预测,在未来的几年里,元数据和内容标准将继续朝着以XML框架及与之相关的技术环境发展。这些发展将使得图书馆应用技术更少专门化和领域特定性(Domain Specific)。实际上我们已经看到MARC等已经在向适应XML的方向发展,如美国国会图书馆的MARCXML Schema等。数字资源组织的方式有多种,各馆数字资源数量种类和服务对象不同,组织方式也要因馆而异,也就是各馆要制定具有自己个性化特色的数字资源组织政策。
元数据可以理解为关于数据的数据或描述其他数据的数据”。元数据具有对数字对象的描述、定位、搜索、评估和选择的功能。元数据与数字对象的关系就如同书目数据与图书的关系一样,能比较完整地反映出数字对象的全貌。为了便于用户有效获取数字资源,进行资源共享,图书馆在对数字资源典藏入库时,有必要对数字资源进行标准化标引。对此,国际上制定了对数字资源的标引方法,即DC元数据。DC元数据集是元数据格式发展中比较熟悉和成功的一种,已成为对数字资源标引事实上的标准。DC元数据标准的创建,是通过对数字资源的提供者对资源属性的描述并对其内容进行缺省的标引方法,进一步保证了数字资源建设的标准化。在提供标准化标引方法的同时,数字资源库与应用软件系统也可以提供图书馆创建自己的标引方法,即系统提供标引模版,图书馆可以根据本馆的性质设计具有自己的个性特征。同时,DC元数据资源描述方案又称为网上资源的编目。由于DC元数据已被结构化,并支持字段查询,为从根本上解决网络环境下的信息资源的编目问题提供了切实有效的方法。
数字资源典藏保护和存取政策。作为对数字资源管理政策的一部分,典藏保护和存取是有长期计划的。任何政策的制定必须解决对典藏资源的安全性跟踪并保证经过一段时间后资源的可存取性。这包括两个含义:一是保护政策也称安全管理政策:在制定安全管理政策时,应考虑数字资源的保护与纸质文献保护的区别。在制定对数字资源安全管理政策时,各馆应考虑本馆各因素的重要性和不可预见的灾难事故,也要考虑典藏员素质的因素。科学的安全管理政策应是一个全面的、系统的、动态的防护体系,在这个体系中对不同的因素,依据其重要性的不同分类分级分别采取不同的安全防护措施。二是存取政策,这需要解决三个问题:(1)历史遗留典藏资源如何存取和激活;(2)当前典藏资源怎样快速存取;(3)未来典藏资源如何存取及控制。这三个问题涉及潜在复杂的法律问题,在对这样的数字资源进行存取时应持慎重的态度。因此,存取政策的制定应包括:连续存取数字资源的特定策略,移植策略的不断发展及标准。数字资源存取需要在法定许可范围内进行规范操作。
数字资源典藏管理权限控制政策。数字资源典藏管理权限控制政策不同于对纸质文献的典藏规则,对数字资源典藏控制过程中涉及的法律问题包括许可授权、法律障碍及解决、技术解决方案等问题。当前最紧迫的是如何解决这几个问题:(1)如何确定数字资源的存储等级,由谁管理;(2)哪些数字对象可以被移植至永久存储;(3)数字对象如何合法对外传输;(4)呈缴数字版本典藏操作与权利如何界定;(5)如何对被典藏资源进行灾难防范与安全管理;(6)如何确定数字对象的生命周期;(7)多馆协同合作典藏系统的对外服务权限。妥善解决数字资源典藏的管理权限问题,是建立可信赖的数字资源典藏机制的基础,否则图书馆难以获得资源商和版权拥有者的积极合作,也难以形成可靠的协同合作典藏关系。就图书馆现状看,作为数字资源保存和服务机构,图书馆应该充分利用知识产权法中的合理使用与法定许可的相关规定,通过与版权所有者或拥有者签订典藏许可协议等方式保证图书馆的典藏权利,同时建立可靠的用户管理机制,加强对图书馆馆员和用户的法制观念,并积极解决或协助解决可能出现的侵权行为,从而建立良好的法律环境、管理机制和合作氛围。
在制定数字资源典藏管理政策时,国家有关部门应组织信息产业界、图书情报界和软件开发商参与讨论制定纸质资源、电子资源、各种元数据、多媒体资源能相互包容的标准,数字资源协同管理机制建立的关键在于能否发挥政策、法规和市场调节的作用,形成合理的具有互惠互利经济结算机制的数字资源利用共同体,以实现在统一的协议下,充分地满足各方对数字资源共享的需求。
[参考文献]
[1]宛玲,张晓林.数字资源长期保存过程中的知识产权问题分析[J].中国图书馆学报,2005(3).
1数字资源的分类
数字资源,又称电子资源,是计算机技术、通信技术及多媒体技术等运用于信息资源的、存取、利用的产物。馆藏数字资源是指图书馆引进(包括购买、租用和受赠)或自建(包括扫描、转换和录入)的,拥有磁、光介质或网络使用权的数字形态的文献资源。数字资源出现至今已发展为多种类型,可以从不同角度进行分类,既可分为电子期刊、电子图书、学位论文、电子报纸、专利/标准、数据/事实等;也可分为全文数据库和题录、文摘、索引数据库等。在国内外不同的数字资源评价体系中对数字资源有不同的归类。如:在“国际图书馆统计标准ISO2789”中,将电子馆藏划分为“数据库、电子连续出版物、数字文献三部分,数据库分全文数据库、文摘、索引数据库及其他类型数据库;数字文献包括电子书、电子专利、网络视听文献和其他电子形态的报告、预印本等文献”[2];在高校图工委和CALIS的《高等学校图书馆数字资源计量指南》中,根据目前高校图书馆的实际情况,“将数字资源划分为四种类型:电子图书(包括与图书类似的出版物);电子期刊(包括与期刊类似的连续出版物);二次文献数据库(包括题录、文摘、索引等);其他数据库”。
2数字资源使用统计的作用和意义
数字资源的使用统计涉及到图书馆、数据库出版商或服务商二个方面。通过数字资源使用统计可以对数字资源进行科学的使用评价分析,了解本馆订购的数字资源的利用效率,跟踪读者的使用行为、分析读者的需求规律,从而有效地调整数字资源建设策略和服务策略,为决策提供依据。同时,数字资源使用统计也能有效的评估数据库质量和服务绩效,对数据库商是一个很好的激励和推动手段。因而无论是对图书馆还是对数据库商,都具有十分重要的意义。
3高校图书馆数字资源使用统计现状和问题
数字资源使用统计数据可以通过数据库出版商或服务商提供和本地自行获取两种方式获得。从图书馆和数据库商两个角度看,高校图书馆数字资源使用统计存在两个主要问题。
3.1我国数字资源使用统计没有实现标准化和规范化针对数字资源的使用统计问题,国外ICOLC、ARL、ISO、NISO、COUNTER等很多组织、机构进行了探讨和研究,并取得了研究成果、提出了相关的指南、手册、标准等。其中COUNTER项目委员会的网络数字资源在线使用统计(COUNTER)得到了广泛的接受,逐渐成为国际化标准。在我国,数字资源使用统计的相关研究起步较晚,目前还没有相关的国家标准或行业标准。中文数据库大多没有遵循COUNTER标准,中文数据库商对于数字资源使用需要统计什么数据、依据什么指标体系进行统计有不同的理解,数据库所设置的统计指标从名称、定义到指标数量均不相同。不同数字资源使用统计指标缺乏兼容性,没有实现标准化和规范化,为图书馆进行数字资源的使用统计分析增加了难度。
3.2高校图书馆对数字资源使用统计的需求度和重视度不够尽管数据库服务商提供的统计指标缺乏兼容性,高校图书馆仍可以利用常用统计指标进行使用分析。然而许多高校图书馆并没有很好地对统计数据进行收集、整理并加以分析,主要原因是高校图书馆对使用统计的需求度和重视度不够。许多高校图书馆投入大量经费购买数字资源,造成数字资源数量的堆砌,对数字资源的使用评价分析的实践还远远不够。同时,图书馆员在汇总和分析使用数据方面也缺少专业的培训,导致数据库商提供的使用报告并没有得到有效利用。此外,图书馆对数字资源使用统计需求程度不高,也是造成数据库商随意设置统计指标的一个因素。
4高校图书馆做好数字资源使用统计的几点策略
4.1提高重视程度、加强与数据库商的合作数字资源使用统计在尚没有相关国家标准和行业标准的前提下,高校图书馆应根据自身的现状和需求,积极与数据库商合作,协商在使用报告中需要提供哪些统计指示,主要依据哪个标准或评价体系,在与数据库商签订合同时,应将提供使用统计报告的具体内容作为合同的一部分。同时,高校图书馆应加大对馆员的培训力度,针对数字资源使用统计问题,邀请专业人员或数据库商的业务人员对相关工作人员进行专门培训,使其正确理解和运行数字资源使用统计报告,掌握数字资源使用统计的分析方法。相关工作人员要持续关注数字资源使用统计、数字资源服务绩效评估等相关研究领域的发展动态,及时丰富业务知识,并设法运用到实践中。
4.2主动进行数字资源使用统计实践面对复杂的数字资源类型以及缺乏统一标准的使用统计报告,高校图书馆应积极主动的进行数字资源使用统计实践。可以依据国外数字资源使用统计的标准化研究成果和国内相关标准、资料,对其指标体系进行对比分析,分别根据不同的数字资源类型找到适合本馆实际需求的、常用的统计指标,在本馆范围内进行一定的规范。偿试通过不同渠道收集、整理、分析各种不同类型数字资源的使用统计数据。
4.3通过Web日志方式获取使用统计对于存储在本地的数字资源或者本馆自建的数据库资源可以通过Web日志方式获取使用统计。web服务器在工作时,会将访问的结果记录在log日志文件中,一般Web日志包括用户的IP地址、请求时间、方法(GET/POST等)、被请求网页或文件的URL、发送/接收字节数、协议版本等信息。通过对服务器日志的分析可以得到访问的时间情况、有哪些用户在访问、有哪些请求被拒绝,以及判断读者对哪些页面内容感兴趣等。从日志文件提供的信息进行统计和分析,可以对整个服务网站有一个精确科学的认识,但这些日志文件信息量很大,用户难以直接从log文件获得直观的结果。因此,可以借助一些商业性的或者源代码开放的软件来完成。
摘要:[HTK]文章简述了目前数字图书馆馆藏资源的可视化现状及现有的可视化技术,分析了馆藏时间结构模型、馆藏学科分类结构模型、馆藏等级结构模型,提出了数字图书馆馆藏资源可视化服务系统设计方案,并重点介绍了系统的总体架构设计、结构模块设计、覆盖率模块设计、利用率模块设计及数据通信与接口模块的设计。
中图文分类号:G250文献标识码:A论文编号:1003-1588(2015)06-0080-03
[FQ(3*2\.172mm,ZX-W]
[KH*3D]
收稿日期:2015-04-30
作者简介:[HTK]莫耀评(1975―),南宁职业技术学院图书馆馆员。[FQ)][HT]
把查询到的馆藏资源数据信息以视觉的形式展现出来,达到数据信息资源的沟通和传达直观化,即是图书馆馆藏资源的可视化技术。馆藏数据资源的可视化使读者不但可以了解数据的最基本特点,还能看到以多种技术手段展现的目标信息,这样用户可以很明确地了解到其所需求的目标数据信息的状态。
[BT3]1数字图书馆馆藏资源可视化现状分析
1.1大数据时代给资源可视化带来的挑战
世界权威组织机构统计的调查曾指出:网络产生数据信息资源以每年50%的速度在增长。随之出现的云计算技术也点燃了人们对大数据的研究热情,在图书馆馆藏资源可视化技术的研究过程中,大数据所占的比重也越来越大。图书馆馆藏信息数据资源不仅数量在不断增加,其复杂程度也在不断增强,因此如何将大量纷繁复杂的馆藏资源信息数据清晰直观地展现在用户面前是当前图书馆馆藏资源可视化研究的一大挑战。
海量且结构复杂的数据信息的存储、传输、并行化和不确定的量化等是可视化研究的难题所在。首先,馆藏资源数据信息的存储所存在的问题是数据数量大、结构复杂,因此存储时所需要的相应空间就大,对空间结构的要求较严谨。其次,馆藏资源数据信息的传输对所需传输速度和所占宽度要求更高。目前图书馆馆藏资源的传输速度难以满足用户需求是大数据下馆藏资源可视化技术研究的难点。
1.2馆藏资源越来越丰富引发的问题
目前即使互联网发展迅速、应用广泛,可在一些领域特别是在科研院所,首选的信息资源还是图书馆馆藏资源。因为图书馆经过这么多年的积累和沉淀不仅有浓厚的文化氛围,更有系统的专业知识和丰富的馆藏资源,这是互联网资源无法可比的。
随着人们对与数字图书馆相关的多媒体大数据信息研究的深入,图书馆与网络技术的结合也逐渐成为一种趋势。现在,人们对馆藏资源可视化的研究主要包括可视化检索研究与可视化检索结果研究。数字图书馆信息资源可视化的过程中,馆藏资源的数字化也是个大问题,有些资源的保存介质是很久以前的纸,这些信息数据的数据库录入工作并不容易,在很大程度上影响到数字图书馆馆藏资源的可视化过程。
[BT3]2数字图书馆馆藏资源可视化现有技术研究
2.1基于几何的数据可视化技术
数据的表达形式采用几何或几何投影的方法称为基于几何的信息数据可视化,该方法的采用使用户能很容易找到目前信息(见图1)。从图中可以发现,信息量大且复杂的数据比较适合基于几何的数据可视化技术。因为该技术能清晰地表达出大量复杂数据之间的逻辑关系,能为用户勾勒出一幅流程清晰、逻辑明确的几何图像。当然该方法也有不足之处,有时由于信息数据过于复杂,数据量又特别大,这样勾画的几何图像有重叠的可能,这样一来用户会很难读懂图形的含义。
2.2面向像素的数据可视化技术
可视化系统VisDB开发应用充分证明了面向像素数据可视化技术的强大优势。该技术原理简单易懂,如图2所示,右边设为一个数据项,经过某种映射变换对应到特定的屏幕上,与这个屏幕上的像素对应,一个数据项能对应几个屏幕上的窗口表示不同的数据属性值。
[3]有两种方法可以实现面向像素的信息资源可化技术,一种是单独查找,另一种是利用查找。第一种方法主要是对数据项进行排序,排序的依据是数据项的属性值,然后在显示屏上显示排序后的数据值,这种方法使用起来既方便又有很有效果。第二种方法通过数据值与所查目标数据的一致程度对颜色进行匹配。该方法的流程非常切合实际,它采用特定的距离函数来估算数据项的属性值和查询值从而得到匹配值。这种方式能如实地反映两者之间的符合程度,距离函数的值越小说明所查找的数据越接近目标信息数据。
2.3基于图标的数据可视化技术
[3]把数据集中的各个数据项都映射成图标的方式被称为基于图标的数据资源可视化技术,该技术在可视化技术中也是非常重要的。这种技术中的图标部分是由数据项的维数决定的,数据项是几维该图标就有几部分,图标的部分与数据项的维数是一一对应的关系。
近年来,基于图标的可视化技术不断发展,并逐渐形成多个分支,其中最典型的当属Chemoff-faces,它是目前基于图标的可视化技术中应用最广的。通过应用该技术能将数据项的两个维度映射当作显示的两个坐标,其他的维度映射成具体的形状。
2.4基于层次的数据可视化技术
[2]该项技术比较适合应用在层次关系比较明确的数据集合中,这一点从基于层次的数据可视化技术的名称中就能看出。树图是基于层次的数据可视化技术的一种,具有代表性。该技术中树上的每个节点代表着数据项的属性值,各个子节点相加的和等于父节点的值。该技术能够把复杂的数据集进行分层处理,能够理顺数据的结构。
[BT3]3数字图书馆馆藏资源可视化结构模型研究
3.1馆藏时间结构模型
数字图书馆馆藏时间结构模型主要是对馆藏时间顺序的研究,该模型有助于对数字图书馆的各类图书信息进行整理和规范。通过对馆藏资源信息的整理能够发现馆中图书量的增长情况,能够如实反映图书馆的图书使用情况。
3.2馆藏学科分类结构模型
随着现代信息技术的不断发展变化和科学技术学科间的交叉及渗透,在高校及相关教育部门内出现了各种各样的学科分类新标准,更值得一提的是,这些学科还在不断地细化及分解。馆藏数据信息资源学科分类在很大意义上是为了观察并及时反映图书文献资源的内容和信息能否为现代信息化教育事业、科学技术研究及社会职业分工等提供一些数据,为决策者服务。馆藏资源学科分类模型可以利用图书分类信息表去了解城市图书馆及高新图书馆内文献的学科覆盖范围,特别是重点学科文献的种类和数量的变化情况,为图书管理者对图书文献的使用及采购决策提供依据。
3.3馆藏等级结构模型
现代数字图书馆馆藏数据资源由于管理和科研的需要被人为地划分为一些特定的等级,如目前比较流行的划分原则有图书馆藏的作用、图书馆特定的相关功能需求、图书阅读人员的文化水平情况等。图书馆藏数据资源信息等级结构模型不但能表现出现存图书文献资源的利用情况,还能反映出阅读者对知识文化需求的解决情况。世界各地的图书馆管理者对馆藏数据文献资源的等级具有各不一样的划分标准,目前我国较多地方的图书馆部门及相关院校的图书馆机构采用五等级法,即划分为甲、乙、丙、丁、戊级。现阶段教育部对大多数本科院校馆藏数据资源的评估主要是依据其藏书的数量评定的,如大于180册/人为A级,大于150册/人为B级,大于100册/人为C级。我们可以通过这些馆藏数据资源的等级结构模型来分析图书馆内阅读者的平均可借阅文献种类和数量,同时还能看出这些数值随着时间的推进或是随着馆藏资源学科信息分类后的变化情况,能更好地实现馆藏资源的可视化。
[BT3]4数字图书馆馆藏资源可视化服务设计
4.1可视化服务总体架构设计
笔者在考虑图书馆学习者的实际需求的情况下,在原来B/S系统的基础上设计了一种面向用户的可视化服务构架。该系统是在图书馆馆藏资源的基础之上设计的一种面向用户的可视化服务架构,主要有可以用来展示可视化服务所有类型的服务效果情况的前台浏览器UI;可以作为请求馆藏所有数据资源的可视化服务情况的中间数据通信部分;可以用来组织、整理监控馆藏资源数据库和其模型库的后台服务器部分(见图3)。
如上图所示,图书馆馆藏可视化服务系统需要设计的模块有:结构可视化设计、馆藏资源覆盖率可视化设计、馆藏资源利用率可视化设计及数据模型管理及其通信部分设计等。
4.2图书馆藏结构可视化模块设计
针对现代图书馆内馆藏资源的结构及其数据模型的可视化主要是在几何元素的基础上建立的可视化相关理论技术。目前较多利用的方法是平行坐标法,但具体实现这种方法的工具是报表,这是因为馆藏数据资源模型的影响因素较多、纵横坐标的参数值特别复杂且具有不确定性。但这种方法使用的报表的结构形式与以往其他形式的老版本报表有很大不同,主要体现在此报表有动态变化的数据、趋势性的参数值、报告和表格融合成一体的结构。
馆藏资源数据结构模型的可视化报表的图表内容包括图书的种类数量、每类型图书的册数量、各种类型之间的比例关系、平均每人可借的最大数量图书比例等。报表中的图和表分布代表不同的意思,其中条状的图形表现的是图书的类型数量和册数量;线状的图形表示的是比例情况。值得一提的是,图书馆可视化报表方便了人们对每个维度表示内容的数据形式的了解,还具有直接联机打印数据可视图片的功能。
4.3数据通信与接口模块的设计
要想实现图书馆馆藏数据的可视化,前台界面效果和系统后台管理服务器应直接连接起来,其需要系统具有数据资源间的相互通信及其间的数据接口。此模块设计中的数据接口功能主要是:①利用对集成电路芯片的封装来显示图书馆馆藏资源信息数据。②由外观页面显示平台对上面的数据接口进行数据和信息的技术访问。③资源服务系统平台的数据接口接到访问信息后便与后台服务器进行数据和资源信息的交互,实现数据的相互传递。其中,可视化系统平台提供的数据服务形式是已经经过封装后的具有相对统一的标准格式的数据,其通过服务器再传递到前台显示界面内,此时具有可视化特定显示要求的信息数据已被传递结束(见图4)。
[T0523.TIF,B]
[TS(][HT5”SS][Z]图4数据通信接口模块框架图[TS)]
图书馆馆藏资源信息可视化服务系统设计因为有了数据通信接口这个特定的模块,从而使系统内部前后台的设计研发具有相对可以分开的效果,因此使用过程中如果发现系统有任何不足和需要改进的地方,都可以对此可视化服务系统进行性能优化和功能改进以及系统信息扩展。
[BT3]5结论
随着可视化技术的不断发展和逐步完善,数字化图书馆馆藏资源的可视化也会逐渐成熟。并且,可视化技术的应用将会进一步提高数字图书馆信息服务系统的服务能力,从而使其能更好地发挥数字图书馆信息服务的功能。
参考文献:[HTK]
[1][ZK(#]吕红,邱均平,李小涛,等.国内馆藏资源可视化研究进展分析.情报资料工作,2014(1):57-60.
[2]邱均平.专题:馆藏资源可视化研究.情报资料工作,2014(1):24-30.
[3][3]刘晓娟,周建华.数字资源可视化的理论、技术及方法研究.图书杂志,2015(2):102-108.
[4][3]王洪娟.高校数字图书馆馆藏资源建设与维护发展研究.绥化学院学报,2013(2):59-64.
[5][3]贺德方,曾建勋.基于语义的馆藏资源深度聚合研究.中国图书馆学报,2012(7):12-17.
[6]张洋,谢卓力.基于多源网络学术信息聚合的知识图谱构建研究.图书情报工作,2014(12):32-37.
[7]侯婷婷.图书馆藏书质量评价指标体系优化分析.才智,2012(20):336-341.
[8]刘文远.基于雷达图表示的多维数据可视化分类方法.系统工程理论与实践,2010(1):178-183.
[关键词]公共图书馆;数字资源;利用率
1公共图书馆数字资源利用现状
数字资源是指利用计算机、网络和通讯技术、高密度存储技术以及多媒体技术将文字、音频、视频等信息数字化,并通过因特网传输提供给人们使用的资源。数字资源可分为三种类型:一是商业数据库,二是自建数据库,三是网络资源(数据库除外)。与传统印刷型资源相比较,数字资源具有不受时空限制、检索和传递速度快、使用灵活方便、支持多用户同时使用等特点。目前,随着计算机、网络技术的飞速发展,越来越多的公共图书馆,特别是省级以上公共图书馆以及其他经济发达地区文献购置经费情况良好的公共图书馆,在数字资源的建设上都有很大的投入,购买和自建了不少的数据库,数字资源成了整个馆藏体系的重要组成部分。然而,有调查表明,各公共图书馆引进或自建的资源数据库除少数利用率较高外,大部分利用率不高,有的利用率很低。以笔者所在的浙江图书馆为例,为了开发、开放更多方便读者的网上服务,完善我馆的网站建设,2006年6月图书馆对到馆读者进行了随机抽样调查。一共发放908份调查表,回收了865份,回收率为95.3%。调查结果显示:在“经常使用的网站栏目”项中,选择数字资源的读者占17.2%;在“目前使用的图书馆网上服务”项中,选择使用数据库检索的读者占22.2%;在“读者选择使用栏目”项中,选择专业数据库的读者占47.4%。由此可见,数字资源的利用率并不高。目前,各公共图书馆对数字资源的建设都很重视,不少图书馆开始朝着数字化方向发展。可是,数字资源的利用率未能与数字资源的建设同步增长。这是我们的服务不到位,还是因为我们的读者对数字资源不感兴趣呢?数字资源不能充分发挥作用,势必会给公共图书馆的数字资源建设带来消极影响,这个问题很值得研究。
2影响公共图书馆数字资源利用率的四大因素
2.1数字资源建设缺乏实用性、针对性
目前,国内各种类型图书馆购置的数据库以文摘索引数据库、全文期刊数据库、学位论文数据库、专利文献数据库为主。这些数据库的专业性很强,比较适合教师与科研人员教学或科研需要,因此对高校和科研机构图书馆来说是必须的,并且一般都具有很高的利用率。而对公共图书馆来说,其实用性就值得商榷。国家图书馆2002年对ElsevierScience全文期刊数据库的利用有过详细统计,发现其利用量只有清华大学同期利用量的4.08%,只有中科院图书馆的5.32%。我馆也采购了EBSCO、NetLibrary等外文数据库,使用率也比较低,即使《中国学术期刊》之类常用数据库,与杭州市的高校图书馆相比,其利用率也存在明显差距。公共图书馆的读者分散、层次不一、需求复杂,如果公共图书馆一味地购买学术性或稀有性资源,完全套用高校和科研机构图书馆的数字资源建设模式,所引进的数据库缺少针对性、实用性,就不能充分满足读者多样的需求,势必造成资源的浪费,影响图书馆数字资源的使用效益。[1]
2.2馆内使用模式的限制
出于著作权保护和商家销售策略的原因,图书馆购买的数据库绝大多数限于馆内使用,或是封闭式镜像,或是采用IP控制,前者还需要很大的硬件投入与维护。这种馆内使用模式难以适应公共图书馆用户分散性、需求多样性的特点。由于高校和科研机构图书馆都有本单位明确的读者对象,用IP控制方式可以使用户在家里、办公室、宿舍或实验室等属于校(院)局域网IP段的任何一台电脑都可以访问利用。对公共图书馆来说,情况却完全不一样,它的IP段在其馆舍内,读者要利用图书馆购买的网络数据库,只能到图书馆来,因此难以发挥网络数据库不受时间、地点限制的特点。部分读者不愿只为查找几篇文献而耗时耗力到图书馆来,转而利用互联网上的开放性资源寻找其他替代文献。[2]从而使网络数据库在公共图书馆的利用率大打折扣。
2.3公共图书馆对数字资源的宣传和对用户的培训不够
公共图书馆是为公众服务的社会文化机构,它的读者除了部分教学科研人员外,更多的是中小学生、普通公民,其中不少读者经济比较困难、文化程度不高,他们在数字资源的获取能力上无疑属于弱势群体,对数字资源的认知度比较低。因此,从实际利用情况看,虽然部分读者已了解并开始使用常见的数据库资源,但总的来看普及度还远远不够。[3]图书馆引进数字资源后,只是通过网页进行推荐,很少再做深入的宣传介绍和引导,使得相当数量的读者根本就不知道图书馆可以提供哪些数字资源。在我们的虚拟参考咨询服务里,经常会有读者询问如何进行资源检索,可以检索哪些资源,这充分说明我们的宣传没有跟进,服务没有到位,致使大量有价值的数字资源沉睡库底。
2.4检索方法繁琐,检索效率不高
信息技术迅猛发展,各类电子图书、电子期刊和数据库层出不穷,各个数据库的检索平台各不相同,数据库收录的内容重复现象也越来越严重,还存在版权、收费等问题。因此,读者在检索某个课题时,必须分别逐个进行重复的步骤进入不同的数据库,检索结果还会重复,查全率、查准率都比较低,这也是影响公共图书馆数字资源利用率的主要原因之一。
3提高公共图书馆数字资源利用率之对策
3.1公共图书馆数字资源建设应体现公共图书馆服务全社会的特点
公共图书馆作为一个为全民服务的文化机构,在数字资源建设上,除了要考虑到教学科研人员需要外,还需要考虑到为数更多的普通读者的需要,使公共图书馆的数字资源能惠及整个社会群体。购买一些学术性、专业性数据库是完全必要的,但应该把更多的精力财力放在提供法律法规政策、教育就业培训、文化艺术娱乐等与群众工作生活密切相关的普及性、实用性资源上,努力做到贴近时代、贴近普通民众的文化需求。[4]现在网络资源数量巨大,各种信息质量不一、真伪并存,对科学研究而言,除了可以广见闻、知消息外,真正有科研价值的并不多,但对普通公众来说基本上都是有实用价值的信息。这些信息大量是免费的,公共图书馆可以有选择、有针对性地对某些方面或某些类型的网络资源进行采集和保存,将它们组织成自己的数字资源的一部分。全国各级人大和政府各部门都公开大量的法律法规条例,它们都是与居民的工作、生活密切相关的,但这些信息存于各部门的门户网站,并非每个人都能了解到。公共图书馆就应广泛收集、集成相关政务信息,向读者提供这方面的咨询服务。除此之外,公共图书馆也可立足于本地,围绕本地区工农商贸等经济建设的特点和文化体育日常生活的需要,自建各种类型、各种主题的地方文献数据库,方便普通居民。如鞋业是温州市的支柱产业之一,也是温州最具地方色彩的一个行业,温州市图书馆就于2001年自建了“中国鞋都图书馆”,为制鞋人士提供全方位的信息咨询、资料检索、鞋样设计、专业培训、多媒体制作等一系列服务。
3.2不同地域、不同层级的公共图书馆在数字资源建设上应有不同的侧重面
公共图书馆由各级文化行政部门领导,自上而下形成一个从国家图书馆到街道乡镇图书馆所构成的体系。在这个图书馆体系中,大城市和省会城市的公共图书馆拥有丰富的学术信息资源与地方信息资源,拥有较为先进的信息技术与信息服务人才,因此,它们实际上起到了地区性中心图书馆的作用,必须承担为科学研究和管理决策服务的任务。所以这类图书馆的数字资源建设要学术科研与知识信息普及并重。县(区)级和街道、乡镇公共图书馆更多地承担着基础文献信息服务和普及文化科技知识的任务,这一类型的图书馆可考虑购置一些偏重文化普及的商业数据库。在经济条件允许的情况下也可考虑一些价格不高的学术性专业性数据库,用有限的资金引进切合本馆实际并且利用率高的数据库。
3.3构建数字资源系统整合平台,简化检索过程
由于数据库不能统一检索,给读者查找信息带来极大不便。这就要求图书馆通过一定的方式,将数字资源有效地整合到一起。数字资源的整合是一个由计算机网络和相关技术构成的系统,实现数字资源的集中管理,跨平台、跨数据库检索。换言之,也就是对不同的数字资源实现无缝集成,建立统一的索引,实现数字资源的统一入口检索和排序等,然后根据用户的需要,经过用户没有感知的一系列中间处理过程,如经过启动标引系统、经过翻译处理、利用信息导航和搜索引擎调用不同的数字资源进行信息查找,最后把检索的结果经过整理和去重后回馈给用户。[5]让用户可以通过一个检索入口检索到所有馆藏数字资源,而且是统一的检索、浏览界面。这就是我们所说的高效检索。
3.4加强馆藏数字资源宣传,使广大读者对数字资源有所了解
图书馆的一切工作都是为了更好地为读者服务,最大限度地满足读者的需求。图书馆不断地创新、不断地丰富馆藏建设、丰富网络信息资源,其目的都是为了服务于读者。而大多数读者可能对图书馆的工作和现状一无所知或了解甚少。虽然图书馆投入了大量资金和人力,建立了网络系统,丰富了网络资源,但是如果忽视了对外宣传工作,仍以守株待兔的工作方式等待读者上门,那么再好的网络资源无人知晓,也不能很好地为读者服务。[6]可见,要让数字资源得到充分利用,就必须对数字资源进行宣传。要充分利用图书馆网站,介绍图书馆新购买的数据库及使用方法,让读者随时了解图书馆数字资源的最新动态。要在图书馆大厅开辟数字资源宣传栏,把宣传工作做得更细致、更深入,增进读者利用图书馆数字资源的意识。还可以向读者发放包含有馆藏数字资源介绍等内容的宣传手册,使来馆读者对馆藏资源有初步了解。总之,采取多种宣传方式,扩大宣传范围,使更多的读者对数字资源有所认识,这是提高数字资源利用率的关键。
3.5加强用户培训,提高读者利用馆藏数字资源的技能
公共图书馆的读者在利用数字资源方面多数还存在一定的困难,图书馆应该把培养读者的信息意识与获取信息的能力,作为自己的责任和义务,积极开展多种形式的教育和培训工作,定期或不定期的开展网络资源使用技术讲座活动,激发用户的信息需求,提高用户获取信息的能力。举办各种短期培训班,采取上机实际操作,使他们掌握数字资源的检索方法,随时获取自己所需的信息。这些讲座或培训要体现公共图书馆的社会公益性,都应是免费的。[7]这样做既使读者对图书馆产生信赖与亲近感,也对图书馆的数字资源进行了宣传,有利于提高图书馆数字资源的利用率。
[参考文献]
[1]余华.公共图书馆数字化建设的误区与对策[J].河南图书馆学刊,2007(1):23—24,27.
[2]周江.关于数字文献高效利用的思考[J].科技情报开发与经济,2007(14):50—51.
[3]孙杨民.提高高校图书馆数字资源利用率的对策分析[J].情报探索,2007(2):94—96.
[4]范并思.基层公共图书馆数字资源建设:理念、原则与方案[J].图书馆论坛,2005(6):190—195.
[5]王艳秀.高校图书馆数字资源利用探讨[J].情报探索,2007(4):47—49.
关键词:高校图书馆;数字化资源;建设现状
中图分类号:G647 文献标志码:A 文章编号:1674-9324(2012)09-0261-02
高校图书馆为高校的教学、科研和服务社会提供图书、文献信息的学术保障机构,其建设水平的高低对学校的教育质量、科研成果和服务社会质量具有重大的影响。随着图书馆管理的计算机化、自动化术、多媒体化、网络化和信息高密度化的发展,高校图书馆的图书文献信息的资源类型和载体呈现多样化,对文献信息的加工、存储、查询、利用、共享的方式更加现代化。因此,为满足高校师生对图书文献信息资源需求度的日益增强和现代化的需求,高校图书馆必须加大投入,加速数字化图书馆的建设,将馆藏文献资源和网络信息资源进行数字化加工、整理、收藏、整序,提供高效、丰富、便捷的数字化文献信息资源,为学校人才培养、科学研究和服务社会提供优质服务。
一、高校数字图书馆的定义与优势
数字图书馆(Digital Library)始于上世纪九十年代。运筹学家阿蒙斯(William Y. Arms)提出:数字图书馆是具有服务功能的整理过的信息收藏,其中信息以数字化格式存储并可通过网络存取。即数字图书馆是对以数字化形式存在的信息进行收集、整理、保存、和利用的实体,其形式可以是具体的社会机构或组织,也可以是虚拟的网站或者任何数字信息资源集合。与传统图书馆相比,数字图书馆具有如下优势:①信息存储不受空间制约。数字图书馆的馆藏扩展为磁盘、光盘、磁带等不同的格式和书目信息、全文信息、图像、音频、视频等不同的信息类型,正式将图书文献信息以数字化形式加以储存,其收藏的资源数量无空间制约。②检索便捷,查全率和查准率高。数字图书馆都配备有电脑查阅系统,通过主题、关键词、摘要、作者、题目、单位、来源等检索项和检索词,可获取大量的相关信息,检索便捷,查全率和查准率高。③信息传递速度快。读者只要登录网站,轻点鼠标,信息文献资源通过网络传递,可在几秒内查阅到想要的信息,随时随地自由检索和下载。④信息资源高度共享。数字图书馆则可以突破“一本书一次只借给一个人使用”的限制,一本通过服务器可同时共多人查阅,大大提高了信息的使用效率。
二、我国高校数字图书馆建设历程及存在的问题
我国正式提出数字图书馆概念并大规模研发工作始于1996年在北京召开的第62届国际图联(IFLA)大会上,IBM公司和清华大学图书馆联手展示“IBM数字图书馆方案”。1997年文化部的“中国试验型数字式图书馆项目”的立项与实施,是中国数字图书馆建设开始的标志。1998年“中国数字图书馆示范工程”国家863计划重点项目的实施和99年国家图书馆的“数字图书馆试验演示系统”开发成功,标志着中国数字图书馆工程进入实质性操作阶段。经过近十几年的努力,各地高校先后也组建了规模不同的数字图书馆,为师生提供丰富的文献信息的同时,也存在着一些亟待解决的问题。
1.专业人员缺乏,馆员素质低。数字化是高校图书馆未来的发展方向,人才是关键。随着数字图书馆的建设,馆员中出现专业人员少、技术人员不足、年龄老化、工作积极性不高等问题。由于图书馆是教辅单位,未受到足够重视,各高校的馆员与教师的待遇相差较大,使图书情报专业、计算机专业、自动化专业等方面的人才不愿到图书馆工作,现有人才因种种原因而跳槽,造成图书馆高素质人才难以引进,具有复合型知识的人才就更少。另外,高校对现有馆员队伍的系统培训、有计划的在职学习重视不够,馆员的业务水平低、知识结构陈旧和服务观念落后,数字图书馆的建设和发展举步维艰。
2.重复建设,浪费资源。数字信息资源是高校图书馆建设工作的中心工作。许多高校图书馆认识到数字图书馆的重要性,十分重视数字图书馆的建设。但由于缺乏统一的规划、协调和标准,许多高校图书馆没有结合自身馆藏的特点和教学实际需要,重复建设严重,使得数字图书馆的用户检索界面、检索语言和管理系统、数据库等不兼容,难以联通和共享,利用率不高,不能完全满足教学、科研和服务社的需要。
3.建设资金不足,设施更新缓慢。数字图书馆是一个系统的、巨大的建设工程,其硬件设备和软件资源购置、网络布防、人员培训、资源更新、信息数字化转换等需要大量的经费作支撑。部属院校、“211工程”和“985工程”等重点大学,拥有专项图书馆建设经费,而普通高校图书馆,作为学校的教辅部门,主要依靠学校拨款,经费来源单一,在资金上也难以得到倾斜,所划拨的经费仅能维持购置书刊等纸质文献及一些日常开支。近年来图书、刊物价格大幅度暴涨,致使许多高校图书馆不得不压缩每年的纸质文献购置计划,花巨资更换硬件设备、软件平台和电子资源的采购进行数字图书馆建设更是举步维艰。
4.法律法规不全,版权保护不力。数字图书馆中信息数字化所涉及的知识产权问题包括信息来源的著作权尊重和数字化信息建成后自身著作权的保护。随着数字图书馆的开通,数据库的利用更加广泛,不可避免会产生的知识产权问题,如网络作品的制作、传播和使用的版权保护,其实质就是版权和知识产权在网络时代的运用问题,是世界各国在网络时代面临的新课题,也是数字图书馆目前面临的最大问题。制定保护网络化、数字化信息文献著作权的法律法规成为当务之急。
三、加强高校数字图书馆建设与开发利用的策略
1.加强人才队伍建设,提高馆员综合素质。高校图书馆数字化的建设,对馆员的专业知识、业务水平、学历结构和管理能力等提出了新的要求。高校应重视图书馆馆员队伍的建设,充分利用人才建设的系列政策,加强通计算机技术、网络技术、自动化控制、图书馆学和信息情报学等专业人才引进的同时,对现有馆员的业务技能、计算机知识、网络技术、等方面的培训,提高馆员的综合素质,促进图书馆数字化的可持续发展。
2.重视馆藏特色建设,提高资源利用率。数字图书馆的建设核心就是特色馆藏的建设。特色馆藏的数字化就是要结合高校的特色、优势专业和特色学科,将其参考价值和收藏价值高的图书、信息文献进行数字化,建设具有区域特色的、专业权威的数字资源库,服务于教学、科研和社会,有利推动学校精品课程、重点学科建设,促进区域经济和社会发展。多种途径提高信息文献资源的利用率。
3.多渠道筹措资金,改善软硬件设施。图书馆数字化建设需有稳定而充足的经费投入。高校图书馆要不断强化服务功能,提供优质服务,取得学校重视,争取增加经费投入的同时,还应积极开发数据库功能,拓展应用项目,扩展服务对象,但保证本校教学科研需要的同时,有偿为当地企事业单位服务,多方筹措资金,弥补建设资金的不足。
4.健全法律法规,保护知识产权。图书馆的数字化建设,面临着知识产权保护问题的。随着计算机技术、自动化技术和网络技术的应用,信息资源的格式转换、数字化作品的复制、下载、盗版等更加容易,知识产权保护问题更加突出。尤其是共建或自建的数据库,易发生版权纠纷。为发生侵权行为,国家根据行业特点制定数字版权保护的法律法规,在知识产权法律许可内,做好高校图书馆数字资源的建设。
总之,高校图书馆数字化是当代经济和社会发展的大趋势。虽然我国高校数字图书馆建设还存在着这样那样的问题,但随着科学技术的发展和相关法律法规不断完善,这些问题会得到合理的解决,促进高校数字化图书馆的可持续发展。
参考文献:
[1]李培.数字图书馆原理与应用[M].北京:高等教育出版社,2004:1-3.
[2]周礼智.论数字图书馆的概念和特点及其意义[J].科技情报开发与经济,2006,16(24):68-69.
[3]王文丽.现代数字化图书馆对图书馆员素质的新要求[J].长沙铁道学院学报(社会科学版),2011,12(2):277-278.
[4]李香丽.高校数字图书馆建设的现状、存在问题及对策研究[J].焦作大学学报,2011,3:128-129.
关键词:云存储;图书馆;数字资源
中图分类号:TP311.131文献标识码:A文章编号:16727800(2011)012016503
作者简介:曾祥文(1982-),男,江苏徐州人,江苏建筑职业技术学院图书馆助理馆员,研究方向为计算机应用。1图书馆数字资源存储现状
1.1图书馆数字资源存储方式比较
传统的数字图书馆服务体系主要解决用户的基本需求,存储方式大多采用直接附加存储(Direct Attached Storage, DAS)技术、网络附加存储(Network Attached Storage, NAS)技术、存储区域网络(Storage Area Network, SAN)技术等。
(1) 直接附加存储(DAS)。直接附加存储是指主机与存储设备之间的直接连接,存储设备通过SCSI或ATA作为数据接口的存储方式。直接附加存储是目前国内比较成熟的数字资源存储方式,具有标准统一、兼容性好等优点,但面对指数型增长的信息量,DAS存储方式存在可靠性和安全性较低的缺陷。
(2) 网络附加存储(NAS)。网络附加存储是指直接接在网上的存储设备,实际上NAS是一台专用的存储服务器,数据通过网络协议进行传输。网络附加存储支持异构服务器间的数据共享,在资源存储的可靠性方面也有所改善,但NAS的数据备份时消耗过多的通信带宽,导致数据传输速度过低,另外NAS不支持数据库服务,因此不适合大型数据库的应用。
(3) 存储区域网络(SAN)。存储区域网络是独立于服务器网络之外的高速存储专用网络,其将存储子系统网络化,实现真正的高速共享存储目标。SAN是继DAS、NAS之后出现的新兴存储技术,其具有传输速度快,扩展能力强,共享能力高及可靠性、安全性好的特点,因此SAN成为现在社会主流的存储解决方案。
1.2图书馆数字资源建设的需求
传统的存储管理机制,可以支撑一定的系统应用,满足一般的服务需求,但随着计算处理能力和网络互连能力的快速发展,传统的存储方式都已无法适应新的需求,表现为存储设备价格昂贵、兼容性差、扩展不足、数据安全性低等。这对数据的存储和管理能力产生了新的需求,图书馆数字资源的建设也面临着新的问题。
(1)存储对象多样化。图书馆的数字资源一部分来自于购买的电子期刊、电子书及其他数据库,另一部分源于自建资源,数据类型多种多样,除了传统的文本、数据外,还包括图像、音频、视频,甚至虚拟机镜像文件、数据库的关系数据等,使得数据的异构化空前加深。
(2)资源总量迅猛增长。随着图书馆数字资源建设进程的加快,对数字资源存储的空间和复杂性需求也在不断增强。无论是自建资源,还是引进资源,其总量都是十分巨大,增长速度也相当快。长期以来,这些电子资源一直存储在各系统自身所配载的硬盘之中,这种分散存储状态在存储管理效率、数据安全性、系统稳定性等许多方面均难以尽如人意。为对已有资源的存储环境加以整合,并考虑到增量资源的潜在存储需求,迫切需要建设一个不仅具有超大容量,而且具有良好扩展性的集中存储架构,满足数字资源不断增长的需要。
(3)存储的安全高效性。图书馆资源面向终端用户,访问者多,访问量大,对其安全性的要求也较高,要求存储系统性能稳定可靠,容错能力强。当设备出现故障或系统崩溃时,能够及时启动备用系统并及时恢复数据,防止任何情况下数据的丢失,确保关键资源的安全存储与关键应用的高效响应,使数据资源具有更高的可用性。
(4)存储应用的可扩展性。数字资源建设要有一定的可伸缩性和较强的可扩展性,能在服务不中断的状态下,完成在线的升级和扩容。
综上所述,图书馆数字资源建设不仅要能适应海量存储和不断增长,同时还要能够满足当今网络环境复杂性和扩展性的不断提高。
2云存储
云存储(Cloud Storage)是云计算的延伸和发展,云存储是通过集群应用、网格技术和分布式文件系统等功能,将网络中各种不同类型的存储设备通过存储管理软件集合起来协调工作,共同对外提供数据存储和业务访问的功能。与传统的存储设备不同,云存储不仅仅是一个硬件,而是一个网络设备、存储设备、服务器、应用软件、公用访问接口、接入网和客户端程序等多个部分组成的复杂系统。各部分以存储设备为核心,通过应用软件来对外提供数据存储和业务访问服务。
源于云计算技术的云存储继承了云计算强大的计算能力,在云存储模式中,当用户提交一个查询请求时,云存储的管理系统将调用云中的所有服务器和存储设备同时搜索众多的数据库,然后将结果返回给用户。另外,除了使用PC外,用户还可以通过PDA,手机等终端方便、快捷地获得云存储中的相关信息和服务,无需考虑使用的哪个数据库,哪个存储设备。在此模式中,通过应用软件可以实现数据的备份和容灾,对数据进行统一管理、分配资源、负载均衡,并可进行可靠的安全实时监测,从而使数据安全得到最大限度的保证。
3基于云存储的图书馆数字资源建设模式分析
建设图书馆数字资源云存储平台,首先要建立一个适合图书馆数字资源存储的分布式存储架构。根据云存储的模型,构建图书馆数字资源的存储架构,如图1所示。
与传统的存储模式相比,云存储模式下的图书馆数字资源建设不仅提供了数据备份服务、网络存储空间,还提供了基于虚拟化技术和云存储管理平台的资源动态扩展能力和资源池共享架构。基于云存储模式的图书馆数字资源建设由存储设备、网络设备、集群中间件、虚拟服务器、业务管理、公用访问接口以及相应协议标准等多个部件协同作用共同组成。各部分以存储设备为核心,通过应用软件来对外提供数据存储备份等服务。根据各部分逻辑功能的不同,云存储模式下图书馆数字资源建设架构由4层组成。
图1存储架构
(1) 存储资源层。存储资源层是该框架最基础的部分,处于整个系统架构的最底层。存储设备可以是FC光纤通道存储设备,可以是NAS和iSCSI等IP存储设备,也可以是SCSI或SAS等DAS存储设备。数量庞大并且可以分布在不同的区域,彼此之间通过广域网、互联网或FC光纤通道网络连接在一起。存储设备管理可通过软件及虚拟化系统实现存储设备的逻辑虚拟化管理以及硬件设备的状态监控和故障维护。
(2) 资源配置层。资源配置层是该框架的核心部分,该层通过虚拟服务器、集群、分布式文件系统等技术,实现多个存储设备之间的协同工作,使多个存储设备可以对外提供同一种服务,并提供强大的数据访问性能。同时,通过各种数据备份和容灾技术保证数据不会丢失,确保整个系统的安全和稳定。
(3) 业务管理层。通过对虚拟系统的管理及各项业务的部署管理,可根据不同的应用服务接口,提供不同的应用服务,实现基于云存储的各项服务的可管可控。
(4) 应用访问层。任何一个授权用户都可通过标准的应用接口来登录,使用云存储模式下的图书馆数字资源及服务。
在云存储中不同存储设备之间利用集群、分布式文件系统和网格计算等技术,把存储于分散设备上的信息资源和处理器资源集中在一起,实现存储设备之间的协同工作,使多个存储设备可以对外提供同一种服务,从而大大提高数据访问性能。
4云存储模式应用于图书馆数字资源建设的优势云存储模式下的存储不仅仅是存储,更多的是应用。将先进的云存储技术应用于现代图书馆数字资源建设已成为数字图书馆的发展趋势。通过云的分布式计算,可为用户提供高效的计算能力和超大数据处理能力,整合优化资源,实现最大规模的资源与服务的整合,为用户的个性化需求提供基础。其优势主要有以下几个方面。
(1) 海量数据存储的安全性与可靠性。云存储模式下图书馆数字资源的安全性不仅要充分考虑传统存储技术或系统可能存在的安全隐患,还要充分考虑由于新技术或系统引入可能引发的安全问题。云存储模式下海量数字资源不是存储于某个图书馆的服务器上,而是存储在“云”的服务器上。虚拟化海量存储可采用数据副本的方式进行容错,通过对每个虚拟盘创建多个副本来提高数据的可用性和访问性能。这种方法不需要维护规模庞大的映射表,即使磁盘被损坏,也不会影响正常的读写访问,更适合在云环境下的海量存储网络系统中实现。显然云存储模式下不会造成数据的损坏和丢失,确保了数据的可靠性。
(2) 提高了数字资源的更新速度及存储的扩展能力。通过云存储提供的空间和计算能力,高度的扩展性满足数据增长对存储系统扩容的要求,修改和添加信息的灵活性可使图书馆间互相补充信息更加方便,充分适应了图书馆业务的发展。
(3) 实现了不同设备间的信息数据共享。通过云存储模式,相关图书馆间可构建共享空间,将数字资源放于存储资源层,用户只需将电子设备连接至互联网,就可访问和获取所需的任何数据。
5结束语
随着云计算技术的发展,云存储服务将改变图书馆数字资源建设的模式,成为未来图书馆数字资源建设发展的一种趋势,它能够有效解决数字图书馆中数字资源存储和服务问题。目前,虽然云存储在图书馆中的应用还处于初级阶段,在实施过程中可能会面临很多问题,但是随着云存储技术进一步的发展和成熟,将为数字图书馆用户提供服务内容更丰富、信息更安全、存取更高效、操作更简便的存储服务。参考文献:
[1]田立峰.图书馆存储技术方案的选择和应用[J]. 图书馆工作与研究,2006(5).
[2]周敬治,修蔽蔽.数字资源存储系统的构建模式及比较[J].情报杂志,2006(11).
[3]刘姝.对高校图书馆建设数字资源存储系统的思考[J].大学图书馆学报,2008(6).
[4]李开复.云计算[J].中国教育网络,2008(6) .
[5]王迪,薛巍,舒继武,等.海量存储网络中的虚拟盘副本容错技术[J].计算机研究与发展,2006(10).
Library Digital Resources Construction Based
on Cloud Storage Mode
[关键词]高校图书馆;数字资源;采购模式
doi:10.3969/j.issn.1673 - 0194.2016.18.129
[中图分类号]G258.6;G253 [文献标识码]A [文章编号]1673-0194(2016)18-0-01
为满足新时代人才的培养需求,我国图书馆行业的科研人员加强科研工作,提出了“数字图书馆”的发展方向。主要原因在于数字资源不仅解决了传统纸质资源的弊端,满足当下快速发展的阅读需求,同时还对相关科研工作具有重要的影响。高等院校是高层次人才的聚集地,优化数字化资源,有利于培养他们的综合素养,提高相关的专业技能。但是由于数字图书馆在采购模式上存在较为严重的资源浪费现象,增加了采购投入成本,影响了学校的相关教学和科研。因此,国内学者对高校图书馆资源采购进行了研究,为后期的科研教学奠定了基础。
1 高校图书馆采购数字资源的现状分析
我国图书馆在数字资源的采购方面缺乏系统的法律规范,因此存在着严重不足。随着科技与经济的发展,现下我国形成了自主采购、集团采购和政府招标采购的3种采购模式,但就目前对图书馆数字化的发展而言,都存在着一定的问题。
自主采购指的是单个高校图书馆自行组织采购数字资源的形式;集团采购指的是多个高校图书馆本着“慎重、科学、严格”的原则,联合起来进行集合采购数字资源的方法,可分为多种采购形式;政府招标采购指的是按照《中华人民共和国招标投标法》和《中华人民共和国政府采购法》的法规及政策,通过数字资源的招标,采购数字资源的形式。
2 高校图书馆数字资源的采购模式分析
2.1 自主采购与集团采购
分析采购流程,可以发现,自主采购与集团采购的采购流程基本一致。分析采购效果,可以发现,自主采购具有一定的局限性,不能整合当下时代各高校的显著优势,缺乏系统性、规范性、科学性,而集团采购可以通过谈判的方式,以最低的价格、最优的服务得到品质较高的数字资源,避免了单个图书馆的人力、财力消耗。
2.2 政府招标采购
分析采购流程,可以发现,政府招标采购的采购流程要比自主采购与集团采购更加严谨、规范。分析采购效果,可以发现,政府招标采购与集团采购和自主采购相比,严格规范各环节采购过程,加大了监督力度。虽然各高校对政府招标采购的褒贬度不一,但它仍是当下高校采购的主流趋势,因此还需要相关学术者不断地探索与完善,同时兼顾现实性与差异性。
3 高校图书馆数字资源采购新模式
近年来,随着我国政府对高校图书数字资源的关注度越来越高,相关的采购法律法规也在不断地完善和修订中,为方便各高校的数字资源采购,现下实施了政府采购协议供货的采购模式。
政府采购协议供货是指通过公开招标的方式,确定数字资源的相关品牌、价格、折扣率等基本信息,通过协议的方式,由政府专门的采购人员执行的某一时期的特定采购方式。在协议的有效期限内,采购人员与供应商直接进行订货交易,采购所需货物,与政府招标采购的模式相比,协议供货缩短了采购所需时间,降低了成本,提高了采购效率,最为突出的优势就是避免了同类货物的重复招标,是当下采购双方普遍认可的一种采购方式。
4 对当前协议采购工作的探讨
4.1 协议供货存在的问题
第一,由于现下缺乏相关的采购规范,相关的法律文献也不健全。因此,采购人缺乏责任心及供应商之间难以形成良性竞争,导致了协议的供货价格要高于市场价格。第二,社会主义市场经济的高速运转,人们对于新产品的需求也在日益的变化,但是目前可供选择的协议资源产品种类相对有限,种类涵盖范围不够全面,不能满足采购单位的所有需求,因此在进行相关的采购工作时,给采购人员带来困扰。第三,为追求经济效益,供应商在招标过程中,为规避公开招标,会将数字资源化大为小、化整为散,分单申报走协议供货程序采购,增加了相关的作业量,对采购工作造成一定的影响。
4.2 优化数字资源协议采购方式的措施与建议
健全数字资源采购的法律法规,运用系统、科学、合理的治理手段,全面贯彻落实《中华人民共和国政府采购法》的同时,将采购理论与实践进行有机结合,丰富采购体系,才能保障相关数字资源采购工作的有序开展。第一,针对当前采购工作管理中的突出问题,教育部门应该结合工作开展的实际,落实好相关制度的建设,政府部门应该不断地完善采购法律及配套细则,制定完善的规章体系;第二,采购监管部门应该强化相关协议,做好前期的调查工作,加强与省级或市级的监管和采集机构的联系,深入性地进行市场调研,及时把握市场动态,加强对协议产品的价格监控;第三,为满足当前高校对于产品的多样化需求,政府部门应该加强相关的采购工作,扩充产品种类、更新产品信息,以此来满足采购配置标准内的不同需求。
5 高校图书馆数字资源的采购原则
当代,高校在进行数字资源采购时,应该遵循以下四项原则,即教学科研保障原则、以人为本原则、经济性原则和灵活机动原则。
6 结 语
我国必须加强相关图书馆数字资源的采购工作,保障在当下图书馆数字化的发展中,满足对相关综合型人才的培养需求,进而推动我国的经济与科技发展。
主要参考文献
因为有了前两届会议的经验,第三届会议的模式已经比较成熟,但从国家图书馆采编部分离出去的外文采编部相关人员前两届参与较少,因此第三届会议的主导权都在中图公司手里,国家图书馆外文采编部乐得当一回甩手掌柜。临开会的头一天,国家图书馆外文采编部主任高红发现会议室不干净,虽然是当甩手掌柜,但这毕竟是她第一次主持全国性的会议,愤怒在所难免,她随即同中图公司商议临时更换会议地点,并一一以会议通知的形式向与会代表说明,总算是有惊无险,确保了会议如期召开。
不过这个小插曲也许会给举办双方今后的合作留下一点小小的阴影。
会议成为了固定模式,有利亦有弊。利就不用说了,无非是复制过去的形式,让人省心,甚至参会的嘉宾都没有什么变化。弊也是显而易见的:突破的空间不大,甚至在某种程度上是一种倒退。比如说,第一届会议有若干出版社参加,图书馆和出版社搭台唱戏,互通有无,对文献采访有百利而无一害,但第二届与第三届都没有出版界人士参加,倒是有几家外国出版赞助商出现在会场,显然,这几家赞助商是冲着国家图书馆外文采编部和中图公司去的,对全国图书馆文献采访兴趣不大。
好在会议并没有因为主办方换成了国家图书馆外文采编部而把关注的内容转向外文文献采访,从这一点亦可以看出,全国图书馆文献采访工作研讨会的品牌意识已经初步显现。
还是那些专家
这次采访工作研讨会邀请的图书馆界专家几乎都是前两届会议的专家:北京大学信息管理系教授刘兹恒、中国社科院图书馆馆长杨沛超、北京大学图书馆采访部主任陈体仁、北京邮电大学出版社社长代根兴和中科院国家科学图书馆副馆长孙坦。杨沛超、孙坦分别是中图学会资源建设与共享专业委员会的主任和副主任,代根兴主要还是作为图书馆界的代表而非出版界的代表参会。
他们都是目前国内图书馆界在文献采访领域非常知名的专家、教授。刘兹恒偏理论研究,陈体仁偏实践工作,孙坦偏数字资源采访,代根兴则跨图书馆和出版社两个领域。这些专家组成了会议论文集的专家评审委员会,同时作为大会发言嘉宾和分会场的主持人。应该说,是他们的辛勤工作给会议的质量提供了保障。
刘兹恒比较感性,充满激情。他所在的分会场,其实是福建省图书馆党委书记谢水顺主持,但刘兹恒当仁不让,甚至有点喧宾夺主,把主持的重任给揽下来了,而谢水顺则是求之不得,乐得清闲。在刘老师的带领下,该分会场热闹非凡、座无虚席,会议结束好久,刘老师还被代表们团团围住。记者与刘老师非常熟,深知刘老师的演讲功底,能连续发言五六个小时以上,所以应付半天的会议简直是易如反掌。听刘老师讲话很过瘾,但千万别单独跟刘老师谈话,因为他很少给你结束的机会,甚至是发言的机会,你老老实实地听着,没办法偷懒,一般人的精力还真扛不住。
陈体仁比较理性,话比较少,他主持的分会场很安静,基本上是中图公司图书文献事业部经理卢茉莉和国图外文采编部的几位年轻员工在进行业务交流,陈老师根本插不进去什么话。
代根兴主持的分会场,代表们更感兴趣的是他现在出版社社长的身份。从主持的角度来说,他很好地调动了代表们的积极性,毕竟他也是大学老师出身。
孙坦是不折不扣的大忙人,在研讨会的第一天上午发完言就匆匆往回赶了。作为中科院国家科学图书馆最年轻的副馆长,他承受的压力与重担可想而知。
这么多专家莅临厦门,厦门大学图书馆馆长萧德洪和厦门市图书馆馆长林丽萍自然不会放过这样一个学习的好机会,分别邀请刘兹恒和杨沛超去他们图书馆作报告。专家们还真是不容易啊,行程排得满满的,不过他们非常充实,套用一句俗话说:累并快乐着。
关注的焦点
因为会议在“世界读书日”当天举行,总理视察国家图书馆,陈力副馆长未能来参会,国图业务处处长汪东波代表国图致辞并作主题发言。包括汪东波、孙坦和杨沛超在内的所有专家的大会主旨报告,其内容都是数字资源建设,这也是第三届文献采访工作研讨会最主要的特点。
汪东波在报告中介绍了《国家图书馆数字资源建设2006―2010年规划》的大致情况。该规划制定了数字资源建设目标,并确定了数字资源建设总体策略。如善本古籍、民国文献及其他特藏、专藏的数字化以自建和合作建设为主;1949年以后出版的文献的数据库以外购为主。馆藏文献数字化以全文影像为主,具有特殊意义的资源可进行全文转换,或者外购全文文本。
在数字资源建设上,国家图书馆已经建成以“碑帖菁华资源库”为代表的“十一大资源库”。同时采用现代技术促进数字资源的利用,如多媒体触摸屏、手持电子书、数字电视服务、掌上国图服务、盲人数字图书馆等,并开发国家数字图书馆分馆资源服务平台。目前,国家图书馆正在与哈佛燕京图书馆合作进行中文善本数字化工作,还参加了世界数字图书馆项目。
孙坦在报告中强调了资源建设要以用户为中心的原则。他说,图书馆开展服务与其锁定的用户群有关。如果割裂了这种关系去谈采访,把采访变成采购,进而变成馆藏,就会变成“我有,所以我提供”的局面;如果追溯到用户群,就会变成“你要,所以我提供”。这两者的区别很大。如果从采购出发,它就是构建图书馆的馆藏;如果是从用户出发,它就是构建图书馆的文献保障体系。
图书馆的馆藏是文献体系保障中的核心,它满足的是最核心、最敏感、最普遍的用户需求,但不是全部的需求,其他需求,就需要图书馆的共建共享体系来完成。
在图书馆界,大家都知道,中科院国家科学图书馆(总馆)每年只采购几千册纸本图书,其他都是数字资源。这与他们的服务对象是有关系的:3.5万名科研人员、2.5万名研究生分散在各地,因此他们的馆藏是虚拟馆藏、分布式馆藏。
据孙坦介绍,随着学术环境的变化,到2020年,中国科学院esci信息化建设的远景设想为:基本建成esci环境,实现科研环境的数字化和网络化,先进的宽带网络和基于宽带网络的多媒体通信设施覆盖科研活动的每一个环节与每一个场所,支持无所不在的科研活动。
杨沛超则强调了图书馆联盟在数字资源建设中的重要作用。随后,会议围绕文献资源发展策略、实体馆藏与虚拟馆藏协调发展、采访工作管理及规范化、网络信息资源的开发与利用、文献资源保障体系模式创新与发展、图书馆特色馆藏资源建设、文献资源建设评估七个专题进行了分组讨论,关注的焦点包括:数字资源的评价标准、使用率、长期保存,以及纸本资源和数字资源的结构配置。此外,业务外包、招标采购和数字资源采购也成为会议的热点话题。
在大会闭幕式上,刘兹恒代表论文评审委员会对会议论文进行述评,并贡献出了他所认为的值得去研究的九大方向。刘老师的论文述评博得了阵阵掌声,可谓实至名归。
虽说图书馆界论文几近泛滥之势,质量不高,但写总比不写要好。写,多多少少都是在学习和研究。书业中,像图书馆员这样爱学习的还真不多见。论文质量不高与体制有很大的关系。如果论文写作不与评职称挂钩,真正是有感而发,那样的论文就差不到哪里去。
变与不变
或许是因为主办单位调整了的原因,这次会议给人的感觉是比较仓促的。一个突出的例子是,中国图书商报作为另一家协办单位,一直在为会议出版会刊。但这次的会刊明显不如第二届,竟把好几位专家的照片、名字和职务弄错了,让大家哭笑不得。
商报的社长兼总编孙月沐全程参会,非常认真,这是不多见的。出版发行界的会议一向比较懒散,领导们神龙见首不见尾,图书馆界的会议精神显然也影响到了孙社长。
作为协办单位之一,商报在其中应该能够发挥更大的作用,比如凭借其在出版界的影响,邀请出版社参会,搭建馆社交流的平台。全国文献采访工作研讨会不应该只是一个图书馆界内部的会议,如果画地为牢,会议会越来越形同鸡肋。
近年来,馆配市场发生了很大的变化,采访工作研讨会应该紧密关注这种变化,与馆配商和出版社共同探讨,一起商量解决之道。
在数字资源建设方面,图书馆远远走在出版社前面,图书馆完全能够与出版社分享这些经验与教训,继而引导国内出版界在数字出版方面少走弯路。
对国家图书馆外文采编部和高红本人来说,这次会议真的是一次非常有益的经历。会议的举办方变成国图外文采编部和中图公司,很容易让人误会这是一次外文文献采访会议。中图公司其实是不在乎的,钱给谁都是给。而高红首先得让自己相信,这次会议是面向全国的、包括中外文文献采访在内,甚至是以中文文献采访为主的一次研讨会。在某种程度上,说服了自己也就是说服了别人。
【关键词】采集原则
采集模式采集系统整合模式
数字资源是海量的,理论上一个图书馆可以收集所有的数字资源,但图书馆应该根据自己的任务和服务对象等因素,制定适合自身的数字资源发展政策,确立采集原则、采集模式、采集系统。
一、采集
1、资源的采集原则
(1)对性原则。根据图书馆的性质、任务和特点,针对不同的专题,确定信息的采集方针、明确采集的类型、范围和采集的深度。
(2)统性原则。在网络环境下,应注意掌握和发挥印刷型文献、电子文献和网络信息资源的特点和优势互补、协调发展,从而形成连续系统、完整的数字资源系统,为学术研究人员提供系统、便捷的服务。
(3)靠性与权威性原则。网络信息资源杂乱无序,资源的来源渠道也很复杂,为了避免不可靠的和重复的信息,应从提供者的信誉、机构的性质与规模等方面来考虑,选择权威性和可信度高的网站。
(4)准化原则。在网络环境下,各用户或机构已不再是独立体,而是整个信息网络中的一个节点,各个节点间的信息资源共享实现建立在信息资源建设的统一的标准和规范的基础上。
(5)术性原则。数字资源种类繁多,实现途径多样化,其主要目的是为了进行学术方面的信息传播与交流,实现学术信息资源共享,因此,在数字资源的选取和利用上,应确定数字资源所属的学科范围,通过质量控制选取有学术价值、有深度、反映学科前沿发展水平的科学学术资源,同时应通过同行评审机制确保信息资源质量和学术价值。
(6)益原则。资源的保存最后是为了开发利用,使信息资源建设发挥出最大的使用效益,数字资源模式应根据用户的不同需求对资源进行分类和补充,通过开发相关的技术,最大限度的提高资源的使用效益。
2、数字资源的采集模式
数字资源机构库的资源既包括一次文献的(对象数据)也包括与之对应的二次文献(元数据),图书馆对数字资源的收集将更多的集中在元数据的收集。由于数字资源信息单元多元化的特征,图书馆对信息进行评估和选择将成为图书馆员的工作。图书馆用户选择行为将在“库”的层级上展开,采集数字资源信息时应重视收集行的效率和收集范围的全面。采集模式至少包括3种。
(1)在国家层面进行集中的元数据采集,构建国家级数字资源的元数据总库,然后主题型或其他类型的服务提供者从国家元数据总库采集元数据或进行联机跨库检索。这种模式比较符合我国国情和数字资源的具体要求。技术上也比较容易实现。建立一个国家级数字资源元数据总库,将保障元数据最大限度的一致性,减少重复性工作。
(2)主题型服务提供者执行基于学科的元数据采集任务,然后作为内容提供者为国家数字资源元数据总库进行采集。
(3)按照资源类型(比如期刊论文,预印本,学位论文和技术报告等)由专门的机构进行元数据采集,然后作为内容提供者为国家元数据总库采集数据。目前我国主题型服务提供者和专门资源类型的机构还不存在,因此我国有必要建立一套开放存取资源元数据的国家级的集中的自动化采集机制和系统。并在元数据集成的基础上实现元数据的二次采集。
3、采集系统
目前信息资源的采集系统有手工和自动两种方法,手工采集即手工选择几百个网址和选定一个存储得频率;自动采集是使用机械手爬虫程序来管理网络文献,它定期运行一种爬行程序,把“爬”过的信息资源的每一页都抓到服务器上,并且自动管理。数字资源的采集最好采用自动爬行和手工采集相结合的方式。采用自动内容爬行的方法能尽可能迅速收集到网络上巨大规模的信息资源,对于那些不能用自动方法得到的深层次网络并且具有极高价值的开放存取信息资源内容,应采取手工采集管理方式作为补充。
二、整合
1、图书馆数字资源整合势在必行
(1)从数字资源内容上看,存在以下问题:一是内容交叉、重复。不同数字资源系统之间存在内容交叉、重复的信息,影响用户对信息的选择与获取。二是存在冗余信息、多数数据库资源收录原则是“全”使得大量使用价值不高的信息进入资源系统,干扰用户对信息的获取。三是知识关联程度低。人类知识是一个紧密联系的有机整体,而现有数据库资源系统内的的数据对象大都是孤立存在的,无法体现学科知识的内在联系。四是不宜获取全文。目前数字资源系统大多为题录型数据库,二次数字资源和一次数字资源间缺少链接关系。用户难以获取全文。
(2)从技术角度看,不同的数字资源系统有着不同的编码结构和表达方式,格式的不同导致描述和组织标准的差异,导致检索途径和方法的不同,不同数据库使用不同的检索软件,使得数据库网检索界面也风格各异,迥然不同,具有差异性和复杂性。
综上,从某种意义上讲,数字资源数量越大,给用户造成的负担也就越重,在这种情况下,如果不对数字资源进行合理有效的整合,必然会使用户陷于不得门径而入的困惑境地,影响着数字资源的有效利用。
2、图书馆数字资源的整合模式
数字资源的整合应包括数字资源系统建设、数字资源关联、跨库跨平台检索、保障技术提升四个层面的内容。其中建设是基础,关联、跨库检索是整合的主体内容,保障技术提升是完善。下面谈一下关于数字资源的整合模式。
(1)以书目管理系统OPAC为平台,以书目数据库为基础整合其他数字资源。这种模式是将各类数字资源的元数据信息导入OPAC书目库,对象数据(如文献的正文、图像、音频、视频等)合理规划,或是用其它数字资源建设系统平台生成各种类型的对象数据库。OPAC在图书馆数据库中发展时间长,MARK格式相当成熟,规范性好,数据库质量高,因此这种模式在理论上有一定的优势。但这种模式基于书目信息管理系统。对其它信息特别是多媒体信息描述还不尽如意,对大量信息的管理困难,不灵活,原有系统的内部结构体系及实现技术又局限了它升级……这些因素决定它并不合适用来对多媒体等大容量信息进行建库。(2)以先进的数字资源建设系统为平台实现多库无缝检索及库间数据关联。目前,许多图书馆引进了数字资源加工系统进行特色数字资源建设,这类系统平台最好的是国家图书馆(中数图)数字资源采集、加工、管理、检索、整合系列系统。这类系统是面向对象数据。在处理信息的种类及容量方面较OPAC有很大的优越性,另外这类系统的检索功能更强大,更灵活,能实现全文检索、二次检索、关联检索等,建库灵活多样,能个性。它功能齐全、处理信息种类多,能很好的实现无缝跨库检索和库间数据关系。