前言:一篇好文章的诞生,需要你不断地搜集资料、整理思路,本站小编为你收集了丰富的图书借阅方法主题范文,仅供参考,欢迎阅读并收藏。
《幸福的种子――亲子共读图画书》是被誉为“日本图画书之父”的松居直先生的一部代表作。在这本书中,作者从图画书与儿童的世界讲起,系统介绍了图画书在儿童成长中的重要作用,列举了许多生动的实例教家长和教师如何为孩子挑选优秀的图画书、如何对孩子进行阅读指导。全书充满着亲切、温暖的氛围,通俗易懂,读后可以消除我们的很多困惑,让人有受益匪浅之感。
精彩书摘:
图画书的作用
要增加幼儿的词汇量,培养幼儿的语言能力,最重要的就是让他们在成长的过程中听到丰富的词汇。事实上,建立幼儿阅读能力的基础,是从耳朵不断积累词汇开始的,而不是让幼儿提早识字、看书。
图画书对幼儿没有任何“用途”,不是拿来学习东西的,而是用来感受快乐的。而且一本图画书愈有趣,它的内容愈能深刻地留在孩子的记忆里,在成长的过程中,或是长大成人之后,他自然能理解其中的含义。
在心灵互通的情形下所交流的语言,才是真正的人类语言。而图画书就是在为孩子制造机会,使他们在成长之路上常常体验这种语言。
要专心地听故事,就必须具备独特的能力,将看不到的故事在脑海中想象成画面,这就是一般所称的想象力。丰富的想象力并非天赋,而是经由直接或间接的体验得来,体验愈多,想象力愈丰富。图画书正好能提供给孩子更多的机会去体验。能从一本书中发掘丰富绚烂的世界,或是只能掏出有限的知识,这完全有赖于读者的想象力,而图画书是培养孩子想象力的启蒙工具。
语言相通,心灵才能相通,才能产生共鸣。共鸣愈多,心灵就愈能结合在一起,从而产生认同感。有了这种共同生活的基础,才能够展开团体育儿的工作。共同的体验发展出共同的创造性活动(游戏),会产生更强烈的共鸣和认同感,最后,每个孩子真正了解到同心协力的乐趣。这种共识和深刻的理解,是图画书在幼儿园教育中的重要功能。
家庭与幼儿园拥有共通的文化、语言和影像,对幼儿来说,是不可取代的成长助力。我们只要确实为图画书定位,好好活用,这一点应该不难实现。
怎样教孩子看图画书
在思考图画书与幼儿的关系时,最重要的是认清图画书不是让孩子自己看的书,而是大人读给孩子听的书。
讲图画书只管一个劲儿地讲就好了,不要问东问西,因为这些问题只是为了满足大人的需求。如果是自然地互相讨论,当然最理想,但一定要做到不落痕迹。
图画书是让人先看图,而不是先看文字。孩子一边看图,大人一边将文字念给他听,孩子的脑海中就会清楚地浮现出对故事的整体印象。这是使用图画书最理想的方式。
孩子会从有图画的地方开始看故事,大人却会跳过这几页,从有文字的地方才开始看,结果遗漏了非常重要的部分。看任何一本图画书时都可能出现这种情形,因此教孩子看图画书时,应该从封面、封二、扉页、正文到封底,仔细阅读每一幅插画。
如何判断图画书的优劣
“画得可爱”“颜色鲜艳美丽”不是图画书插画的必备要素。真正重要的是“插画能否充分表达故事”。
要判断故事的好坏,可以读一读图画书的文字,然后在心中描绘故事的情节,看看会不会出现清楚的影像。
对于图画书,要确认故事好坏的最好方法,不是用眼睛看文章,而是用耳朵去听。我们可以请别人来读,自己用耳朵听,如果故事中的画面一幕幕自动浮现在眼前,那就是容易理解的文章。由于孩子们是用耳朵听图画书的,因此大人有必要站在孩子的立场,以相同的方式来接触图画书。
图画书的插画应该比文字的描述更丰富、更正确。
好的图画书作者会以历历在目的方式来叙述,将要说的主题传达给孩子,同时将插画的细部与整体结合,以图文一致的形态表现整个故事。这种图画书能使孩子确实把握主题,相信作者的描述并产生共鸣。
图画书的插画应该天真可爱的说法,没有任何依据……我们应该慎选内容及表现手法恰当的图画书。
自称是世界名著的图画书,都是简明版,是模仿原著的赝品。希望父母为孩子选图画书时,能够先剔除这类由世界名著改编而成的图画书。
小贴士:
本书的附录中,按照“欢迎来到图画书的世界”“培养语言能力的图画书”“感受亲子温情的图画书”“给孩子生存力的图画书”等类别,向我们推荐了松居直先生喜欢的50本图画书。按照这个书单去购买图画书,相信您一定不会失望。
著者简介:
松居直,1926年生于京都,于1956年创办日本第一本图画书月刊《儿童之友》,发掘了赤羽末吉、长新太、神泽利子等世界级的图画书作家,对日本图画书的发展起到了重要作用,被称为“日本图画书之父”。现为福音馆书店顾问、日本出版学会会员、日本国际儿童读物联盟(JBBY)理事、联合国教科文组织亚洲文化中心评议员、中日儿童文学美术交流中心副会长。著有《桃太郎》(获日本产经儿童出版文化奖)、《木匠和鬼六》等多种图画书,出版了《我的图画书论》《看图画书的眼睛》《绘本之力》等理论著作。
译者简介:
关键词:图书馆 统计分析 借阅量
中图分类号:G255 文献标识码:A 文章编号:1672-3791(2017)01(c)-0195-04
Abstract: The statistics of library is an important part of library work, it could improve the scientific management level by finding problems and taking measures to the problems from the statistical analysis. Through the statistical analysis of books daily borrowing and readers into the library in 2015 of China University of Political Science and Law Library, this paper analyzes in depth the objective phenomenon of utilization of university libraries of different type readers. The data shows that the library resources construction needs to pay attention to the readers’ actual demand, and provides some valuable suggestions for the construction of library resources, it is also one of the main basis for library work’s decision and evaluation.
Key Words: Library;Statistical analysis;Borrowing amount
1 图书馆利用统计的意义
图书馆是人才培养和知识传播的重要场所。读者根据需要走进图书馆进行学习,以便在生活、学习、工作中表现出更高的知识素养、学习和工作能力[1]。图书馆利用统计是了解图书馆利用与读者需求之间关系的一种方法,通过统计图书的日常借阅和读者入馆情况,掌握读者对图书的需求,从客观的角度反映图书馆的服务水平[2]。
2 统计的目的、内容与方法
2.1 统计的目的
图书馆利用是衡量图书馆馆藏和服务质量的重要指标,通过借阅统计与读者入馆次数统计了解读者阅读倾向与习惯,掌握读者对图书的需求。通过统计还能加强图书馆硬件与藏书建设,制定科学合理的藏书规划,从而对完善图书馆整体建设提供依据。总之,图书馆统计对馆藏质量和读者服务水平的提高具有重要的意义[3]。
2.2 统计的方法与内容
统计的具体内容是对馆藏的图书借阅数据与读者的入馆次数进行统计,一般统计时间为1年,以读者借阅与入馆情况为统计样本[3]。借阅情况统计可以借鉴《中国图书馆图书分类法》。统计的方法是对读者每日的借阅数据与入馆次数情况进行统计、汇总与分析,进而掌握图书馆的年度利用情况。
3 实例分析
通过进行实例分析,能够了解并掌握阅读者对馆藏图书的需求,根据读者的需求,合理调整馆内资源建设,使图书馆的建设更加合理化,同时提高读者的综合素质,进一步做好服务育人[4]。以中国政法大学图书馆为例进行分析。
3.1 图书借阅量与读者倾向分析
从表1得知,该馆各学科图书的借阅情况相差悬殊,借阅量最大的是政治法律类书籍占51.88%,其次是文学类、经济类、哲学类、历史地理类,这五类图书占85.97%。流通量最小的有综合性图书、天文学科类、生物科学类、农业科学类、交通运输类及航空航天类图书,其流通量占0.20%。在馆藏图书全年流通量中,社会科学图书的流通量占88.13%,自然科学类占1.64%,综合性图书类占0.08%。社会科学类图书的流通量最高,这说明了我馆读者借阅需求偏重于社科类图书,这也与我校专业设置与资源分配相吻合。
3.2 各类读者借阅情况分析
该馆读者主要由学生、教职工和其他读者(包括馆际互借读者、担保生等)构成。学生读者又分为本科生、硕士生和博士生。从图1中可以看出借阅量最大的是本科生,但图2表明其人均借书量排在第三位,并未因其借阅量大而提高人均借阅量,这是因为本科生的借阅量虽大,但其人数也最多,所以本科生的人均借阅量并未达到最高,恰恰是比重最少的博士生取得了最高的人均借阅量,硕士生次之。这恰恰反映高校的现状,就是要求培养高素质高水平人才,对研究生的毕业要求在逐年增长,尤其是博士生的更为明显,所以研究生的人均借阅量较高。其他类型读者的借阅量比例虽小,但这也彰显了一个好的发展趋势,说明读者正在向多元化发展。
关键词:大一新生 图书借阅 问题 对策
图书馆是一所大学最重要的书籍资料集藏地,是大学生四年学习生涯中除了教室之外最重要的学习场所。大学生学会科学、合理地借阅图书,对其学习、成长无疑具有十分重要的意义。但在实际当中,许多大学生尤其是大一新生在图书借阅过程中存在不同程度的问题,值得师生们思考。
一、大一新生图书借阅存在问题
由于刚刚脱离高中繁重的学业,步入大学校园,大一的同学往往缺乏图书借阅方面的知识。
1.阅读书目较盲目
阅读书目是针对各专业特点而为学生设计和推荐阅读的书目清单,包括专业类、人文类和综合类书籍。大学的文、理、工、农、经、管、艺等各专业课程设置存在很大差异,其参阅书目亦各有侧重。
大一新生由于刚从高三繁重的学习中解脱出来,普遍存在一种上大学后放松的心态,因此在阅读书目的选择上存在偏差,往往喜爱借阅小说、休闲杂志、通俗读物等,而不愿意借阅本专业的入门类书籍及拓宽学习视野的综合类书籍。
2.索书、找书有困难
高校图书馆的藏书一般都有几十万至上百万册,按照《中国图书馆分类法》进行分类上架;每一个书架上的藏书又是按照从小号到大号,以“Z”型顺序排放。
大一新生在高中时并未接触过相关知识,进入大学后在索引和寻取图书时容易出现不知道图书分类法的含义、不知道如何寻找图书等情况,给他们的图书借阅带来一定的困扰。
3.借阅规则不熟悉
图书馆一般都对图书流通有详细地规定,如读者借阅等级、借阅权限,图书借阅期限、图书续借、超期罚款,图书证办理、注销及延期等情况。
大一新生由于不熟悉借阅规则,往往会产生一些超期欠费、证件遗失未及时挂失,甚至图书被冒名借阅等麻烦。
4.借阅习惯未养成
一些大一新生没有养成良好的借阅习惯,例如:阅读了图书之后就将其遗留在自习室座位上,而不愿顺手将其放到图书流转架,从而增加了图书馆工作人员的工作量;部分读者不爱惜图书,将图书随意折叠、污损;书籍借阅之后不能按期归还导致超期;不懂得在网上或者手机上进行续借操作;借还书时不懂得将书籍码放整齐以方便图书馆老师扫描图书条形码。
二、原因分析
产生上述情况的原因,主要有以下几点:
1.系部无暇顾及
新生报到之后就是紧张的军训,接着便是正式上课,大一年级各种各样的事务非常多,因此各教学系部的精力都集中在这些工作上,对于新生入馆知识培训、入馆教育等方面根本就无暇顾及。
2.入馆教育工作不到位
按照相关规定,大一新生入学后应当接受图书馆利用方法的教育。但是由于多方面原因,新生的入馆教育往往由图书馆老师在会堂里做一个讲座,学生也是爱听不听,导致讲座起不到什么实际效果。入馆教育工作不到位,流于形式,走走过场。
3. 学生自己不重视
大一新生往往认为,入馆教育就是简单的借还图书,一看就会,并没有什么知识可学的,参加入馆教育讲座时很多同学压根就没听,光顾低头玩手机。甚至从来不登陆图书馆网站,不阅读图书馆相关规章制度。
三、对策探讨
针对上述问题,我们可以从多个方面加以改进及提高。
1.加强大一新生的入馆教育
入馆教育是大一新生入学教育的重要部分,是其了解、认识并学会利用图书馆的开始。做好了入馆教育,能帮助大一新生有效地掌握图书馆的资源利用方法,如同交给了他们一把开启知识宝库的金钥匙。
高校分管领导、各院系领导、图书馆领导要高度重视入馆教育工作,把入馆教育纳入新生必修课。通过组织新生实地参观,开设讲座,利用校园网、宣传栏、《读者手册》等途径,切实做好做扎实新生入馆教育。
2.借助新兴媒体提高工作效率
现在的大学生都是95后,他们成长在信息时代,对新兴媒体的接触和掌握能力较强。因此,我们完全可以充分利用微信、微博、人人网、百度贴吧等新兴媒体手段,将图书馆的借阅规则、借阅流程、索书细则、新书推介等内容在其上,以95后喜闻乐见的形式开展工作,并与读者进行交流互动,从而提高工作效率。
3.培养新生良好的借阅习惯
【关键词】图书室 管理 现状
【中图分类号】G 【文献标识码】A
【文章编号】0450-9889(2017)01A-0011-02
一、学校图书馆(室)的作用
中小学图书馆(室)建设是学校基本建设之一,是学校教育教学的重要组成部分,是学校领导不断提高管理水平,教师不断更新知识、提高育人艺术和教学教研能力,以及培养学生收集与处理信息的能力、促进学生全面发展的有力助手。图书馆(室)是学校的文献信息中心,是为学校教育、教学和科研服务的机构,图书馆(室)的建设水平在一定程度上体现了学校的办学水平。根据《广西中小学图书馆(室)建设工作实施意见(试行)》中的说明,也可以看出图书馆(室)建设与管理是学校的重要工作之一,更是学生获取知识不可缺少的地方。对于农村小学来说,学校的图书室更是活跃学生第二课堂的主要场所。
语文课程标准提出,要让学生“认识中华文化的丰厚博大,吸收民族文化智慧”,其中明确要求学生在九年义务教育阶段课外阅读量达到400万字以上,一到六年级学生背诵古今优秀诗文160篇(段),由此看出新课标对学生课外阅读的重视程度。作为一名语文老师,同时也是一名图书室管理人员,笔者深感课外阅读对于学生的重要性。一般来说,凡是课外阅读量大的学生,知识积累比较丰厚,做阅读题、完成习作对他们而言不算太难,而受经济条件所限,农村地区小学生的课外阅读主要在学校的图书室完成。
二、目前农村小学图书室的发展现状
近几年来,随着国家对各地中小学基础建设的重视和支持,许多中小学图书室建设取得了较大的进步,图书室由无到有,藏书有少到多。但由于各地的办学条件限制,目前许多农村中小学校的图书室均由一间两至三开间的教室改建而成,存在馆舍面积不达标的问题,使图书室仍为一个图书储存间,没办法开架借阅;同时,图书室内大多是经年累积的旧图书,或由上级下拔,或由校外赠送,或由校内老师、学生自主捐赠,藏书量根本没办法达到基础建设的要求,有些学校就算达到了生均本数的要求,但从学生的阅读需求来说,可读图书仍大为不足;另外,大部分学校图书室采用一些旧制木架或各种不规范的改制铁架存放图书,配套设施较为简陋,没有达到通风防霉条件,图书易损坏,添置的新书没过一阵子就会出现掉页的现象。许多学校没有正规的图书管理老师,而是由一些即将退休的老教师或是任课老师充当,出现管理人员图书管理能力偏低和管理工作不规范等问题,大大制约了学校图书室的发展,也让学生对阅读课外书兴趣不大,使图书室的功能没能最大程度地发挥出来。
三、建立规范化的图书室管理办法
为了最大限度地发挥图书室的功能和作用,学校需建立一套规范化的图书室管理办法。根据农村小学的办学实际,可以从以下方面着手。
(一)创造条件设置图书室
首先,学校应创设条件,按照要求在校内开设图书室或阅览室,尽量选择通风采光好的场所,书架以对向通透的架子为宜。除此之外,为便于管理,图书室管理也应逐步向管理电子化发展,如配备电脑和条形码扫描器、使用图书管理系统软件等,有条件的也可以考虑进行自助化借阅,如自动借阅。
(二)规范图书管理
图书室中,林林总总的书籍很多,要想提高图书的利用率,发挥图书室在学校教学中的作用,首先就要建立规范化的图书室管理方法,如建立图书室管理制度、图书借阅制度、图书室管理员守则等,进一步规范图书室的基础管理工作。只有实施规范化的管理方法,才能保证图书室业务工作和管理的科学化。
1.建立规范的图书分类及科学的目录检索
为规范管理,学校图书室的图书应当按《中国图书馆图书分类法》进行分类,可以将图书分为22个大类。当然,让所有兼职的图书室管理老师去系统学习图书的分类方法是不现实的,目前最省事的办法就是参照图书在版编目(CIP)数据中的Ⅳ.项进行分类,这个是图书在出版前出版社就已经根据分类方法进行的分类。假如图书上没有在版编目数据项,可以简单地将其分至大类。经过分类处理的图书,已经基本能满足图书索引的需要。另外,应该将图书室内所有图书的基本信息录入电脑,一方面能提升工作效率,也便于打印或下发到班级中作为检索目录;另一方面也为开展电子借阅提供了基础信息支持。
2.多样化借阅方式提高图书的借阅率
图书只有到了读者手上,才能最大限度地发挥作用。目前我校的图书借阅工作仍使用简单的手工借阅(即借出或归还图书使用手工记录的方式),主要有凭证借阅、教师代办借阅两种形式。
凭证借阅,就是图书室给每位学生办理借书证,学生根据自己所办的借书证,在自己班级规定的借阅时段到图书室自主借书;借书后,由学生将所借图书信息填写到借书证上,交由图书管理员核对后即可。借书完成后,学生的借书证统一由图书室按班级保管,待到下次还书后归还给学生,再进行下一次的借阅。根据学生的自主阅读能力,目前我校图书室实行的是三至六年级学生凭证借阅。教师代办借阅,就是教师根据自己的教学需求,要求学生集体阅读一些专题资料时,可由任课老师凭自己的借阅证到图书馆代办借阅,借阅的图书由代办老师发放给学生并回收归还图书室,借阅过程中的相关事宜均由代办老师统一管理和负责。教师代办借阅主要面向低年级的学生。
总的来说,凭证借阅是由学生自主进行图书选择与借阅,每个班级中学生的兴趣爱好不尽相同,这样的方式可以让他们喜欢读哪一类图书就借哪一类书籍,最大限度地满足学生的借阅需求,保证了学生的阅读兴趣。只是这样的借阅方式要对学生进行图书分类的指导,另外还要由熟悉藏书的老师或学生进行有针对性的推荐,不然学生就会找不到想看的图书,或是浪费太多时间去寻找书籍。相比前一种方式,教师代办借阅就更省事、更省时间,只需要任课老师到图书室统一借阅、统一登记即可。这种方式之所以面向低年级的学生,主要因为小学低年级的学生识字量较少,不知道挑哪一本书去阅读,有的个子小的学生甚至还够不到上层的书架,所以由任课老师代办借阅。同时,根据学生的心理特点和学习特点,这一年龄段的学生仍需要管理员给他们推荐一些插画式的注音读物。
3.图书的常规管理
(1)图书入库和登记制度。无论是学校统一采购还是上部门下拨的图书,在新书入库前,都要进行拆包点数,一方面要核对到库图书的数量与价格,方便进行学校资产登记;另一方面也可以为图书基础信息录入工作做准备。当拆包点数工作完成后,就要进行图书分类整理,接着进行信息录入。图书在上架前还要加盖馆藏章及图书室流水章,这样既明确了图书的归属,又便于核对馆藏图书的数量。图书也是学校资产的一个大项,藏书量多少也体现了学校文化资产的多少,而且在学校基础信息年报里通常也需要填报该项目。此外,掌握各类在馆图书的数量,更方便有针对性地选购新书。从方便管理员对图书进行上架或索引的角度出发,接着要做的工作就是给图书贴标签,标签上通常手写或打印图书的分类号及四角编码或大类顺序号。目前我校图书标签上贴的是分类号及大类顺序号,采用贴侧签与背签两种贴标方式。以上图书上架前的准备工作完成后,新书就可以正式上架进行借阅了。
(2)旧书维护与赔偿制度。由于部分学生对书籍的保护意识不强,平时所借阅的图书会经常出现破损或者脱页的情况,在日常借阅工作中,可以由管理员对读者所借图书进行初步的检查,如有损坏的,可以安排人员进行修补;如果出现一些损坏特别严重的图书,已经影响到后期的借阅,则应该上报登记并作为缺失处理。同时,对于损坏、丢失图书的教师或学生,要根据《图书维护与赔偿制度》的相关规定进行赔偿处理,以此提高师生的爱书意识。
(三)建立图书管理员责任制度
1.专职负责人。图书管理是专业性、技术性和创造性都很强的工作,复杂而繁琐,管理者一定要有良好的职业道德,具有高度认真负责的工作作风,热爱图书管理,不断提高管理水平。
2.其他管理员。多数农村小学没有专职的图书管理员,管理老师还要兼任教学工作,除了不能保证时刻都在图书室,还肩负着非常大的工作量。我校根据实际情况,从三至六年级每班选出一至两名学生作为学校图书管理员,承担每天课余时间开放图书室的管理工作,负责借书班级的借还书以及图书室的日常管理工作。此外,还在各班另外安排班级图书管理员,由班级管理员到图书室借出图书,发给班上所需的学生阅读,并做好相关记录。班级图书管理员还可以组织大家在班上进行交换阅读,待全班学生阅读完后,再将书收还图书室,这样不仅很大程度分担了老师的工作,也培养了学生的管理能力,提高了学生对图书的保护意识。工作出色的图书管理员,还会在期末受到奖励及表彰。无论是管理老师,还是学生图书管理员,都要熟悉图书的藏书分类归档情况、借阅的工作流程及方法。
3.卫生工作。图书室的卫生一定要按时打扫,一天两次以上,门窗、书架、桌椅等要经常用毛巾擦洗,桌椅摆放要整齐、规范,使人一见就觉得十分舒服,也就是说图书室一定要经常保持干净、清洁,良好的卫生环境才能让师生们在图书室安心借书、读书。
【关键词】开架借阅管理措施
开架借阅是图书馆发展的必然趋势,是“以人为本”的理念在图书馆服务工作中的具体实践,是现代化的管理手段、面对面的服务方式,为广大读者提供了最大的方便和最有效的借阅方式,同时提高了文献的流通率和利用率。但也存在一些如乱架、丢失、污损等问题,不利于馆藏文献的保护,本文就这些问题进行探讨
一、图书开架借阅的优势
1.1提高馆内藏书利用率,降低读者拒借率。
开架借阅能使读者博览群书,开扩视野,激发了读者的阅读兴趣和求知欲望,,一些不易被读者发现的呆滞书也得到充分利用,使馆藏文献的利用率大大提高。扩大了读者检索、选择的范围,读者找不到急需的书时,还可用相关的书代替减少了拒借率,提高了图书的流通。
1.2可以节省读者时间。
图书开架借阅省去了读者检索目录、填写索书单、排长队等待工作人员到书库取书的时间,缩短了获取图书的过程,极大方便了时间紧迫的读者,受到读者欢迎。
1.3减少馆员劳动强度和无效劳动,提高工作效率。
开架借阅图书,工作人员从繁忙的人工借阅工作中解脱出来。而把更多的精力投入到服务读者、介绍馆藏、解答咨询、维护借阅秩序、修补图书等有效劳动中。让读者高兴而来,满意而归。
二、开架借阅的弊端
开架借阅给读者带来了很多方便,但并非尽善尽美,由于不同的读者有不同的道德修养,图书馆内部的管理制度客观因素,给开架管理带来一定的妨害与困扰。
2.1图书错架、乱架现象严重。
读者在选书过程中存在盲目性和随意性。有些读者,不了解图书开架的方法和制度,不懂得图书的分类方法和架位上图书的严密有序性和科学性。选书中出于好奇心,无目标地东翻翻西看看,盲目地乱取乱放。在找书过程中从书架上抽出来便翻阅,发现不适合自己阅读随意放到空架上。
另外还有些读者由于受借阅量的限制,将自己喜爱而本次无法借出的图书私自放置到不引人注意的地方,以防别人借出,影响图书的正常借阅。大多数读者忽视代书板的作用,到借阅处后虽然凭借阅证换取了代书板,但不去使用它。
2.2图书破损、开“天窗”时有发生。
一是自然因素。开架借阅流通量较大,图书频繁地下架、归架,对图书的丢皮、掉页、索书号和条形码的自然磨损就相应增加,图书在流通过程中由新到旧,由完整到破损,这是属于正常的不可避免的现象。二是人为因素。开架借阅众多读者可以直接入库自由挑选,抽取频率大,破损率增高。个别读者缺乏爱护图书的意识,选书时毫无章法地乱翻、乱插、乱扔,甚至将一些自己喜欢的图片或文字撕下来,造成“开天窗”的现象。
2.3故意损坏及偷盗图书。
有的读者入库后趁工作人员不注意时,将图书的防盗磁条偷偷抠下来,把书藏在衣内通过监测仪伺机偷出。由于丢失的图书往往是价格高、较时尚、借阅率较高的图书,也是很少再版和复本较少的图书,有的甚至是珍贵的孤本书。这样对馆藏图书资源造成很大损失。
三、解决问题的措施、方法
由于开架借阅中存在着许多问题,所以在图书开架借阅管理中必须采用以下有效的强化措施,以确保开架借阅工作的顺利开展。
3.1加强对读者入馆宣传教育工作。
图书馆每年应对新生进行入馆培训及专题讲座,向他们介绍本馆的规章制度、借阅规则、藏书结构、布局、特点等,以杜绝或最大限度减少开架借阅所出现的不文明、不道德现象的发生;同时要把爱书、护书、爱馆的教育融入其中,使读者理解爱护书刊不仅是馆员的责任,也是读者应尽的义务和起码的道德修养。从而减少了乱架、污损、丢失等现象的发生。
3.2培养读者规范使用代书板。
乱架是开架借阅中最大难题,而规范“代书板”制度,能有效地克服开架管理中这一最普遍、最棘手的难题。对乱放、乱扔图书者耐心教育,使读者逐渐养成规范使用代书板的习惯,培养他们正确使用代书板的自觉性。同时在架位上留出一定的空间,供读者存放从书架中取出而又不借的图书,从而使图书错架、乱架现象得到有效的控制。
3.3优化馆藏布局,建立平面图,配备先进的管理设备。
高校图书馆可根据读者需求设立专门书架(如新书架、热门书架等)特色书架(如就业指导、考试辅导类等)同时在书库入口处设置详细的标识平面图,标明各类图书的分布情况,在书架上标明详细架标,使读者一目了然,减少盲目性。这样既方便了读者,也减少了乱架损书等现象的发生。在书库进出口处安装防盗检测仪,对窃书者起到威慑作用。建立完善的查询系统,使读者随时在校园网查询所需资料。配备先进的复印设备,将读者喜爱某些书刊中的内容或图片及时复印,减少撕毁和丢失现象。
3.4提高馆员政治素质、业务水平,强化责任心,实行岗位责任制。
高校图书馆工作人员必须具有较高的业务水平、渊博的知识和爱岗敬业、无私奉献的精神。能主动对读者进行指导,解决他们的疑难问题,随时纠正读者的违章行为,减少书库的乱架现象。要求做到三勤,即“眼勤、口勤、手勤”。要利用一切时间,尤其是读者较少的时间进行整架、顺架、归架。严格实行岗位责任制,做到责任到人、分工明确、定期检查、奖罚分明,充分调动馆员积极性。
开架借阅是图书馆传统管理的一项重大突破,给图书馆带来了新的活力和生机,是图书馆以人为本的服务方向,然而科学地管理开架书库,不断掌握开架借阅的规律,研究开架服务中读者的心理和活动规律,正确协调读者与图书、书库关系任重而道远。今后,图书馆还要从多方面努力,继续提供更优质的服务,以适应现代不断提高的读者需求。
参考文献:
1熊燕,谈高校图书馆开架借阅中存在的问题及管理措施大庆师范学院,2005,04
2李小平,高校,图书馆,图书的开架借阅利弊谈,四川畜牧兽医学院学报,20015
3钟良健如何做好高校图书馆开架借阅的管理,科学教育家2008,8
关键词: 决策树; 分类; 图书馆; Clementine; 借阅权限
中图分类号:TP391 文献标志码:A 文章编号:1006-8228(2014)04-30-04
Abstract: The factors influencing readers' borrowing amount are analyzed and different readers' borrowing demand are determined. The differential borrowing authority and service are customized. A decision tree classification model of reader borrowing frequency is built with C5.0 in mining tool of SPSS Clementine. The decision tree classifies readers into three groups: activing readers, common readers and silent readers. The mined data come from reader borrowing records of the library of university of international relations. The results show readers' identity, major, grade and gender have an important effect on borrowing amount. The borrowing demand of junior students is great, while that of senior students is small. The library readers may be classified by refering to decision tree classification to provide theoretical evident for adjusting borrowing authority.
Key words: decision tree; classification; library; Clementine; borrowing authority
0 引言
数据挖掘能从大量数据中发现有用的知识,目前己成功应用于各个领域。图书馆系统积累了大量读者数据,研究如何将数据挖掘有效地用于图书馆[1-4],变数据为知识,从而更好地为读者服务,是数据挖掘和图书馆工作者的共同责任。
决策树分类是数据挖掘中的一种重要方法,该方法通过对已有数据的学习,识别影响对象分类的若干因素,构建一个决策树分类模型,对对象进行分类。文献[5-6]为决策树在图书馆读者借阅数据中的应用实例,其中文献[5]利用C4.5算法,对306条读者借阅记录进行了分类建模,利用学历、专业和年级三个属性,构建借阅次数(高/中/低)分级模型,得出的结论为:学历是第一决定因素,其次是专业和年级,研究生和大四学生借阅量低等。笔者认为文献[5]挖掘的数据量过小,不具有足够的说服力,且借阅次数分级采取主观划分的方法,缺乏依据。文献[6]利用ID3算法,对1969条研究生的借阅记录进行了分类建模,利用读者是否为新生、是否为工程类学生、性别和距离图书馆的远近等属性,构建决策树模型,得出的结论为:读者是否为新生为第一决定因素,其次为是否工程类、距离远近和性别,一年级新生离图书馆近的、高年级工科学生为活跃读者等。笔者认为文献[6]的数据只覆盖研究生读者,样本不全,且模型仅从训练数据构建,没有测试数据测试,使模型的普适性受到怀疑。另外,文献[5-6]没有对具体所用挖掘工具的介绍。
针对上述研究背景,本文使用SPSS Clementine软件,采用基于C5.0的决策树分类算法,对国关图书馆的4366条读者借阅记录进行建模。建模过程综合考虑读者身份、专业、年级、性别、民族和索书号等因素,构建读者借阅频度决策树分类模型,分析影响读者借阅量的主要因素,给出针对不同读者群的借阅权限分配和服务建议。作为数据挖掘在图书馆的进一步应用探索,本文一方面可为国际关系学院图书馆开展实际业务工作提供帮助;另一方面可为其他高校图书馆开展挖掘实践,提供方法和过程指导。
1 需求分析及技术思路
1.1 需求分析
国际关系学院图书馆藏书37万余册,服务对象为全校师生员工、家属、成人教育学员、国际大学预科项目PCP学员(Pre-College Program)等。服务的部门涵盖法律系、公共管理系(简称公管)、国际经济系(简称国经)、国际政治系(简称国政)、日语法语系(简称日法)、文化与传播系(简称文传)、信息科技系(简称信科)、英语系共八个系。
长期以来,国关图书馆对于读者权限的设定按本科生、研究生和教工划分,见表1。这种划分一是没有结合读者的实际借阅需求,可能造成借阅需求量大的读者权限不足,借阅需求量小的读者权限过剩;二是划分不够细化,没有考虑到读者年级、专业、性别、成绩等因素对借阅量的影响。依据读者的现实个性化需求来确定借阅权限,已成为目前高校图书馆借阅权限改革的方向[7],问题在于:影响用户借阅量的因素有哪些,哪些是主要因素,如何确定这些因素,如何根据这些因素定制差异化权限和服务。本文针对这些问题展开讨论。
1.2 技术思路
本文收集国关图书馆的借阅数据,通过对历史数据的挖掘和分析找出影响读者借阅需求的若干因素,依靠这些因素进行借阅权限细分。具体地,本文借助于SPSS Clementine工具中的决策树挖掘方法对数据进行分析,借助于挖掘得到的决策树识别影响读者借阅量的主要因素,对借阅量按借阅频度进行分级,并构建一个判定用户借阅频度的决策树分类模型,然后基于决策树分类模型,给出针对国关图书馆读者的借阅权限建议。具体技术思路如图1所示。
2 具体的实现方案
2.1 数据源
数据源于国关图书馆金盘系统Oracle数据库,主要涉及原始数据库三个表:、、。其中流通日志表记录读者每次到馆的一项事务。笔者利用这三张表进行连接,从流通日志表抽取2009-2010完整一学年的数据,抽取后的数据存储在Excel表中,命名为 (格式见表2),该表共包含记录109609条,字段8个。其中操作类型为事务类型,如J:借书/H:还书/S:赔书等;读者级别为读者身份,如本科生、研究生、信科教职工等;源单位具体到班级,如:信科0601/国经0702/国政研二等。
2.2 数据预处理
⑴ 数据筛选
取出流通事务记录表中操作类型为“J”(借书)的全部记录。
⑵ 分组计数
取出的记录集按读者条码分组,统计每个读者出现的次数,将此数值记为读者在一学年中的“借书数”。将此属性添加到中具有相同读者条码的记录中。未在流通事务记录表中出现的读者条码的借书数记为0。
⑶ 空缺值的处理
一些记录在“单位”字段上取值为空,用“资料不全”填充空缺值。
⑷ “借书数”区间化
对“借书数”这一数值属性,在建模前对其区间化,把它划分为几个等级来描述读者的借阅频度,并让其作为输出属性,为读者建立分类决策树。该字段原先的数值分布如图2所示。在4366个读者中,一年中读者借书数最多的为174本,平均约12本,最少的为0本(约占50%,即一般读者该年没有借过书)。借过书的读者按照其累计借书量的增加,人数基本呈递减模式。
对“借书数”区间化时,先将没借过书的读者单分一个区间,即借书数等于0,记为“Null”。其余读者尽量按照等频,即相等人数的原则,分为高(high)、低(Low)两个区间,经过统计分析,发现“17”为较好的分界点,区间划分规则为:0
为记录区间化后的借阅频度,为读者库表添加列“借阅频度”,来储存每位读者的年借阅量,处理后的借阅频度属性不同区间的样本数量分布为:
Null:2187;Low:1103;High:1076;总计:4366。
⑸ 其他字段的概化
“读者级别”字段中,教职人员具体到各系和各行政部门,将该字段统一归为“教职工”。“源单位”字段中,学生的单位具体到班级,将其概化到年级。将“索书号”字段概化为索书号头一位。
将预处理后的数据导入到Microsoft Access数据库中,表名命名为,它共包含国关4366名读者09-10学年的借书统计数据,见表3。
2.3 模型构建
利用数据挖掘工具SPSS Clementine(版本11.1)中的C5.0建模节点构建决策树模型。将预处理后的Access数据库表文件作为数据源节点,先后连接工具中的“选择节点”、“抽样节点”和“C5.0节点”,形成如图3所示的读者借阅频度挖掘训练流程图。
将得到的分类模型加入到流程取代“借阅频度类别”建模节点,链接相关输出节点,检验训练样本的自检正确率。之后再用原样本剩下的30%做测试,具体流程如图7所示。其中测试路径抽样节点的配置跟图6基本相同,除了将单选按钮“包含”改为“丢弃。
执行图7流程,得到模型测试结果,其中训练样本上的测试正确率为69.1%,测试样本上的正确率为67.2%。
模型分类结果与测试样本的对比矩阵见表4。该矩阵记录了得到的决策树模型对不同属性取值的分类结果和所占总样本的比例等信息。例如表4,对于测试样本中原来标注为“High”的记录,决策树准确地将其中的203条记录归类为“High”,占所有标为“High”的样本数的60.237%,占总样本数的16.009%。在所有被决策树归类为“High”的记录中,正确归类的这432条占其中的59.882%。
2.4 模型优化
在创建决策树过程中,训练样本可能存在噪声和离群点,形成异常分支,异常分枝在训练模型中表现好,但会对预测带来不良影响。因此通常需对决策树剪枝,使树的复杂度降低,更易理解,预测分类时更快更好。
在SPSS Clementine中,C5.0模型通过“修剪严重性”指标控制对决策树的修剪程度,取值为0到100,该指标值越小剪枝越少;值越大剪枝越多。为保证模型精度,并使构建的决策树简单。笔者对“修剪严重性”指标进行了不同设置和反复测试,测试结果见表5。
从表5看出,当“修剪严重性”在50-85间变化时,测试样本准确率和训练样本自检率并没有出现较大变化,而树的复杂度降低了,深度从3变为2。为了在不增加决策树深度的情况下保留较完整的决策树信息,我们将“修剪严重性”值设为50,此时树的深度为2。
最终生成的国关读者借阅频度决策树分类模型如图8所示。
集合A={法律(大三,研一/研二),公管大三,国经(研一/研二),国政(大二/大三,研一/研二),日法(研一/研二),文传(大一/大二/大三,研一/研二),信科(大一/大二/大三,研一/研二),英语(大一/大三/大四,研一/研二),应用化学研一}
集合B={法律(大一/大二/大四),公管(大一/大四),国经(大一/大三/大四),国政(大一/大四),日法(大二/大三/大四),信科大四,英语大二,应用化学研二,家属,成人教育}
集合C={公管大二,信科研三,应用化学研三,教职工,外教,PCP}
需说明的是,公管系在2009年至2010学年还没有研究生,故相应信息未出现在决策树分支集合中。除信科系外,其他系的研究生学制均为两年,没有研三。
2.5 模型分析和建议
模型的准确度还不够高,这可能是由于源数据缺乏更多与“借阅频度”相关的属性,可继续收集一些有关读者学习成绩(如GPA、年级排名)、距离图书馆远近等信息来为建模服务。
从图8中看出,所在单位(包括身份、专业和年级)对其借阅量影响较大,其次是“性别”。具体如下。
⑴ 借阅量高的读者(活跃读者群):文传大四女生,集合A(特别是大三的学生)。约占总人数的25%。
⑵ 借阅量低的读者(一般读者群):国经大二女生,日法大一女生,集合B;约占总人数的25%。
⑶ 无借阅的读者(沉默读者群):国经大二、日法大一、文传大四的男生,集合C。约占总人数的50%。
按身份分析,大致地,本科生大二、大三的借阅需求较大,大一新生和大四毕业班学生借阅需求较小;研究生文科的借阅需求较大,理科非毕业班的借阅需求大,理科毕业班研三的借阅需求小;教职工借阅需求小。尤其是理科研三学生和教职工在09-10学年的借阅量为0,这可能是由于理科研三写论文所需要的文献大多从电子数据库中获取,而国关教职工每人每年都有充足的购书经费,使得他们更愿意自己购买图书的方式获取资料。
从上述分析结果看出,权限最低的本科生中很多群体借阅量高,而权限最高的教工的借阅量却为0,这跟表1的权限分配相悖,说明了表1权限分配的不合理性。针对国关图书馆读者的借阅权限分配,本文提出以下建议。
建议⑴:按决策树分类模型划分权限。模型中活跃读者群,借阅册数权限设为20;一般读者群,借阅册数权限设为10;沉默读者群,借阅册数权限设为5。权限划分的关键在于模型的构建和基于模型的读者分类,具体数值可根据藏书量、读者人数加以调整。
建议⑵:平均划分权限。按教育部规定,高校图书馆的生均藏书量应达到80-100册,按一个图书馆可经常利用文献量约为馆藏总量的20%计[8],理论上的每生借阅权限应在16-20之间。国关人均藏书量约为85册(37万册/4366人),因此理论上每人借阅权限应为20%×85册=17册,考虑到国关有约50%的人基本不到图书馆借书,理论上的借阅权限还有较大上调空间。保守计算,可将借阅册数权限统一设为17,以最大程度体现“平等服务”和最大限度满足读者借阅量。
建议⑴重视读者需求差异,有助于提高文献利用率和读者需求满足率,但未考虑读者对“平等借阅权”的诉求,然而相对于表1的权限设置更为合理和科学;建议⑵重视读者借阅权的平等。
除借阅权限,图书馆还可针对不同读者群提供针对,比如针对活跃读者群,图书馆可让其参与到图书购买、图书资源评价中,进行新书推荐,提供额外的培训,以提高文献资源利用率和最大限度满足读者需求。
3 结束语
图书馆的数据挖掘对提升图书馆服务质量,开发增值服务具有重要意义。本文从校图书馆的实际需求分析和数据出发,采用SPSS Clementine中的C5.O决策树算法,建立借阅频度决策树分类模型。建模结果显示,决策树模型可按借阅量对读者有效分类,读者身份、专业、年级和性别对借阅量有重要影响,本科大三学生借阅需求较大,大四学生借阅需求小。决策树模型能够帮助图书馆进行读者细分、调整借阅权限和提供差异化服务。
进一步的研究可从两个方面开展,一是收集更多年份、更多属性的数据,提高模型的准确率;二是以分析读者的借阅时长为目标,建立读者借阅时长分类模型,为图书馆针对不同读者群制定不同借阅期限提供帮助。
参考文献:
[1] 顾倩.数据挖掘应用于高校图书馆个性化服务的探讨[J].图书馆杂志,2013.32(8):63-65
[2] 郑斐,郭彦宏,郝俊勤,刘娜.数据挖掘技术如何在图书馆建设中体现价值[J].图书情报工作,2013.S1:263-264,212
[3] 王伟.基于数据挖掘的图书馆用户行为分析与偏好研究[J].情报科学,2012.30(3):391-394,418
[4] 冯研,王馨.国内图书馆数据挖掘技术实践应用进展分析[J].图书馆学研究,2011.20:2-4
[5] 吴修琴.决策树分类技术在图书馆管理中的应用[J].农业图书情报学刊,2007.19(5):24-26,35
[6] 张金镯.基于数据挖掘的图书馆活跃读者研究[J].现代图书情报技术,2008.7:96-99
关键字:高校图书馆 纸质图书 利用 调查分析
图书馆作为高等院校的文献信息、情报服务中心,也是为教学和科学研究服务的学术性机构,其发展状况也直接影响到高校培养人才的质量。目前高校图书馆的发展状况不容乐观。高校图书馆的纸质利用率持续走低,纸质文献资源的发展面临严峻挑战。
在这种情况下,为了充分了解高校图书馆的纸质图书资源利用情况,并使纸质图书资源在高校充分发挥最大作用,提高纸质图书资源的利用率,加强资源优化与服务,全面提升图书馆的服务质量,以更好地服务于读者,本文就以近年5年平顶山市教育学院凌云校区图书馆的纸质图书资源的借阅情况为基础进行了调查与分析。
一、图书馆纸质图书发展现状
随着近年来高校的合并及招生规模的扩大,高校图书馆文献资源馆藏量呈现逐年递增的态势,纸质图书资源的购置投资也在不断稳步增加。自2008年以来,我校图书馆在纸质图书资源方面的投资基本是直线上升。相关的纸质图书资源包括一般图书、期刊报纸和特色文献这三方面都处于逐年增加状态,不过在特色文献方面的增加相对较弱。笔者比较了这三者近五年的一个大概比例情况。基本属于一般图书占纸质图书资源购置费用的78%左右,期刊报纸占18%左右,特色文献占4%左右。由此可以看出我校图书馆的一个大概购置状况。据统计,2012年我校图书馆借阅对象分类中,学生借书占到了98.7%,教师借书占了1%,校外人员借书仅占了0.3%。另外,纸质图书资源的利用率反映纸质图书资源被利用的程度,是衡量纸质图书资源质量和图书馆服务的重要指标之一。据统计,全国高校图书馆的纸质文献利用率一般在50%左右,当然其中也包括期刊和报纸,但我校最好的在2008年是25.42%,到了去年只有15.43%。从中可以看出我校的纸质图书资源利用情况不容乐观。
二、纸质图书利用状况及分析
通过调查统计2008年至2012年我校图书馆各类图书的大致借阅情况,纵观各年各类型图书的利用率都普遍偏低,最低的v类(航空、航天)图书连续四年的图书利用率都只有0.01%,最高的图书利用率也只有25.72%,总体来看所有的图书利用率普遍都在百分之零点几到百分之几,如此低的利用率的确让人惊讶。另外,几乎所有类别的图书借阅量从2008年到2012年在数量上基本上都是减少了1-3倍左右,最为夸张的是n类,(自然科学总论)这类图书的下降倍数达到了9倍多,似乎这类自然原理性的图书正在逐渐被人们遗忘。值得一提的是在近年的各类图书借阅量逐年减少的情况下x类(环境、安全科学)图书的借阅量却在近两三年有所提升,特别是在2011年图书借阅量达到2008年的两倍多。也充分证实了在当今社会逐步重视环境与安全的同时潜移默化地使学生在环境安全方面的重视有所提高。最后的统计数据也可以明显看出逐年的借阅量是在快速下降的。
笔者将近五年的图书借阅量进行了逐年排名,可以看出基本上前五名是被文学,语言、文字,工业技术,艺术,经济类所占据。其中文学,语言、文字包揽了全部的第一二名,语言、文字更是在最近四年连续占据了第一名。对大多数本校学生来说,通过相关的英语书籍练习更有利于通过考试,因此这也是直接影响语言文字类图书借阅情况一直占据第一的主要原因。而最为稳定的则是排在第三的工业技术类图书,一直备受学生喜爱。排名靠后的图书例如2008年和2009年排在倒数第二的环境科学、安全科学类在近年社会广泛关注环境和安全问题后也顺利退出倒数行列。航空、航天类图书的借阅量在前几年排在最后一名,但随着近年中国航空事业的飞速发展也逐渐引起人们的重视,在2010年后也退出了倒数行列。而自然科学总论类图书在2010年跌入倒数行列后更是在近两年一直处于了最后一名,可见这类书正逐步被人们遗忘,也直接淡化了其在图书馆中应有的价值。
三、提高高校图书馆纸质图书利用的建议和思考
(一)做好新书通报和各类藏书的宣传工作
在数字资源被广泛利用而纸质图书资源备受冷落的现状下,对藏书的宣传就显得格外重要。图书馆可利用多种形式对图书进
行宣传,比如通过培训讲座,帮助读者了解馆藏图书的分类方法和图书的排架方法;通过实地参观的形式使读者尽快熟悉馆藏资源的分布、图书的借还流程、阅览规则和书目数据库的使用方法等。对于新生而言,进行馆前教育,是了解图书馆,熟悉馆藏资源的最好形式。
(二)完善管理体制和馆员业务培训制度,激励员工工作积极性
在图书馆中长时间的工作就会使馆员觉得繁琐枯燥并产生消极情绪,轮岗和转变服务方式是把工作做活的途径,由此将馆员的被动工作变为主动服务。所以,合理安排员工工作,不断完善管理体制是一种促进图书利用的方法之一。定期对馆员进行培训或者多途径提供继续教育机会,使图书馆员对于图书馆计算机集成系统的利用逐步精通,同时馆员在工作岗位上也应该大胆探索和实践,拓宽服务领域,更新服务手段,积极开拓适应新时期读者需求的创新服务方式,以更好地为读者提供真正有效、优质的服务。
(三)落实购书流程,鼓励和提倡读者荐购图书,优化购书比例
在购书方面要充分下功夫使每次购置的新书有一定的质量。另外就是购书比例,在图书馆中不怎么被借阅或近年呈严重下降趋势的图书要适当减少比例,以此来逐步提高图书利用量。
(四)缩短借阅期限,建立借阅提醒和催还服务
适当缩短图书的借阅期限,比如2到3周即可,这样既可以催促读者及时完成已借图书的阅读,还可以方便后续读者的及时借阅。另外,可以建立借阅提醒和催还服务。一方面可以减少读者因为遗忘所造成的不必要罚款,另一方面也可以使图书及时回馆,方便了之后读者的图书借阅,提高图书的利用率。
参考资料:
[1]李萌远.论高校图书馆员的素质提升[j].中国成人教育,2009(11).
关键词: 图书借阅量;组合预测;GM(1,1);线性回归
中图分类号:G251.4
文献标识码:A文章编号:1672-8513(2010)03-0170-03
Research on the Grey Regression Combination Model for the Library Loan
LIU Subing,LIU Haiming,MIAO Jiajing,ZHANG Hongyu,ZHANG Peng
(Department of Mathematic, Mudanjiang Normal University,Mudanjiang 157012,China)
Abstract:
Taking “the erroneous sum of squares is smallest” as the most superior criterion,this paper combines the GM(1,1) with the linear regression forecast model to establish the combination forecasting model for the library loan. The result shows the combination forecasting models forecast precision surpasses that of each sub-method and has much good application value.
Key words:
library loan;forecasting combination;GM(1,1); linear regression
借阅量是图书馆业务统计中的重要指标,可以衡量图书情报部门的工作质量与效益.有关借阅量的调查、统计、分析、预测等研究和探讨,一直是图书情报学界的研究热点[1-2].目前,在图书借阅量预测的工作中,传统的图书借阅量的预测方法有统计回归分析法[3-4]、灰色GM(1,1)预测法[5-6]、时间序列法[7]、混沌预测[8]等,但由于单一模型的假设条件及适用范围存在着这样或那样的局限性,使用单一模型往往使许多有用的信息得不到有效的利用,若对单一模型进行适当的组合,则可充分利用有效信息,弥补单一模型的不足而使预测结果具有更大的可信度.本文以“误差平方和最小”作为最优准则,建立灰色回归组合模型,该模型改善了原灰色GM(1,1)模型中没有线性因素和原线性回归模型中指数增长趋势的不足,得到图书借阅量更为精确的预测结果.
1 最优加权组合预测模型和最优权数的计算
1.1 基于误差平方和最小的组合预测模型
假设对同一预测问题,设yt为一预测对象某个指标序列(t=1,2,…,n),用m个不同的预测模型来进行预测,由m个模型得到的预测值记为yit(i=1,2,…,m;t=1,2,…,n),则这m个预测模型构成的组合预测模型为:
t=w1y1t+w2y2t+…+wmymt,t=1,2,…,n.(1)
其中,t为组合预测值,w=(w1,w2,…,wm)T为m个预测模型加权系数向量,wi为第i个模型在组合预测中所占的权系数,wi满足约束条件∑mi=1wi=1,wi≥0(i=1,2,…,m)
,eit=yt-yit为第i个预测模型在第t时刻的预测误差(i=1,2,…,m;t=1,2,…,n),第i个单一模型的误差向量为Ei=[ei1,ei2,…,ein]T,i=1,2,…,m;预测误差矩阵e=[E1,E2,…Em],记预测误差信息矩阵为E,则E=(eit)m×n(eit)Tm×n=eTe,设在t时刻组合模型的预测误差为:et=yt-t,t=1,2,…,n,则,
et=yt-t=∑mi=1wi(yt-yit)=∑mi=1wieit,t=1,2,…,n.
则组合模型的预测误差平方和为:
SSE=∑nt=1e2t=∑nt=1(∑mi=1wieit)2=WTEW.
1.2 组合最优加权系数的确定
以误差平方和(SSE)最小为准则,不变权系数线性组合模型最优权系数W0为线性规划问题的最优解,其中Rm=[1,1,…,1].
min SSE=WTEW,
s.t.RmW=1.(2)
由以上模型(2)解得线性组合模型的最优加权系数W0为:W0=E-1RTmRmE-1RTm.
2 图书借阅量的2种预测模型
2.1 灰色GM(1,1)预测
刘素兵,刘海明,苗佳晶,等:图书借阅量的灰色回归组合模型研究
1)数列选择. 采集图书借阅量1999~2003年的5年数据[5](见表1)为原始数据数列:X(0)=x(0)(k),k=1,2,…,5;
2)形成1-AGO数据序列X(1)={x(1)(k)},其中,x(1)(k)=∑ki=1x(0)(i),k=1,2,…,5;
3)建立灰色预测GM(1,1)模型.
该模型是一个包含单变量的一阶微分方程构成的动态模型:
x(0)(k)+az(1)(k)=b,k=2,3,…,5.(3)
相应的白化方程为:dX(1)dt+aX(1)=b.
(4)
由最小二乘估计解得式(3)中参数列[a,b]T=[-0.1277,141760.982]T.
取x(1)(1)=x(0)(1)=149568,求得白化方程的解,即时间响应函数为:
(1)(k+1)=(x(0)(1)-ba)e-ak+ba=
(x(0)(1)+141760.9820.1277)e0.1277k-141760.9820.1277 ;(5)
4) 累减还原. 对式(5)做1-IAGO累减还原,X(0)的预测公式为
(0)(k+1)=(1)(k+1)-(1)(k)=1259974(1-e-0.1277)e0.1277k;(6)
5) 模型检验. 原始数据的后验差比值S2S1=0.14450.95,精度p0=97.79根据灰色相关检验标准[9],该模型精度,后验差比值和小误差概率都为一级指标水平,可知模型为较好模型,可以用于预测.
2.2 回归模型预测
读者量与借阅量Xt之间相关密切,且有线性正相关关系,线性回归模型预测借阅量的回归方程为:
y2t=32675.3258+19.8392Xt .(7)
由可决系数r2=0.9618,F=75.5788,P=0.0032
3 组合预测模型及其单一模型的对比分析
以式(6)、(7)作为单一模型,采用第1节介绍的组合预测方法计算出GM(1,1)模型和回归模型的权系数分别为w1=0.6972,w2=0.3028,则建立的灰色回归组合模型如下:
t=0.6972y1t+0.3028y2t.(8)
使用灰色回归组合模型对借阅量进行拟合,并对2004~2005学年的图书借阅量进行了检验性预测,其中,单项模型与组合模型的拟合效果比较见表1.
为了进一步对模型进行评价,采用以下2种统计评价指标(结果见表2):
通过比较上述3种模型的平均相对误差、MSE和MAE可以看到,灰色GM(1,1)模型要优于线性回归模型,而灰色回归组合模型充分融合各种信息,弥补单一模型的不足,由表2可以看到,组合模型的2种统计指标均优于2种单一预测模型的计算结果.另外,以2004~2005学年图书借阅量预测做一步检验,实际值为272226,组合预测值为275438,相对误差仅为-1.18%.因此,组合预测模型在模拟性能和预测性能方面的改善是显而易见的,它综合了2种单一预测方法所提供的有用信息,使考虑的因素更加全面,因而,较图书借阅量单一预测模型而言,它具有更好的科学性和通用性.
表3 2006~2010年图书借阅量预测结果
年份2006~20072007~20082008~20092009~2010
灰色回归组合模型316995354465396016439610
基于灰色回归组合模型,对2006年至2010年图书借阅量预测结果如表3所示.
4 结语
本文将灰色GM(1,1)模型和线性回归模型,通过优化组合,建立了图书借阅量的灰色回归组合预测模型,对图书借阅量进行了模拟和预测.结果表明,该模型其预报精度优于各单个模型,可以用来预测未来连续若干个学年度的借阅量,这对于改进图书馆管理,提高服务质量,具有较好的指导作用和实际意义.
参考文献:
[1]
李丕仕,黄贤树.中文图书入藏量和借阅量关系的定性探讨[J]. 情报杂志,1993(3):42-43.
[2] 李秀凤,曹 健.借阅统计分析[J]. 农业图书情报学刊,2008,20(9):83-84.
[3] 孙宝,刘玲.线性回归模型预测借阅量[J]. 现代情报,2007(9):159-161.
[4] 蔡智裎.图书馆流通系统读者分布密度及回归分析[J]. 情报杂志,2004(3):114-115.
[5] 孙宝,王志丽,刘琳.基于GM的高校图书馆借阅量预测模型研究[J].现代情报,2008(4):186-188.
[6] 谭文华.高校图书馆图书流通的灰色预测[J].现代情报,2003(10): 119-120.
[7] 吴红艳.图书借阅流量行为季节预测模型[J].图书情报工作,2007,51(11):98-101.
[关键词] R;图书馆用户;借阅行为;数据挖掘
[中图分类号] TP311 [文献标识码] A [文章编号] 1671-0037(2017)2-91-6
Data Mining Study of Library Users' Borrowing Behavior based on R
Hou Songxia
(Tianjin Transportation Vocational College, Tianjin 300112)
Abstract: The article aims at the status of inefficient use of library data, adopts R based data mining technology, and deeply evacuates the borrowing data of library, hoping to find the implied values of the data. In order to complete the efficient use of the value of the data by data mining, we explore the implied laws of the borrowing data by data mining and apply the mined laws into practical application .
Key words: R; library users; borrowing behavior; data mining
1 引言
评判一个图书馆服务水平的基本标准应当是借阅者的借阅需求满足情况。为尽可能满足借阅者的借阅需求,图书馆需要在馆藏文献管理及对借阅者提供个性化服务两个方面做出努力。因此,需要通过对用户借阅行为进行深入的数据挖掘,得到更加接近真实的用户需求情况。通过对用户的借阅兴趣、借阅习惯进行分析总结,在预测未来的借阅行为的基础上,发挥图书馆对用户的引导教育作用。
2 图书馆用户借阅行为分析数据特点
图书馆的服务对象主要可以分为:教师和学生。根据专业的不同,又可以进一步细分,如学生用户可以进一步分为理工类学科与人文社科类学科等。显然,各类用户群对信息的需求层次差异很大,同一用户群中不同专业的用户信息需求也存在较大差异[1]。图书馆用户的学科专业性非常明显,信息需求主要集中在与专业领域紧密相关的专业文献上,不同专业的用户需求差异十分明显,可以根据挖掘数据的结果进行分析,将书籍的摆放位置和书籍的数量进行调整,而相同专业的用户也具有相近的兴趣度,可以通过数据挖掘技术对各个用户的借阅行为数据进行挖掘,并对挖掘结果进行专业性的分析,针对各个用户的相似性开展大量的个性化服务。
3 挖掘过程
3.1 数据挖掘目标的确定
本文数据挖掘采用R语言,其目的是根据图书馆用户借阅行为的数据来得到用户的借阅习惯、借阅特点等,最终实现对馆藏文献的优化管理及对借阅者提供个性化服务[2]。挖掘工作的重点应该是分析并获取:1.用户类型及各自类型的借阅特点;2.不同种类图书的利用率。
3.2 数据获取
在用户利用图书馆的资源过程中会留下诸如读者基本信息、借阅历史、检索历史等大量的有价值信息,这就是我们进行数据挖掘的数据来源,通过对用户信息和借阅历史的挖掘来得到我们需要的信息。
3.2.1 读者信息。读者的具体身份信息作为数据挖掘中的一项基础数据。主要用来为用户分类、借阅行为分类聚类提供信息,由于数据量庞大,在预处理时需删掉无用的数据,保留本次挖掘所需数据,如用户编号、专业、性别属性,如表1所示,本文针对某图书馆近几年的图书借阅情况进行挖掘。
3.2.2 书目信息。书目信息与用户信息类似,是所有馆藏书目的一个数据库,主要包括书目名称、书目编号、出版社、所属类别、类别编号、馆藏位置、入馆时间、下架时间等属性。通过预处理后,所选择的有效数据如表2所示。
3.2.3 读者借阅记录。读者借阅历史记录主要包含了借阅的目标信息(书籍数据)、时间信息及连接信息(编号数据),如表3所示。其中目标信息的主要组成部分为书籍的属性信息;时间信息的主要内容包含借阅书籍的起止时间信息;联系信息主要内容为用户编号等起联系作用的信息[3]。但是这三种信息不应该被撕裂开来,而应该是呈相互关联、缺一不可的关系。在这里主要为方便叙述将其分为三类:
第一,目标信息。目标信息是进行聚类分类的重要核心数据,主要通过用户编号与用户信息进行连接从而进行数据挖掘。在此只截取数据中书名及图书编号等数据进行概化后用于数据挖掘;
第二,时间信息。时间信息对于数据挖掘的主要意义是进行时间序列的分析,其主要内容包括借阅时间、归还时间等;
第三,联系信息。联系信息则为用户编号等起联系性作用的数据。这部分信息是利用数据挖掘技术获取图书馆文献利用状况的关键,通过对它们的统计、归类、分析有助于了解书刊的使用情况并进行预测分析同样需要通过基于属性的归纳算法进行数据概化。最后得到的主要属性有图书主题、图书编号、借阅时间段、借阅时长。
3.3 数据预处理
从图书馆得到的用户数据往往十分杂乱,结构化进行的并不完全,而且存在大量的无效信息。因此需要对其数据进行预处理。
经过预处理后的数据结构如表4所示。
3.4 挖掘过程
根据指导图书馆实现其馆藏文献优化目标及给借阅者提供个性化推荐的目标,对具体的挖掘任务进行分配。根据借阅行为的主体及客体,我们将挖掘分为三个大的环节[4]。首先是对整体数据的大的挖掘,即得出高频借阅者和高频书籍,通过这一步骤的挖掘,我们会对于整体的数据结构有直观的理解。其次是对馆藏文献的挖掘。对文献的挖掘,要考虑时间要素、优质资源、待下架资源这三方面的信息。最后是对于借阅者的需求信息的挖掘,其目的是挖掘出读者的不同需求。
3.4.1 概览。通过对多个数据集的联立(merge()函数)得到了数据的整体情况。经过对预处理数据进行简单的统计,其中借阅记录10 342条,借阅者编号(人数)3 321个,图书编号4 032个。如图1所示。
然后对数据中的用户和书目进行统计,发现国际经济与贸易,金融学,成教院,信息管理与信息系统,计算机科学与技术和数学与应用数学专业的同学借阅量最多,然后将所有出现次数前5的单位单独导出,作为后续分析中的重点挖掘对象。同理导出被借阅书籍最多的种类,作为向学校推荐加强馆藏建设的重点内容。如图2所示。
3.4.2 挖掘文献使用规律
图书馆的文献被借阅情况,其往往表现出一定的规律性。
第一,对时间要素的挖掘
在时间序列上,往往表现在特定时间的某种类型书籍被大量借阅,而突然增大的借阅量必然会影响图书馆的服务质量。所以通过对时间要素的挖掘,我们可以对图书馆在借阅量增加的时候对图书馆的工作情况进行适当的调整。如图3所示。
经过观察发现数据集中在2011年的11月,因此时间序列上以天数为划分标准,然后利用table()函数及plot()函数来绘制出不同月份图书借阅量的图表。以便于直观地对借阅量的月度变化进行掌握。通过对图书馆不同月份借阅量的对比,我们可以根据图4看出,在该月,图书借阅量随着时间变化呈现出明显的规律性变化,整体呈现出波动性变化。再结合周度记录的图表图5,可以得出图书馆的借阅活动相对高峰期出现在每周的周二前后,并且在周五前后将出现一个较明显的低落,经过分析后判断出这种规律性变动,主要是因为学校在课程安排以周为单位。很多同学会在新的一周开始时接到教师安排的新的学习任务,为了满足专业性的知识需求,会在周一之后开始去图书馆借阅书籍,这直接导致了周二前后借阅的出现。在经过一周的学习后,面对即将到来的周末,由于周末休息时间较长,部分读者利用周末安排了外出游玩等社交休闲活动,因此借阅热情减退,这也导致了周五前后的借阅量低潮的出现。
第二,对优质资源的挖掘。图书馆中存在着大量的优质资源,这些优质资源常常处于被借阅的状态,但是在实际流通中其表现出的流通率却并不高,因为这些资源经常被同一用户反复借阅[5]。这就为我们挖掘出这一部分优质的资源埋下了巨大的障碍,因为既不能单纯以流通率来判断(部分书籍可能因为封面设计吸引眼球而被频繁借阅,但质量并不足够优质),也不能单纯以被借阅时长来判断(部分书籍被借走但却长期停留在书架上)。
因此,在筛选出优质资源时需要考虑多个参数的影响:a.平均借阅时间;b.被借阅次数;c.重复借用率。在这三个参数都满足阈值的记录时应该基本满足优质资源的标准。但是,因为这种筛选方法在阈值这个门槛上将大量的新进书籍排除在外,所以还需要再进行重新考虑。为寻求更合适的筛选方法,我们可以通过聚类分析的方法来进行初步的探索(即对新进书籍与历史书籍进行聚类分析)。
第三,对待下架资源的挖掘。在获取了优质资源目录的同时,我们还需要对图书馆中的陈旧资源进行清理,以避免部分类新购进书籍因为书架资源有限而无法陈列出来。对待下架资源的挖掘需要考虑两方面的因素:1.新增加的书籍数量,这是驱动对待下架资源挖掘的动力;2.文献的被借阅量,这是评判一本书籍是否需要下架的主要因素。
因为文献使用的量是动态变化的,所以通过数据挖掘对历史数据的分析,获取平均上架数量对于图书馆的优化馆藏排架结构十分重要。新增书籍的数量可以通过书目记录信息获得,而流通数量可以通过以下方式获得:首先利用往年相同时期的流通数量变化情况,特别是在高校图书馆,由于院系课程进度的原因,会出现周期性学生大量借阅同类书籍文献的现象,利用这一已知规律,可以很方便地来推算当前流通数量。当然这有一个前提,就是该类书籍必须具有这种周期性变化,在这里可以使用回归分析、时间序列分析的方法来获取这些规律。当某类图书不存在周期性借阅起伏时可以利用其回归曲线的变化趋势来分析,如果曲线历来比较平稳,说明这类书籍的在馆率比较稳定,而如果偶然出现一次高峰,我们可以向上文一样通过关联挖掘获取其当时借阅量突增的原因。
第四,挖掘用户特点。通过对借阅者与借阅记录的联合挖掘,可以得出大量的用户需求信息,而这些需求信息,是指导图书馆实现其馆藏文献优化目标及给借阅者提供个性化推荐的重要指导。要实现对这些联合信息的挖掘,我们需要频繁使用到关联规则的挖掘,因此在此进行较为具体的描述。我们主要采用的是购物篮分析(Market Basket Analysis)[6]。购物篮分析是通过顾客购物时的篮子内的商品所显示的信息来研究顾客的购买行为,通过这些信息,可以了解到不同顾客的不同需求以及需求的原因,从而得到一定的规律。主要的目的在于找出什么样的东西应该放在一起,并藉由这些规则的挖掘获得利益与建立竞争优势。这种思路对于我们进行图书的个性化推荐具有重要参考价值。我们可以通过对借阅者借阅记录中的书籍进行汇总,进而形成每个借阅者的“数据篮子”,然后对众多的“数据篮子”进行汇总,通过apriori算法,对其进行相关性的挖掘,然后对形成的关联规则进行排序,将其中联系性较强的数据进行推广利用,主要的目的在于推断借了某本书的人还会借阅哪本书,并藉由这些信息来实现对读者的个性化推荐。
关联规则的挖掘包括两个阶段的工作,首先是对于资料的整理,因为一般的数据集需要经过整理符合其算法的需求才可以进行下一步的输入处理。在此过程中,主要利用as(transactions,数据集名称)函数将一般性的数据转换为购物篮类型的数据。如图6所示。
其次,就是具体的关联过程。是从资料集合中找出所有的高频项目组,在图书馆用户行为数据挖掘中,使用关联规则挖掘技术,对数据库中的纪录进行资料挖掘,首先必须要设定最小支持度与最小信赖度两个门槛值。符合此需求的关联规则将必须同时满足以上两个条件。最后,再由这些高频项目组中产生关联规则,若经过挖掘过程所找到的关联规则(如「专业,书目类别),满足设定最小支持度与最小信赖度两个门槛值,将可接受该关联规则。因此,今后若有某读者已_定某一相关要素,则图书馆将可推荐该读者借阅某一类书籍。如图7所示。
在对整体数据进行关联分析之后,又对不同类别数据(如金融系等)进行了多次重复性关联之后[7],我们得出很多的结论,如通过对整体数据挖掘发现借阅计算机类图书的读者往往会再借阅一些文学性的书籍,而对管理学专业的挖掘表明,管理学学生的借阅内容范围往往十分广泛,不易形成关联规则(支持度往往不高),这些结论对于图书馆的馆藏内容进行优化就具有比较明显的作用,而且根据得出的具体关联规则,还可以在进行图书推荐时针对不同院系的学生进行相对个性化的推荐。
4 结语
因为本次挖掘完全依赖数据驱动,只是根据数据内容上挖掘出需要的规则,所以源数据的准确性完全决定了本次挖掘准确性,但是部分的数据挖掘过程因为数据量太小,仅为几百条,所以进行个性化推荐的挖掘中得出的结论可能会受此影响。与此同时,我们只是对源数据进行了挖掘,对于源数据的准确性并未深究,所以,本次挖掘结果并不一定与实际情况吻合。通过数据挖掘这一工具,我们得到的用户模型必定与事实存在着一定的差异。因此,将模型与实际情况进行验证,并进行适当的调整应当是提高挖掘结果准确性的一种重要思路。
参考文献:
[1] 李贤虹.基于数据挖掘的读者个性化信息服务系统的研究与设计[D].南昌:南昌大学,2009.
[2] 谭云江.基于数据挖掘技术的高校图书馆读者行为研究[J].图书情报工作,2012(S).
[3] 艾金勇.图书馆读者借阅行为的关联规则挖掘研究[J].情报探索,2017(1):40-43.
[4] 陈静荣.图书借阅分析系统的数据挖掘技术[J].农业图书情报学刊,2017(2):69-72.
[5] 陈洁.数据挖掘在高校图书馆服务中的应用探析[J]. 大学图书情报学刊,2016(2):53-57.