前言:想要写出一篇引人入胜的文章?我们特意为您整理了高校档案管理的策略研究范文,希望能给你带来灵感和参考,敬请阅读。
摘要:人工智能技术的发展给高校档案管理的创新和变革提供了契机,高校档案馆要转变思想,注重对档案全流程、多维度、非结构化数据的收集,构建档案大数据平台,并依靠人工智能算法对大数据进行分析挖掘,以解决档案管理中的各种创新难题,如智能推荐和咨询服务、自动回答和编研汇总、主动服务和个性化服务等,提高档案管理水平。但另一方面,人工智能技术对用户隐私和档案安全等可能造成一定的侵害,需要引起高校档案工作者的重视。
关键词:人工智能;高校档案管理;大数据;RFID;隐私;档案安全
一、人工智能技术的基本概念
人工智能是指用一种新的能以人类智能相似的方式做出反应的智能机器,它能够自我学习和思考、判断并作出决策[2]。不过计算机获得智能的方式和人类不同,它不是依靠逻辑推理,而是靠着大数据和智能算法。因此人工智能的实质是在大数据基础上,通过深度学习,将数据挖掘问题转化为可计算问题来处理的过程。比如AlphaGo把下围棋这个难题转化为棋盘问题空间的表达和搜索问题,在学习数以万计棋谱的基础上,利用启发式搜索算法,求得当前的最优解,并不断迭代推演,最终战胜人类围棋世界冠军[3]。可见,人工智能并不神秘,并非遥不可攀,关键就在于数据的收集和算法的使用。而高校档案馆就是一个“数据密集型”部门,有大量的学籍、文书、科研、基建、人物等档案数据,可以充分利用人工智能技术对档案资源和用户数据进行挖掘,发现关系以及分析趋势,提供更加主动及优质的档案服务[4]。
二、人工智能技术在高校档案管理中的应用
人工智能技术在高校档案管理中的应用可以从思维、数据、技术等几个方面来进行研究。
1.思维方面
人工智能不仅仅是一种技术,更是一种思维方式的转变。工业革命以来,人们已经习惯了机械思维,相信所有问题都有一个通用的解决办法,并在努力寻求事物间的因果关系。进入人工智能时代,人们开始接受世界的不确定性,学会利用信息或者数据来消除这种不确定性,又逐渐利用相关关系取代因果关系,以更快地获得问题的近似解,如预测投票选举结果和预测股市波动。受此思维影响,高校档案工作者在指导各部门档案收整时可以不预先设定目标,而是先把所有能够收集到的本部门相关的档案数据收集起来,运用“全部留”的方法破解档案价值的不确定,档案价值认定难的问题。因为在人工智能时代,数据或信息不再是包袱,而是财富[5],然后对这些档案数据分析挖掘,能够得到什么结论就是什么结论,用“数据说话”,尽量减少人工主观的干预活动。另外针对档案收整和利用的不确定性和易变性,可以引入外部信息,如历年数据、收整和利用的关系,利用者需求的变化等数据,以便对档案管理作出合理预测和规划。
2.数据方面
人工智能的基础是大数据。近几年大数据一词经常出现在媒体上,它的3V特性(体量大、多样性、及时性)也逐渐被更多人所熟知和接受,但大数据更重要的含义其实是多维度和完备性。具体到高校档案领域,档案数据多维度是指在常规档案显性数据以外,包含其它隐性维度的数据。比如在教学档案中,除学生姓名、成绩、学号、专业等基本信息以外,还应该收集整合学生的籍贯、出生年月、高考分数、高中学校、报考专业、奖惩明细、毕业学位信息、工作派遣单位等数据,如果有可能还可以跟踪补录学生就业后的一些个人数据信息,以便从多角度分析数据间的相关关系,挖掘隐含信息。档案数据的完备性是指包含档案管理全流程的数据。比如在文书档案中,除文件题名、责任者、归档时间等基本信息以外,还应该收集文件生成时间、地点,文件流转过程批注、修改、查阅人,档案整理人姓名、职务,档案移交时间,档案利用时间、人员姓名和单位,档案利用方式等数据,这些数据有助于打通从档案生成到档案利用之间的关系,使档案生成单位能更好的把握归档内容,及时获得档案利用者的反馈,调整归档策略,以提供更多利用者感兴趣或需要的档案。随着移动互联网和物联网技术的发展,档案大数据的收集越来越方便实时,把控每一个用户,每一卷档案和每一次档案利用细节也将成为现实。档案数据越来越丰富全面,档案案卷实体正在成为流通渠道、数据收集途径,这也为人工智能时代的档案数据收集提供了一个新的来源。
3.技术方面
人工智能技术主要包括软件和硬件两方面内容。软件主要指各种数据挖掘算法,常用的有启发式搜索算法、蒙特卡罗树搜索算法、神经网络算法等,这些算法可以解决在实际档案利用中如何有针对性地给用户推荐档案的问题。人工智能时代,人们追求档案利用的时效性和个性化,各种档案利用数据能够被即时而完整地记录下来。如档案查询关键词、查询时间、查询结果点击数、查询者账号信息、查询者满意度等,这些数据随时可用,以便系统及时做出分析。而随着算法的改进和提高,以往同类档案用户归类的推荐方式,可以进一步变为由档案直接推荐档案,由两类档案到两件具体档案的直接关联,一件档案被利用时,自动推荐和其相关的档案文件。随着档案利用数据的积累,尤其是和每一个用户相关的各种维度数据的积累,推荐将越来越靠谱,越来越准确,最终做到因人而异,完全个性化。硬件方面则主要采用在档案中插入RFID芯片和在档案阅览室安装各种监控摄像头。RFID是一种不需要电源的芯片,里面存储的信息可以被专门的阅读器发出的无线电波探测出来[6]。这种芯片价格便宜,将它装到各种物品上,就可以自动识别各种物品,进而跟踪物品。在档案管理中,RFID不仅可以记录档案生成期间的各种数据信息,还可以记录档案利用过程中的各种数据信息,档案的每一次查询、提取、翻阅、借出等全流程数据都能够被完整收集保存,RFID中的数据记录了档案文件全生命周期的与档案实体相关的数据,堪称档案的“全息影像”。这些数据有助于档案馆对馆藏档案的布局、档案的质量有清晰的认识,有针对性地提供利用服务。而各种监控摄像头可以实时记录档案阅览室的人员情况,查档等待时间,服务利用时间,查档次数等数据,这些数据有助于档案利用部门合理安排人员,简化办事流程,提高工作效率。
4.其他应用方面
除了以上一些应用,有了通过多种途径收集的档案多维度全流程大数据,再利用各种数据挖掘算法,还可进一步实现人工智能时代档案的智能化管理利用。在此另外举几个例子,抛砖引玉,希望未来高校档案工作者能发掘出更多的档案创新工作模式。(1)根据档案利用者的反馈,系统自动向各归档单位推送其归档档案的利用情况,并建议其加大某类档案的归档力度,或者提醒其可适当增加某类用户可能更感兴趣更需要的档案等。(2)根据学生成绩,通过横向同学间比较和纵向历史成绩数据对比,并结合个人实际情况,智能推荐其更合适的毕业选择,是读研、出国还是工作。如果数据全面准确,甚至可以具体到读研、出国的学校信息或者工作地点、工作单位等信息,推荐更精准。(3)对电子化的档案图像进行全文识别读写,自动分析其中的关键字,使计算机获得“档案知识”,并结合已有目录数据库,将整理后的信息推送给用户,如可自动回答用户提出的“学校最年轻正教授”、“学校某专业成绩绩点分布”、“学校各省市招生人数变化”等问题,提高查档利用的全面性和满意度。另外还可以利用计算机阅读和分析档案汇编成果,并从已有的大量文本语料中学习写作,最终实现计算机自动编研档案和撰写档案文章。(4)对各种档案利用异常行为进行预警,及时提醒档案利用单位重点关注某些利用行为或者利用者。先从档案数据找到普遍规律,然后再应用于每一个具体的用户,并且影响到每一个具体的操作,以发现每一个异常情况。做到从个体到全体再从全体到个体的双向流动。
三、人工智能对高校档案管理的挑战
人工智能对档案创新变革提供技术支持的同时,也对用户隐私和数据安全方面提出了新的挑战。
1.用户隐私安全
由于大数据具有多维度和全面性的特点,它可以从很多看似支离破碎的信息中完全复原一个人或者一个组织的全貌,并且了解到这个人工作生活的细节或者组织内部的各种信息。这样就会引发大家对个人隐私权的担忧。比如要想推荐精准,对学生数据的收集就要更加全面多维度,在这个过程中必然会涉及对学生隐私的干预。要想对这些档案大数据进行隐私保护,一种办法是从收集信息的一开始就对数据进行一些预处理,将数据“脱敏”,比如去掉姓名、学号、身份证号等这些具有明显个人属性的数据。预处理后的数据保留了原来的特性,能够进行分析利用,但却“读不懂”数据的内容。第二种办法是利用一定规则在档案数据中添加“扰动”,通过数学的方法让大数据依然有很强的可靠性,但是却完全找不到每条数据对应的来源,如苹果公司的“差别隐私”技术。第三种办法是双向监视,使数据从采集到使用都在双方知情的情况下进行,使数据使用者受到监督,提高档案馆对数据利用的自律意识,相比前两者,这种方式可能更有效果。
2.数据存储和数据安全
人工智能的核心是海量全面的数据,因此数据存储和数据安全是未来所面临的最大挑战。数据存储。由于摩尔定律导致各种存储器的容量成倍增加,同时价格迅速下降,使得更多的档案数据有条件存起来以供使用。但是随着数据量的剧增,查找和使用档案数据的时间也会变得很长,影响分析数据的效率。而且即使采用并行计算,受制于算法和计算机,数据分析处理的效率也存在瓶颈,这些问题还需依靠技术的进步来解决。数据安全。档案数据安全有两层含义,首先是保证档案数据不损坏、不丢失;第二层含义是要保证档案数据不会被偷走或者盗用。为避免安全问题,要尽量将学生个人情况等敏感信息放到不同的地方,以免多种敏感数据同时丢失。另一种保护数据安全的方法则可以利用大数据本身的特点,即发现异常操作,比如某次某个账号使用档案系统的流程和正常不符,即可断定这是一起档案系统密码泄露、系统入侵事件。另外,当数据量足够大时,每个系统用户的操作习惯也可以学习,不符合某人习惯的操作就可能是来自于非法的闯入者,这些操作就会被禁止。
四、总结
“档案+人工智能”指日可待,而其特点,则是档案的智能化和精细化,在这些变革中,具有智能的计算机将可以帮助我们完成相当多的工作,甚至是绝大部分工作。人工智能时代,档案管理将全部数据化,从档案生成到档案利用,全流程所有数据都将被记录;档案服务利用将全部无人化,用户自助远程查询,而查询结果不仅限于原始档案文件,更有可能来自于计算机的智能整合推荐;档案系统会根据不同用户,自动定期推送精准的个性化内容,深度挖掘档案的人文内涵;而档案全文的数字化将对学校沿革和未来决策提供更多辅助信息。未来的人工智能时代是一个大数据的时代,而高校档案馆的定位则应该作为一个数据集中平台,以数据驱动解决各种问题,以相关性取代因果关系来快速迭代结果。另外各个档案馆要注重数据的共享共建,尽量采用标准化数据,以提高数据整合效率。
作者:刘洋 单位:天津大学档案馆