公务员期刊网 精选范文 个性化推荐系统范文

个性化推荐系统精选(九篇)

前言:一篇好文章的诞生,需要你不断地搜集资料、整理思路,本站小编为你收集了丰富的个性化推荐系统主题范文,仅供参考,欢迎阅读并收藏。

个性化推荐系统

第1篇:个性化推荐系统范文

【关键词】个性化;智能化推荐系统;推荐技术

不断扩大规模的电子商务系统,在为消费者提供越来越多购物选择的同时,其自身商业结构也变得更加复杂。消费者经常会迷失在大量的商品信息空间中,无法顺利找到自己需要的商品;另一方面,商家也失去了与消费者之间的联系,不能准确获知消费者的消费需求、消费建议。推荐系统就像商店导购人员,直接面对消费者,为其提供商品推荐。这种能准确获取不同消费者消费需求的推荐系统就是我们要研究的个性化智能推荐系统。

一、电子商务个性化智能推荐系统

个性化智能推荐系统是指通过收集、统计和分析不同消费者消费特征,使用推荐算法研究消费者的兴趣偏好和购买行为,并适时更新数据,实现主动向消费者推荐其所需商品的工作过程。

智能推荐系统运作的中心是准确得出消费者的个体需求,建立以消费者本身消费特征为中心的个性化的营销策略,满足不同消费者的不同偏好。电子商务推荐系统通过个性化推荐技术对网站整体结构进行调整,增加商品的曝光数,提升用户平均访问步长和商品页访问量,从而提高网站整体营销能力。

如何使电子商务个性推荐系统更好地根据消费者的需求推荐消费者感兴趣的商品,答案就在其采用的推荐技术上。推荐技术是电子商务推荐系统中最核心,最关键的技术,很大程度上决定了推荐系统性能的优劣。

二、推荐技术

从电子商务个性化推荐系统的主动性上分类,可以将推荐技术分为主动式推荐和被动式推荐。

所谓主动式推荐,是指推荐系统通过对消费者信息和行为的分析,给出恰当的意见和建议主动引导消费;而被动式推荐是指消费者通过自己的努力获得所需要的商品信息。

根据目前主流的推荐技术分类,制作下表。

(一)被动推荐

被动式推荐技术的优点是技术比较成熟,用户易于使用。主要有下面两大类:

1、分类浏览式推荐

分类浏览是一种按照主题分类进行信息查询的方法。它用树形结构将分类的商品和服务信息表现出来,易于实现,同时操作方便。

几乎所有的电子商务交易网站都提供这种方式的推荐。但是推荐效率低,且分类方法不统一,对新出现的商品和信息很难准确归类。

2、关键词查询式推荐

关键词查询由用户输入查找目标的关键词,系统寻找与关键词匹配的内容进行推荐。这种方法也是比较常见的推荐方法,技术较为成熟,且易于用户接受查找结果,但是对关键词的选择要求较高,且不易发现用户的潜在兴趣点。

被动式推荐自动化程度低,无法发掘用户潜在兴趣与消费需求,因此目前研究比较多的是主动式推荐,即智能推荐技术

(二)智能推荐技术

第2篇:个性化推荐系统范文

关键词:个性化;采集;推荐

中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2013)36-8222-03

基于社会计算的个性化推荐系统的设计,主要以新浪博客网页作为数据源来采集设计的,继而为其网页文档信息创建索引。主要模块包括网页文本信息采集,lucene索引库,搜索推荐主干,系统管理等。

为了实现网页文档信息的自动采集功能,本系统将采集模块设置了后台管理参数,来实现信息的自动“爬虫”功能,而为了使推荐模块能够基于用户的信息关键词来搜索并提高效率,就必须实现用户信息的即时搜索和反馈推荐功能。其详细设计如下:

1 系统流程分析

1)系统业务处理流程:首先,管理员利用爬虫进行数据的采集,并将采集到的数据(博客网页文档)存储进入本地数据库。采集完成即可对数据库中的文档建立索引。用户登录系统前台输入关键词进行搜索之后,服务器下达命令于搜索引擎,进行搜索并且对与关键字相关的数据进行协同过滤,最后推荐出用户感兴趣的信息,其处理流程如图1示,系统业务流程分析图。

2)系统数据处理流程:管理员登入系统后台爬虫参数设置界面,设置好采集数据参数,进而在数据采集页面进行抓取网页文档,在数据采集完成之对采集到的数据建立索引,其中包括博文的题目、作者、采集时间等。用户登录系统前台主页,输入搜索的数据,即关键词进行搜索,程序服务器往后台数据库发送命令,数据库返回协同过滤后的搜索结果给程序服务器,再完成所搜索到的博文以及其作者的反馈推荐。其处理流程如图2示,系统数据流程分析图。

2 系统概要设计

1)系统概念结构设计:概念结构设计就是根据需求分析的结果,以规定的方法将其转化为一个概念数据模型。而概念数据模型,是根据系统的需求点来对数据和信息进行建模,采用E-R关系图来描述。其系统总体E-R图,如图3示。

2)系统数据库设计:本系统选用Mysql数据库。从个性化推荐系统的功能需求点出发,在系统中设计了采集信息配置表(如图4示)、信息推荐表等数据库表(如图5示),可以准确有效地存储采集到的数据。

3)安全性设计:为了系统安全,采用身份和密码双重登陆验证机制,来确保系统后台管理只有管理员能够才能够登陆,进行爬虫参数设置、数据采集、索引建立以及采集信息查看等操作,保证了系统数据的安全性。

此外,还加设了数据库的安全工具策略,如对数据库中表字段或内容的编辑功能等操作,需要特定的数据库管理工具配合才能进行,从而进一步提高数据的安全性。

3 系统详细设计

1)系统功能结构设计:根据系统概要设计,将本系统分为前台交互和后台数据处理,由四个模块共同组成:爬虫采集网页文档和信息、lucene索引的创建,以及操控数据库、搜索主干、前台输入输出处理。各个模块分工协作运行。其系统功能结构如图6示。

本系统管理和界面设计,包含了前台和后台相联构建的内容,采用了Eclipse Tomcat服务器和JSP技术。以lucene创建索引,数据库应用了mysql,并使用JDBC来实现编程的友好交互,从而设计出友好的用户界面。此外,在整个系统的设计上,采用了 B/S 三层体系结构(如图7示)。管理员使用网页浏览工具向应用服务器发送服务请求,应用服务器接收请求,并且执行业务逻辑,将操作人员想要的信息返回浏览工具显示,确保整个系统使用过程的开放性与安全性。

本系统中抓取网页文档是系统的信息数据基础,也是数据的来源,只有有了丰富的数据源,才能够提供有效的服务。因此,本系统测试过程,主要以新浪博客网页作为数据源,来抓取其页面的文本, heritrix爬虫具有良好的扩充功能,可以通过编程进行过滤来抓取另外的文本。通过采集网页的信息,来对网页中有价值的数据实行提取,过滤掉那些无作用的数据,只留下有效性的文本信息,来提高存储的利用效率,其数据采集结果主要包括该博客网页文档以及该博客的地址,博客的题目、内容、作者以及采集的时间等,如图8数据采集过程图和图9数据采集查看图所示。而搜索推荐主干同样是利用lucene实现,搜索的关键字在已经创建的索引库中搜查对应的文本。

4 系统实现

基于社会计算的个性化推荐系统使用软件MyEclipse 8.5集成开发实现,采用JAVA语言来进行开发,页面采用jsp语言来设计实现,而数据库则是利用Mysql来实现,从而实现了根据用户的需求和兴趣为用户推荐出有价值的结果集,使用户能够在更短的时间获取到自己想要的信息,其结果转换如图10 系统推荐实现图所示。

参考文献:

[1] 陈诺言.基于个性化推荐引擎组合的推荐系统的设计与实现[D].广州:华南理工大学,2012.

[2] 梁弼,王光琼,邓小青.基于 Lucene 的全文检索系统模型的研究及应用[J]. 微型机与应用, 2011(3).

第3篇:个性化推荐系统范文

关键词:推荐算法;负面评价;物质扩散

中图分类号:TP312文献标识码:A文章编号:1009-3044(2012)03-0611-03

Frame Research of Personalized Recommendation Algorithm by Considering the Negative Ratings

SU Ying

(Business School, University of Shanghai for Science and Technology, Shanghai 200093,China)

Abstract: This paper introduces new recommendation algorithm frame by reconsidering the negative ratings. The numerical results based on MovieLens dataset and the mass-diffusion-based algorithm show that,the new algorithm frame can greatly reduce the redundancy, and also enhance the accuracy and improve the quality of the recommended results.

Key words: recommendation algorithm; negative ratings; mass diffusion

如何准确识别用户的需求,帮助用户找到自己真正需要的信息成为信息过滤技术的一大挑战。为了解决这些问题,推荐系统,也称为个性化推荐应运而生。个性化推荐系统被认为是信息爆炸时代解决信息超载问题的最有效的信息过滤手段。个性化推荐系统是建立在海量数据挖掘基础上的一种高级智能平台,通过记录用户的网站使用足迹,挖掘用户的兴趣特点,向用户推荐其感兴趣的信息或商品,为用户提供完全个性化的决策支持和信息服务,满足用户的个性化需求,改善用户体验。近几年,各种各样的推荐系统被广泛研究和应用,经典的推荐算法包括协同过滤算法,基于内容的推荐算法,基于网络结构的推荐算法和混合算法等等。

然而,目前对个性化推荐算法的研究都关注利用用户喜欢产品的信息预测可能感兴趣的产品,而用户的负面评价信息则没有引起重视。本文重新考虑了在很多推荐算法研究中被忽略掉的用户的负面评价信息对推荐算法改进的意义,构建了考虑负面评价的个性化推荐算法框架。

1负面评价对推荐算法改进的意义

现实中应用的推荐系统一般都会向用户提供一个统一的评价体系,方便用户对产品进行评价的同时,还可以使评分数据标准化统一化。几乎所有系统的评分数据都可以大致分为好评和差评两类:好评数据隐含了用户的偏好特征;差评数据隐含了用户的不喜欢产品的特征。以往的推荐算法研究中都会清洗掉用户的负面评价,但我们认为负面评价对于推荐系统具有重要意义,具体表现在以下三方面:

1.1利用负面评价可以减少数据稀疏给系统带来的负面影响

实际系统中收集的信息,常由于用户不愿意透漏自己的隐私等种种原因,严重缺省。随着维度增加,数据在它所占据的空间中将越来越稀疏,最终导致具有统计意义的数据样本稀少。推荐算法依赖于用户的历史数据,一般来说历史数据越多,系统的推荐准确度相对越高,因此数据的稀疏问题将直接影响系统的推荐质量。忽视用户的负面评价信息在一定程度上增大了系统的数据稀疏性,不利于算法的运行。我们认为用户的负面评价信息有助于降低系统的数据稀疏性,可以有效缓解数据稀疏带来的各种问题,因此用户的负面评价信息应该得到研究者的关注,并将其合理地用于改进推荐算法。

1.2负面评价可以帮助系统更准确地定位用户喜好

现有的推荐算法或者利用所有评分数据,忽略用户评分数据的高低差异,或者只利用用户正面评价的产品信息,清洗掉用户负面评价的产品信息。用户或产品相似性网络的构建过程中也都只考虑基于正面评价的信息,比如协同过滤算法,总是从偏好出发去搜索相似的偏好;基于网络结构的推荐算法,也只利用用户的喜欢信息去建立二分图网络。在很多情况下,忽视用户负面评价信息会影响推荐系统对用户兴趣点定位的精确度。如对于一部正在热映评价尚好的电影,有一小群用户打了低分,那么他们差评的 理由可能会非常相似,而对于打高分的大多数人来说,好评的原因却可能相差很远,比如,这些人中可能存在着盲从的随大流的评价者,他们的评价可靠性差,推荐能力很弱,难以刻画出用户的兴趣点。实际应用中,用户一般更倾向于进行正面评价,负面评价一旦出现就意味着用户的厌恶情绪鲜明强烈,因此我们认为用户的负面评价信息可靠性更高,可以帮助系统更准确地把握用户的兴趣特征。

1.3利用负面评价信息可以有效减少系统中的冗余信息

随着网络用户数量与产品种类的增加,推荐算法的扩展性问题将成为制约推荐系统发展的重要因素。数据量的急剧增加将给系统存储、更新带来越来越大的成本压力。随着计算规模和复杂度逐渐增大,推荐算法的性能将越来越差。如果可以利用用户的负面评价信息找到用户不喜欢的产品黑名单,就可以将其作为用户推荐列表的限制性条件,一旦用户推荐列表中的产品同时也在黑名单,系统就自动将它从用户的推荐列表中去除,从而避免向用户推荐其可能不喜欢的产品,减少用户的不满意度,增强用户对推荐系统的信任。因此利用用户的负面评价信息不但可以降低推荐列表的出错率,还有助于降低系统中的信息冗余,对于推荐系统扩展性问题的解决具有重要意义。

2利用负面评价的个性化推荐算法框架

无论哪一种推荐算法,算法的核心都是相似性搜索,既然通过用户喜欢的产品信息可以找到那些潜在的会得到用户喜欢的产品,那么通过用户不喜欢的产品信息也可以找到那些会让用户不喜欢的产品。基于这种理论假设,我们设计了考虑用户负面评价的推荐算法框架,如图1所示。

该框架的运行原理为:

1)考虑用户评分数据的好坏差异,对评分数据进行分类;

2)通过个性化推荐算法,基于获得用户好评的产品信息得到用户最初的推荐列表,基于得到用户差评的产品信息得到用户不喜欢的产品列表;

3)在过滤模块中,识别并剔除掉那些用户的推荐列表中存在的用户不喜欢的产品列表中的产品,精炼推荐结果。

4)为了验证该框架的运行效果,我们在算法框架的基础上设计了评价指标算法模块,可以从推荐准确度,推荐结果的流行性和多样性,推荐结果的信息量,以及去除的冗余信息量等角度对该算法框架进行评价。

图1考虑负面评价的个性化推荐算法框架

3数值实验

我们采用MovieLens标准数据库中数量级为105的数据集,基于物质扩散推荐算法,对该算法框架进行了数值实验。该数据集包含了943个用户对1682部电影的打分信息。根据打分规则的描述,我们假设用户对电影的打分大于等于3表示用户喜欢这部电影,打分小于3表示用户不喜欢这部电影,据此将数据集分为两部分:基于喜欢的82520条打分信息和基于不喜欢的17480条打分信息。为了考察算法框架的表现,我们把基于喜欢的82520条打分信息按照9:1随机划分为训练集和测试集,进行对照实验。当推荐列表长度L=10时实验结果如表1所示。

1)准确度。平均排序分是衡量推荐算法准确度的一个重要指标,测试集中用户喜欢的所有产品的排序分数的平均值越小,就说明推荐算法趋向于把用户喜欢的产品排在前面,推荐算法的准确度越高。

2)流行性。一个产品的度就是这个产品被收藏的次数,产品的度越大说明越流行。一般而言,推荐列表的产品平均度越小的系统,意味着系统不会总向用户推荐热门产品,用户满意度相对更好。

3)多样性。平均海明距离度量了不同用户推荐列表的差异化程度,最大值为1,即所有用户的推荐列表完全不同,最小值为0,

表1实验结果对比

即所有用户的推荐列表都完全一致。平均海明距离越大说明系统趋向于向不同的用户提供差异化更大的推荐列表,推荐列表的多样性更好。

4)信息量。平均信息量越大,说明每一个推荐结果对用户的效用越大,意味着推荐结果传递的新信息更多,带给用户的意外感更强。

5)冗余度。由于利用负面评价的算法,可以用用户不喜欢的产品列表精炼推荐结果,因此推荐列表总长度更小,推荐列表的信息冗余明显减少。

综上,利用负面评价的算法在以上五个评价指标的表现均优于经典的物质扩散推荐算法。

4总结

在推荐系统的实际应用中,用户的负面评价具有稀缺性,但用户的负面评价信息却能够比大量存在的正面评价信息更准确地反映出用户的兴趣特征,具有重要的研究价值。本文重新考虑了用户的负面评价对改进推荐系统的作用,构建了考虑用户负面评价的个性化推荐算法框架。基于物质扩散推荐算法和MovieLens标准数据集的数值实验证明,利用负面评价的推荐算法框架能在一定程度上减弱庞大数据集数据稀疏性的影响,通过去除冗余信息还能提高系统的推荐质量,可作为目前推荐系统扩展性难题的解决方法之一。

下一步的工作将关注对负面评价信息的影响进行控制。推荐系统的最终目的是向用户推荐他们喜欢的产品,而并非不喜欢的产品,并且负面评价中也存在着不准确的信息,因此如何平衡正面评价和负面评价将是未来的工作重点。

参考文献:

第4篇:个性化推荐系统范文

关键词:服装搭配;个性推荐;专家系统

目前,时尚导购类应用越来越多,面向用户所展开的功能良莠不齐,很多的应用充斥着大量信息,增加了用户对于使用产品时的工作负荷量。本文基于专家系统,对于个性化推荐穿搭应用是要改善用户使用体验,增进理解用户的需求,降低个人与服装之间的沟通张力,平衡用户自知与服装客观感知间的和谐。市场上现有的导购推荐类应用,大部分以服装搭配推荐图例的展示形式陈列给用户,却从未发自内心推敲用户到底想要什么。用户开始会被不同的展示图片所吸引,随之进入“流”的购物模式。

“流”(Flow),这个概念最早在Mihaly Csikszentmihalyi的著作中Flow:The Psychology of Optimal Experience中被提到。在Peopleware:Productive Projects and Teams一书中,作者Tom DeMarco和Timothy Lister将流描述为“一种深层的、近乎完全的融入状态”。流通常包括一种温和的沉醉感并能让你对时间的流逝毫无察觉。[1]流也可称为沉浸式模式,进入沉浸式购物模式的用户,心境就会发生转变,对于网站推荐的衣服本身要求就将变得更加严苛。用户目标与动机明确的设计,是产品最该被列入首要的主题。

用户在购买时,从购物心理学的角度来讲分为:无意识购物、购物环境潜移默化、消费者固有的惯性思维中心等。简单来说,用户在购物的时候大多处于一种盲目的状态,如以下网购流程简述:正常的网上购物行为应该粗略分为以下12步:想要购买衣服、不同应用中探寻、有喜欢的、看价格、价格合适、链接、看图片服饰细节、看店家信誉、看已购买用户评价、(思考是否合适自己、联想自己的已有服饰的搭配)、是否是7天无理由退还货物店、加入购物车、(再次思考犹豫)、购买。

在网上购物不同于现实购物,所看即所得,只要上身好看就可以直接购买。网购时,购买的12步中,我们其实从第3步就已经开始有了购买的欲望,但是到最终的购买我们还要历经很多的评断时间。问题在于我们对于物品的不信任,对于自己的不了解,更加重要的是对于自己的衣橱没有一个整体概览。很多18~25岁的“小白用户”人群想要寻求变化,找到自己的特点穿出个性,盲目地推荐她们下载时尚导购类的应用,只会叫她们更加的举步维艰。

解铃还须系铃人,问题的根本要从用户自身寻找,要使用户自己了解自己。服装搭配不仅仅是肉体和布料间的叠加,而是有关色彩、材质、款型、身高体重、脸型等因素组成,个性化推荐也是基于此。个性化推荐的专家系统,首先是要在大量的数据基础之上,运用人工智能的技术完成。

专家系统(Expert System,ES)亦称为专家咨询系统,它是一种具有大量专门知识与经验的智能计算机系统。它把专门领域中人类专家的知识和思考解决问题的方法、经验和诀窍组织整理且存储在计算机中,不但能模拟领域专家的思维过程,而且能让计算机如同人类专家那样智能地解决实际问题。“专家系统”指拥有某个或某些专门领域相当数量的专家级知识,并且能够在运行过程中不断地增长新知识和修改原有知识,从总体上达到专家水平。由于专家系统是基于知识的系统,那么,建造专家系统就涉及知识获取(从人类专家那里或从实际问题那里搜集、整理、归纳专家级知识),知识的组织与管理,知识库建立与维护,知识的利用等。本文中所描述的基于专家系统的个性化穿搭应用推荐猜想,也是从搜集专家级的知识开始,以下会从视觉上最先感知的颜色开始,推导出我们的个性化穿搭推荐的专家系统。[2]

服饰搭配中最为吸引人眼球的是整体的颜色。首先,要确立用户肤色的大致划分,以便找到适合自己的服装风格颜色。例如,皮肤比较偏向棕色的女生,可能由于更加崇尚健康常晒太阳,比较适合活跃的荧光色,色彩饱和度高的色彩;皮肤比较白皙的女生,比较适合暖色。颜色确定后,我们通过颜色的划分和归类,可以导向服饰搭配中的风格分类。根据各大电商的风格分类总结,可以将服饰风格划分为4种大类:女性化、中性化、个性化、大众化。根据色彩的关联,能够很快地定位用户的方向,每次向用户推荐2种风格,其中可变更风格1种(女性化、中性化、个性化任选其一)。更换一种大风格则相应的推荐另外两种可变更风格之一;替换一种大风格下的小趋向,可从新获得2种小趋向风格。

不做硬性的推荐,而是感情化的给予建议,如同你的购物闺蜜一般。这样的推荐来源于用户自身真实的个体特征资料,通过猜风格的形式和用户产生第一次的互动,让用户不会有被迫的感觉。这样的个性化推荐,大大减少了用户寻找想要服饰的时间,并且在每次用户操作过后,系统将会更加了解用户心里的欲求购买物品,可以更加准确的推荐给用户。每种大风格下面的服饰搭配,所用的单品总是共10种,包括包、配饰等配件,10种搭配衍生出7种整体符合大风格的造型。这就是我们想要强调的收敛型。不是夸张地叫你总是购买新衣服,而是有节制的从需求、适合、喜欢,三种不同层级出发收敛,以帮助用户不会穿错的基础上提高20%的心意,打造潮级平凡的搭配效果。

每款推荐的搭配都是在一定价格范围之内。根据18~25岁用户的经济水平,每套服装搭配都应该有其应用的价格倾向,适合“小白用户”的更加细分的人群。在校园中,大部分的经济来源都是父母的支持,我们应该树立良好的价值观,不应过度消费。

每款推荐的搭配单品可以通过拍照的方式进行替换,合理的利用现有服饰,搭配出相同的效果。本质是现有衣服的重组没有建立起来。一遍遍的试穿现有的服装,在体力上用户使用度不够良好。所以,只要用户输入了现有的服装,系统可以自动为其匹配;或是用户可以利用其碎片时间,完成搭配的小游戏。这种互动可以增加用户的搭配能力,在体验中寻求成长。用户的搭配知识来源于,系统的推荐和达人用户的服饰街拍样例。每一次用户自我的搭配还可以分享给其他用户,通过评分的机制,增加整个使用过程中的游戏性,让搭配成为一种谁人都可以做好的事情。达人的服饰展示不仅可以作为服饰搭配的知识来源,还可以作为“小白用户”的匹配样板。根据“小白用户”最开始的个体体征数据,可以找到资料相当的达人,作为参考样板。

通过这样的专家系统化的个性化推荐设计,不仅可以减少用户在寻求购买时的时间成本,最重要的可以帮助“小白用户”完成自我探寻的第一步,开启了他们的服饰搭配敲门砖。购物只需三步:选择――喜欢――购买。个性化推荐的关键就是在帮助用户,在一定的预算范围之内,完成最大化的个性服饰搭配,并解决最快的购买流程。基于专家系统的个性化推荐设计,想要做的就是平衡“个人偏好”与“实际获得”之间的距离,让用户最终买到的东西尽可能的贴近用户心里欲求的。

参考文献:

[1] Alan Cooper(美),等.About Face3交互设计精髓[M].刘松涛,等,译.电子工业出版社.

第5篇:个性化推荐系统范文

关键词:个性化服务 Web使用挖掘 频繁访问模式 在线推荐

中图分类号:TP311.52 文献标识码:A 文章编号:1007-9416(2012)07-0141-02

1、引言

互联网已经成为日常生活不可或缺的重要组成部分,然而随着近年来爆炸式地增长,信息过载与信息迷失正逐渐制约着人们利用互联网来高效地获取有价值的信息。面对浩如烟海的网络空间,如何快速定位到个人真正感兴趣的资源是一个迫切需要解决的问题,个性化服务应运而生。本文采用当前网络开发的较为成熟的主流技术,设计了一个基于Web使用数据挖掘的个性化推荐系统。

2、个性化服务的概述

2.1 个性化服务的主要方式

个性化服务是以用户为中心的,解决和满足用户的信息服务的需要。目前,个性化服务方式主要有以下几种:

(1)信息分类定制服务:主要面对大众提供可以定制的 web 页面,具有为用户创立和管理个人信息的功能,用户可根据自己的需要定制个性化的界面设置、信息资源和服务形式,而系统会根据用户的定制要求完成个性化的页面设计,自动呈现用户需要的信息类别。

(2)个性化信息检索服务:根据用户的兴趣和特点进行检索,返回与用户需求相关的检索结果。这就要求个性化信息系统增加优化查询功能,通过内容过滤等技术,在检索的同时考虑用户的个性化差异,从而提高检索质量。

(3)个性化推荐服务:主要是根据用户的信息例如用户的喜好,为满足用户的信息需求向用户推送用户喜好相关的信息,在这个过程中就是根据用户的需求和目前的信息数据库进行不断的配对,将相关的信息推送给用户。

2.2 个性化服务的相关技术

(1)数据挖掘是从大量的、不完整的、有噪声的、模糊的和随机的数据中,提取隐含在其中的、人们事先不知道的、但又是可信的、潜在的和有价值的信息和知识的过程。

(2)信息推送技术是通过一定的标准和协议,在网络上按照用户的需求,定期主动传送用户需要的信息的一项计算机技术。推送技术的核心思想是建立一个信息机制,把由客户端担负的责任转给服务器,由服务器将用户定制好的感兴趣的网上信息以推送或网播的方式直接传送到用户面前。

(3)信息过滤是指从动态的信息流中获取符合用户静态需求的信息,或者根据需要禁止满足特定条件的信息流入。

(4)Web挖掘技术它可以从网络浏览行为中抽取用户感兴趣的模式。通过对用户浏览网站的日志数据进行收集、分析和处理,建立起用户的行为和兴趣模型,这些模型可以帮助理解用户行为,改进站点结构以及为用户提供良好的个性化信息服务。

3、系统分析和设计

3.1 个性化服务的内涵及特征

个性化信息服务是“信息爆炸”的背景下针对“信息过载”和“信息迷向”问题的重要解决方案之一。它基于用户的学科、兴趣和使用习惯等特征,利用网络等信息技术,通过用户个人信息定制、系统推荐和信息推送等功能,针对不同的用户需求,采用不同的服务方式,提供不同的信息内容,实现多层面的个性化。从理论层面讲,个性化信息服务是一种服务理念,从技术层面讲,个性化信息服务是一个实现个性化服务的平台。具休地说,个性化信息服务具有如下特征:

3.1.1 以用户需求为中心

以用户需求为中心包含两层含义:一是以用户的需求为导向设计与安排服务功能与设施;二是创建个性化的信息环境,按照用户或用户群的特点组织信息资源,提供多样化的信息服务。

3.1.2 信息资源多元化

通过对各种馆藏资源的有效组织、管理与配置,建立多元化的信息资源组织体系,为读者利用馆藏资源提供最大的便利。支持个性化服务系统的数据库包含指向丰富信息内容的链接,力争达到让用户即需即得的效果。

3.1.3 具有智能化分析和挖掘用户需求的功能

智能化分析是指主动采集并跟踪用户浏览的信息,一方面从用户日常检索浏览中主动学习用户的兴趣,推理并预测用户需求,及时处理推荐信息;另一方面可根据不同用户的相同点或相似性进行信息推荐,使需求相同的用户之间共享查询结果。

3.1.4 推荐信息的准确性、高效性

由个性化服务推荐给用户的信息必须是准确的、高效的、适合用户的。能通过使用信息过滤等技术,屏蔽无关、无用的冗余信息,推荐精确、真实可用的信息;能自动地、智能地将大量的数据信息转换为用户所要求的或用户可接受的系统知识形式,从而节约用户时间,提高服务效率。

3.2 系统结构设计

在Web使用挖掘的一般过程中,主要将其划分为三个阶段:数据预处理;模式发现;模式分析与应用,如图1所示。

由于服务器日志并非专门用于数据挖掘,因此在进行Web使用挖掘之前必须对其进行处理过滤,解决数据的不一致性、不完整性等问题,使之符合Web挖掘的需要,这就是数据预处理阶段,预处理的结果会直接影响到挖掘算法产生的规则和模式;模式发现阶段即挖掘算法实施阶段,是对预处理后的数据使用数据挖掘中的算法如关联规则,聚类分析等来产生规则和模式;模式分析与应用阶段是整个Web使用挖掘过程的最后一步,此阶段的主要目的是通过一定的技术和方法过滤掉模式发现阶段产生的“不感兴趣”的规则和模式。

3.3 系统功能模块设计

整个系统框架包括离线和在线推荐引擎两部分。离线部分又包括数据准备、用户兴趣建模等模块;在线部分则由建立推荐池、产生初步推荐集、融合离线部分产生结果推荐集模块组成。离线部分承担数据准备和知识挖掘等功能,该部分面向的数据源通常为系统内存储的各种海量历史数据,挖掘处理需要较长时间,因此被设计为离线部分,以避免对实时性要求的影响;在线部分则承担向当前用户提供实时个性化服务推荐等功能,该部分是建立在离线部分的基础上,直接参照其所生成的基于用户兴趣的页面推荐集,针对不同用户快速生成各种推荐服务。基于Web挖掘的个性化推荐系统的功能框架图如图2所示。

图2 基于Web挖掘的个性化推荐系统框架图

各子模块功能如下:

(1)数据准备模块。该模块是对原始的用户访问日志进行数据采集、数据清洗和事务标识,生成对挖掘阶段有用的用户会话文件、事务数据库及将站点的相关文件生成站点数据文件。

(2)建立用户兴趣模型库模块。该模块使用Web挖掘技术对用户访问页面内容和用户访问行为进行分析,抽取用户兴趣,结合信息资源的相关性,形成用户兴趣的矢量描述,并能随着用户的访问的推进和用户兴趣的改变,及时更新用户模型。

(3)建立推荐池模块。该模块就是通过获取用户评价,得到带有用户访问时长的用户访问页面集合。

(4)产生初步推荐集模块。该模块通过对当前用户访问页面的相似度计算,继而进行用户聚类分析,再对聚类用户进行关联规则发现,产生初步推荐页面集。

(5)融合离线部分产生个性化推荐集模块。该模块将产生的初步推荐页面集与离线部分的用户兴趣模型相匹配。通过比较产生出最适合用户的个性化推荐页面集,并把这些页面的地址附加到当前访问页面的底部,以进行推荐(图3)。

4、结语

综上所述,本文在对web服务技术及数据挖掘语言实施了分析和研究后,提出一个基于Web使用挖掘的个性化系统架构,该系统通过挖掘用户Web访问信息,生成了独立的用户兴趣模型库,可以更全面地反映用户的兴趣偏好,从而为用户提供更详细的信息推荐。

参考文献

[1]韩家炜,孟小峰.Web挖掘研究.计算机研究与发展,38(4):405-414,2001.

[2]崔林,宋瀚涛,龚永罡,陆玉昌.基于Web使用挖掘的个性化服务技术研究.计算机系统应用,第三期:23-26,2005.

[3]王彤,何丕谦.Web日志挖掘及AprioriAll算法的改进.天津理工大学学报,23(1):13-17,2007.

第6篇:个性化推荐系统范文

[关键词]e-learning;协同过滤技术;学习资源;个性化推荐

[中图分类号]Tp391 [文献标识码]A [文章编号]1672-0008(2011)03-0066-06

一、引言

e-learning已成为企业开展员工培训的有效方式之一。目前,许多企业在企业内部网或互联网搭建了e-learning支持系统。随着e-learning应用实践的深入,e-learning支持系统中学习资源数量日渐增多,导致员工需要花费大量的时间和精力在平台中检索和查阅符合自己需要的学习资源,甚至找不到符合自己兴趣和工作岗位需求的学习资源。

通过分析多个企业e-learning门户系统,我们发现,当前e―learning系统推送学习资源的方式有三种:

(1)Top-N推荐方式,即采取将点击率最高的前N个热门资源推荐给用户。点击率的高低在一定程度上反映学习资源的受欢迎程度,但无法实现个性化推荐。在包含多种职业领域的学习资源管理系统中,学习者对资源类别、媒体类型需求迥异,点击率较高的学习资源,只能反映部分学习者的需求和偏好。

(2)关键字查询方式。这种方式具有便捷和快速的优点,但是这种被动式资源查询方式只追求目标资源与所提供检索关键字的契合程度,无法体现目标资源质量的高低,无法实现资源主动式个性化推荐。

(3)最新资源推荐。这种方式可以将资源库的更新情况在第一时间反馈给用户,增加最新学习资源被访问机会,但是资源的质量无法保证,个性化的推荐无法实现。鉴于以上资源推送方式存在的不足,如何解决e-learning系统中学习资源的主动式个性化推荐,成为当前教育技术学研究人员面临的研究主题之一。

个性化推荐技术能克服传统资源检索方式的缺陷,其中,协同过滤推荐技术是一种应用最为广泛的个性化推荐技术。目前,协同过滤技术已成功应用于电子商务领域。本研究尝试将协同过滤推荐技术引入e-learning系统的学习资源个性化推荐中,以推进这一研究主题的深入。

二、文献综述

(一)个性化推荐技术

个性化推荐是推荐系统根据用户的个性化特征,如兴趣、爱好、职业或专业特点等,主动地向用户推送适合其学习需要或可能感兴趣的信息资源的一种推荐技术。此外,个性化推荐技术可以共享用户间的经验,为目标用户推荐其相似用户群偏好的信息资源。其工作原理是:首先根据用户信息建立用户兴趣模型;然后,在信息资源库中寻找与其匹配的资源信息并产生推荐,以满足不同用户的个性化需求。按实现算法和实现方式的不同,个性化推荐技术可分为基于关联规则的推荐、内容过滤推荐、协同过滤推荐等三种,也可以综合以上三种推荐方式产生新的混合型推荐算法。

1.基于关联规则的推荐

基于关联规则的推荐技术的工作原理:首先由管理员定制一系列的规则条目,然后利用制定的规则度量项目间的相互关联性,将关联密切的项目推送给用户。在进行推荐时,系统分析用户当前的兴趣爱好或访问记录,然后按照事先制定的规则向用户推荐其可能感兴趣的资源项目。例如,对于一个正在学习网页设计技术的学习者来说,当他点播以ASP网页设计为主题的学习资源时,系统向他推荐了与HTML技术相关的学习资源。这是因为HTML技术是网页制作的基础知识,学习者有可能并未很好掌握,或者仍有兴趣深入学习。这样就形成了一个基于关联规则的推荐。

基于关联规则的个性化推荐存在两个缺点:

(1)规则无法由系统自动生成,必须由管理员手动定制,这无法保证推荐的精确度,而且规则的制定和维护的工作量大;(2)规则在制定之后不能动态变化。制定后的规则只能为用户推荐与其原始兴趣相符的资源条目,无法为其推荐其它高质量的资源,更不能发现用户潜在的兴趣点。

2.内容过滤推荐

内容过滤推荐技术是信息过滤中最基本的一种方法,是较早被提出的一种推荐技术。内容过滤的工作原理:采用概率统计和机器学习等技术实现过滤,首先用一个用户兴趣向量表示用户的信息需求;然后对文本集内的文本进行分词、标引、词频统计加权等,生成一个文本向量;最后计算用户向量和文本向量之间的相似度,把相似度高的资源条目发送给该用户模型的注册用户。

内容过滤推荐技术适用于推荐文本类型的学习资源,不适用于推荐多媒体类型的学习资源。内容过滤推荐技术需要在分析文本资源结构的基础上,抽象出若干个代表文本特征的关键词,描述资源内容特征。对于其它形式的学习资源(动画、音频、视频等),该技术不能用几个关键词概括它们而无法做出较高精度的推荐。另外,内容过滤推荐只能根据资源向量同用户向量的匹配程度向用户推荐相关资源,无法筛选出优质的资源。

3.协同过滤推荐

与前两种推荐技术不同,协同过滤推荐需要在分析资源内容、计算资源和用户的匹配度的基础上产生用户推荐,产生推荐的依据是用户对资源的评分。协同过滤推荐的工作原理:首先分析用户特性,如兴趣、职业等信息;然后利用相似性算法计算用户间的相似性,找出与目标用户相似性最高的k个用户;最后参照邻居对资源的评分预测目标用户对资源的评分,将预测评分最高的n个资源推荐给目标用户。

协同过滤推荐技术具有以下三个特点:(1)较好的普适性。与其它个性化推荐技术不同,协同过滤推荐算法所依赖的是用户对资源的评分,和资源的内容或者形式无关。这一特点使得协同过滤推荐不仅适用于容易抽象出特征向量的文本类资源,而且对动画、视频、音频等难以准确概括出特征向量的多媒体素材具有同样的推荐效果。(2)良好的推荐精度。用户对资源的评分反映了用户对资源的满意程度,在绝大多数情况下代表了资源的品质,使建立在评分数据基础上的协同过滤推荐具有出色的推荐准度,其推荐结果在质量上能够得到保证。(3)共享好友经验。由于协同过滤推荐通过目标用户(项目)的邻居预测评分,使得相似用户间彼此共享资源使用经验。通过分享邻居的经验发现目标用户的潜在兴趣点,能拓展其学习思路和提供学习支架,使得推荐更加高效。

三、协同过滤推荐技术

(一)概述

协同过滤概念的提出要追溯到上个世纪,在1992年由Goldberg、Oki、Nichols和Terry首次提出,首先应用在Tapestry系统中。作为协同过滤技术的第一代产品,Tapestry系统存在诸多缺陷,没有达到成熟的程度。发展至今,协同过滤技术在互联网的众多领域得到了广泛地应用,如电子商务领域的Amazon、Netflix、Taobao,国内主流的视频点播网站Youku、Tudou等。协同过滤推荐技术已成为流行的个性化推荐技术之一。

协同过滤算法分为两大类:基于存储(Memory-based)的协同过滤算法和基于模型(Model-based)的协同过滤算法。目前,大部分协同过滤算法的实际应用都属于基于存储的协同过滤算法范畴。

基于存储的协同过滤算法包括基于用户(User-based)的协同过滤算法和基于项目(Item-based)的协同过滤算法。它以用户――项目(信息资源)评分数据为基础,通过使用不同的相似性度量方法,计算用户或者项目之间的相似性值,形成邻居用户或者邻居项目集合;然后,以邻居集合中用户对项目的评分为依据,预测用户对未评分项目的评分,形成推荐项目列表,以合适的视图呈现给用户。

基于模型的协同过滤算法首先建立一个用户――项目评价模型,以此模型为依据提供对项的推荐。基于模型的协同过滤算法同基于存储的协同过滤算法的区别在于,基于模型的方法不是基于一些启发规则进行预测计算,而是基于对已有数据应用统计和机器学习生成的模型进行预测。目前,基于模型的协同过滤算法主要有聚类模型、Bayes模型、关联规则模型、语义生成模型等几种。

(二)协同过滤推荐技术的实现

协同过滤推荐基于以下假设:如果用户对一些项目的评分比较相似,则他们对其它项目的评分也比较相似;如果大部分用户对一些项目的评分比较相似,则当前用户对这些项目的评分也比较相似。协同过滤推荐系统使用统计技术搜索目标用户的若干最近邻,然后根据最近邻对项目的评分预测目标用户对项目的评分,产生对应的推荐列表。协同过滤推荐的实现流程包含三个关键步骤:获取及表示用户信息、形成邻居和产生推荐。

1.荻取及表示用户信息

用户数据包括三类:用户注册信息、用户学习数据和用户行为记录。推荐系统获取用户行为数据有显式评分和隐式评分两种方法。显式评分是指用户通过直接打分的形式给资源的评分过程。隐式评分是记录用户行为数据,将其加权转化为用户对资源的评分。显式评分和隐式评分各有其优缺点,前者比较直观,能准确反映用户对资源喜好程度,但由于评分操作可能中断用户的学习行为,所以会给用户带来一些不便;后者通过分析用户相关信息而间接得到评分,不需要增加用户额外的操作,但其缺点是相关用户数据在某些情况下不能准确地反映用户的喜好,使评分的准确性下降。

协同过滤技术将获取的数据以用户一资源评分矩阵的形式表示,如表1所示。其中,第i行第j列的元素R代表第i个用户对第i个资源的评分。

2.形成邻居

寻找目标用户的邻居是协同过滤技术的最核心步骤。所谓邻居,即与目标用户i具有相同或者相似兴趣的用户群。计算目标用户i和其他用户i之间相似性的过程:首先筛选得到用户i和用户j共同评分的所有资源集合Resli=Resln Res,,然后通过相似性度量方法计算两个用户之间的相似性。目前常用的相似性度量方法有:余弦相似性、相关相似性和修正的余弦相似性。

余弦相似性是最为传统的相似性计算方法,而修正的余弦相似性算法的计算过程为:推荐系统中的不同用户在学习经历、对资源的要求、价值标准等各方面都存在较大地差异,用户对资源的评分在很大程度上建立在用户的主观判断上,所以会体现出对资源的评价尺度上的差异性,为了适应这种状况,需要适当地修正余弦相似性算法。修正的余弦相似性算法在计算用户对资源评分时减去用户对资源的平均评分,弱化由于用户间评价尺度的差异性带来的评分误差,因此较传统的余弦相似性算法得到更为准确地相似性值。

3.产生推荐

产生推荐是协同过滤推荐算法的最后一个步骤。产生推荐的计算过程是通过邻居集对资源的评分预测目标用户学习资源的评分:用户i对项目s的打分R,通过其他用户(即邻居集x中的用户)对s的打分计算得到,在预测了用户i对资源集s的评分R之后,取R值最大的前若干项资源推荐给用户i基于协同过滤的推荐算法流程如图1所示。

(三)协同过滤推荐系统的案例分析

协同过滤推荐算法作为一种高效的资源推荐技术,在电子商务及网上视频点播领域已经得到广泛、成功的应用。全球最大的图书销售网站Amazon(亚马逊),国内最大的电子商务网站Taobao(淘宝网),以及国内知名的视频网站Tudou(土豆网)等。在本节中,我们将Amazon网站的协同推荐算法作为案例加以分析。

Amazon网站的协同过滤推荐算法与传统的算法有一定差异,它采用的是所谓的item-to-item协同过滤算法,类似于传统协同过滤推荐算法中基于项目(itern-based)的推荐算法,其算法流程如图3所示。

与传统的协同过滤算法相比,hem-to-item~法的优点是:商品(项)之间的相似度计算可以离线进行,这提升了系统对用户请求的响应速度;同时,由于不同用户共同购买的商品数量很小,所以商品间的相似度计算更为快速。其不足之处在于:离线计算的形式不能实时地反映用户对商品的评价情况,影响了相似度计算以及推荐的精度。

我们通过一个简单的实例进一步说明该算法的计算机过程。表2中的数据是一个简化的图书购买信息表,其中“1”表示购买,“O”表示未购买。

对于上表,以“赵大”为例,说明item―t0一item协同过滤算法的计算流程:

(1)根据用户购买行为生成“资源――用户”向量。将表中以书名划分的每一个条目转化为向量,各条目及对应向量如下:《TCP/IP协议解析》:Vecl=;《算法导论》:Vee2=;《人工智能》:Vee3=;《Linux~作系统》:Vec4=;《概率统计》:Vec5=。

(2)两两计算资源条目间的相似度。此过程的计算操作可以离线进行,采用的是前文介绍的修正的余弦相似性计算方法。“赵大”购买了《TCP/IP协议解析》和《人工智能》两书,他们与其它书目的相似度为:《TCP/IP协议解析》:Sirel:=0.82,Sire=0.82,Siml4=0.82,Siml,=0.41;《人工智能》:Sim2l=0.82,Sim23=0.5,Sim24=0,Sim25=0.5。

(3)产生推荐结果。通过对比得出,与《TCP/IP协议解析》有最大相似度的是《算法导论》和《人工智能》,与《人

工智能》最为相似的是《TCP/IP协议解析》、《算法导论》、《概率统计》,最后,推荐系统取两者的交集,将《算法导论》推荐给“赵大”。

(四)协同过滤推荐算法存在的缺陷

从Amazon的案例分析我们看到,协同过滤推荐技术可以为用户找到与其原有兴趣点最为契合的资源。然而,该技术产生精确推荐的前提是要有足够多的评分数据,即较高的用户――资源评分率。然而,对于大型的应用系统(电子商务网站、e-learning平台等)来说,其数据库中的资源项目的数量异常庞大。目前,在Amazon网站上销售的书目已超过310万之多,每个用户访问并评价的资源数目只占其中很小的一部分,这将导致用户――资源评分矩阵极为稀疏,由此产生协同过滤算法的第一个缺陷:数据稀疏。这种情况使得系统难以成功的产生邻居用户集,用户间的相似性计算非常耗时,产生的推荐结果也难尽人意。

协同过滤推荐技术的第二个缺陷是“冷启动”问题。一方面,对于一个新注册的用户来说,由于系统中没有该用户的任何资源访问记录,所以系统无法为其找到邻居用户集,更无法对其进行推荐;同样的,对于一个新加入的资源,系统中也不存在对该资源的任何评分记录,因而无法被协同过滤算法所推荐。这两种“0评分”情况构成了协同过滤算法的“冷启动”问题。

在下一部分,笔者将综合相关学者提出的协同过滤优化算法,形成一种组合的协同过滤推荐算法,提出个性化的学习资源推荐模型,以在一定程度上降低两大问题给推荐带来的负面影响。

四、基于协同过滤技术的学习资源个性化推荐模型

(一)两大缺陷的解决思路

首先,对于“数据稀疏”问题,目前流行的有两种解决方法:一种是缺省值法,也就是将用户对未评分项目的评分统一设置设为一个固定的缺省值(通过情况下取用户对项目评分的平均值,如5分制中的2.5分),这个方法虽然简单,但可以在一定程度上缓解数据稀疏问题;另一种方法是项目评分预测法,可通过计算资源条目之间的相似性,由用户对相似项目的评分来预测用户对未评分项目的评分,使得用户之间共同评分的项目比较多,从而有效地解决用户评分数据极端稀疏情况下传统相似性度量方法存在的不足。

其次,对于“冷启动”问题,我们引入内容过滤克服协同过滤推荐算法的不足。具体实现方法:对用户――资源的评分率设定一个阈值,当评分率小于阈值时即可认为处于“冷启动”状态,此时采用内容过滤推荐的方式。由于内容过滤是根据用户兴趣模型与资源向量空间模型的匹配来产生推荐,其对每个用户的操作都是独立的而不依赖其他用户对资源的评价,因此能够比较好地解决“冷启动”问题。

(二)个性化推荐模型结构

前文我们已经对协同过滤推荐算法从算法原理到实现过程都作了细致的分析,并提出了对协同过滤算法两大问题的解决思路。在此基础上我们构建了一个基于协同过滤技术的学习资源个性化推荐系统的理论模型,该模型主要包括数据支持、协同过滤推荐引擎和新进资源推荐等三个模块,如图4所示。

1.数据支持

数据支持模块为一个信息数据库,其中包含四个数据表:用户信息表、学习行为数据表、资源信息表、资源评分数据表。(1)用户信息表:存放学习者的个人信息,包括注册时填写的基本信息,以及通过Web数据挖掘技术得到的其它相关信息,如兴趣、习惯、资源偏好等。为了提升协同过滤推荐的准确度,要求系统对用户个人信息的掌握越详细越好。(2)学习行为数据表:保存学习者在学习过程中产生的学习行为记录。系统通过跟踪、记录学习者的各种行为数据,经过分析后抽取其中能较好体现学习者对资源偏好的行为数据(如对资源的下载、阅读、收藏、推荐等)记录到该数据表中。学习行为数据是用户对资源条目隐式评分的数据来源。(3)资源信息库:保存了系统中各种学习资源信息,如课件、案例、试题、新闻、文献等。(4)资源评分数据表:保存学习者对学习资源的评分信息。该表是协同过滤算法的主要数据支撑。协同过滤算法通过分析用户――资源评分数据、计算用户或者资源之间的相似度来为用户产生推荐。

2.协同过滤推荐引擎

该引擎是推荐系统的核心模块,学习资源个性化推荐实现的中枢,其实现流程如图5所示。

整个推荐引擎的算法流程可以概括为以下几步:第一步,检索数据库,形成用户――资源评分矩阵;第二步,计算数据稀疏度,在此把数据稀疏度定义为:

第三步,根据稀疏度值选择用何种方法对协同过滤算法进行修正。此处,我们设置了一个阈值,Th value’作为选择进行评分预测或者内容过滤的临界值。当SparsityTh value时,将采用评分预测算法进行修正;第四步,形成邻居,并最终对用户产生推荐。

3.新进资源推荐

该模块主要针对协同过滤推荐技术中“冷启动”问题而设计。它的主要功能是分析每个学习者的兴趣、爱好与专业(职业)类别,并为其推荐相关领域的最新资源,以提高最新资源的被访问率。协同过滤推荐的基础是用户对资源的评分,但是一个刚加入到资源库的资源如果还没有被学习者访问和评价而一直处于被访问的等待队列中,那么它将永远没有机会为系统所推荐。通过新增这一模块,能在一定程度上克服协同过滤中的冷启动问题,提高新人库的学习资源被访问的机率。

(二)隐式评分的引入

协同过滤推荐算法的一大优点是对各种不同的资源类型都具有很好的适用性,这使得该算法可以轻易地从电子商务领域移植到e-learning系统中。然而e-learning系统中学习者的学习行为有异于电子商务领域中消费者的购买行为,前者要考虑的因素更多。考虑到e-learning系统存在这样的情况:即有一部分未被评分的学习资源事实上已经被学习者点播或者学习。我们可以通过分析用户对于这一部分资源的学习行为,形成一个隐式评价模型。用户的学习行为中如果出现了表示用户对资源喜好的行为因素(下载、收藏、推荐、学习时长等),就可以把这些行为加权转化为用户对资源的隐式评分。

隐式评分是通过计算用户各特定行为或者行为组合的分值而得到的。如表3所示,为了方便期间,我们用D、c、R、T四个字母分别代表下载、收藏、推荐、学习时长(>30min)等四种行为,资源评分的最高分为10分。

在e-learning系统中引入隐式评价有两个好处:第一,通过用户自身的学习行为来计算其对资源的评分,具有比预测更高的可靠性;第二,可以增加资源的评分率,使得预测算法有更多地评分数据可以参考。这将在一定程度上缓解协同过滤算法的“数据稀疏”问题,从而间接地提高了预测评分的准确性。

(三)有关模型的几个关键问题的讨论

为了满足学习者的个性化学习需求,我们从学习资源人

手,提出了基于协同过滤技术的学习资源个性化推荐系统模型。该模型能有效指导e-learning个性化学习环境的设计,提高e-learning绩效。但是,这其中有多个因素会影响个性化推荐的精度,降低算法的推荐效率,从而导致推荐结果难以满足学习者的个性化学习需求。

1.学习者兴趣偏好的获取及更新

在个性化推荐系统中,学习者的兴趣和偏好的地位相当于坐标系中的参照点。因为一个好的个性化推荐系统所推荐的资源应能够很好地符合每个用户的兴趣、偏好,所以,学习者兴趣、偏好的抽取过程与方法在推荐系统中显得极为重要。另外,由于学习者的兴趣、偏好和知识水平不是一成不变的,推荐系统应能够很好地追踪这些变化并及时地更新相关信息,以满足学习者新的个性化需求。

2.学习者学习行为的跟踪

学习者特定的学习行为能体现出学习者当前的学习偏好。例如,他学习了哪份教材第几章第几节的内容,这就说明他当前比较热衷于学习这一节所涵盖的知识点,可以对其进行有针对性地推荐。同样,学习者收藏、下载、推荐学习资源的行为说明学习者对这项资源感兴趣。因此,系统应该有效跟踪这类学习行为,并将行为数据记录到数据库,作为协同过滤推荐中隐式评分的重要依据。除此之外,推荐系统应力求更全面地掌握其它能够体现用户偏好的行为要素,以期能够更为精确地掌握用户的兴趣、爱好,并对其产生最为合适的资源。

3.协同过滤推荐中两大问题的进一步研究

虽然在我们提出的组合协同过滤推荐算法中引入了项目评分预测和内容过滤推荐的方法,以解决协同过滤算法存在的“数据稀疏”和“冷启动”两大问题,但组合协同过滤推荐算法中仍有两个关键点需要进一步深入考虑:(1)阈值的选取。阈值决定了何时用项目评分预测与何时用内容过滤推荐,那么阈值在何值时才能使推荐引擎具有最优的推荐精度?这需要进一步的考证;(2)两大问题更优解决方法的探寻。诚然我们提出的组合算法能在一定程度上缓解协同过滤算法的两大问题,但是否还存在更为有效的解决办法,需要我们开展进一步的工作去探究、找寻,以期找到更为完美的解决方案

五、结论与未来研究展望

第7篇:个性化推荐系统范文

关键词:个性化信息服务 协同过滤 用户评分

中图分类号:TP399 文献标识码:A 文章编号:1007-9416(2015)09-0000-00

1 引言

随着互联网的普及和全球信息化进程的发展,网络已经成为人们获取信息的主要途径,互联网上的信息资源也开始呈现爆炸式增长。信息流量、规模、服务项目等各方面的迅猛发展,给人们带来了极大便利,同时也产生了“信息过载”等问题,传统的信息服务模式已难以满足用户的实际需求,个性化信息服务逐渐成为人们的网络服务诉求。互联网服务在电子商务、社交网络、数字媒体服务等领域不断应用扩展,在关注信息本身的基础上,对信息服务的信息量、时效性和表现形式等多方面也都有了新的需求,特别是对信息服务的个性化要求尤为突出。如果网站针对不同用户根据其兴趣展示不同的页面,可以使用户快速、准确的找到自己需要的信息资源,进而使用户产生被认真服务的良好体验,从而对网站维护稳定的用户群起到了大大的促进作用。个性化推荐系统正是在这种需求背景下产生的,它是网络信息快速膨胀的结果,是未来网络服务的一个发展方向,也是IT领域的一个研究热点[1]。

2 个性化信息服务网络系统

使用个性化信息服务网络系统是为了让每个用户获得的信息资源或服务都符合其自身的知识结构、身份背景等不同需要,满足用户的个性化信息需求[2]。为了能够为用户主动、准确的提供所需信息,个性化信息服务推荐系统通常应具有如下基本功能:

(1)用户信息维护。主要包括用户姓名、性别、年龄等基本信息,用户的兴趣、爱好、习惯、思维方式等背景信息和用户的工作性质、业务领域等信息如何存储和表示。负责处理用户初次输入的信息,并且满足用户随时查询、修改最新的个人信息;负责用户身份验证问题;将用户输入的兴趣、爱好信息及用户对于推荐信息的评价提交给需求分析模块。

(2)网络资源的建设与共享。网络信息资源的建设是个性化信息服务系统的基础,资源的类型多种多样,包括文档、图片、音频、视频等。作为公共资源网络平台,通常,由注册用户来共同进行资源建设,服务平台提供用户和管理资源的功能。在平台中,每位用户的资源都对其他用户公开,并对他们提供浏览、搜索、下载等功能,实现资源的共享。

(3)资源的评分与评价。为了帮助网络用户更快的甄别资源的好坏,同时也能为用户间的相互交流提供服务,网络系统实现注册用户对于资源打分和评价的功能,这也是为实现个性化服务获得基础数据的重要途径,负责用户对个性化信息服务反馈信息的收集、整理,实现系统开发者与使用者的交互。

(4)资源的自动推荐。这体现了“资源找人”的服务理念。网络信息服务系统中通常包括两种类型的推荐:一种是非个性化的推荐(即对所有游客的推荐内容都相同),包括热门资源的推荐、最新资源的推荐,这种推荐方式面向所有浏览网络信息系统的人员;另一种是个性化推荐,这是个性化服务的体现所在,针对已经注册并登录的用户,提供具有个性化特征的资源推荐服务。

(5)信息的数据挖掘过滤。使用 web 数据挖掘技术,根据用户模型,对具有相同或相似兴趣的用户进行信息检索,根据检索结果进行过滤并依据某种原则将过滤结果推送给用户,这是个性化服务性能的关键所在。

系统的运行需要用户(系统使用者)、系统开发者、网站经营者的三方共同支持,让用户以最简洁、方便、快捷的方式得到最需要的信息,使系统开发者和网站经营者实现其商业目的。个性化信息推荐服务系统的体系结构[3]如图1所示。

图 1 个性化信息服务网络系统体系架构

应用层的功能是面向用户的。其中,资源建设功能包括资源上传、历史上传资源查看\修改\删除等;资源共享功能包括资源的下载、查看、搜索等;用户管理功能包括用户的注册与登录、用户信息的查看与修改等;评分管理包括用户对资源的评分与文字评价等。

数据库存放着用户信息数据、网络资源数据和用户评价数据等,这些数据来自系统的交互活动中,构成了资源个性化推荐模型所需的基本数据。

系统的关键部分是资源个性化推荐,承担为注册用户推荐符合其个性化需求的网络资源的任务,主要包括用户兴趣模型的构建、用户相似性计算和资源预测评分产生推荐数据集。数据处理和模型构建是个性化推荐技术的基础,负责将系统收集到的数据进行预处理,使其可计算化。推荐策略是整个推荐模型的核心部分,决定了推荐模型的质量,需要完成个性化推荐中大部分的计算工作。采用协同过滤推荐技术,对项目进行聚类,计算用户兴趣的相似度,通过多轮循环,找出目标用户的最相似的几个用户,并建立相似用户数据集。产生推荐结果集的工作是依据推荐算法计算阶段得到的结果进行目标用户对于资源的预测评分计算,来过滤出最终可供推荐的资源,实现推荐过程。

3 关键技术说明

个性化信息推荐系统在建?用户的个人信息的基础上,通过用户对网络资源评价及浏览、收藏等操作行为了解用户的特征、习性、偏好等信息,借此过滤出与用户相关的内容并加以整合,进而利用机器学习和数据挖掘算法提取用户的偏好特征,帮助用户在众多且杂乱的信息中过滤出有用的部分,最后推荐符合使用者预期的资源。其中信息的有效过滤推荐是系统性能好坏的决定因素,推荐方法主要有关联规则推荐、基于内容的推荐和协同过滤推荐,其中最为流行且高效的是协同过滤推荐技术。

协同过滤(Collaboration Filtering,简化为CF)推荐的基本思想是利用已有用户群的行为或评分等信息,找到目标用户与用户群中其他用户的相似性关系,根据目标用户的相似用户信息对目标用户产生推荐。举个简单的例子,如果用户A和用户B的购买经历非常相似,而且用户A最近买了一本用户B还不知道的书,那么基于协同过滤技术的逻辑就是要向B推荐这本书。由于系统依据购买经历等信息判断用户A是用户B的相似用户,那么系统就会把相似用户A喜爱的物品直接推荐给用户B,而在产生推荐的整个过程中,用户间是相互协作的关系,故这种技术被称为协同过滤技术。

协同过滤推荐通常基于下面三点假设:

(1)在时间上用户兴趣偏好不变。比如,用户A在过去喜欢科技类书籍,那么将来也会喜欢科技类书籍。(2)相似用户的兴趣是相同的。如果用户A和用户B有相似的购买经历(A与B相似),那么用户A感兴趣的物品也是用户B所感兴趣的,反之,用户B感兴趣的也是A所感兴趣的。(3)目标用户对未评分项目的评分是可以预测的。系统可以依据整个用户群对项目集合的评分信息以及它们之间的相似性信息,预测未评分项目的评分。

协同过滤不需要对物品的内容进行分析,不用提取资源的特征信息,只是依靠用户对资源的评价信息来为当前用户寻找兴趣相近的用户,然后通过邻居用户的评分来预测当前用户对项目的评分,最后依据预测评分对当前用户产生推荐。协同过滤推荐技术避免了获取物品特征信息的难度,因而在推荐系统中得到了广泛的应用。根据实现推荐的策略不同,可分为基于内存的协同过滤推荐和基于模型的协同过滤推荐两类,两类推荐算法都需要对用户-项目评分矩阵进行分析计算[4]。

基于内存的协作推荐主要根据系统拥有的已有用户评分数据,在内存中通过一定的启发式方法实现评分预测,进而为用户推荐预测评分最高的资源。基于推荐角度的不同,又可分为2类:从用户角度实现的基于用户的协作推荐,根据用户最近邻居实现推荐,其关键在于查找目标用户的邻居用户,并根据邻居的评分对目标用户的未访问项目进行评分预测;从项目角度实现基于项目的协作推荐,其工作原理与基于用户的协同推荐类似,区别在于它更强调“用户未来的信息兴趣将保持与以往信息兴趣相一致”,项目间相似度更为稳定,挖掘信息项目之间的相似性,分类相似的项目是算法的关键[5]。

基于模型的协同推荐对系统中的评分数据分布进行分析和挖掘,通过机器学习或统计方法学习符合评分数据分布的评分预测模型进而依据目标用户的已有评分数据,通过该模型实现未知评分的预测计算。此类技术大量采用了机器学习和数据挖掘算法,对评分数据的潜在复杂模式进行学习。常用的模型和算法有贝叶斯网络、聚类算法、回归算法、马尔科夫决策模型和关联规则挖掘等。由于对模型的训练和学习一般需要耗费大量的计算时间,因此预测模型的构造往往离线完成,并且还要对模型进行周期性的更新。

协同过滤推荐的基础是用户对项目的评分,然而对于那些新加入系统的用户或资源项目,由于没有任何评分信息而无法合理推荐,这就是协同过滤的“冷启动”问题;在实际应用中,由于用户习惯和需求会使用户对项目不能进行充分的评分,造成评分数据不足,严重影响推荐精度,这就是协同过滤的“数据稀疏性”问题;随着系统的运行时间的加长,用户和资源数据不断增加,数据处理的计算量和复杂度会越来越大,这会降低算法的运行效率,因而如何有效降低算法的复杂度也是协同过滤推荐的一个亟待解决的重要问题。

4 结语

个性化的信息获取、个性化的信息服务的研究与IT技术的发展是密不可分的,只有应用最先进的信息技术才能真正做到信息服务的个性化。个性化推荐系统是互联网时展的产物,协同过滤技术是个性化推荐系统最热门的研究对象。个性化推荐系统既能作为信息过滤的工具帮助用户更好地利用互联网信息,又能作为网站营销的武器,提高网站的用户黏着度和推广相关产品或服务。

参考文献:

[1]李春,朱珍民,叶剑,周佳颖.个性化服务研究综述[J].计算机应用研究,2009,11:4001-4005.

[2]杜鹏飞.基于Web的数据挖掘与网络个性化信息服务研究[D].中国石油大学,2009:6-12.

[3]唐国菊.网络学习资源个性化推荐系统的设计与开发[D].山西师范大学,2012:41-49.

[4]http:///lnhenrylee@126/blog/static/2414832520123269713813/?COLLCC=1862522904&.

[5]任磊.推荐系统关键技术研究[D].华东师范大学,2012:18-30.

收稿日期:2015-08-18

第8篇:个性化推荐系统范文

关键词:个性化推荐系统;推荐算法

中图分类号:TP751文献标识码:A文章编号:1009-3044(2010)13-3501-01

Web Research on Personalized Recommendation

ZHAO Zhi, LIU Chang-ming, SUN Yan

(Computer Office, Aviation University of Air Force, Changchun 130022, China)

Abstract: This article describes the Web Personalized Recommendation on the classification of technologies input data and interface forms.

Key words: personalization recommendation system;recommendation algorithm

1 概述

进入21世纪后,随着网络的普及,Internet正在前所未有地改变着我们的生活。WWW上的一些主要工作,例如Web站点设计、Web服务设计、电子商务等工作正变得越来越复杂。由此,如何对网络上大量的信息进行有效组织利用,帮助海量数据的拥有者们找出真正有价值的信息和知识,以指导他们的决策行为成为研究者们主要关注的热点。个性化推荐就在这样的背景下产生出来,它是在Internet出现后产生的数据挖掘的一个新的分支,主要研究在Internet网络上,对各种数据源,如Web日志、用户登记信息、页面内容等,利用数据挖掘技术寻找网络上数据间各种隐含的知识模式和获取一些测试信息。把Web数据挖掘用于个性化推荐,可以帮助指导站点改进服务、调整结构和实施有针对性的商业行为,以更好地满足访问者的需求。

2 推荐系统的分类

(1) 非个性化推荐:推荐主要基于其它客户对该产品的评价。电子商务推荐系统对每个用户产生的推荐都是相同的。这种推荐系统可以基于Web站点工作人员的手工推荐,可以基于统计分析技术等。

(2) 基于产品属性的推荐:推荐主要是基于产品的属性。该系统需要客户输入他所需要产品的属性,因此推荐是手工产生的。基于产品属性的推荐也可以是瞬时的或个性化的,这取决于电子商务网站是否保存有客户偏好的记录。

(3) 相关性产品推荐:推荐系统根据客户感兴趣的产品推荐相关的产品,由于它不需要客户购买产品的历史记录,只需了解客户当前选择的产品,因此是瞬时的。如果推荐系统产生的推荐是基于客户长期较少改变的购买模式,可以认为它是自动的,如果需要客户明确输入一些感兴趣的产品后产生推荐,可以认为它是手工。

(4) 相关性客户推荐:又称协作过滤或社会过滤。它考虑了用户的评价信息,根据客户与其他已经购买了商品的客户之间的相关性进行推荐。

3 关键技术

目前存在着许多个性化服务系统[1],它们提出了各种思路以实现个性化服务。个性化服务系统根据其所采用的推荐技术可以分为两种:基于规则的系统和信息过滤系统。信息过滤系统又可分为基于内容过滤的系统和协同过滤系统[2]。

3.1 基于规则的技术

基于规则的系统它们允许系统管理员根据用户的静态特征和动态属性来制定规则,规则可以由用户定制,也可以利用基于关联规则的挖掘技术来发现,利用规则来推荐信息依赖于规则的质量和数量,一个规则本质上是一个If-Then语句,规则决定了在不同的情况下如何提供不同的服务。

基于规则的系统一般分为 3 部分:关键词层、描述层和用户接口层。关键词层提供上层描述所需的关键词,并定义关键词间的依赖关系,在该层可以定义静态属性的个性化规则。描述层定义用户描述和资源描述,由于描述层是针对具体的用户和资源,所以描述层的个性化规则是动态变化的。用户接口层提供个性化服务,根据下面两层定义的个性化规则将满足规则的资源推荐给用户。

3.2 信息过滤技术

信息过滤,也就是所谓的信息的选择性传播。与信息检索不同,信息过滤关注用户的长线需求(指在一段时间内,比较固定的信息需求),是为非结构化及半结构化的数据设计的,主要用来处理文本信息。其目标是帮助用户处理大量的信息,对动态的信息流进行筛选,着重于排除用户不希望得到的信息。信息过滤技术可分为基于内容过滤的技术和协同过滤技术。

3.2.1 内容过滤

基于内容过滤的技术是通过比较资源与用户描述文件来推荐资源,假定每个用户的操作都是相互独立的,因此过滤的结果仅仅依赖于用户信息需求模型(也称用户模板)与文本的匹配程度。基于内容过滤的基本问题包括用户兴趣的建模与更新以及相似性计算方法。

基于内容过滤的系统其优点是简单、有效,缺点是难以区分资源内容的品质和风格,而且不能为用户发现新的感兴趣的资源,只能发现和用户已有兴趣相似的资源。

3.2.2 协同过滤

迄今为止在个性化推荐系统中,协同过滤技术是应用最成功的技术。协同过滤,又称社会过滤[3],它是基于这样的假设:为一用户找到他真正感兴趣内容的好方法是首先找到与此用户有相似兴趣的其他用户,然后将他们感兴趣的内容推荐给此用户。它们利用用户之间的相似性来过滤信息。它一般采用基于近邻用户的协同过滤技术,核心问题是为当前用户寻找 k 个最相似的邻居来预测当前用户的兴趣。

目前有许多网站采用了该技术的推荐系统如:互联网上最大的书店; Web上最大的CD商店;互联网上最大访问量之一的电影网站等。由微软研究院开发的协同过滤工具已被集成在微软的Commerce Server产品中,并被许多站点使用。

参考文献:

[1] Pretschner, A. Ontology based personalized search [MS. Thesis]. Lawrence, KS:University of Kansas, 1999.

第9篇:个性化推荐系统范文

[关键词]情景感知 图书馆服务 自适应服务 个性化服务

[分类号]G250.7

引言

关于个性化信息服务(PIS)的研究一直是备受图书馆领域关注的课题。但随着个性化服务应用的不断深入,人们逐渐发现当前图书馆在实现个性化服务中存在的一些不足:①当前多数PIS系统使用繁琐或系统复杂,不能自动地隐式获取用户需求;②获取的用户个性化需求准确性和可靠性不高;③自适应性不强,提供的服务不能适应用户信息需求不断变化的实际情况;④缺乏探测性,用户的信息需求有时不是非常有目的性,需要根据对用户已有需求的了解推断出用户可能感兴趣的信息,而当前的PIS系统和方法在这方面没有考虑或者考虑很少。

与此同时,对情景和情景感知的研究不断深入,并取得不少成功的应用案例,于是基于情景感知的自适应服务应运而生。情景(context),也称情境、上下文,是指用于刻画一个实体所处状态的任何信息,包括每个实体的位置、时间、活动和偏好等。这里,实体可以是一个人、一个地方、一个对象,也包括用户和应用软件本身。利用情景向用户提供适合当前情形的相关信息或服务就是情景感知(context-aware)服务。它通过自动感知用户当前所处的情景信息(如人物、地点、时间和任务等)自动获取和发现用户需求,实现信息服务与用户的自适应,提高服务的准确性和可靠性,是协助信息服务系统提高性能和质量的重要支持手段和方法。因此,个性化服务中开始探究引入情景和情景感知的方法。如Kwon等创建的NAMA原型系统通过用户情景、用户描述等信息来发现用户的信息需求,从而为电子商务购买者推荐个性化信息。Kim等提出的新型个性化推荐系统通过获取用户的位置、时间、身份、需求类型等情景信息为用户提供个性化的广告服务。Mylonas等分析了用户的历史情景和当前情景的表示,并对不确定环境下的模糊情景(如用户注意力和愿望等)展开了研究,认为情景是提升个性化信息服务质量的有效手段。图书馆作为一个以服务用户为宗旨的知识信息中心,也应该不断适应新技术和新环境的变化,创新个性化服务方式,以满足用户的动态需求。

2图书馆中基于情景感知的自适应个性化服务的产生动因分析

泛在计算和移动网络的发展极大地改变了用户获取和使用信息的方式。用户需求不断趋于动态化、多元化、高效化,同时,越来越多的信息服务商给图书馆的发展带来了严峻的挑战。图书馆只有不断寻求新的服务方式,才能获得可持续发展。因此,将情景感知引入图书馆个性化服务中是多种动力综合作用的结果。

2.1 外推力――移动技术推动与泛在环境的挑战

从传统图书馆到数字图书馆、移动图书馆,图书馆的每一步发展都离不开信息技术的支撑和推动作用。20世纪90年代“泛在计算”(也称普适计算、无处不在的计算)的概念被提出。普适计算的应用、泛在环境的建立,更是对图书馆的型态、资源与服务都产生了重要的影响。泛在环境下,随着无线网络技术、传感器技术、移动终端设备的发展,信息技术对用户活动及其所处情景的捕获、分析和推理能力进一步增强,为图书馆营造普适计算环境,将信息服务融入用户当前的任务情景,通过“感知”用户的具体行为识别用户的实时需求,并据此提供自适应的动态服务提供了发展契机。因此,移动技术的发展与泛在环境的到来,是图书馆关注、获取情景信息并探讨实现情景感知自适应服务的重要推动力。

2.2 内驱力――图书馆应对危机、获得自身持续发展的出路

图书馆作为传播知识和提供服务的重要机构,曾经在传统的信息交流体系中扮演着重要的角色。但随着信息技术的发展和数字资源的主流化,随着信息资源中心和公共信息服务平台的非图书馆化以及以用户和信息生产者驱动的信息资源与服务市场新格局的出现,图书馆作为曾经的信息服务中心的地位正在被边缘化。OCLC最新的《图书馆认知2010》显示,已经没有人将图书馆门户作为查找信息的首选人口(2005年的调查结果为1%)。这反映了图书馆面临的危机。而情景感知自适应服务就是充分利用情景感知计算的技术优势,通过获取用户的地理位置、时间、标识和活动等当前情景信息,并结合用户的历史情景,自适应地调整信息服务,贯彻“用户在什么位置,服务就延伸到什么位置”,是图书馆应对危机、获得自身发-展的重要出路。

2.3 引导力――用户信息需求动态化、情景敏感化

以用户为中心、满足用户的个性化需求是图书馆一切工作的出发点。但是用户的个性化需求是复杂的、多维的、动态的、易变的,尤其是在当前的移动和泛在环境下,用户的个性化需求表现出极强的情景敏感性。这种需求特点的变化对图书馆服务提出了更高的要求,引导着图书馆个性化服务的变革方向。图书馆传统的依靠用户模型提供个性化服务的方式已无法满足用户的需求,这是因为用户的信息需求不仅与用户的身份、兴趣、偏好等有关,而且依赖于时间、地点、用户任务以及用户与系统的交互历史等情景信息,后者甚至是决定用户所需信息的关键因素。因此,基于情景感知提供自适应的个性化服务是图书馆满足用户动态多变信息需求的重要举措。

3图书馆情景感知自适应个性化服务的定位7实现模式

3.1 情景感知与图书馆个性化服务的契舍性分析

情景感知不仅是一种技术,更是一种理念,它通过将情景信息引入推荐系统中,以进一步提高个性化服务的精确度和用户满意度,兼具“普适计算”和“个性化”两种优势。情景感知计算作为普适计算的核心领域之一,能够利用人机交互或传感器提供给计算设备关于用户与设备环境等方面的情景信息,并让计算设备给出相应的反应,从而支持用户随时随地、透明地获取符合个性化需求的信息,因而为图书馆个性化服务的实现提供了有效的支撑。普适计算所体现的普适服务“无所不在”的时空特性、“自然透明”的人机交互模式以及“以人为本”的根本理念,与图书馆的用户服务理论也是不谋而合的。

另外,用户个性化需求的复杂、异构、变化甚至冲突,使得用户所处的具体环境和状态不同,面临的任务不同,其需求也将会不同。即使在同样的情况下,由于用户知识积累与偏好的不同,其所需的信息与服务也不尽相同。因此,将情景感知引入图书馆个性化服务具有重要的研究意义和实用价值,情景感知与图书馆个性化服务具有天然的契合性。

3.2图书馆情景感知自适应个性化服务的内涵与特征

“情景感知”自被提出之后,不同的研究者就给予其不同的定义。Dey等认为如果一个系统利用情景向

用户提供与用户任务相关的信息或者服务,那么这个系统就是情景感知系统,提供的服务就是情景感知服务。万亚红等认为情景感知是指系统利用情景信息,智能判断用户行为及目的并主动提供相关信息或服务,人性化调整人与情景交互的方式和内容。

笔者以为,图书馆情景感知自适应个性化服务是以用户为中心,将图书馆的信息空间与用户的物理空间相融合,将图书馆服务嵌入到用户的活动任务过程中,通过系统自动感知实时情景,智能判断用户活动行为及目的,并自适应地调整系统的服务行为,以便满足用户动态需求的新型服务模式。情景感知服务的目的是通过利用人机交互或传感器提供给计算设备的各种情景信息,构筑自动适应用户及其任务需求的服务体系,使图书馆服务充分融入并逐步成为用户信息活动的有机组成部分。因此,这种服务具有环境导向性、情景适应性、智能性、主动性等特征。

3.3 图书馆情景感知自适应个性化服务的实现模式

3.3.1 图书馆开展情景感知自适应个性化服务涉及的问题 图书馆情景感知服务的开展依赖于情景感知技术,情景感知技术涉及情景要素的界定、情景信息的获取、情景过滤与推理、情景建模、情景管理与利用等多个方面,这些问题的有效解决是实现情景感知服务的关键。在针对图书馆个性化服务的应用中,需要关注的情景要素包括用户情景与资源或者服务情景。用户情景包括用户的身份、偏好、需求历史、当前的任务与活动、周围的环境状态等信息。资源情景包括图书馆资源的类型、用途与所属学科、被用户利用的情景以及用户使用之后的反馈和评价等信息。服务情景包括服务的特性、功能、质量、服务状态等信息。情景信息可以通过感知器捕获、从已有的信息中抽取、由用户直接设定等多种方式获得。在情景感知服务的应用领域,其主要获取方式包括显式获取、隐式获取和推理获取。通过各种方式获取的情景信息一般是一些原始、模糊、不精确、不稳定甚至是冲突、不一致的数据,因此需要进行清洗、过滤、推断、解释和融合,以得到各种应用所需的高层情景。

3.3.2 图书馆情景感知自适应个性化服务的应用模式 由于技术等方面的限制,目前情景感知服务系统还不能捕获各种完整而又准确的全部情景信息,完全智能化服务的实现还比较困难。因此,在当前图书馆中,基于情景感知的自适应个性化服务主要有以下三种实现模式:

・情景感知检索服务。在信息搜索活动中,无论是用户的信息需求,还是用户所需的各种信息,都是处于各自的情景之下的,因此有效地利用情景信息提高检索性能,开展基于情景感知的信息检索与信息抽取研究已经成为信息领域具有挑战性的一个新课题。ACM SIGIR和European Science Foundation等组织早在2004年7月的国际会议IRiX(Information Interaction inContext)上就开始讨论如何利用情景信息帮助信息检索。情景信息可以帮助确定查询关键词的意义,可以用来进行查询扩展以及过滤初始的查询结果。在当前的图书馆信息检索服务中,情景信息主要用于对初始的检索结果进行重新排序与过滤,其基本的服务过程

情景感知检索服务综合考虑了用户的查询情景、查询任务、查询条件、用户偏好以及所需信息的情景等因素,使得用户能够获得“动态”的查询结果,即检索系统能够根据具体的检索情景和应用环境,能动地、自适应地输出用户真正需要的结果,从而有效地提高个性化检索的准确性和可靠性。情景化的检索也被认为是信息检索领域中一个长期的挑战。

・情景感知推荐服务。基于情景感知的推荐服务和推荐系统的理论与方法研究在国外的许多大学和研究机构都得到了深入的开展。ACM推荐系统年会(ACM Conference on Recommender Systems)从2009年开始举办情景感知推荐系统专题研讨会CARS,到目前已经举行了三届,对情景感知推荐系统领域中的情景建模技术、情景依赖推荐数据集、识别相关情景数据的算法、融入情景信息的推荐算法等问题进行了广泛的探讨。2011年2月在美国举办的情景感知检索与推荐专题会(Workshop 0n Context-aware Retrieval andRecommendation,CaRR)重点关注情景感知建模、聚类、检索、推荐、协同过滤等主题。继2010年情景感知的电影推荐(CAMRa2010)年会成功举办之后,CAM―Ra2011将与推荐系统年会(RecSys2011)一起举办,对基于情景感知的电影推荐课题中的挑战进行深入探讨。情景信息在提升图书馆个性化推荐质量方面同样具有非常重要的作用。现有的个性化推荐主要考虑用户和资源或服务两个方面的因素,而基于情景感知的个性化推荐不仅考虑“用户一项目”二元关系,而且融人用户的需求情景和资源或服务情景,进行多维度的推荐,生成精确度更高的推荐服务。其基本的服务过程

在基于情景感知的图书馆推荐服务中,既通过比较资源或服务情景与用户情景的相似度进行内容匹配,向用户推荐最适合其情景的资源或服务,同时又能够根据用户在特定情景下的行为和需求进行用户聚类,从而可以组成用户社区,实现协作推荐。当然,情景化推荐中涉及到情景信息的有效获取与计算、用户情景化需求的精确提取、情景感知推荐算法以及隐私与安全等问题,因此在具体的实现过程中还有很多技术问题需要深入研究。

・情景感知咨询服务。为用户提供参考咨询服务是图书馆的核心业务之一。然而传统的咨询服务存在以下缺陷:一是缺少对提供咨询答案的权威性与可靠性的检查;二是在用户与咨询人员交互过程中未考虑情景因素,导致对不同用户提出的同样问题给予统一的答案。基于情景感知的问答咨询服务则综合考虑了用户、问题所属领域、回答者、相关答案等情景因素,根据用户提出问题时所处的位置、提问的原因、与问题相关的隐含因素、用户特点、用户先前咨询过的问题、交互历史等情景信息,为用户提供量身定制的答案。将情景信息融入咨询服务过程,在目前国内外的咨询服务实践中已得到了一定的应用。互联网公共图书馆(IPL)提出一个多学科研究计划来探索问答服务(Q―A)中情景的影响,通过在数字问答服务中充分挖掘情景因素的作用,并致力于开发一个情景敏感的网上参考服务,以帮助用户在一个数字图书馆中找到问题的正确答案,从而提供高效的咨询服务。中国科学院国家科学图书馆在国内外图书馆界首次开展9―9实时咨询服务,利用页面共览、嵌接和情景敏感等先进技术,将咨询服务全程地嵌入用户环境和流程中,实现向不同IP的读者推荐相应的学科馆员或本地咨询馆员,从而提升咨询服务的质量和效率。这些实践活动为在图书馆中广泛开展基于情景感知的咨询服务提供了有效的参考借鉴。4结语

移动、泛在环境的发展直接推动了图书馆个性化服务的变革,图书馆将不再是被动地满足用户的需求,而是主动感知用户场景的变化并进行信息交互,提供智能化的自适应服务。这种新型的服务不仅拓展了图书馆个性化服务的新模式,丰富了图书馆信息服务的理论体系,同时也能够有效地改善用户体验,提升图书馆在迅速变化的信息环境下应对危机与挑战的能力,具有重要的理论和实践价值。可以预见,以用户为中心,具备丰富的泛在智能环境和情景感知能力,能为用户提供迅速、快捷、高效的信息资源,提供面向用户最佳个性化体验的情景感知服务将是未来图书馆信息服务的发展方向。

相关热门标签