公务员期刊网 论文中心 正文

短视频个性化推荐数据挖掘研究

前言:想要写出一篇引人入胜的文章?我们特意为您整理了短视频个性化推荐数据挖掘研究范文,希望能给你带来灵感和参考,敬请阅读。

短视频个性化推荐数据挖掘研究

【摘要】在当今大数据的大背景下,每个行业都清楚地意识到数据挖掘技术带来的便利与潜在的商业价值,并开始将数据挖掘用于快速精准决策和与管理,这不仅促进了经济的快速发展与社会的蓬勃进步,这也引起了世界新一轮的竞争浪潮。本文主要以抖音短视频为例,分析了大数据背景下的短视频个性化推荐机制和数据挖掘在短视频平台中的具体应用。

【关键词】数据挖掘;短视频;市场

引言

随着我国互联网通信技术与多媒体技术的快速发展,我国新媒体短视频的数量与日俱增。截至2019年底,爱奇艺、腾讯视频与抖音短视频等用户观看视频总数达到1亿,用户月活跃数接近3亿,每天播放视频量可达15亿个。利用数据挖掘能够进行研究决策,能够帮助理清数据交互的复杂性、认识数据缺失造成的不确定性,还能够深挖复杂数据背后蕴含的巨大商业价值。在广阔的短视频市场中,数据挖掘贯穿其中,如市场分析、细分、目标选取,到最后的制定计划,都将离不开数据挖掘,可以说数据挖掘为短视频的发展开辟了新的路径。

1短视频呈现井喷式增长的原因

1.1外部技术的成熟优化用户体验

短视频的繁荣发展主要依赖于我国通信基础建设发展与应用的不断优化,网络环境的不断提升、信息传输速度和稳定性的提高也为短视频的发展提供了强有力的技术保障。智能手机的普及为短视频用户的积累提供了宝贵的土壤,且短视频APP中的视频制作简单易学、使用门槛低、实现了生产与制作的融合,降低了用户的操作成本。在视觉成像领域,AR技术的应用增强了用户的多维体验,基于数据挖掘的精确推送,形成用户独有的个性化标签,牢牢将用户锁住。

1.2UGC生产模式满足个性化需求

UGC是用户原创内容的简写。短视频平台的定位就是内容分享,所有的用户可以上传分享自己的生活短视频,几乎没有内容的限制,满足了用户个性化的需求。通过UGC内容模式,降低了用户生产内容的门槛,扩大了平台的用户数量,以达到占领市场的目的。

1.3从用户的三个维度实现传播效果

短视频具有简短、内容丰富与参与互动性强等特点。在认知层面,用户通过大量的短视频来识别外部丰富世界。在心理层面,短视频占据了用户大部分零散时间,并且短视频通过文本、声音与图像感官的三维形式给用户以沉浸式体验。在行动层面,用户的评论与转发已成为短视频体验的一部分,也进一步增强了用户的参与感。

2数据挖掘的概念与特征

信息爆炸时代产生了海量信息,但往往难以提炼有效的信息,从而造成了无用的信息过多和有效信息的丢失,这就是约翰•内斯伯特(JohnNalsbert)所说的“信息丰富而知识贫乏”窘境。因此,人们迫切希望能对海量数据进行深入分析、发现、提取并利用隐藏在其中的信息。数据挖掘,就是指从大量的数据中通过算法搜索隐藏于其中信息的过程。数据挖掘有以下几个特点:

2.1规模化

目前对于数据的计量而言,已由TB发展到PB与EB,往后很有可能会用ZB与YB来进行计算,今后的数据规模还将会以指数的形式扩增。

2.2特性化

挖掘出来的数据应该是以前未知的,而不是验证已有的经验。只有全新的知识,才可以帮助企业获得进一步的洞察力。

2.3动态化

海量信息时代的数据迭代速度十分快速,因此数据挖掘也要具备动态性与时效性,数据库的数据要及时更新。

2.4价值性

另外,数据挖掘一个明显特点就是潜在价值,对数据进行及时清理、数据集成与数据规约化以后,就能够挖掘数据的潜在价值,给企业带来直接或间接的效益,这也是数据挖掘的真正意义所在。

3数据挖掘下的短视频个性化推荐机制———以抖音为例

抖音是一个去中心化的音乐创意短视频社交平台,任何一个账号都有机会拥有百万粉丝甚至千万粉丝。即便是新号,只要视频内容受欢迎,就会被越来越多的人关注。

3.1叠加推荐

视频上传抖音平台之后抖音官方会检测视频是否违规,如果违规,抖音官方会把视频打回或者对用户限流;如果不违规,抖音官方会进行一个随机推荐,平台会根据账号的权重给予一定的初始推荐流量,初始推荐优先分发给附近的用户、关注账号的粉丝以及自身所关注的用户,并根据用户标签与内容标签进行智能分发。抖音采用逐层推荐的方式:第一次推荐,会根据账号的权重推荐200~500流量,这200~500用户的播放量、点赞量、评论量、转发量、关注量和完播率等数据指标达到官方的初步标准后,平台通过数据比对自动判定视频内容较受欢迎,从而进行第二次推荐;第二次推荐的播放量在3000左右;第三次推荐在1.2万~1.5万之间;第四次推荐在10万~12万之间;第五次推荐在40万~60万之间;第六次推荐量在200万~300万之间;第七次推荐量在700万~1100万之间;第八次推荐会进行标签人群推荐,这时候的量级在3000多万。其中,从第四个层级开始会介入人工审核。人工审核决定是否可以加大视频曝光量,到了第8个层级,会定期将作品推送给符合作品标签的人群。如果作品没有达到每一层级的标准就不会再进入下一个流量池,也就是说首次流量推送的各项数据指标合格,就会进入第二个流量池的推送,如果第一个流量池的各项数据合格就会进行第三次推送,如果在第三次推送的时候,数据没有达标,那么视频播放量就会停留在第三层级。

3.2巧用算法关键数据打造爆款视频

抖音评价视频在流量池中的表现,主要参照四个标准:完播率、点赞比、评论量和转发量。其中,完播率对应的是抖音用户时长的要求,在不影响视频质量的前提下,尽量缩短视频的时长,力求在短时间内完成表述;点赞比是抖音推荐算法中判断视频质量的重要依据;评论区是粉丝和视频创作者的互动区域,评论区互动会大大增加粉丝对创作者的粘性;视频的转发数意味用户对视频的认可程度,对于任何一个平台而言,用户增长一定是至关重要的。品牌主在视频开始发放后,就应想办法发动所有力量去提升完播率、点赞比、评论数和转发数。

4数据挖掘在短视频营销中的具体应用

尽管短视频具备传统营销无法比拟的优势,但品牌布局短视频营销仍面临着难以找到合适的KOL、对广告创意要求高、数据监测难、效果评估不理想等问题。因此,必须通过数据挖掘推动智慧营销,以解决短视频营销中的难题。

4.1多维度分析,打造KOL评定标准

短视频传播中,选择适合自己品牌的KOL、制定正确的营销组合策略,对于资源和精力有限的品牌主来说是一件非常困难的事情。可以通过数据挖掘,建立KOL价值标准,对其进行定期淘汰。

4.1.1KOL的品牌营销价值分析目前各平台10万量级以上的KOL超过20万个,想要在庞大的资源库中找到最适合自己品牌的KOL(图1),需要对KOL的粉丝、日常内容等进行数据挖掘。主要包括:KOL的私域流量、受众人群、受众年龄、活跃粉丝数量、视频类型、UGC、电商导流能力、影响能力、服务评价等。

4.1.2KOL的定期优化要想在碎片的平台环境中快速进行KOL迭代:①跨平台寻找KOL资源;②定期抓取新兴KOL并开展深度合作;③制定执行标准,通过量化及评分等方式建立优胜劣汰的KOL选择机制。

4.2挖掘用户特点,输出精准内容

对于短视频平台而言,在大数据和人工智能的基础上,不断收集用户数据并进行分析,并根据每个用户最常访问的视频类型进行分类标记,平台再根据用户感兴趣的内容进行准确、个性化的分发,从而让用户沉浸在短视频环境中,增加对下一个视频的好奇心,最终增强用户粘性。对于内容创作者来说,数据挖掘将帮助他们更快地了解大众的喜好,更好地迎合大众的需求,促进短视频内容制作的精准化,提升产出效率。

4.3数据建模,不断优化投放和监测

对于短视频营销效果的监测而言,数据挖掘将帮助品牌主了解短视频营销的效果,并最终形成且优化营销模型,更好地服务于品牌打造。可以通过数据挖掘配合相应的模型进行测算,从而评判KOL的品牌投放效果是否达到预期。通过抓取效果数据并持续优化投放模型、基于数据分析优化资源推荐模型、优化投放组合策略,以达到最佳的营销效果。

5结束语

在大数据时代,各行各业都清楚地认识到数据挖掘带来的便利,并将数据挖掘用于企业快速精准决策中,这不仅促进了经济的快速发展,也引起了新一轮的竞争浪潮。在数据挖掘的大浪潮下,我们要学会通过数据赋能解决短视频营销中的难题,实现营销效果的最大化。

参考文献

[1]宋淑米.以大数据技术为基础的短视频营销特点及挑战研究:以快手为例[J].无线互联科技,2019(11):147-148.

[2]姚力文,段峰峰.网络短视频平台流量变现探析[J].新闻前哨,2019(8):34-36.

[3]徐宗本,冯芷艳,郭迅华.大数据驱动的管理与决策前沿课题[J].管理世界,2014(11):158-163.

[4]徐宗本.用好大数据须有大智慧[N].人民日报,2016-03-15(7).

[5]叶上怀.基于大数据时代下的市场营销机遇及挑战[J].商场现代化,2018(16):42-43.

作者:苏艳 单位:广西国际商务职业技术学院