前言:想要写出一篇引人入胜的文章?我们特意为您整理了大数据技术下的大型超市数据分析范文,希望能给你带来灵感和参考,敬请阅读。
摘要:以一家全球大型超市四年的销售数据为研究对象,对该超市的销售数据进行一个多方面的分析。采用python、图表秀,对该超市进行销售情况、商品情况以及客户情况三方面的分析。通过分析结果可以看出超市这四年的发货情况、利润情况、整体地区布局、各类商品销售情况、超市客户情况等等。该超市可以根据这些结果,有针对性地对超市的经营模式和营销模式进行一个改善和提高。
关键词:大数据;超市;销售分析;商品分析;客户分析
1概述
随着大型超市和连锁超市的快速发展,超市业已成为商业领域最具活力的商业业态[1],我们日常生活中经常会去超市采购日用品,超市已经成为我们生活中不可或缺的一部分,超市的发展也紧密连系着我们的生活。全球大型零售商沃尔玛在分析大量的数据时发现,男性顾客在购买尿布时,常会买几瓶啤酒,于是将啤酒和尿布摆在一起。[2]在之后的数据表明使尿布和啤酒的销量都大幅增加了,这是大数据的经典案例“啤酒+尿布”。可以看出通过大数据技术的数据分析等等方面可以挖掘到超市一些隐藏的有效数据信息,其中数据挖掘就是利用数据分析工具从海量数据中提取隐含的、表面不为人们所知但又有价值的信息获取过程。[3]零售领域是数据挖掘的主要应用领域之一,[4]比如大数据技术可以了解消费记录、消费额、地区销售额等数据,有针对性地对重点区域进行广告投放,助力超市的发展。
2研究思路
以一家全球大型超市四年的销售数据为研究对象,数据是2011-2014年该超市的销售数据,对该数据进行一个多角度的分析,采用python、图表秀,对该超市进行销售情况、商品情况以及客户情况三方面分析。具体分析了超市这四年的发货情况、利润情况、整体地区布局、各类商品销售情况、销售数量、超市客户类型占比、客户增长情况等。
3数据说明
3.1数据来源
数据来源于kaggle平台公开的一家全球超市四年的销售数据,数据表中包含了行编号、订单编号、订购日期、发货日期、运送方式、顾客ID、顾客姓名、市、州、国家、市场、地区、类别、产品名称、营业额、数量、折扣、利润、运输费等24个特征,共50000多条数据,12M。
3.2数据预处理
在数据表中,存在一些空值、异常值、错误值和无效列等等数据,因此对数据进行了数据预处理,筛选出了我们需要的、正确的数据,把不需要的数据进行了剔除,其中主要使用了订购时间、发货日期、市、州、市场等字段的数据进行分析和探索。通过筛选空值发现,邮政编码这一列存在大量空值,并且对数据分析没有作用,因此删除该列。数据中订单优先这一列有为空值的数据,并且发现这些数据存在错位现象,删除订单优先为空值的数据行。筛选中发现,Sales这一列有不是数值的数据,删除销售额为字符串的数据行。
4销售情况分析
4.1发货情况分析
一共有50629笔订单,每笔订单的发货时间差平均为1天左右,最长的发货时间差为7天,并且发货时间差为0天的订单数量为38472个。由图1可知:当天就发货的订单数量占所有的75%以上证明该超市发货时间差较小,大多都能够在短时间内发货,效率较高,也证明该超市的商品库存量基本都保持在一个充足的状态下。
4.2利润分析
由图2可知,该超市从2011-2014年的总利润同比上一年相比呈现上升的趋势,2011-2014年的下半年利润总体都大于下半年利润,该超市的销售季节性非常明显,上半年是销售淡季,下半年是销售旺季。但上半年中6月份利润额呈现一个上升的趋势,利润偏高,下半年中7月份的利润额较下半年的其他月份偏低。对于上半年,结合多种原因分析其6月份利润额偏高的原因,利用这些原因可以进行一些销售活动,提高6月份的利润额。上年半年的其他月份,可结合商品的特点制定销售策略,还可以举办一些促销活动,促销可以刺激和诱导消费者购买商品。促销主要是聚集人气、吸引客户、提高销售额。而一般情况下,消费者进入超市,计划性购买仅占30%~40%,而冲动性购买则占到60%~70%。超市只有通过开展多种促销活动,才能扩大销售、提高营业额。[5]对于下半年,在保持原来的营销策略基础上,可以针对其具有季节性特点的商品,举办活动,加大商品投入。
4.3销售地区分布
该超市销售额中,APAC(亚太地区)销售额最高,Canada(加拿大)销售额最低,APAC、LATAM(拉美)、US(美国)、EU(欧盟)这四个地区就达到了85%以上的销售额占比。根据图3可知:除加拿大地区以外,其余的六个地区销售额每年呈现一个上升趋势。APAC、EU两个地区的每年销售额增长较快,具有巨大的发展潜力,该超市可以将市场重点放在APAC和EU上面,加大投入,在重点区域有针对性的投放广告等,增加每年销售额。其余地区可以参照APAC与EU的经营模式和策略,将两个地区的超市负责人与其他地区的负责人进行一个交流,将其余地区也做大、做强。
5商品情况分析
各类商品销售额贡献情况:由图4可以看出:只有Tables(桌子)的利润为负,说明桌子目前处于亏损的状态,通过筛选发现大部分桌子都在打折并且打折力度很大,超市要看是否是因为桌子滞销而打折出售的,如果不是此类情况就该考虑改变营销策略,减少亏损。Copies(复印机)、Phones(手机)、Bookcases(书柜)、Appliances(电器)、Chairs(椅子)、Machines(机器)、Storage(储藏箱)这几类商品是销售额比较好的,一共占到了总销售额的一半以上,这几类商品是该超市主要销售商品。销售额比较少的几类商品,Paper、Supplies、Labels都是办公用品中的小商品,超市可以在不亏损的情况下,降低这些小商品单独买卖的定价与复印机、书柜这几个销售额较高的办公用品一起打包销售,或者采用买多少送一些小商品的营销策略。
6客户情况分析
6.1不同类型客户消费情况
从图5可以看出:消费者占该超市客户数量最大,说明普通的消费者是该超市的主要客户,企业占比也比较高,企业的单子都比较大且固定,多多加强与企业的合作有利于超市的发展。2011-2014年各类型客户的销售额呈现逐渐上升的趋势,说明该超市的经营模式比较好,可以继续保持该经营模式。
6.2每年客户数量变化
从图6可知:2011-2014年的订单数量是在逐年增加的,但每年新增的客户呈现一个逐年下降的趋势。证明该超市客户的回购率比较好,经营情况保持的也比较好,订单主要都是老客户。保持老客户,吸引更多的新客户才是企业的生存之道。该超市可以举办一些销售活动或者不定期的进行超市的宣传、营销活动吸引更多的新客户注入超市。
7结论及建议
7.1销售情况方面。
发货时间差有75%以上都是当天发货,可以继续保持。2011-2014年,订单数量是逐年增加的,说明超市的经营比较好。该超市从2011-2014年的总利润同比上一年呈现上升的趋势,销售季节性明显,上半年是淡季,下半年旺季。在上半年可以举办一些促销活动,还可以结合商品的特点制定销售策略。下半年,在保持原来的营销策略基础上,可以针对其具有季节性特点的商品举办活动,加大商品投入。销售地区分布中,APAC销售额占比最高,Canada销售额最低,APAC、LATAM、US、EU达到了85%以上的销售额占比。APAC、EU两个地区的每年销售额增长较快,该超市可以将市场重点放在APAC和EU上面,加大投入,其余地区可以参照APAC与EU的经营模式和策略,将地区之间进行交流,把其余地区也做大做强。
7.2商品情况方面。
销售额前三是:Phones、Copiers、Chairs,利润前三的商品是:复印机、手机、书柜,可以加大这几类利润高的商品的营销和推广。桌子目前处于亏损的状态,超市要看是否是因为桌子滞销而打折出售的,如果不是此类情况就该考虑改变营销策略、减少亏损。降低Paper、Supplies、Labels等小商品单独买卖的定价与复印机、书柜这几个销售额较高的办公用品一起销售,或者采用买多少送一些小商品的营销策略。
7.3客户情况方面。
消费者是该超市的主要客户,可以多加强与企业的合作。2011-2014年各类型客户的销售额呈现逐渐上升的趋势,该超市的经营模式比较好,可以继续保持。每年的订单数量是在逐年增加的,每年新增客户为下降趋势,说明该超市客户的回购率比较好,经营情况保持的也比较好,订单主要都是老客户。该超市可以举办一些销售活动或者不定期的进行超市的宣传、营销活动吸引新客户。
参考文献
[1]肖生苓,牟娌娜,王维,高晓红.基于数据挖掘技术的超市顾客群研究[J].资源开发与市场,2011,27(08):683-685+712+672.
[2]孙杰.数据挖掘技术在零售业领域中的应用研究[D].大连:东北财经大学,2003.
[3]李春林,任博雅.基于某超市的数据挖掘分析[J].现代商业,2009(05):13-14.
[4]张红梅,夏南强.数据挖掘技术在零售业中的应用[J].经济师,2006(01):48-49.
[5]李春林,屈驳韵.超市销售数据的计量模型与分析[J].经济论坛,2006(21):99-101.
作者:李清蔓 杨杉 单位:四川大学锦城学院