谁是最好的客户

来源:百度文库 编辑:神马文学网 时间:2024/04/29 01:25:14
“谁是最好的客户?”
http://www.besturn.org/
摘要
本文使用SPSS的频数分析、描述性分析、缺失值分析、方差分析、卡方检验、交叉表、均值比较、相关分析、线性回归、决策树等统计方法及饼状图、条形图、箱图、散点图、树形图等图表对一个客户数据案例进行分析,以发现不同客户群体的特征,为市场推广活动提供依据。
关键词
市场,细分,客户,统计,分析,比较
SPSS可以使您从营销数据中获得最多的信息!
所有的商务人员都对“谁是最好的客户”这个问题的答案感兴趣。在当今竞争激烈的市场环境下,接触、吸引并更好地保持客户群体变得越来越困难,所需的人力物力也越来越多。在这种压力下,更多的机构运用基于客户数据的营销(Database Marketing)来最大限度地挖掘客户的价值。
有很多已知的方法来描述和评估“最佳客户”的特点。本文使用SPSS统计软件对客户数据进行分析。
下面的这个案例包括了2,000个客户资料,数据结构如下:
— 消费者第一次购买的时间
— 按订单金额排序的购买记录
— 对不同促销活动的回应率
— 家庭收入水平
— 所属地区
— 性别和其他的人口统计变量
研究目的是通过分析客户在过去的消费金额来对客户进行细分。我们将使用从基本到复杂的各种数据分析技术,从客户数据中挖掘信息。
初步研究:典型客户的特征
通过对不同变量研究分析,可以得到以下问题的答案:
— 客户居住在哪个地区?在东、西、中三个地区的分布情况如何?
— 客户的平均收入水平如何?
— 成为我们的客户有多长时间?
— 对各种促销活动的一般回应是什么?多少人回应了第一种促销活动?
— 客户花了多少钱?
SPSS提供了可以迅速回答以上问题的几种分析方法,频数和描述性分析过程可以提供对客户数据的初步印象。
从图1饼状图中可以看出,东部地区所占比例最大(34%),西部地区最小(19%),而有16.9%的数据未列出所属地区。
     
图1                                                   表1
SPSS对缺失值进行特殊处理。了解数据在什么时候、为什么缺失是十分有用的。比如,你想区分这些缺失的数据是因为客户不提供还是因为数据无法得到的时候。在表1中,“percent”值包括缺失值,“valid percent”值则排除了缺失值,可以方便地比较缺失值对分析结果的影响。

表2
描述统计提供了一组摘要统计量。从表2中可以看出,客户的平均家庭收入在61,000美元左右,多数客户的收入在50,000到72,000美元之间。
要回答“成为我们的客户有多长时间?”这个问题,需要对数据库里的一个字段进行处理,以计算每个时间阶段的客户数量。数据库中记录了客户第一次购买产品的日期,可以把它转换为成为客户的时间长度。SPSS提供了多种时间变量计算函数。

表3
频数表显示:29%的客户有10年以上的历史,过半客户在7年以上。
我们继续回答“谁花的钱最多?”这个问题。为了精确了解客户生命周期,预测模型将结合先前的购买行为,来预测未来的购买趋势。我们从每个客户的总订单值开始分析。
首先,新建一个变量:总订单值(单位:美元)
从直方图(图2)可以看出,大多数客户消费500美元或者更少,只有少数客户的消费在500美元以上。客户平均消费为1,360美元,几乎没有客户的消费超过7,000美元。
通过以上分析,可以得知典型的客户有这样几个特征:
— 居住在东部
— 家庭收入在61,000美元左右
— 成为客户在7年以上
— 在我们产品和服务上消费了1,360美元

图2
客户如何回应不同的营销活动?
为了回答“多少人对促销活动有回应?” 和“对不同促销活动的一般回应是什么?”这些问题,可以对每个促销活动的回应进行频数分析,同时对四个促销方案的订单额进行描述分析。

表4
在表4中,可以看到890(大约45 %)人对促销活动一有回应。对其他促销活动的类似分析表明39%的人对促销活动二有回应,37.4 %的人对促销活动三有回应,17.4 %的人对促销活动四有回应。

表5
购买历史分析(表5)显示促销活动三的平均值为294美元,比其他的方案都低。这一差异的显著性将在以后的分析中进行检验。
深入分析:客户的不同点在哪?相同点在哪?
下面以地区为基础来观察客户对促销活动一如何回应,以找出以下问题的答案:
— 每个地区的平均客户生命周期是多少?
— 每个地区对促销活动一的回应如何?
SPSS可以方便地在不同数据组之间进行比较。交叉表、均值比较、分组条形图、误差条形图可以清晰地表现结果,卡方统计,方差分析(ANOVA)和决策树(AnswerTree)可以确定结果的差异是否显著。
下面我们深入探讨“每个地区的平均客户生命周期是多少?”这个问题。图3同时显示了数据的平均值和95 %置信区间,可以看出西部的生命周期比其他地区长,而且该差异具有显著性。

图3
表6为图3的表格表达形式,表明整体平均生命周期为7.49年,西部比其他地区要长。

表6
表7的ANOVA报告表明生命周期和地区之间的差异具有统计显著性。可能的解释有:首先在西部开设了办事处,不同地区需求不同,或某一产品在该地区的推广比较成功,等等。

表7
图4表明:中部地区比其他两个地区,尤其是西部地区的回应要小。

图4
为了证明这个结果具有显著性,对每个地区对单个方案的回应结果进行更深入的分析。为了回答“每个地区对促销活动一的回应如何?”,我们做一个促销活动一(Offer 1)和地区(Region)的交叉表。
表8显示在对促销活动一有回应的人当中有41.3 %来自东部地区,而只有26.5 %的人来自西部,有超过一半(50.5 %)的西部人对促销活动一有回应。

表8
为了确定地区是否对回应率有影响,对“% of Region”进行比较,可以发现东部地区有45%的人有回应,中部为40%。据此得出结论∶西部是促销活动一有较好回应的地区,但这并不能作为在该地区扩大推广促销活动一的充分理由,还必须通过显著性检验来作进一步分析。

表9
表9包含了地区和促销活动一的卡方分析结果。卡方显著性水平为0.007,具有显著性。这表明促销活动一在西部地区的成功有特殊原因,如产品解说更直接迎合了西部的要求,宣传媒体更能吸引他们的注意力等。
哪些客户花的钱最多?
观察购买历史的另一种方法是对花费的全部数量,而不是在单个订单上的花费进行评估。花费总数和地区之间的关系也可能反映一些重要的信息。
单因素方差分析可以检验平均值差异的显著性。它首先提供了一个描述统计表格,表示各个地区对四种促销活动的花费总数的平均值。中部地区为1,206美元,东部为,1391美元,西部为1,600美元以上。
最后一个报告(表10)显示出东部和西部花费水平之间的差异是否显著。

表10
单因素方差分析表明,东部和西部地区的花费水平不存在显著差异,西部和中部地区之间的差异则有显著性。
可以用这些信息做进一步的分析,以确定地区之间如何不同,为什么不同,并根据这些不同做出有针对性的营销计划。
预测消费总数
预测模型是确定市场前景和优化市场资源的强大工具。它可以回答类似“家庭将花费他们收入中的多少?”这样的问题。

图5
散点图(图5)显示了家庭总收入和总订单金额两个变量之间的关系。
SPSS提供多种方法来确定变量之间的关系和定义预测模型,如散点图、相关分析、线性和逻辑斯谛回归、CHAID等。
表11显示相关系数是0.608,表示家庭收入和花费总额之间有密切的关系。
回归分析进一步通过模型来表示它们的关系,如表12和图6所示。

表11
这个关系表明家庭收入增加,消费总额也会增加。可以以此来预测营业额,并改善营销活动。如:以能消费更多的产品和服务的高收入家庭作为目标,或者开发“客户保持计划”使高收入家庭始终感到满意,等等。
        
表12                                         图6
客户细分以追求更多的利益和成功的市场
基于客户数据的营销活动经常使用卡方自动交互检验技术(CHAID)进行分析。 SPSS AnswerTree提供了四种决策树算法,CHAID是其中一种。AnswerTree可以找出哪些特征的组合最有可能实现一种结果(如对一种促销活动的回应)。我们把地区、产品和收入类别放在AnswerTree的模型中,以发现最有可能回应促销活动一的组合。AnswerTree把结果自动构造成树型图,如图7所示。

图7
图8显示了树形图的顶端分枝,它们是对促销活动一的回应最具影响力的几种因素。可以发现收入的影响是最大的(与前面回归分析的结果相同)。

图8
在图9中,下一级分枝表示如果收入不低于65,000美元,产品种类是AB或C1,则有98 %回应率。用更多的因素来进行AnswerTree分析可以得到更多的信息,例如,可以发现尽管中部地区整体上对促销方案没有多大回应,但有特定收入的妇女群体却有较好的回应,这可能是另一次直邮营销的成果。

图9
采取行动
根据分析结果,可以制定下列计划:
— 为最好的客户(高收入、居住在西部、长期客户、购买一级产品)制定一个全新的顾客保持计划
— 对于中部地区的低收入客户尝试采取一种产品和服务捆绑的形式,以更好的满足这些客户的需要
— 把西部的市场开发经验应用到中部和东部,以建立长期客户为目标
— 在西部地区继续推行促销活动一
— 把未来的营销活动集中在最有价值的市场目标上