当前位置:首页 > 数据挖掘商业案例
图2.7:C5.0决策树结果
图2.8:神经网络模型结果
决策树模型中有4个终端节点和仅仅3个重要的输入变量(按照重要性降序排列):投资账户余额、客户性别和客户年龄。神经网络模型在输入层、隐藏层和输出层分别有15个、5个和3个神经元。此外,最终要的5个输入变量是(按照重要性降序排列):活期账户余额、客户孩子数目、储蓄账户余额、投资账户余额和客户婚姻状况。Logistic回归模型统计有效,卡方检验的p值为1.000,表明数据吻合得很好。此外,下列输入变量在统计时,在0.05的有效水平上预测客户流失状态也统计有效:储蓄账户余额c(p值=0.000)、活期账户余额(p值=0.000)、客户年龄(p值=0.002)、客户年收入(p值=0.033)及客户性别(p值=0.000)。
从用评估图节点产生的提升表中可以看出每个预测模型都是有效的,如图2.9所示(从左至右分别为Logistic回归、决策树和神经网络)。提升表中绘制的是累积提升值与样本百分比的关系(在这里是构造/培训样本)。基准值(即评估每个模型的底限)是1,它表示当从样本中随机抽取记录的百分点时能成功地“击中”现有客户。提示值衡量的是当来自数据中的某一记录是一个现有客户的降序预测概率能被百分点反映时,预测模型“击中”现有客户的成功可能性(准确度)
9
有多高。如图2.9(左)所示,每个模型的提升值均大于1,在100%时收敛于1。由于每个预测模型都能以有效精度预测目标变量(起码对于现有客户和非现有客户之间的关系),因此我们可以说它们都是有效的。
图2.9:提升图(左)和三个模型的分析结果(右)
值得注意的是神经网络和决策树得出的预测模型并不完全一致,这从图2.9(右)两个模型结果的比较可以看出来。所以,不仅要在训练样本中比较两个模型的表现,也要在训练/测试样本中进行比较,而后者更加重要。对于这些预测模型来说,评估它们相对表现的最佳办法应该是看它们预测目标变量(客户流失状态)的精确率。在本例中为了简单起见,假设总体精确度包括了比较不同预测模型表现的评估标准。在图2.10的右面板中,决策树模型的预测相对精确,总体精确度为81.6%,因此根据评估标准,决策树模型是最好的预测模型,应该在ZABNK预测房贷客户的流失中使用。
图2.10:测试集的提升表(左)和三个模型的分析结果(右)
(5)模型部署
在本例中,决策树模型不仅精度最高,而且从图2.7中的简明的规则可以看出,决策树的模型也容易理解。结果表明,ZBANK的房贷客户中,那些39岁以上,在投资帐户中余额超过4976美元的女性更可能主动流失。要注意的是,客户流失状态滞后输入变量六个月。从到目前位置的结果来看,决策树客户流失预测模型能够更精确地根据交易和人口统计的信息判断出流失客户和非流失客户,从而产生增值效益。因此,ZBANK可以用决策树模型判断哪些客户倾向于主动流失,然后向他们提供优惠措施或采取其它预防措施。同样,客户流失模型可以判断哪些是流失风险较低的房贷申请者。使用数据挖掘的决策树模型可以用来对现有客户和新的房贷申请者进行评级。在Clementine中部署模型的数据流图如图所示。运行数据流后,Clementine自动将结果存储在逗号分隔的文件中。银行中其他人员即使没有安装Clementine,也可以使用记事本等软件打开查看。并且可以很好的集成到银行现有的其他业务系统中。图2.12给出了一个结果的例子。其中按照客户流失概率的大小,对客户进行排序。
10
图2.11:模型部署的数据流图
图2.12:流失概率和客户价值的散点图
最后需要指出的是在本例中,模型的总体分类精确率是简化计算的。在实际使用中,一般还需要考虑误分类及其相关成本,还有流失客户和非流失客户在样本和总体中的相对比重。
3.客户细分
信用风险分析
随着金融市场逐步开放,商业银行和保险公司面临着巨大的压力和挑战。面对竞争和挑战、重点是做好客户市场细分,有效发掘客户需求,提供客户差异化服务。一个银行的客户是多种多样的,各个客户的需求也是千变万化的,银行不可能满足所有客户所有的需求,这不仅是由银行自身条件所限制,而且从经济效益方面来看也是不足取的,因而银行应该分辨出它能有效为之服务的最具吸引力的市场,扬长避短,而不是四面出击。对一个银行来说,在经营管理中应用市场细分理论是很有必要的。
客户细分的概念
客户细分的概念是美国市场学家温德尔?史密斯(Wendeii R.Smith)于20世纪50年代中期提出来的。
客户细分(Customer Segmentation)是指按照一定的标准将企业的现有客户划分为不同的客户群。客户细分是客户关系管理的核心概念之一,是实施客户关系管理重要的工具和环节。Suzanne Donner认为:正确的客户细分能够有效地降低成本,同时获得更强、更有利可图的市场渗透。通过客户细分,企业可以更好地
11
识别不同客户群体对企业的价值及其需求,以此指导企业的客户关系管理,达到吸引合适客户,保持客户,建立客户忠诚的目的。
所谓客户细分主要指企业在明确的战略、业务模式下和专注的市场条件下,根据客户的价值、需求和偏好等综合因素对客户进行分类,分属于同一客户群的消费者具备一定程度的相似性,而不同的细分客户群间存在明显的差异性。客户细分的理论依据主要有:
(1) 客户需求的异质性。影响消费者购买决策因素的差异决定了消费者的需求、消费者的消费行为必然存在区别。因此可以根据这种差异来区分不同的客户,客户需求的异质性是进行客户细分的内在依据。
(2) 消费档次假说。随着经济的发展和消费者收入水平的提高,消费量会随之增加。但消费量的增加并非线性增长,而是呈现出区间性台阶式的变化形式,一旦消费者达到某种消费层次之后,消费变化的趋势将变得非常平缓。根据消费档次假说,消费者的消费档次或消费习惯在一段时期内是相对稳定的,这就为通过消费行为来划分消费群体提供了理论前提和基础。
(3) 企业资源的有限性和有效市场竞争的目的性。资源总是希缺的,由于缺乏足够的资源去应对整个客户群体,因此必须有选择地分配资源。为了充分发挥资源的最大效用,企业必须区分不同的客户群,对不同的客户制定不同的服务策略,集中资源服务好重点客户。
(4) 稳定性。有效的客户细分还必须具有相对的稳定性,足以实现在此基础上进行的实际应用,如果变化太快,应用方案还未来得及实施,群体就已面目全非,这样的细分方法就显得毫无意义。
客户细分模型
客户群细分的目的是为了选择适合企业发展目标和资源条件的目标市场。客户细分模型是指选择一定的细分变量,按照一定的划分标准对客户进行分类的方法。一个好的细分模型,首先是要满足细分深度的要求,不同的使用者对客户细分的深度也有不同的要求,这就要求模型划分的结果能满足不同使用者的需要。其次是对数据的处理能力和容错能力,现代数据库的存储容量越来越大,数据结构也趋于多样性,误差数据也会随之增多,这就要求模型能适应数据在量和样上的膨胀,对误差数据能做出判别和处理。最后是模型要有很强的适用能力,变化是绝对的,而稳定只是相对的,无论是个人消费者还是消费群体,他们的消费行为都是在变化的,这就要求模型对客户的细分标准要随新的情况而不断更新。在对客户进行细分的方法中,除了传统的按照客户基本属性进行分类的方法以外,还有其他多种客户细分模型,如基于客户价值贡献度的细分模型、基于不同需求偏好的细分模型和基于消费行为的细分模型。基于消费者消费行为的客户细分模型研究,主要是以消费者的购买频率、消费金额等为细分变量,如RFM 模型和客户价值矩阵模型。
(1)RFM模型。RFM细分模型是根据消费者消费的间隔、频率和金额三个变量来识别重点客户的细分模型。
R-Recency指客户上次消费行为发生至今的间隔,间隔越短则R越大;F—Frequency指在一段时期内消费行为的频率;M—Monetary指在某一时期内消费的金额。研究发现,R值越大、F值越大的客户越有可能与企业达成新的交易,M越大的客户越有可能再次响应企业的产品和服务。
(2)客户价值矩阵模型。
客户价值矩阵模型是在对传统的RFM 模型修正的基础上提出的改进模型。用购买次数F和平均购买额A构成客户价值矩阵,用平均购买额替代了RFM 模型中存在多重共线性的两个变量,消除了RFM模型中购买次数和总购买额的多重共线性的影响。在客户价值矩阵中,确定购买次数F和平均购买额A的基准是各自的平均值,一旦确定了坐标轴的划分,客户就被定位在客户价值矩阵的某一象限区间内。依据客户购买次数的高低和平均购买额的多少,客户价值矩阵将客户划分成四种类型,即乐于消费型客户、优质型客户、经常客户和不确定客户,如图3.l所示。
12
共分享92篇相关文档