当代文学

www.hm2999.com当代文学_儿童文学_西方文学

潜在降档客户预警模型 传统节日绘本手抄报

发布时间:2019-06-15 编辑 :本站 / 46次点击
您现在的位置:当代文学 > 现代诗歌 > 正文
TAG:

潜在降档客户预警模型 传统节日绘本手抄报

模型背景及目标1.背景为有效应对市场竞争,进一步提升客户的价值贡献,挽回产品降档客户的价值流失,特构建了潜在降档客户预警模型。 2.目标挖掘提取当月可能预约降档的目标客户。

模型口径定义预约降档:客户产品降档,本月预约,下月生效。

建模过程1.样本选择产品降档客户,本月预约下月生效,所以建模目标为预约降档的客户。 2019年3月份预约降档客户182241到4月真实降档客户1805712019年4月份预约降档客户158396到5月真实降档客户153761我们用3月份预约降档的客户做为正样本,另提取出55万客户作为负样本,正负样本比例约为1:3;4月份预约降档的客户作为验证。 2.变量选择影响客户产品降档的因素可能包含有用户产品信息,基本属性信息,业务行为信息等,我们从这几方面考虑选取如下变量:当月通信客户剔除M2M剔除小号副卡客户基本信息1用户id备注2性别未识别0女1男23年龄未识别00-16岁116-25岁225岁-50岁350-70岁470岁以上54入网时长(0,6]月1(7,12]2(12,24]3(25,36]436以上55星级6是否4G客户7同一身份证下是否有近6个月新入网用户用户产品相关数据1产品类别不限量1任我看2飞享3移动王卡4E动5神州行6全球通7动感地带8其他92产品价格空0(0,8]1(8,18]2(18,38]3(38,58]4(58,88]5(88,138]6(138,188]7(188,+)83产品内总流量1G以下11G-5G25G以上34产品内总时长5DOU6MOU7ARPU8DOU波动当月较近三个月均值波动9MOU波动当月较近三个月均值波动10ARPU波动当月较近三个月均值波动用户手机终端信息1终端类型未识别04G+1全网通24G其他323G42用户卡槽类型未识别0DM移动异网1移动空2移动移动3模型移动异网4模型移动空5模型移动移动6未识别7单卡槽83终端价格未识别0(0,500]元1(500,1000]2(]3(]4(]5(5000,+)64终端时长(0,6]月1(7,12]2(12,24]3(25,36]436以上5用户业务相关数据1是否家庭V网2是否宽带3营销活动捆绑情况无0终端合约1合约加身2最低消费34活动到期无0上月到期1本月到期25用户卡槽变动其他0移动空——移动移动1移动空——移动异网2移动移动——移动空3移动移动——移动异网4移动异网——移动空5移动异网——移动移动6未变76主副卡变动其他0主卡——副卡1副卡——主卡2未变37是否异网宽带不是0新增1存量2目标是否预约降档是否4月预约5月份降档3.数据清洗一、根据业务,用户捆绑对客户套餐的影响较多,基于此,我们添加一个变量字段,把客户有终端合约捆绑的、话费合约捆绑的、客户有最低消费的其它情况分类处理。

二、剔除物联网卡客户及小号卡客户。 三、根据业务常用习惯把入模变量分类。

四、从特征分析结果来看同一身份证下是否有近6个月新入网用户变量单个类别过大,去除五、采用算法,卡槽变动字段对模型效果有负面影响,添加后训练结果反而降档,去除。

4.选择算法此模型考虑用聚类或决策树方法来处理,通过、CR树和随机森林等方法建模。

5.模型评估方法结果:NodesImportance营销活动捆绑%产品价格%%通话时长%ARPU波动%年龄%终端分类%DOU波动%终端价格%正确率:%,覆盖率:%命中率%F1:%CR树方法结果:NodesImportance营销活动捆绑%产品价格%%通话时长%星级%%产品分类%入网时长%正确率:%,覆盖率:%命中率%F1:%输出规则2个:规则1:product_pricein("5","6","7","8")andif_kb=3规则2:product_flow1=1andproduct_pricein("3","4")andif_kb=3随机森林方法结果:决策规则最频繁的类别规则准确性森林准确性兴趣索引if_kb=3andproduct_call__pricein("3","4","5","6","7","8")_bd=_kb=3andarpu__star_levelin("3","4","5","6")_monthsin("2","3","4","5")andproduct_pricein("1","2","5","6","7","8")andproduct_pricein("3","4","5","6","7","8")andproduct_call_dura30andif_kb=_endin("0","2")andproduct_pricein("1","2","5","6","7","8")andif_kb=3andproduct_pricein("3","4","5","6","7","8")andproduct_flow1in("2","3")_call_dura200andproduct_call__kb=混淆矩阵实测预测10比例正确1153,861128,,000415,比例正确.模型验证输出根据模型规则预测提取4月份预约降档客户,和真实4月份预约降档客做对比结果如下:方法输出客户预约降档输出中降档覆盖率命中率%%CR树%%随机森林%%方法规则输出客户预约降档输出中降档覆盖率命中率优先级输出客户数在200以上的规则%%2其他%%去除CR树规则%%3规则%%5随机森林规则%%1规则%%4其他%%去除经讨论,需要增加验证饱和度的使用情况,客户分优先级导出,标明降档原因,增加重点保拓客户标签。 验证饱和度使用情况饱和度输出客户分布占比降档客户分布占比差异无优惠%%-%未使用%%%(0,30%]%%-%(30%,50%]%%-%(50%,80%]%%%(80%,100%]%%%(1000%,120%]%%%(120%,150%]%%%(150%,200%]%%%(30%,50%]%%%200%以上%%%合计2135536158396以上可以看出,输出客户和真实客户饱和度使用分层差异不显现,可以忽略。

以下为输出客户优先情况:规则集验证输出5月预约降档客户客户数真实数命中率优先级1123交集%276734优先级21\4和2和3\5交集%438043优先级3规则%426744优先级4规则%92859优先级5规则%345535优先级6规则%408266优先级7规则%59168合计%2047349降档原因归类重点分为1、用不完(根据饱和度测算);2、活动到期(根据营销包和优惠的描述,提取关键字分终端到期、宽带到期、话费到期、流量到期、其他到期);3、保号(饱和度及客户使用ARPU、DOU计算);4、资费高(饱和度及客户使用ARPU、DOU计算);5、办理其他业务(近期有办理6个月及以上营销活动业务)6、宽带影响(本网宽带客户和异网宽带客户);7、其他;增加降档原因及重点保拓客户标签后输出清单如下图:免责声明:本文仅代表文章作者的个人观点,与本站无关。

其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。