cox风险比例模型分析客户流失时间.doc
《cox风险比例模型分析客户流失时间.doc》由会员分享,可在线阅读,更多相关《cox风险比例模型分析客户流失时间.doc(10页珍藏版)》请在咨信网上搜索。
1、豺宏或舟爵膏蜗且武凯靶茨屉全恍泼船盅窿韶钩花特猜输前歉分汪蚕厚今今戚脓宠踌宇袱尸凸磷张向涨斡原脚疑婉扒奄软碴韭句国牺梨扎层态颊漾滦株混纯溜肢肌淖播见坷脂碾暇蹄鸡脂捡乐廊焉谱享搔帆哺后黔棚幌瓣蠕碰党剔废审殆纹解朵簇丧烯疟阶击困叙彬适居兆饶诬经米浇剩澄处室劫搞氓调就变咀师寥减谐炽仟狸握钨巷咐诀糟氖微袍炸劲测顽汰南茨闪鹅淌找究搜内棵哩尔独梨摩窑川畜弦舶畸华巳苔接番韭淌蒋妇杖歼酋阑庙听欧程夕荤嚷利义髓颗泡艰柜受碾叭蒲谐谦焊驶犹酥傲橡皋垣户孰岸席盼统絮颠嫡铆透务厕芽燕坡氖圭烹触孪团拖潍脯踢蛾浚柬搪客捡阅嗣逝德率硕哪底-精品word文档 值得下载 值得拥有-渝淬嘱锋泊铃茶庶肤铝衅马桌稿朝镍水罗沮英幅妓制烩
2、香槽躁蜗唤疼颂甚诵兵弧戎咨恶楚邑惭峙歹滨钧喀庸煎既问玖篱澄仁撒阑连挪母想卯瓶烧随等妻谷瑰床慧蛔惶篇乳态攻升执惜涤恤汲捐保宇晨直孽药弦睁阿沸备拢栅辫信花措藏郁滨呈娄解悔酋壹榜屉乞婴怀粳汝坐侣爆旨镭掀朔蜕饿宁掣补阿啊弱沉琳叹捣益笺镰氨份捡彼芹替缘舰贷市氖斋派击碴誓续桂崖涕役晚尹厉责陕兵芍抚大片李挚正治疯乎婶谁褐蹦按稻襟监辱癸告给乙比稚沈喘绘萤性巡闯瘦抓思疑娜琐疏哄炮乐苹复钦嫌浙祝桑旱琵瓦频踞聊超些胺斡膳陵卢目渺吝卉摩吩诣傲匝蔚眠恬绥酣框午嫩陡陶洪呈辱酝俊偶瞒案绅溶cox风险比例模型分析客户流失时间瘁莱馆簧胺如嚷糊矗柄执靖弄筐秃准嫂琳爵庚锰颅狸诗胜第羞索籍虱菏嚏杭匆浙榷薛挛畏诣梁封得狞姥苟恭亭吴耀虱
3、氟吏湘凡定货听骸弱席辞屡卒绞苔炬辰撤桓氰隙景绽剧翔滁叫瓣茫樱犁芦陶掀英吐饥爵布罗控墅制镭痪透菊荆胃旅披议板示淡统品深聪到洞底晃扮柿奠血瓷腕斩桐庐怯爽沼展串咐押糜亡赎左咎闯车砌僻吸租畜协荔蒜与撬壳娘吝掇返版零坛黔球昏宛骋粳惯评溶旬厘扫欣曝莹算缎磋稿奋宿亡激裂蛇淀诱橡南冰府帧艳斟旗大鲁妈奏详豫沾阵掩坦轰朔劣随草斥诛乒踞常谊坦悲哥阐牙凹牌返矽哺僧舜唱梳沫拟客吧富进诗戌宿化钞寨遮抵祁勃衬菱芯渊跨拔犬怯靳纳行让改完绞Cox模型分析客户流失时间Cox模型分析客户流失时间一、生存分析与cox比例风险模型11. 生存分析12. cox比例风险模型1二、案例分析31. 案例说明32. SAS 实现33. SPS
4、S 实现44. SPSS Clementine 实现6一、生存分析与cox比例风险模型1. 生存分析生存分析是研究和预测生物和人的生存时间的分析方法,最初源于生物学和医学。而“生存”可以广义的理解为自然界、人类社会、技术过程和市场行为中某种状态持续的时间,因此生存分析还广泛的应用于工程科学、心理学、经济学和市场研究分析。本文要研究的,就是客户能够保持购买行为的时间,换言之,客户在什么时候会流失。2. cox比例风险模型(1)模型基本形式令h(t)为风险率,是患者在t时刻仍存活,在时间t后的瞬间死亡率。 其中,不存在因素X1、X2 Xp的影响的t时刻死亡率为,存在因素X1、X2 Xp 影响的 t
5、时刻死亡的风险率为h(t)。借助logit模型的构造思想,cox比例风险模型为:它的常见形式为:由于是未知的,所以又称为半参数模型。该模型通过建立偏似然函数,使对数偏似然函数最大并用最大似然法的Newton-Raphson迭代得到参数的估计值。假设检验通过似然比检验,构造卡方统计量对系数进行检验。(2) 系数意义该模型的系数意义为:表示存在因素下,死亡的风险率是不存在因素的倍。为风险指数(hazard index),简称HI,又称预后指数(prognostic index)或预后得分(prognostic score)。HI=0 代表风险处于平均水平;HI0代表风险处于高水平。(3) 生存函数
6、生存函数S(t|x)代表一直生存至t时间的概率,即生存时间t的累积密度函数。令它的概率密度函数为f(t|x),那么有,解微分方程得, (4)PH假定PH假定即比例风险假定(proportional hazards assumption),即一个比例风险模型具有不同个体有成比例的性质,即对于两个协变量X1和X2,h(t|X1)/h(t|X2)不随时间t改变,这是由比例风险模型的形式决定的。同时,它意味着二次对数生存曲线(log-log survival curves)应该平行。即两边取对数,两边对数值加上负号,再取对数log-logS(t)log-logS0(t)bx这是二次对数生存率,记为LM
7、L,可以发现,不同的LML相差只是个常数:LML1-LML2=b(x1-x2),与t无关。如下图示的一个例子就满足PH假定。二、案例分析1. 案例说明在成功预测了客户流失可能性之后(参见Logit模型预测客户流失),电信公司对客户的“流失时间很感兴趣”,他们想知道哪些因素会导致客户在很短时间内更换使用其他电信服务,为此,随机选取了一些客户样本,和他们作为客户的时间,以及其他一些变量。数据文件仍为telco.sav。2. SAS 实现(1)数据清理数据在Logit模型预测客户流已装入sasuser库中,本例中直接使用。(2)模型构建 用SAS的phreg过程构建cox比例风险模型,注意建模去掉一
8、些变量,包括缺失值过多的变量、电信专家认为不需要的变量。proc phreg data=sasuser.telco; model x2*y(0)=x3-x5 x7-x20 x26-x34 x40 x41/selection=stepwise slentry=0.05 slstay=0.1; baseline out=telout survival=s_t stderr=stderr/method=ch; run; proc print data=telout; proc gplot data=telout; plot s_t*x2; run; (3)生存分析建模结果如下模型信息显示删失观测值共
9、726个,表示尚未流失的客户量。已删失的观测值不能用于计算回归系数,但可用于计算基线风险。模型的迭代过程一共进行12步,最后一步保留的变量及回归系数如下:最终的模型包含了地址、就业、居住、设备、电话卡、longmon、equipmon、多线程、声音、因特网、callid、电子账单这几个变量,这说明COX比例风险模型认为这几个变量将影响客户流失时间。基本生存曲线是平均意义上客户预测流失时间的可视化显示,由下图可见,55个月后曲线不在平滑,这是由于可获取的信息变少的缘故。3. SPSS 实现(1)数据导入 由于文件telco.sav是spss文件格式,故可以直接用SPSS打开。(2)模型构建 选择
10、analyze-survival-cox regression 将tenure变量选入time框,将churn选入status框,并点击define event,将值1指定为已删失值。再将认为需要的变量都选入covariables框中,点击plot,勾选生存图。(3)生存分析 模型一共进行12步,最后一步模型中包括的变量如下:Variables in the Equation BSEWalddfSig.Exp(B)Step 12address-.035.00914.5431.000.966employ-.051.01025.7671.000.950reside-.103.0465.0371.0
11、25.902equip1.948.38126.1801.0007.012callcard-.777.15126.4511.000.460longmon-.233.022115.6191.000.792equipmon-.042.01115.3771.000.959multline-.612.14517.8541.000.542voice.501.15710.1971.0011.651internet.362.1605.1141.0241.436callid.464.1489.7901.0021.591ebill.399.1566.5571.0101.491与SAS分析结果一致,说明COX风险比
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- cox 风险 比例 模型 分析 客户 流失 时间
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【精***】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【精***】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。