《大数据导论》课件 第7章 大数据的商业应用.pdf
《《大数据导论》课件 第7章 大数据的商业应用.pdf》由会员分享,可在线阅读,更多相关《《大数据导论》课件 第7章 大数据的商业应用.pdf(44页珍藏版)》请在咨信网上搜索。
1、大数据导论大数据应用人才培养系列教材第七章大数据的商业应用7.1 国外大数据应用经典案例7.2 国内大数据应用经典案例习题7.1国外大数据应用经典案例第七章大数据的商业应用资源数量的重要性再 由Xz 数据之间的相关性2 z任何数据都存在商机z大数据新价值的挖掘大数据在医疗行业的应用7.1国外大数据应用经典案例第七章大数据的商业应用资源数量的重要性Google使用的数据,常有不完整的 句子,如拼字错误、语法缺失,但 正因为拥有比其他语料库多出千万 倍的资料,足以盖过他的缺点。因 此,进入大数据时代的第一个应用 观念,就是要接受资料数量远比数 据品质更重要的事实。7.1国外大数据应用经典案例第七章
2、大数据的商业应用O OU_Google的翻译软件涵盖了60种语言。早在20世纪90年 代,IBM的专家就曾开发一套Candide翻译系统,采用 加拿大国会的英法双语文件,大约是300万个句对,训练 电脑读懂使用机率,寻找词汇库中对应的词汇,来增加 翻译的精准度,把翻译转换成数学问题,但效果不明显,进展不大,最后以失败告终。若要数据精确,首先必 须要扩大资料的规模,扩大数据量,提高数据在库中的 选择几率。7.1国外大数据应用经典案例数据之间的相关性第七章大数据的商业应用7.1国外大数据应用经典案例第七章大数据的商业应用8案例美国纽约每年都会因为地下管道火灾,付出巨大代价,路面上重达140千克的铸
3、铁孔盖更是常因闷 烧爆炸,飞到几层楼高,再砸回地面,造成严重的安全事故。且纽约市的地下电缆,长度超过15万 公里,足以绕地球三圈半,光曼哈顿就有超过5万多个孔盖,数量之多,就算每年定期检查,意外 仍然防不胜防。负责管理此业务的爱迪生联合电力公司,找到哥伦比亚大学统计专家Cynthia Rudin协助,期望能够解决这一现状,缓解和减少不必要事故的发生。首先,他们先收集1880年到 2008年管路历史数据,但是光维修孔的表达方式就有38种不同的写法,数据杂乱无章。然而研究 的重点,在于找出相关性。不在于为什么会爆炸,而是哪个孔盖会爆炸。筛选出有效指标,逐步缩 小问题范围,降低爆炸可能性。研究小组从
4、106个重大孔盖灾害预测指标下手,慢慢去芜存菁,最 后剩下几个最有效的指标。接着他们再缩小范围,仅研究某一区的地下电缆,分析截至2008年的数 据,来预测2009年的危险孔盖位置,结果小组列出的前10%的危险清单,的确有44%曾发生过严重 事故,也据此找出最有相关性的几个指标。最后,研究小组发现电缆年份和过去是否发生事故是最重要的判断指标,依此原则来替市区几 万个孔盖安排检查顺序。虽然答案好像显而易见,但是过去却浑然不知,直到研究小组用大数据的 科学验证,大家才恍然大悟。纽约政府利用这种方式同时解决了城市住宅问题。7.1国外大数据应用经典案例第七章大数据的商业应用对于大数据而言,首先要篦够 接
5、班第蜷攵据,从中找出相关 性7进彳强据分析。当然还有 另一个重点,就是任何纪录,县至连情绪、社交图谱、搜寻 轨迹,都可数据化。.7.1国外大数据应用经典案例第七章大数据的商业应用案例8Foursquare蕴含用户地域位置的打卡数据、轨迹从一个社群平台,变成有附加价值 的精确市场分析数据提供商。联合包裹速递服务公司通过每台货车的无线电设备和GPS,精确知道车辆所在位置,并从累积下来的大量 的行车路径,找出最佳行车路线,进行推荐。靠着大数据分析技术,UPS一年送货 里程大幅减少4800公里,等于省下300万升的油料及减少3万吨二氧化碳排放量,安 全性和效率也提高了,大数据让出行变得低碳环保。推特是
6、国外一个大型社交网站,他利用人们的情绪和社交互动进行数据分析。每天至少有四亿条以上的推文,表面看来大多数推文,就像是随口嚷嚷,但却成了 重要的分析指标,可以用来提前了解消费者反应,或是判断推销活动成果,不少公 司都抢着要和推特(Twitter)签订数据资源的存取权。网购龙头亚马逊正是依照客户浏览的历史,来比对产品和产品的关连性,开发无人 能敌的自动推荐系统。现在亚马逊上,每三笔订单,就有一笔是来自电脑推荐和定 制化系统。这便是,当用户的网络轨迹成为数据资源而带来的改变,无形中推动了 一个行业的发展,带动了经济增长,完成了科技革命带来的新机遇。7.1国外大数据应用经典案例第七章大数据的商业应用大
7、数据新价值的挖掘大数据的使用,应是每个领域,每个行业和每个企业的使用,并不是某一特定 行业或企业的专有技术,不要认为用大数据分析,是大公司或是科技大厂的专 利,小型企业不一定要自己拥有数据,可以靠授权获得,再使用廉价云端运算 平台分析。拥有大数据思维和好点子,能让公司蓬勃发展。7.1国外大数据应用经典案例第七章大数据的商业应用OU_Oren Etzioni在从西雅图飞往洛杉矶参加弟弟婚礼的飞机上,发现临座几位乘 客的票价都比他的便宜,打破以往觉得飞机票越早买、越省钱的想法,萌生创 业点子。他开发出了预测飞机票未来是涨是跌的服务Farecast。其关键是需要 取得特定航线的所有票价资讯,再比对与
8、出发日期的关联性,假设平均票价下 跌,则买票的事可以暂缓,如果平均票价上升,系统就会建议立即购票。Oren Etzioni先在某个旅游网站取得1万2000笔票价数据作为样本,建立预测 模型,接着引进更多数据,直到现在,Farecast手中有2000亿笔票价纪录。后来Oren Etzioni的公司被微软并购,并把这套服务结合到Bing搜寻引擎中,平均为每位用户节省50美元。随后被eBay并购的价格预测服务D,也是Oren Etzioni的杰作。在2012年,开业一年的Decide,已调查超过250 亿笔价格资讯、分析400万项产品,随时和数据库中的产品价格比对。从普查 中,他们发现零售业秘密,就
9、是新产品上市时,旧产品竟不跌反涨,或异常的 价格暴涨,来警告消费者先等一等,再下手。4 7.1国外大数据应用经典案例第七章大数据的商业应用大数据在医疗行业的应用医保行业可以通过大数据和高级 分析来获得巨大收益。医保的成 本推动了对大数据驱动的医保应 用系统的需求,技术决策者不会 忽略大数据带来的效率提升,经 济吸引力和快速的创新步伐,都 能够用在医保行业中并使行业受 益。许多人发现,对医保数据进 行数字化和共享的新标准和激励 措施,以及商用硬件产品在存储 和并行处理方面的改进和价格的 下降,正在导致医保行业的的大 数据革命,其以更低的成本提供 更好的服务为目标。其中有三个 案例。Valence
10、 Health:提升医 保结果和财务状况、Liaison科技 医保行业数据记录的流处理和 Novartis Genomicso7.1国外大数据应用经典案例第七章大数据的商业应用Val ence Heal thValence Health使用MapR公司的数据融合平台(Converged Data Platform)来建立一个数据湖并作为公司主要的数据仓库。Valence每天从3000个数据输入源接收45种不同类型的数据。这些 关键数据包括实验室测试结果、患者健康记录、处方、疫苗记录、药店优惠、账单和付款,以及医生和医院的账单,用来提升决策来改 善医保结果和财务状况。该公司快速增长的客户和日益增
11、加的相 关数据量正在压垮现有的技术基础设施。在采用MapR的解决方案之前,如果收到一个数据源发来的2千万 个实验室测试结果,他们需要22个小时来处理这些数据。MapR把 这个处理时间从22小时降到20分钟,并且使用更少的硬件。提升 了医保结果和财务状况。7.1国外大数据应用经典案例第七章大数据的商业应用Liaison 科技Liaison科技提供了一个云端解决方案来协助企业集成,管理和安 全保障他的数据。他的一个垂直解决方案是针对医保行业和生命 科学行业,这两个行业有2个挑战一满足HIPAA合规要求和数据格 式及其展现形式的多样性。利用MapR流,流处理将系统数据记录 变成了一个无限的,不可更改
12、的数据转换日志。多样性的挑战在 于,一个患者信息的记录可以有多种使用方式即文档或图,或者 是查询结果,当然这取决于不同的用户,可能是制药公司,医院,诊所或医生。利用流处理实时地将数据变化输出到MapR-DB,HBase,MapR-DB JSON文档,图和搜索数据库,用户通过文 档、图和搜索数据库可以得到最新的和最适合的数据。此外,通 过在MapR融合数据平台上开发这一服务,Liaison可以保障所有 数据模块的安全,避免了其他方案的数据和安全孤岛的问题。解 决了医保行业数据记录的流处理问题。7.1国外大数据应用经典案例第七章大数据的商业应用Novartis Genomics下一代基因测序(NG
13、S)是一个经典的大数据应用,它面临双重 的挑战,即巨量原始异构的数据,以及NGS最佳实践的快速变化。另外,许多前沿研究需要与外部组织的不同数据进行大量的交互。这就需要强大的工作流程工具来处理大量的原始的NGS数据,而 且足够灵活以跟上快速变化的研究技术。它还需要一个方法来将 这些大量外部组织的数据有意义地整合到Novartis的数据,如1000 Geomes,NIH 的 GTEx(Genotype-Tissue Expression,基因型组织 表达)和TCGA(The Cancer Genome Atlas,癌症基因组图谱)-特别 是临床数据,表型性数据,实验数据和其他相关数据。第七章大数据
14、的商业应用7.1 国外大数据应用经典案例7.2 国内大数据应用经典案例习题互联网大数据国内大数据应用场景/智慧蜥-1_1丁3班*p 1 衣业TTiSM零售行业H 大数据舆情分析物流行业.房地产业v地震面前,大数据.来拯救)肆出境游大数据、,7.2国内大数据应用经典案例第七章大数据的商业应用现有基础23建设原则“智慧XX”一期建设内容(“3211+N”)智慧城市7.2国内大数据应用经典案例第七章大数据的商业应用智慧城市现有基础六个统一“统一网络机房”、“统一政府门户网站”、“统一电子地图”、“统据库”、“统一办公平台”统一建设管工jamI现有、画1、缺乏顶层引领,建设处于相对无序状态。2、缺乏统
15、筹协调,智慧应用项目相对分散。3、缺乏规范标准,数据整合共享难度较大。4、缺乏配套机制,运维管理体系建设有待跟进。5、缺乏保障措施,政府信息资源面临安全挑战。6、建设主体单一,社会共建模式有待探索加强。7.2国内大数据应用经典案例第七章大数据的商业应用智慧城市建设原则“智慧XX”建设方案整 体思路坚持“规划设计、感知设施、应用平台、数据资源”位一体建设思路以及具体要求建设整体框架是在国家智慧城市 建设总体框架的指导下设计的,.一 由7+2”构成。7是指:感知层、网络层、公共 设施层、数据层、交换层、智慧 应用和用户层;2是指:安全与保障体系、运营 与管理体系。,7.2国内大数据应用经典案例第七
16、章大数据的商业应用智慧XX一期建设内容(“3211+N)3211+N中3指的是要尽快建成政务云平台、公共数据库平台和公共 信息平台等3个智慧政务公共基础设施;2指的城市网格化指挥中心综合管理平台 和一门式公共服务综合信息平台等2个平台;第一个 T 指的是以智慧XX通信 平台为切入点打造1个XX区区级移动互联网综合服务平台;第二个指的是 成立1个智慧XX建设和维护管理中心;N是指分类分批推进N个智慧应用项目 实施。2个应用平台 N个智慧应用3个大数据 基础设施政务云平台1个中心1个微信7.2国内大数据应用经典案例第七章大数据的商业应用保险行业保险数据主要 是围绕产品和 客户进行的,典型的有利用
17、用户行为数据 来制定车险价 格,利用客户 外部行为数据 来了解客户需 求,向目标用 户推荐产品。7.2国内大数据应用经典案例保险行业面临的困难1)数据多,整合困难。2)客户多,分析困难。3)需求多,应用困难。险企业客户进行建模第七章大数据的商业应用1)客户细分模型。2)客户价值模型。3)客户忠诚度模型。4)受众群体的扩散模型。5)社会模型。7.2国内大数据应用经典案例第七章大数据的商业应用O案例泰康保险使用大数据进行数据采集和数据统计分析项目泰康人寿蓬勃发展,业务量壮大,客户量激增,却面临以下问题:如何使用用户数据?如何了解客户、经营客户?如何建立情感链接、实现有效互动,如何为客户打造个 性化
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 大数据导论 大数据导论课件 第7章 大数据的商业应用 数据 导论 课件 商业 应用
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【曲****】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【曲****】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。