7大数据113.pptx
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 113
- 资源描述:
-
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,2021/2/8,#,1,2,3,大数据概述,大数据,4V,特性,相关,领域,应用,4,相关技术架构,目录,5,总结,1,大数据概述,大数据产生的背景,什么是大数据,大数据时代,数据量级变化,大数据产生背景,数据量级不断增加|,根据IDC 监测,人类产生的数据,量正在呈指数级增长,大约每两年翻一番,这个速度在2020,年之前会继续保持下去。,数据结构日趋复杂,|,大量新数据源的出现则导致非结构化、,半结构化数据爆发式的增长,TB,PB,ZB,EB,地球上至今的数据量:,在2006 年,个人用户才刚刚迈进TB时代,全球一共新产生了约180EB的数据;,在2011 年,这个数字达到了1.8ZB。,而有市场研究机构预测:到2020 年,整个世界的数据总量将会增长44 倍,达到35.2ZB(1ZB=10 亿TB),说明,互联网(社交、搜索、电商)、移动互联网(微博)、物联网(传感器,智慧地球)、车联网、GPS、医学影像、安全监控、金融(银行、股市、保险)、电信(通话、短信)都在疯狂产生着数据。,1GB(Gigabyte)=1024MB,1TB(Terabyte)=1024GB,1PB(Petabyte)=1024TB,1EB(Exabyte)=1024PB,1ZB(Zettabyte)=1024EB,平均,每一分钟,中国互联网上发生了什么?,百度搜索查询,48.7,万,次,5,万,条,微博,465,名,新用户,1.37,亿,人,同时,QQ,在线,556,篇,博客文章,83,名,新博客,4944,条,心情更新,6597,篇,日志发布,13.9,万张,照片上传,3125,条,状态更新发布,417,篇,日记更新,97,个,视频上传到优酷,内容总计,14,个小时,5.6,万,人,淘宝在线,交易额,230,万,元,80,篇,新帖子发布,新回复,1200,篇,是的,,我们已经进入了,大数据时代,大数据时代,变化,数据,在web 2.0的时代,人们从信息的被动接受者变成了主动创造者,全球每秒钟发送 2.9 百万封电子邮件,,每天会有 2.88 万个小时的视频上传到Youtube,,推特上每天发布 5 千万条消息,量级,每月网民在Facebook 上要花费7 千亿分钟,发送和接收的数据高达1.3EB,Google 上每天需要处理24PB 的数据,20,世纪,90,年代,数据仓库之父的,Bill Inmon,就经常提及,Big Data,2011,年,5,月,,在,“云计算相遇大数据”,为主题的,EMC World 2011,会议中,,,EMC,抛出了,Big Data,概念,什么是大数据:,Big Data,名词由来,什么是大,数据(,NO-SQL,Not Only SQL),不同,“,看,”,数据的方式,10,可视:结构化资料,15%,未视:半,/,非结构化数据,85%,DB/DW,主管们看的,战情数位仪表板,其实是残缺的,大数据不仅仅是“大”,多大?,PB,级,比,大,更重要的是,数据的复杂性,,有时甚至大数据中的小数据如一条微博就具有颠覆性的价值,大数据,=,海量数据,+,复杂类型的数据,海量交易数据:,企业内部的经营交易信息主要包括联机交易数据和联机分析数据,是结构化的、通过关系数据库进行管理和访问的静态、历史数据。通过这些数据,我们能了解过去发生了什么。,大数据包括:,交易数据和交互数据集在内的所有数据集,海量交互数据:,源于各种网络和社交媒体。它包括了呼叫详细记录、设备和传感器信息、,GPS,和地理定位映射数据、通过管理文件传输协议传送的海量图像文件、,Web,文本和点击流数据、评价数据、科学信息、电子邮件等等。可以告诉我们未来会发生什么。,大数据的构成,大数据要上升为国家战略,国家,时间,政策,备注,美国,2012-3-29,大数据研究与发展计划,推动政府开放、提升政策预见性(粮食、天气、流感等)、提高政府服务水平、降底运营开支,英国,2010-5,数据权、我的数据,日本,2012-5,ICT,战略,中国,2012-5,互联网大数据技术创新研究,14,拒绝大数据时代,可能会失去生命!,大数据时代:生活、工作与思维的大变革,一书的作者维克托,迈尔,舍恩伯格,如是说,“,如果你是一个个人,如果你拒绝的话,可能会失去生命,如果是一个国家的话,拒绝大数据时代的话,可能失去这个国家的未来,失去一代人的未来。”,这一句话恐怕不能算作耸人听闻,因为每当人们站在现在这个节点的时候,总会去眺望未来,但是未来往往在你不经意当中已经悄悄地来到你的身边。,15,硬件成本的降低,网络带宽的提升,云计算的兴起,网络技术的发展,智能终端的普及,电子商务、社交网络、,电子地图等的全面应用,物联网,大数据时代到来的必然性:,大数据市场分析,1,2011,年,-2016,年中国大数据市场规模,2,各行业大数据市场规模,政府、互联网、电信、金融的大数据市场规模较大,四个行业将占据一半市场份额。,由于各个行业都存在大数据应用需求,潜在市场空间非常可观。,2011,年是中国大数据市场元年,一些大数据产品已经推出,部分行业也有大数据应用案例的产生。,2012,年,-2016,年,将迎来大数据市场的飞速发展。,2012,年中国大数据市场规模达到,4.7,亿元,,2013,年大数据市场将迎来增速为,138.3%,的飞跃,到,2016,年,整个市场规模逼近百亿。,2,大数据的,4V,特性,体量Volume,多样性Variety,价值密度Value,速度Velocity,1,2,3,4,数据量,Volume,多样性Variety,价值密度Value,速度Velocity,4V,特,性,从,非结构化数据的超大规模和增长,比结构化数据增长快10倍到50倍,是传统数据仓库的10倍到50倍,总数据量的8090%,大数据的异构和多样性,多种形式(文本、图像、视频、机器数据),无模式或者模式不明显,,不连贯的语法或句义,大量的不相关信息对未来趋势与模式的可预测分析,深度复杂分析,机器学习、人工智能Vs传统商务智能(咨询、报告等),实时分析而非批量式分析,数据输入、处理与丢弃,立竿见影而非事后见效,Volume,数据量,PB,是大数据層次的临界点,.,KB,-,MB,-,GB,-,TB,-,PB,-,EB,-,ZB,-,YB,-,NB,-,DB,Variety,多样性,企业内部的经营交易信息,;,物联网世界中商品,物流信息,;,互联网世界中人与人交互信息,位置信息等是大数据的主要来源,.,文本,/,图片,/,视频 等,非结构化,/,半结构化数据,能够在不同的数据类型中,进行交叉分析的技术,是大数据的核心技术之一,.,语义分析技术,图文转换技术,模式识别技术,地理信息技术等,都会在大数据分析时获得应用,.,非结构化数据,相对,于结构化数据而言,不方便用数据库二维逻辑表来表现的数据即称为非结构化数据,包括所有格式的办公文档、文本、图片、,XML,、,HTML,、各类报表、图像和音频,/,视频信息等等,。,Value,价值,挖掘大数据的价值类似沙里淘金,从海量数据中挖掘稀疏但珍贵的信息,.,价值密度低,是大数据的一个典型特征,.,2010,年海地地震,海地人散落在全国各地,援助人员为弄清该去哪里援助手忙脚乱。传统上,他们只能通过飞往灾区上空来查找需要援助的人群。,一些研究人员采取了一种不同的做法:他们开始跟踪海地人所持手机内部的,SIM,卡,由此判断出手机持有人所处的位置和行动方向。正如一份联合国,(UN),报告所述,此举帮助他们“准确地分析出了逾,60,万名海地人逃离太子港之后的目的地。”后来,当海地爆发霍乱疫情时,同一批研究人员再次通过追踪,SIM,卡把药品投放到正确的地点,阻止了疫情的蔓延。,Velocity,速度,1s,是临界点,.,对于大数据应用而言,必须要在,1,秒钟内形成答案,否则处理结果就是过时和无效的,.,实时处理的要求,是区别大数据引用和传统数据仓库技术,BI,技术的关键差别之一,.,讨论一下:,传统的数据库与大数据的区别?,问题,1,:大,数据与传统数据库的区别,大数据是在传统数据库学科的分支,数据仓库与数据挖掘的基础上进一步发展起来的。但有两点比较主要的不同:,结构化程度,:,传统数据库保存的是结构化或者半结构化的数据,,以二维表或者标准,XML,文件的方式存储数据,由于结构清晰,处理相对容易;,大数据面向的是一切计算机可以存储的数据格式,,包括互联网上的各种网页、图片、音频、视频,包括办公文档、报表,包括人们在搜索引擎中输入的关键词、在社交网络中的留言、喜好,也包括各种传感器自动收集的监控结果等等,显然不同的格式处理起来更加困难。,噪声(,异常,),数据的处理,:,传统数据库通常把异常数据先剔除,,应用在需要高精确度的领域,如银行对每个账户的管理;,大数据则允许异常数据存在,,更多应用在预测方面,找出大量数据中隐藏的关联关系,少量异常数据不会对总体结果产生影响。,3,相关领域的应用,大数据使移动电商进入个性化时代,各种网络平台的开封不仅增加了数据的规模,而且使数据具有较强的流动性和有效性,社会化登录使得用户第一次在互联网上具有统一的身份,个性化电商时代,两者合起来创造了这样一种网络环境:通过利用各网络平台的数据,企业能够相对容易地查到用户的具体身份,了解该用户在网络上都干了些什么。有了这些信息,企业就可以在移动电商平台上更好地实现个性化推荐。,数据支撑营销,电商战线新阵法,当前大数据可以辅助销售的方面包括:提高潜在客户的质量,提高销售机会数据的质量,提高目标客户开发精确性,区域规划,赢利率等等。而在市场营销中,大数据也功不可没。除了提供提高转换率策略,销售前景预测,增长收入和客户生命周期外,还有可以帮助我们判断销售周期内各阶段哪些内容是最有效的,以及如何改进客户关系管理系统。如果公司是提供基于云计算的企业软件服务,大数据还可以提供关于何降低客户获取成本,(CAC),,客户终身价值,(CLTV),的信息,管理许多其他客户驱动的指标,这些指标对于经营云业务至关重要。,数据挖据流程,知识运用,知识运用就是对挖掘的评估结果在现实决策中的运用,这是一个非常重要的过程,也是数据挖掘的最终目标,价值的体现。,数据准备,数据准备,是从海量的原始数据中准备要据挖掘的数据,它是长期的、无规律的数据积累的结果。由于原始数据不适合数据挖掘,所以要先进行预处理,包括数据选择、清洗、推测、转换等操作。数据准备的好坏直接决定着数据挖掘的质量和效率。,数据挖掘 数据挖掘是整个程序的关键过程,按照数据挖掘的目标要求,选择合适的算法,来挖掘数据规律,常见的算法有决策树、分类、神经网络、,Apriori,算法等。,模式的评价、分析,对挖掘过的数据结果进行解释、分析、提取有意义或有使用价值的规律,还原成人们能够理解的数据语言。,1,、,信息的發現和收集,2,、,信息,传播指导,3,、效果评估,4,、负面处理,5,、品牌调研,6,、消费者决策分析,大數據商務電子的應用,信息的發現和收集,竞品,信息,发现、行业资讯获取,情报数据全面整合,传播方向发现,大数据,为我们带来了什么?,她是,后,她的生活習慣,她喜歡甚麼化妝品,她的個性,她平常參加哪些互動活動,她用甚麼手機,她喜歡甚麼電影,她喜歡甚麼,她的休閒娛樂,她平常的作息時間,大数据,为我们带来了什么?,她是,后,商品,、,美食,是她的最爱,她爱,兰蔻,她,个性,、,清新,、,时,尚,对喜欢的东西有某种,狂,热,她关注,新媒体,和,移动互联网,关注,网络营销,、,推广活动,爱,小米,爱,热播剧,爱,汽车,爱,旅游,10,点、,14,点,前后是她频繁上网的时间,每一秒:全球发送,290,万封电子邮件;,每一分钟:微博推特上新发的数据量超过10万;社交网络Facebook的浏览量超过600万;,每一天:全球上传,2.88,万小时视频至,Youtube,;,每个月:网民在,Facebook,上花费,7,千亿分钟;,上一年:人们制造并使用的数据达,1.8ZB,。,数据已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来,,大数据正成为最值得关注的领域之一.,“大数据”在互联网行业通常表现为互联网公司在日常运营中生成、累积的用户网络行为数据。,信息的發現和收集,信息的發現和收集,發現,收集,情报数据全面整合,竞品,广告投放,+,公关活动,洞察分析,,全面,了解竞品市场动态。,12%,10%,5%,3%,70%,Search-suning,Sale-suning,-suning,-cnsuning,Bbs-suning,5%,3%,广告投放力度,广告创意内容,广告投放阵地,传播诉求,传播声量趋势,传播媒体投放,广告,公关,联想,苹果,三星,手机品牌各媒体声量比重,微博,新闻,博客,论坛,传播方向发现,海量数据中,,2,大维度,、,7,大指标,挖掘关键资讯,准确提供传播方向。,重点位置,+,重要内容,名人权重,首页露出,首屏露出,焦点图露出,热门位置,热点位置,热搜位置,传播主要诉求及类别,不同类别内容,TOP10,媒体与网友评价正负信息,TOP10,传播指导,目标人群界定,媒介战略指导,传播内容指导,目标人群界定,年龄,性别,收入,所在区域,职业,教育程度,.,消费心理,喜好,关注内容,活跃时间,关注群体,.,男,女,14:00,14:30,18:00,品牌,产品,服务,质量,物流,售后,渠道,诚信,价格,美誉,性能,档次,形象,效果,卖点,行业名人,时评家,准确了解用户构成,掌握用户行为特征,Who-,围绕哪类人群展开传播?,受众分布是否与设想吻合?,媒介战略指导,了解用户触媒习惯,锁定用户所在媒体分布,合理分配媒体投放资源。,35,%,10,%,25,%,15,%,10,%,5,%,Where-,媒体选择,预算分配,传播方式,传播内容指导,What-,确定卖点,诉求方向,话题设计,传播力度,全面了解消费者决策因素及竞品传播内容,为后期传播内容策略提供支持。,喜欢,不喜欢,前卫的、卓越的、有格调的,无保障的、不安全的,.,购买动机,A,ction,购买,S,hare,重复购买,A,ttention,关注,I,nteresting,记忆,C,hoice,选择,决策轨迹,效果评估,传播表现评估,搜索表现评估,用户到达评估,用户购买评估,AICAS,模型,:,消费者决策轨迹,Attention,Interest,ing,Choice,Action,Share,工作量,人员配备,工作时长,信息量,信息总量,媒体亮点,影响力,点击量、健康度,首页时长,媒体占有率,竞品比较,自身比较,用户关注,百度指数,网站流量,销售转化,产品售出数,产品评论数,传播表现评估,指标:,信息总量,影响力,媒体占有率,提及数,负面数,信息影响力,覆盖度,曝光时长,网站权重曲线,搜索表现评估,首页露出条数,前三页露出条数,前五页露出条数,联想词露出个数,相关词露出个数,用户到达评估,指标:,声量评估,内容评估,满意度评估,百度指数,决策变化,网站流量,用户购买评估,SALES,产品评论数,每日评论,评论总数,产品售出数,每日售出,售出总数,负面处理,负面识别及分级,危机追踪及路径分析,负面识别及分级,盐城论坛二级页面,尼康,垃圾,.,联想频死机、坑爹,负面内容语义识别,负面位置影响力判断,AC,AB,AA,BC,BB,BA,CC,CB,CA,CC,级重大负面,315,网站首页:,京东商城销售问题电视,.,尼康,D600,深陷“进灰门”,智能识别负面信息,,更快速,的,发现负面,负面处理优先排序,,更,科学的,指导负面处理,搜索引擎首页,小米,2,使用不到一天爆炸,营养快线商标遭侵权,.,危机追踪及路径分析,(上午,9:03,当事人粉丝,助推扩大声势),(上午,9:05,专家、意见领袖,发表观点 ),发展期,潜伏期,爆发期,消退期,当事人,(上午,9:00,发表,XX,奶粉促进婴儿性早熟),事件声量跟踪,事件发布者跟踪,实时把控事件脉络,(下午,13:00,媒体,要热点对事件进行报道),(,一个月,竞争品牌,恶意传播扩散),品牌调研,大众用户评价,消费用户评价,关联品牌联想,大众用户评价,产品产地,知名度,行业地位,品牌口碑,SNS,视频,问答,论坛,博客,微博,深入了解潜在用户对我们的评价。,消费用户评价,效果周期,安全性,价格优势,售后保障,对消费用户的评价进行全面分析,有效帮助我们改善工作。,关联品牌联想,关注,同时关注,了解消费者感兴趣的关联品牌,为后续品牌联合传播提供指导支持。,消费者决策分析,决策因素发现,决策点与传播卖点差异性比较,决策因素发现,卖点,品牌,产品特点,服务,价格,质量,物流,渠道,真实了解消费者决策因素,提供销售策略。,决策点与传播卖点差异性比较,有效,长效,产品传播卖点:,速度快、无痛感、快速脱毛,消费者关注点:长期有效,了解传播卖点与消费者决策点差异,有效改进卖点传播策略。,报告呈现,报告类型,报告内容,报告结论,表现形式,6,大类报告类型、,64,种专项研究,多指标(,20,类、,258,个分析指标),战略角度:,定位、诉求方向、整体策略,执行角度:,预算分配、媒体选择、内容设计,直观、简洁,例子:电,商用户数据分析与挖掘,2025/11/18 周二,说 明,报告介绍,分析:,分析店铺的整体运营状况;,分析客户特征,从不同细分角度寻找不同客户之间的差异;,客户属性特征分析,客户消费行为分析,目的:,为了卖家能更直观的了解自己店铺的运营现状;,了解客户特征,为客户维护和回购刺激提供决策依据;,提供个性化的实施建议;,数据来源,订单数据,客户数据,外部数据,行业数据,订单样本,XXX,专卖店,自:,2012-8-10,到,2015-4-30,,状态为交易成功的订单,极值处理,剔除客单价,2000,元的订单,剔除客单价,10,元的订单,剔除批发商:购买次数大于,50,次,订单处理方式,同一客户一天内多比订单默认合并为一笔订单,备注信息:,2025/11/18 周二,3.,如何实施?,2.,客户特征表现?,1.,整体现状?,购物体验,深入客户关系管理,客户属性特征,消费行为特征,个性化实施方案,1.1,购物体验,DSR,评分,1.2,深入客户关系管理,1.2.1,年滚动趋势,1.2.2,月滚动趋势,一、购物体验现状,1.1 DSR,动态评分,DSR,评分不错,尤其在“宝贝与描述相符”上比较突出。,提升,DSR,的其他方案:,客服专业性服务及客户信息收集,;,批量进行(利用订单中心):个性化包裹、发货提醒、同城到达提醒等;,个性化进行:物流跟进、退款跟进、评价跟进等,但是整体的退款率非常大!,1.2.1,年滚动趋势:活跃客户,*备注:回头客比例,=,(一年购买,2,次及以上新客户,+,一年前购买过又来买的客户),/,一年总客户数,如,,201308,指,201209-201308,整体销售额呈现一定的稳定增长趋势;,回头客销售额占比整体呈现逐渐上升的趋势,目前占到,6%,,低于行业均值,需后续加强老客户的维护。,整体客户数同销售额类似,呈现一定的稳定增长态势;,相比而言,老客户的客单价高于新客户。,但是目前的整体现状仍需改进。,1.2.2,月趋势,从销售额的趋势来看,波动非常大,中间竟然出现几个月非常低的销售情况,如,2013,年的,1,、,2,、,6,、,7,、,8,月份。需引起高度重视。,去年下半年以来整体情况还不错。,新老客户占比,从店铺整体来看还是主要有新客户支撑;,只是在某几个月份,整体销量特别不好的时候,能够凸显老客户的价值。,从客户数可以明显的看出,老客户的贡献人均贡献大于新客户的人均贡献值。,2.1,客户属性,2.1.1,地域,2.1.2,地址,职业,2.2,客户消费行为,2.2.1 RFM,2.2.2,购物时间分析,2.2.3,商品分析,二、客户特征,2.1.1,地域,2.1.2,地址,职业,地址,-,职业回购情况:,2.2.1 RFM,:,F&M,新客户复购分析:,R,首次客单价在,100,元以下的属于低价值客户,复购率低于,4%,右,占比总客户数的,40%,;,首次客单价在,100200,元的属于中价值客户,复购率也低于,4%,,占比约为,57%,;,首次客单价大于,200,元的可以归类为高价值客户,复购率略高,占比约为,3%,;,新客户复购分析:首次客单价,2.2.2,购物时间分析,地域,时点:,不同区域在购物时间上还是存在一定的差异性,可以适当的针对不同的地区在不同的时间点进行营销。,页面优化方案:,1,、日常搭配套餐、页面关联的选择,2,、充分利用流量(主打产品,-,搭配套餐),提升,ROI,3,、浏览连带率高,但是购买连带率,/,单品购买情况不佳,研究详情页面(优势的突出,/,劣势的攻击),6,、,A,与,B,商品功能大致相同,,A,更便宜,加强对价格高产品的价值认同,5,、,A,和,B,价格一样、功能一样,,A,是主推,将,B,与,A,分开,由其他热销款带动,B,7,、,A,和,B,功能不同(搭配),匹配度不高,调整;组合价格太高,买了又买,看了又看,看了最终买,4,、单品转化率低,单品整体转化率高,主图吸引人,价格以及页面详情不尽如意,订单催付,订单关怀,个性化跟进,基础策略:,新客户培养策略:,购后,2,天,感谢,/EDM,关怀,购后,8,天,商品使用指导,/,晒单有礼,/,加微信,/,加微博,购后,20,天,关联商品推荐,/,商品回购周期营销,购后,30,天,满月礼,/,定向营销,/,短信关怀,购后,60,天,当季热卖品推荐,/60,天关怀,/,大促,购后,90,天,换季新品推荐,购后当天,发货通知,/,快递,/,包裹礼品,购后,180,天,购后,220,天,进入流失客户组管理,(,沉默期,),(,睡眠期,),(,睡眠期,),(,睡眠期,),当季清仓品推荐,/,聚划算,(,活跃期,),(,活跃期,),(,活跃期,),(,流失期,),新客户培养案例,DAY 1,DAY 8,DAY 30,DAY 45,DAY 60,感谢信,干货特辑,根据客户购买的产品种类,分类推送。,会员生日特权,/,满月礼,会员专享,优惠刺激,3.1.2,后期重点:沿着,RFM,特征进行,资源投入,一段生命周期内必须有一定量的维系类活动;,营销类活动和维系类活动按照一定比例匹配;,随着客户关系从购买到死亡,资源投入逐渐下降,保持资源利用的高效性;,一段生命周期内客户接触次数有下限,也有上限;,每个活动都应该有针对性,或针对新客户、或这对某一会员等级的用户,切忌大众化;,活动选择,活动特性,售后期,0,天,365,天以上,7,天,45,天,活跃期,90,天,沉默期,140,天,睡眠期,流失期,死亡,催付、发货通知、评价有礼、,包裹礼品、晒单奖励,会员升级刺激、,满月礼,、,会员特权提醒,2-3,次维系类活动,保证,DSR,2-3,次营销类,活动,1-2,次维系类,活动,1-2,次维系类,活动,1-2,次营销类,活动,上新通知、爆款打造,事件营销、定向推荐,节日关怀、会员活动、,降级预警、,60,天回购刺激,1,次维系类,活动,1,次营销类,活动,节日关怀、特权提醒、,降级预警、,99,天记忆唤醒,店铺活动、爆款打造,促销活动、事件营销,0-1,次维系类,活动,1,次营销类,活动,会员特权提醒,节日关怀,爆款打造,促销活动,促销活动,事件营销,0-1,次营销类,活动,上新通知、店铺活动、,爆款打造、关联推荐,中间结合:地域、地址,-,职业、信用等级、购物时间、商品等等维度,用户行为数据,用户消费数据,用户社交等UGC数据,培,亚马逊、SMG、淘宝,信用卡中心、蚂蚁金服,谷歌地图、大众点评、美团等APP的自动定位系统,互联网金融数据,支付宝、陆金所,用户地理位置数据,互联网大数据,简单罗列几个行业,fackbook、新浪,大数据在营销和销售中的十大,应用,1.,大,数据使得根据每个客户和每个产品的关系进行等级差别定价策略,最大限度的优化定价变得可能。,麦肯锡的分析发现,一家典型的公司,75%,的收入来源于其标准产品,在每年这成百上千种定价标准产品的决策中,30%,的时候公司无法定出最好的价格。假定销售量没有减少,,1%,的价格提高却可以带来高达经营利润,8.7%,的增加,定价具有显著的提高盈利能力的潜力空间。,2.,大,数据可以带来更大的顾客回应率以及更深层次的客户信息,根据下图的调查问卷,,Forrester,的研究发现,44%,的,B2C,的市场营销人员正在使用大数据提高客户的的回应率,,36%,的营销人员运用数据分析和数据挖掘,获取更多的深层客户信息从而策划更多的关系驱动的市场策略。,3.,客户,分析,(48%),,操作分析,(21%),,欺诈和合规,(12%),,新产品与服务创新,(10%),和企业数据仓库优化,(10%),是当今最常见的大数据销售和营销案例,大数据联盟,(DataMeer),最近的研究发现,客户分析统领大数据在销售和市场营销部门的应用。而支持这个趋势的有下面四个关键策略:增加潜在客户、减少客户流失、增加每个客户的投入以及改进现有产品。,4.,大,数据将分析数据嵌入到情境营销中,许多公司的营销平台技术正在快速完善,支持这个趋势的基础是不断变化的客户、销售、服务和与现有系统不匹配的渠道需求。这造成了许多营销部门在数据和处理上无法完全集成好。大数据分析可以创建可扩展的系统分析,可以再一定程度上缓解这个问题。下图来自,Forrester,的研究,在,SAS,网站上可以免费下载,结合直觉与参与的情境营销工具和技术:企业营销技术手册。,5.,大数据分析可以完善客户关系使得营销方案更成功,通过大数据分析,定义和指导客户发展,营销人员创造更大客户忠诚度。下图来自于,SAS,赞助,Forrester,的研究,分析是如何在整个客户生命周中提供价值的,(,图中两条线间的距离表示者数据分析带来的价值,),。,大,数据,带给我们,的,隐患:,隐忧一,,,数据采集过程中的偏差。,隐忧二,,市场干扰数据的准确性。,隐忧三,,“第三只眼”的监控。,隐忧四,,营销轰炸。,数据,和数据集本身并不是客观的,而是由人们设计的,人们用数据来说话,从数据进行推断以及解释数据。,大量,的刷量以及水军好评差评等数据已经严重干扰了数据的准确性,这实际上大大降低了数据的价值,。,普通人的各种私人信息也会成为被收集的数据,我们的隐私岌岌可危!,隐私,应对,措施,企业方面:,一个好的企业应该未雨绸缪,从现在开始就应该着手准备,为企业的后期的数据收集和分析做好准备,企业可以从下面六个方面着手,这样当面临铺天盖地的大数据的时候,以确保企业能够快速发展,具体为下面六点:,1.,目标,2.,准则,3.,重新评估,4.,重视大数据技术,5.,培训企业的员工,6.,培养三种能力,Teradata,大中华区首席执行官辛儿伦对新浪科技表示,随着大数据时代的到来,企业应该在内部培养三种能力。第一,整合企业数据的能力;第二,探索数据背后价值和制定精确行动纲领的能力;第三,进行精确快速实时行动的能力。,4,相关技术,云计算,列数据库,实时分析,hadoop,生态集群,技术领域的挑战,1,、对现有数据库管理技术的挑战,传统的数据库部署不能处理数,TB,级别的数据,也不能很好的支持高级别的数据分析。急速膨胀的数据体量即将超越传统数据库的管理能力。,如何构建全球级的分布式数据库,(Globally-Distributed Database),,可以扩展到数百万的机器,数已百计的数据中心,上万亿的行数据。,2,、经典数据库技术并没有考虑数据的多类别(,variety,),SQL,(结构化数据查询语言),在设计的一开始是没有考虑非结构化数据的。,3,、实时性的技术挑战:,一般而言,像数据仓库系统、,BI,应用,对处理时间的要求并不高。因此这类应用往往运行,1,、,2,天获得结果依然可行的。但实时处理的要求,是区别大数据应用和传统数据仓库技术、,BI,技术的关键差别之一。,网络架构、数据中心、运维的挑战:,技术架构的挑战:,人们每天创建的数据量正呈爆炸式增长,但就数据保存来说,我们的技术改进不大,而数据丢失的可能性却不断增加。,如此庞大的数据量首先在存储上就会是一个非常严重的问题,硬件的更新速度将是大数据发展的基石。,分析技术:,数据处理:自然语言处理技术,统计和分析:,A/B test;top N,排行榜;地域占比;文本情感分析,数据挖掘:关联规则分析;分类;聚类,模型预测:预测模型;机器学习;建模仿真,大数据技术:,数据采集:,ETL,工具,数据存取:关系数据库;,NoSQL,;,SQL,等,基础架构支持:云存储;分布式文件系统等,计算结果展现:云计算;标签云;关系图等,一些相关技术,存储,结构化数据:,海量数据的查询、统计、更新等操作效率低,非结构化数据,图片、视频、,word,、,pdf,、,ppt,等文件存储,不利于检索、查询和存储,半结构化数据,转换为结构化存储,按照非结构化存储,解决方案:,Hadoop,(,MapReduce,技术),流计算(,twitter,的,storm,和,yahoo,!的,S4,),数据采集,数据储存,数据管理,数据分析与挖掘,数据采集,数据储存与管理,数据分析与挖掘,计算结果展示,大数据的相关技术,ETL,数据众包,(,CrowdSouring,),结构化、非结构化和半结构化数据,分布式文件系统,关系数据库,非关系数据库,(,NoSQL,),数据仓库,云计算和云存储,实时流处理,A/B Testing,关联规则分析,分类,聚类,遗传算法,神经网络,预测模型,模式识别,时间序列分析,回归分析,系统仿真,机器学习,优化,空间分析,社会网络分析,自然语言分析,MapReduce,R,语言,标签云,(,Tag Cloud,),聚类图,(,Clustergram,),空间信息流,(,Spatial information flow,),热图,(,Heatmap,),经过剁手族24小时的鏖战,天猫双11的销售总额最终定格在1207亿,,大数据给您带来的启发是什么?选择一个身份来展开,如阿里工作人员、某某商家老板、消费者。,as a Service,,,IaaS,),平台环境服务(,Platform as a Service,PaaS,),应用软件服务(,Software as a Service,SaaS,),存储服务,网络服务,开发与运行环境,计算服务,各类开放,服务能力,办公应用,信息化应用,通讯应用,互联网应用,数据库,1,2,3,好处,Iaas,PaaS,SaaS,低成本、大规模、高效率提供,IT,基础设施,统一平台架构,开放平台能力,引入外部开发创新力量,形成生态系统,增强业务性能,降低业务提供成本,降低终端要求,基于网络以服务的形式提供计算、存储等资源能力,基于互联网以服务的形式提供平台运行环境(运行库),基于互联网以服务的形式提供软件应用,云计算优点,方便易用,经济实惠,资源整合,超强计算能力,安全性更高,绿色环保,6.1.3,云计算的优点和问题,云计算服务的问题,云计算标准问题,隐私权、知识产权问题,数据完全问题,云计算核心服务层,3,个子层的比较,核心服务层,1,云计算体系架构,云计算应用于移动商务领域将为众多移动商务企业的发展提供全新的技术基础和服务模式,尤其是中小企业将获得更廉价的资源、更广阔的发展机遇和更完善的服务。,云计算将给移动商务带来全面的历史发展机遇。,(1),打破移动终端性能瓶颈;,(2),提供全新的,IT,资源部署模式;,(3),更加安全的数据存储模式;,(4),提供商业智能级的经营决策模式。,1,云计算带来的机遇,你认同下面,4,点发展机遇吗?,WHY?,2,全新移动商务模式构建,基于“供应链云”的全程移动电子商务模式,基础云平台:,主要由云计算服务提供商提供云计算的基础架构和平台建设,为电子商务企业提供使用云计算的基本环境和物理基础。对应于云计算的的,Iaas,和,Paas,基础云服务层:,主要由应用开发商提供云计算的相关服务和公共应用接口为电子商务企业提供所需的服务和软件。对应于云计算的SaaS服务和PaaS服务:,企业应用云层:,这一层是企业,开展全程移动商务的核心层。在这一层移动商务企业应用供应链管理的基本思想,开展企业核心业务流程的重组,构建,移动供应链管理系统。利用已有的云计算平台和服务,整合企业资源,改善企业流程,合理分配权限,采用广泛的“供应链云”实现全程移动商务的最终目标,综上所述:,从云计算平台供应商,到云计算应用开发商,再到云计算的使用者移动商务企业,形成了一个全新基于云计算的产业链。目前,诸如用友、金算盘、伟库等大型服务商都已经开始打造全程移动商务服务系统,基于“供应链云”的全程移动商务已经进入实践应用的阶段。,2,全新移动商务模式构建,基于“移动云”的移动电子商务模式,此模式解决了移动终端性能瓶颈的问题,还极大地提高了数据分享的便捷性、任务执行的高效性。在这种模式下,对手机等移动终端没有复杂的硬件性能要求,只要具备简单的跨系统平台就可以顺利连接“云端”,获取移动 商务企业利用“移动云”所提供的信息和服务。,移动商务企业自身也无需搭建复杂的移动电子商务平台,而只需要向云计算服务提供商申请租赁,就可以获取相应的“云服务”,从而快速实现其业务功能。“移动云”快捷高效的存储、运算、处理、共享能力,为移动电子商务的发展提供了全新的发展空间,大数据,=,海量数据,+,复杂类型的数据,海量交易数据:,企业内部的经营交易信息主要包括联机交易数据和联机分析数据,是结构化的、通过关系数据库进行管理和访问的静态、历史数据。通过这些数据,我们能了解过去发生了什么。,大数据包括:,交易数据和交互数据集在内的所有数据集,海量交互数据:,源于各种网络和社交媒体。它包括了呼叫详细记录、设备和传感器信息、,GPS,和地理定位映射数据、通过管理文件传输协议传送的海量图像文件、,Web,文本和点击流数据、评价数据、科学信息、电子邮件等等。可以告诉我们未来会发生什么。,大数据的构成,1,2,3,4,体量Volume,多样性Variety,价值密度Value,速度Velocity,4V,特,性,从,非结构化数据的超大规模和增长,比结构化数据增长快10倍到50倍,是传统数据仓库的10倍到50倍,总数据量的8090%,大数据的异构和多样性,多种形式(文本、图像、视频、机器数据),无模式或者模式不明显,,不连贯的语法或句义,大量的不相关信息对未来趋势与模式的可预测分析,深度复杂分析,机器学习、人工智能Vs传统商务智能(咨询、报告等),实时分析而非批量式分析,数据输入、处理与丢弃,立竿见影而非事后见效,数据挖据流程,知识运用,知识运用就是对挖掘的评估结果在现实决策中的运用,这是一个非常重要的过程,也是数据挖掘的最终目标,价值的体现。,数据准备,数据准备,是从海量的原始数据中准备要据挖掘的数据,它是长期的、无规律的数据积累的结果。由于原始数据不适合数据挖掘,所以要先进行预处理,包括数据选择、清洗、推测、转换等操作。数据准备的好坏直接决定着数据挖掘的质量和效率。,数据挖掘 数据挖掘是整个程序的关键过程,按照数据挖掘的目标要求,选择合适的算法,来挖掘数据规律,常见的算法有决策树、分类、神经网络、,Apriori,算法等。,模式的评价、分析,对挖掘过的数据结果进行解释、分析、提取有意义或有使用价值的规律,还原成人们能够理解的数据语言。,数据采集,数据储存与管理,数据分析与挖掘,计算结果展示,大数据的相关技术,ETL,数据众包,(,CrowdSouring,),结构化、非结构化和半结构化数据,分布式文件系统,关系数据库,非关系数据库,(,NoSQL,),数据仓库,云计算和云存储,实时流处理,A/B Testing,关联规则分析,分类,聚类,遗传算法,神经展开阅读全文
咨信网温馨提示:1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前可先查看【教您几个在下载文档中可以更好的避免被坑】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时联系平台进行协调解决,联系【微信客服】、【QQ客服】,若有其他问题请点击或扫码反馈【服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【版权申诉】”,意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:0574-28810668;投诉电话:18658249818。




7大数据113.pptx



实名认证













自信AI助手
















微信客服
客服QQ
发送邮件
意见反馈



链接地址:https://www.zixin.com.cn/doc/12644033.html