大数据时代的人工智能应用.ppt
《大数据时代的人工智能应用.ppt》由会员分享,可在线阅读,更多相关《大数据时代的人工智能应用.ppt(75页珍藏版)》请在咨信网上搜索。
1、时代背景:新一代人工智能发展规划的提出1为抢抓人工智能发展的重大战略机遇,构筑我国人工智能发展的先发优势,加快建设创新型国家和世界科技强国,日前国务院印发新一代人工智能发展规划。-2017.7.8规划指出:立足国家发展全局,准确把握全球人工智能发展态势,找准突破口和主攻方向,全面增强科技创新基础能力,全面拓展重点领域应用深度广度,全面提升经济社会发展和国防应用智能化水平。AlphaGo到底有多厉害?22011年,北京邮电大学的Lingo围棋程序在9*9棋盘上以受让两子的条件,首次击败了中国围棋教练职业围棋9段俞斌和先生。那时,谁也没有想到仅仅5年之后,AlphaGo围棋程序就在19*19棋盘上
2、无条件战胜了人类棋王。研制AlphaGo的团队DeepMind正在投入AlphaSC的研发,未来将于人类顶尖高手在星际争霸游戏中一较高下。AlphaGo怎么做到的?AlphaGo使用两种不同的深度神经网络:第一种是策略网络,目标是选择在哪里落子。第二种则是价值网络,价值网络的作用是衡量走这一步对最终输赢的影响。AlphaGo成功的关键在于:海量对弈数据海量对弈数据:6000万局对弈数据。算算法法创新创新:深度神经网络+“左右手互搏”。计算能力出众计算能力出众:打败李世石的AlphaGo Lee 的芯片为 50 TPU,搜索速度为10k位置/秒。3人类专家位置监督式学习强化学习AlphaGo绝非
3、一帆风顺43月13日李世石九段“神之一手神之一手”“AlphaGo远非人工智能的终点。”微软研究院著名机器学习专家John Langford批评了Wired和Slashdot等媒体对于“实现人工智能”夸大其词的相关报道。Langford认为这些进展本是好事,但报道的时候产生了偏差,这容易导致失望和人工智能寒冬。John Langford国际机器学习大会ICML2016程序主席“AlphaGo以以为自己做的自己做的很好,但在很好,但在87手迷惑了,手迷惑了,有麻有麻烦了了”“错误在第在第79手,但手,但AlphaGo到到第第87手才手才发觉”从AlphaGo到AlphaGo Master5Zen
4、/CrazyStoneAlphaGo FanAlphaGo LeeAlphaGo Master500045004000350030002500200015001000500060-0 vs 顶级专业人士(在线游戏)等级分专业级业余级入门级2017年7月9日,柯洁携20连胜,等级分冲至3675分,世界排名第一。6震撼之后的思考什么是人工智能?为什么那么厉害?AlphaGo未来有没有可能被人类打败?人工智能技术未来有没有可能取代人类?为什么?人工智能可以帮助人类完成哪些事情?人工智能已经出现在哪些领域,今后还会出现在哪些领域?大数据时代的人工智能大数据时代的人工智能内容提纲人工智能基本概念与发展历
5、史人工智能与大数据人工智能在气象领域的应用案例人工智能在环保领域的应用案例人工智能在网络安全领域的应用案例人工智能面临的机遇与挑战总结与展望8内容提纲人工智能基本概念与发展历史人工智能与大数据人工智能在气象领域的应用案例人工智能在环保领域的应用案例人工智能在网络安全领域的应用案例人工智能面临的机遇与挑战总结与展望9什么是智能智力或知能智力或知能是指生物一般性的精神能力。这个能力包括以下几点:理解、计划、解决问题,抽象思维,表达意念以及语言和学习的能力。智力三因素理论智力三因素理论(Robert Sternberg)(Robert Sternberg)成分性智力(componential int
6、elligence),指思维和问题解决所依赖的心理过程。经验智力(experiential intelligence),指人们在两种极端情况下处理问题的能力:新异的或常规的问题。情境智力(contextual intelligence)反映,在对日常事物的处理上,它包括对新的和不同环境的适应,选择合适的环境以及有效地改变环境以适应你的需要。10Robert SternbergRobert Sternberg(1949-)是美国心理学家和心理测量学家。他是康奈尔大学人类发展教授。什么是人工智能人工智能人工智能(Artificial Intelligence,AI)也称作机器智能,是指由人工制造出
7、来的系统所表现出来的智能。通常人工智能是指通过普通计算机实现的智能。人工智能研究人工智能研究研究内容:包括认知建模、知识学习、推理及应用、机器感知、机器思维、机器学习、机器行为和智能系统等。研究动机:包括推理,知识,规划,学习,交流,感知,移动和操作物体的能力等。基础知识:包括搜索和数学优化,逻辑,基于概率论和经济学的方法等。应用系统:目前有大量的人工智能应用系统,如AlphaGo,Siri等。11人工智能的三大发展要素12基础理论引入相关学科交叉多领域应用机器学机器学习数据挖掘数据挖掘人工智能人工智能数学统计学认知科学神经科学控制论人工智能发展历程中的里程碑(1)-图灵测试图灵测试(1950
8、)一个人(C)询问两个他看不见的对象(机器A和正常思维的人B)。如果经过若干询问后,C无法区分A与B,则A通过图灵测试。聊天机器人Eugene Goostman(2014)在5分钟内试图欺骗30%的人。13图灵测试额外加分项:说服测试者,令他认为自己是电脑。你知道吗,你说的这些话真的很有道理。我我已经不知道自己究竟是谁了。人工智能发展历程中的里程碑(2)-深蓝vs卡斯帕罗夫1997年,IBM研制的超级电脑“深蓝”在标准比赛时限内以3.5比2.5的累计积分击败了国际象棋世界冠军卡斯帕罗夫,震惊世界。“深蓝”的设计者许峰雄曾表示,一般的国际象棋手能想到后7步就很不错了,但“深蓝”能想到12步,甚至
9、40步远,棋手当然不是计算机的对手。插曲:卡斯帕罗夫在落败后曾称无法理解电脑下棋时做出的决定。他亦认为电脑在棋局中可能得到人类帮助并要求重赛,但IBM拒绝。思考:深蓝靠什么打败了卡斯帕罗夫?深蓝能否击败李世石?为什么?14人工智能发展历程中的里程碑(3)-Waston与人机大战2011年2月16日,在美国智力竞猜节目危险边缘第三场比赛中,IBM另一超级电脑“沃森”以三倍的巨大分数优势力压该竞猜节目有史以来最强的两位选手肯詹宁斯和布拉德鲁特,夺得这场人机大战的冠军。“沃森”在比赛中没有连接互联网,其数据库中包括辞海和世界图书百科全书等数百万份资料,强大的硬件则助力其能在3秒钟之内检索数亿页的材料
10、并给出答案。思考:就面临的挑战来说,“沃森”相比深蓝有哪些不同?“沃森”的特点是什么?“沃森”有可能胜任AlphaGo的工作吗?15人工智能发展历程中的里程碑(4)-图像识别领域机器首次超越人类2015年的 ImageNet 挑战赛,在图像识别准确率上,机器的表现首次超过了人类。这被公认为是一个里程碑式的突破。在此之前,2010年算法的图像识别错误率至少在25%左右,但到2015年,计算机图像识别错误率已经低于人类(人类水平大概是4%左右)。2015年是0.03567,也就是3.5%。2016年,ImageNet 竞赛,图像识别错误率进一步下降,最好成绩为:平均错误率0.02991,也就是2.
11、99%左右。思考:这一次的人工智能突破和前几次相比有何不同?1620102011201220132014 Human ArXiv 201507.51522.530ILSVRC top-5 error on ImageNet人工智能发展(简史)17混沌初生 开天辟地百家争鸣 百花齐放物竞天择 适者生存达特茅斯会议的召开标志着人工智能的诞生。(1956年)图灵测试的提出标志人工智能进入萌芽阶段。以DENDRAL系统为代表的专家系统大量涌现。(19701980)浅层机器学习模型兴起,SVM、LR、Boosting算法等纷纷面世。(19902000)多伦多大学教授Hinton开启深度学习在学术界和工业
12、界的浪潮(2006)人工智能出现新的研究高潮,机器开始通过视频学习识别人和事物,AlphaGo战胜围棋冠军(2011今)随着新的算法和模型不断涌现,学科交叉现象日趋明显,人工智能的研究进入了新的阶段。奠定了人工智能的数学基础,出现了人工智能历史上的第一个应用。-西蒙和纽厄尔提出了“Logic Theorist”自动定理证明系统。大数据时代的到来给人工智能的发展带来契机,人工智能全面融入人们的社会生活。人工智能发展的真实历史过程(波浪式前进)18最近一次的人工智能热潮兴起,是由于大数据时代使得数据需求得到了满足。达特茅斯会议标志AI的诞生自然语言探索式推理微世界第一款神经网络感知机,将人工智能推
13、向第一个高峰人工智能计算机DARPA无条件拨款放弃联结主义计算能力突破没能使机器完成大规模数据训练和复杂任务,AI进入第一个低谷DARPA停止拨款集成电路技术提高反向传播算法提出霍普菲尔德神经网络被提出DARPA受到认可重获拨款反向传播算法获得广泛关注,AI进入第二黄金时期循环神经网络狂热追捧带来失望LISP机市场的崩溃DARPA失败,政府投入缩减,AI跌入第二次谷底行为主义提出非线性多层自适应网络循环神经网络出现IBM深蓝战胜人类象棋冠军深度卷积神经网络提出人工智能加速发展人脸识别率超过99%欧盟、美国脑工程计划AlphaGo挑战人类围棋冠军计算能力数据需求下一个问题呢启蒙阶段低潮时期复兴阶
14、段遇冷时期快速发展1955201620051991198619701958内容提纲人工智能基本概念与发展历史人工智能与大数据人工智能在气象领域的应用案例人工智能在环保领域的应用案例人工智能在网络安全领域的应用案例人工智能面临的机遇与挑战总结与展望19大数据是什么?大数据(Big Data):是指大小大小超出了常用软件工具在运行时间内运行时间内可以承受的收集、管理和处理数据能力的数据集。大数据是目前存储模式与能力、计算模式与能力不能满足存储与处理现有数据集规模产生的相对概相对概念念。20大数据真正价值不在于大数据本身,而在于数据内容的分析和洞察。大数据时代的5V特点21大数据时代的要求大数据规模
15、大小是一个不断演化的指标当前任务处理的单一的数据集当前数据规模:从数十TB到十几PB级处理大数据的可等待的合理时间依赖应用场景地震数据预测要求在几分钟内才有效气象数据应该在小时级别失联飞机数据处理要在7天之内数据挖掘一般要求在12小时内22大数据时代需要人工智能技术同时满足以上两个要求。大数据时代需要什么样的人工智能?能适应反映大数据分布的抽样方法解剖麻雀基于大数据分布的算法庖丁解牛追求高效并行的人工智能算法曹冲称象反映全量特征的人工智能算法治大国如烹小鲜23大数据时代的人工智能技术不断涌现24互联网搜索生物特征识别汽车自动驾驶智能机器人选举结果预测智能客服系统人工智能的应用范围和领域不断拓展
16、25人工智能应用图像识别语音识别文字识别其他信号识别无人驾驶人脸识别场景感知气象预报文献筛选污染预报医学影像分析虹膜识别视频监控计算机春联手写数字识别智能交通智能客服智能庭审记录小米基因筛选网络安全计算机写诗内容提纲人工智能基本概念与发展历史人工智能与大数据人工智能在气象领域的应用案例人工智能在环保领域的应用案例人工智能在网络安全领域的应用案例人工智能面临的机遇与挑战总结与展望26人机交互层基于人工智能技术的强对流天气聚焦与推演方案目方案目标:聚焦:聚焦:辅助决策。助决策。从海量数据中聚焦关键特征和重点区域,辅助气象专家进行决策;推演:推演:协助研判。助研判。提供智能推演,协助气象专家对未来3
17、小时的天气形势进行研判。方案特点:方案特点:采用人工智能技采用人工智能技术综合运用多种深度学合运用多种深度学习算法算法半半结构构化化与与非非结构构化化大大数数据据处理理技技术雷达反射图雷达反射图核核心模心模块气象气象数数据据展展示效果示效果模型算法模型算法多层神经多层神经网络网络Softmax线性模型线性模型卷积神经卷积神经网络网络(CNN)循环神经循环神经网络网络(LSTM)卫星云图卫星云图GRIB2在分析预在分析预报场资料报场资料关键特征关键特征识别识别重点区重点区域域识识别别时空特征时空特征学习学习天气变化推天气变化推演演未来未来3小时强小时强对对流天气模拟推演流天气模拟推演关键特征和重
18、点关键特征和重点区域区域2维维效果效果展示层系统层模型层数据层辅助人工决策提供智能推演气象专家最终气象预报结果历史对流过程历史对流过程标注数据标注数据与传统方法的比较u拥有深度自学习能力。认知计算无需先验知识,即可从海量历史数据中进行训练学习,并挖掘潜在的规律和模式。同时,认知计算能够根据每天产生的气象数据进行自动学习,自我调整以适应天气变化的最新情况。u拥有基于大数据的辅助决策能力。能够充分利用气象历史数据。气象数据越多,收集时间越长,认知计算模型的分析结果越准确。u数据依赖程度低。认知计算系统只需少量的观察和再分析数据即可完成分析和推演。u基于空气动力学进行数值计算。传统数值方法主要依赖空
19、气动力学公式对气象数据进行分析,计算开销高。u基于少量历史数据进行人工决策。传统数值方法主要基于少量历史数据,进行人工外推。其历史气象数据未得到充分利用。u依赖专家经验。传统数值方法依赖专家根据其掌握的经验进行分析和调整。u需要大量的物理变量组合分析。传统数值方法很难处理物理变量缺失的情况。传统数值方法人工智能方法强对流天气聚焦700mb高度垂直速度,地面能见度,10米风,80米风,地表温度,历史对流天气标注结果输入参数关键特征识别重点区域可视化子系子系统的构成:的构成:气象气象图片片资料的自料的自动解析解析多多层神神经网网络模型模型Softmax线性模型性模型特征特征预测效果效果评估模估模块
20、多特征自多特征自动排序模排序模块重点区域可重点区域可视化模化模块子系子系统的特点:的特点:支支持持43+种种气象气象图片的自片的自动分析分析综合运用合运用领先的深先的深度学度学习技技术支持端到端的关支持端到端的关键特征特征识别和排序和排序支持支持基基于于计算机算机视觉技技术的重点区域可的重点区域可视化化气象气象图片片资料料历史史对流天气流天气标注集注集多层神经网多层神经网络模型络模型单特征预测单特征预测效果效果评估评估训练数据验证数据多多特征自动特征自动排序排序气象气象图片片资料料历史史对流天气流天气标注集注集Softmax线线性模型性模型格网不同位格网不同位置置权权重解析重解析重点区域可重点
21、区域可视化视化待分析特征待分析特征注:深度学习的结果只能揭示区域和预测目标的相关性,但不能解释区域和预测目标的因果关系。关键技术1-关键特征识别与排序候候选气象特征气象特征(43个)个)地面对流有效位能2米露点温度 可降水相对湿度 入射短波辐射 地面对流抑制 2米相对湿度 700mb高度温度 行星边界层高度 混合对流有效位能 累计降水 700mb高度垂直速度 雪水当量 最不稳定对流有效位能 降水类型 500mb高度温度 1小时降雪 最不稳定层对流有效位能可降水 500mb高度涡度 雪深 10米风 航空飞行规则 250mb高度风场 2米位温80米风925mb高度温度 250mb高度风速 850m
22、b高度相对湿度 地面能见度850mb高度温度 云顶高度 高层云量地表温度 850mb高度风场 云底高度 低层云量 2米温度850mb高度风速 总云量 中层云量 模拟雷达反射率2米温度-地表温度 850-500mb平均相对湿度 高 低6-10月历史对流天气标注集 针对2016年6月-10月间48个对流天气过程,根据其中43个候选气象特征,收集10w+张图片。针对每个候选特征,应用深度学习中的多层神经网络模型对其预测对流天气过程的能力进行评估。根据评估结果,对不同特征按照预测效果进行排序。关键特征的识别与排序旨在从海量数据中提炼有效特征,协助气象专家提升对流天气过程的预报准确率。输入层输出层隐层I
23、隐层II隐层III误差反向传播信息正向传播重点区域31 针对待分析特征,按照发生对流过程的类型,对图片进行分别标注。关键技术2-重点区域识别 根据对流过程的类型,应用softmax线性模型对不同位置网格点(RGB取值)的重要性(权重)进行评估,进而识别出不同类型天气的重点区域,如右图所示。31 网格点权重可视化。示例示例 250mb高度高度风场(b)待分析图片重点区域可视化旨在从海量地理气象数据中快速发现重要区域,辅助气象专家提升对流天气过程的预报精度。如上图所示,通过比较待分析图片和标准模板,可以计算对应区域的偏差。通过对偏差的分析比较,可以准确地识别出待分析图片未来1-3h内可能发生的天气
24、过程的类型。(a)无对流过程标准模板无对流过程台风过程大尺度天气系统降水过程局地对流天气过程32重点区域重点区域识别结果果验证(示(示例:例:250mb高度高度风场)局地局地对流天气流天气2016年10月04日14:0017:00偏差0.030.410.210.09偏差0.030.330.190.11偏差0.050.210.070.14偏差0.010.010.10.12重点区域无对流过程台风过程大尺度天气系统降水过程局地对流天气过程根据重点区域的分析结果,可以分析出未来出现不同天气类型的概率。结果果验证:系统为预报员提供无对流天气过程模板和重点区域具体位置。预报员可以通过比较重点区域的偏差情况
25、,分析未来0-3h出现的天气类型。2016年10月04日 14:002016年10月04日 15:002016年10月04日 16:002016年10月04日 17:00强对流天气推演强对流天气推演子系子系统的构成:的构成:卫星云星云图和雷达反射和雷达反射图的自的自动解析解析卷卷积神神经网网络模型模型循循环神神经网网络模型模型多多层网网络的深度学的深度学习模型模型支持支持未来天气的自未来天气的自动推演模推演模块系系统特点:特点:通通过海量海量历史数据史数据训练模型模型时空特征空特征认知知空空间特征:卷特征:卷积神神经网网络(CNN)时序特征:循序特征:循环神神经网网络(LSTM)利用深度学利用
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 完整版 数据 时代 人工智能 应用
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【w****g】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【w****g】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。