ChatGPT开启AIGC产业生态新时代.pdf
《ChatGPT开启AIGC产业生态新时代.pdf》由会员分享,可在线阅读,更多相关《ChatGPT开启AIGC产业生态新时代.pdf(50页珍藏版)》请在咨信网上搜索。
1、新风口新生态新变革新机遇目录新风口:ChatGPT引爆AIGC产业01新生态:AIGC产业生态逐渐完善02新变革:AIGC助力行业转型升级03新机遇:AIGC时代的机遇与挑战0401新风口:ChatGPT引爆AIGC产业1.1OpenAI发展历程1.2ChatGPT技术演进1.3ChatGPT是AIGC浪潮的一部分1.4ChatGPT市场影响力巨大1.5国内外科技企业加码布局AIGC产业OpenAI是由美国一群科技领袖,包括山姆阿尔特曼(SamAltman)、彼得泰尔(PeterThiel)、里德霍夫曼(ReidHoffman)及埃隆马斯克(ElonMusk)等人在2015年12月联合创立的人
2、工智能研究机构。成立次年OpenAI即发布第一个开源AI平台,2020年6月推出OpenAlAPI,正式开启商业化运营。公司在AI领域进程迅猛,于2022年11月发布了ChatGPT产品,作为一款生成式AI,能够协助高效处理文本工作、写代码、编剧等,引发全球对AIGC的积极关注。1.1OpenAI发展历程资料来源:OpenAI官网OpenAI发展里程碑2019年7月2020年6月微软向OpenAI投资了10亿美金,并获得了OpenAl技术的商业化授权。从此,OpenAI的一些技术开始出现在微软的产品和业务上OpenAI发布了第一个开源的AI平台2015年12月OpenAI团队成立OpenAI发
3、布了OpenAlAPI,这是OpenAI推出的一种云端人工智能服务,作为OpenAI第一个商业化产品开启了商业化运作的时代。2022年11月在GPT-3.5的基础上发布ChatGPT,这是一款人工智能聊天机器人OpenAI公司发展里程碑事件梳理2016年3月2018年6月OpenAI发布了GPT模型ChatGPT(ChatGenerativePre-trainedTransformer)是一款人工智能聊天机器人,其背后的GPT模型是一种自然语言处理(NLP)模型,使用多层变换器(Transformer)来预测下一个单词的概率分布,通过训练在大型文本语料库上学习到的语言模式来生成自然语言文本。1
4、.2.1GPT模型技术演进进程资料来源:CSDNGPT-1有一定的泛化能力,能够用于和监督任务无关的NLP任务中GPT-1(1.17亿参数)GPT-3作为一个自监督模型,可以完成自然语言处理的绝大部分任务:将网页描述转换为相应代码、模仿人类叙事、创作定制诗歌、生成游戏剧本,甚至模仿已故的哲学家预测生命的真谛GPT-3(1750亿参数)ChatGPT是InstructGPT的衍生产品,它将人类的反馈纳入训练过程,更好地使模型输出与用户意图保持致ChatGPT除了理解能力外,GPT-2在生成方面表现出了强大的天赋:阅读摘要、聊天、续写、编故事,甚至可以生成假新闻、钓鱼邮件或在线进行角色扮演GPT-
5、2(15亿参数)InstructGPT是一个经过微调的新版GPT-3,可以将有害的、不真实的和有偏差的输出最小化InstructGPT201820192020-062022-012022-11ChatGPT核心技术主要是基于人工反馈的强化学习(RLHF),具体实现上,人类标注人员扮演用户和代理进行对话,产生对话样本并对回复进行排名打分,将更好的结果反馈给模型,让模型从两种反馈模式人类评价奖励和环境奖励中学习策略,对模型进行持续迭代式微调。1.2.2ChatGPT核心技术RLHF资料来源:OpenAI官网哈尔滨工业大学自然语言处理研究所向一个6岁智力的模型解释强化学习对行为给出奖励与惩罚向一个6
6、岁智力的模型解释强化学习回答A、B、C、DDCAB示例:写一则关于的故事DCAB示例:很久以前rk第一步:收集描述性数据,并训练一个监督学习模型第二步:收集比较性数据,并训练一个奖励模型第三步:用PPO强化学习算法对奖励模型最优化从prompt数据库中取样由人类训练师撰写期望的输出值收集的数据用来以监督学习的方式微调GPT-3.5模型从prompt数据库中取样,并得到数个模型的回答由人类训练师对回答进行排序收集的数据用来训练我们的奖励模型从prompt数据库中另外取样由监督学习初始化PPO模型模型给出回答奖励模型对回答进行打分获得的分数通过PPO算法优化模型ChatGPT采用监督学习+奖励模型
7、进行语言模型训练一、训练监督策略模型首先,ChatGPT会从问题数据集中随机抽取若干问题并向模型解释强化学习机制,其次标记者通过给予特定奖励或惩罚引导Al行为,最后通过监督学习将这一条数据用于微调GPT3.5模型。二、训练奖励模型训练奖励模型的过程同样可以分为三步:1、抽样出一个问题及其对应的几个模型输出结果;2、标记员将这几个结果按质量排序;3、将排序后的这套数据结果用于训练奖励模型。三、近端策略优化(PPO)核心在于将在线学习转化为离线学习。具体来说,也就是先通过监督学习策略生成PPO模型,经过奖励机制反馈最优结果后,再将结果用于优化和迭代原有的PPO模型参数。往复多次第二阶段和第三阶段,
8、从而得到参数质量越来越高的ChatGPT模型。ChatGPT模型原理AIGC历程可以划分为三个阶段,从19世纪50年代的早期萌芽开始,该阶段AIGC仅限于小范围实验;20世纪90年代开始向实用性转变;21世纪10年代进入快速发展阶段,人工智能生成内容百花齐放,ChatGPT是AIGC最新浪潮的代表性产品。1.3ChatGPT是AIGC浪潮的一部分资料来源:中国信息通信研究院典型事件1950年,艾伦图灵提出著名的“图灵测试”,给出判断机器是否具有“智能”的方法1966年,世界第一款可人机对话机器人“Eliza”问世80年代中期,IBM创造语音控制打字机Tangora早期萌芽阶段(1950s-19
9、90s)沉淀积累阶段(1990s-2010s)快速发展阶段(2010s-至今)受限于技术水平,AIGC仅限于小范围实验AIGC从实验性向实用性转变,受限于算法瓶颈,无法直接进行内容生成深度学习算法不断迭代,人工智能生成内容百花齐放,效果逐渐逼真2007年,世界上第一部完全由人工智能创作的小说1TheRoad问世2012年,微软展示语全自动同声传译系统,可将英文语音自动翻译成中文语音2014年,IanJ.Goodfellow提出生成式对抗网络GAN2018年,英伟达发布StyleGAN模型用于自动生成高质量图片2019年,DeepMind发布DVD-GAN模型用于生成连续性视频2022年,Ope
10、nAI发布ChatGPT用于生成自然语言文本全球AIGC产业发展历程发展特点ChatGPT具备划时代的强大功能,一经发布短短5天便获得100万用户,此前全球顶流社交软件ins触及100万用户花费了2.5个月时间。此外,ChatGPT也引发全球资本市场对AIGC的投资热潮,Deelroom数据显示,2023年1月全球生成式AI总估值达到480亿美元,相比2020年底增长了6倍。其中OpenAI估值达到290亿美元,相比2021年增长超1倍。1.4ChatGPT发布后市场影响力巨大资料来源:Statista投资界ChatGPTInstagramSpotifyFacebookFoursquareTw
11、itterAirbnbNetflixChatGPT到达100万用户耗时及热门产品对比3.5years2.5years2years13months10months5months2.5months5days14029020212023.012021-2023年OpenAI估值水平对比(单位:亿美元)国内外互联网头部企业持续关注AIGC产业,自ChatGPT发布后,纷纷加码布局,如谷歌为应对来自ChatGPT的威胁,投资Anthropic布局智能聊天机器人;Meta宣布将在2023年底推出AIGC商业化落地产品;国内百度推出文心一言对标ChatGPT产品。根据IT桔子投融资数据,2023年前3个月全
12、球AIGC赛道投资金额达54.93亿元,同比增长了5倍。1.5国内外科技企业加码布局AIGC产业资料来源:IT桔子公司官网2022-2023年全球AIGC投资热度对比(单位:件、亿元)国内外科技企业加码布局AIGC产业6149.154.932022.01-032023.01-03事件数量金额 国内百度发布文心一言,其成为国内第一款类ChatGPT产品 谷歌正式开放Bard的访问,其也是一款AI聊天机器人 英伟达在GTC大会发布带有双GPUNVLink的H100NVL新显卡,专为算力需求巨大的ChatGPT而设计2023.03 谷歌注资3亿美元投资Anthropic旗下开发智能聊天机器人Clau
13、de 微软宣布将ChatGPT整合进office全家桶、bing搜索引擎等 Meta宣布将成立专注AIGC的顶级产品团队2023.02 Meta首次对外宣称,将在2023年底推出AIGC的商业化落地产品 阿里云正式对外发布大模型产品“通义千问”360官方宣布基于360GPT大模型的“360智脑”率先落地搜索场景,开放内测 商汤科技推出“日日新SenseNova”大模型体系2023.0402新生态:AIGC产业生态逐渐完善2.1AIGC产业链全景图谱2.2AIGC产业基础层需求提升2.3AIGC产业垂直赛道加速发展2.4AIGC产业链市场规模将突破万亿在科技巨头持续加码布局的推动下,AIGC产业
14、链涌现了一批新型初创企业和创新企业,产业链生态不断丰富,AIGC产业链队伍不断壮大。AIGC产业链上游主要由数据、算法、芯片、平台等提供基础支撑;中游为AIGC产品开发,可初步分为垂直类及综合大型平台企业;下游应用多元,典型场景如搜索、对话、智能推荐等。2.1AIGC产业链全景资料来源:前瞻产业研究院整理数据供给(业务数据联通、素材数据搜集、版权图库等)上游(数据源/算法/芯片等)数据分拆及标注创作者生态底层配合工具相关算法/模型智能芯片/服务器硬件嵌入/结合能力的业务平台垂直赛道初创公司文字图像视频音频综合大型平台企业生态服务内容设计视觉设计、文案设计、结构设计等内容制作工具音视频制作工具、
15、新闻采编运营增效智能客服、简单决策等个性化市场营销广告植入、虚拟形象打造、营销内容生产等其他搜索对话推荐医疗遥感基础科学元宇宙城市运营其他中游(产品开发)下游(产品应用)AI的发展主要依赖两个领域的创新,一是模仿人脑建立的数学模型和算法,二是AI芯片等算力发展,均属于产业链上游环节(基础层)。在AI领域,数据、算法、算力被称为三大要素,如今各类大模型动辄数亿的参数量,也对算力要素提出更高的要求。2.2.1AIGC产业发展关键在上游基础层资料来源:腾讯研究院IDC公司预训练模型应用参数量领域谷歌BERT语言理解与生成4810亿NLPLaMDA对话系统5400亿NLPPaLM语言理解与生成、推理、
16、代码生成/NLPImagen语言理解与图像生成110亿多模态Parti语言理解与图像生成200亿多模态微软Florence视觉识别6.4亿CVTuring-NLG语言理解、生成170亿NLPFacebookOPT-175B语言模型1750亿NLPM2M-100100种语言互译150亿NLPDeepMindGato多面手的智能体12亿多模态Gopher语言理解与生成2800亿NLPAlphaCode代码生成414亿NLPOpenAIGPT3语言理解与生成、推理等1750亿NLPCLIP&DALL-E图像生成、跨模态检索120亿多模态Codex代码生成120亿NLPChatGPT语言理解与生成、推
17、理等/NLP国外部分AIGC预训练模型梳理31.775155.2268427640.7922.81271.420192020202120222023E2024E2025E2026E2019-2026年中国智能算力规模及预测(单位:EFLOPS)算力硬件层三大要素包括AI芯片、AI服务器、数据中心,其中AI芯片是算力层的基石,承担人工智能相关的计算任务,是决定算力层性能的关键,AI芯片中以GPU产品份额最大;AI服务器是芯片的系统集成,其架构相比传统服务器更具效率优势;数据中心是承载算力的物理场所,相关硬件产品包括服务器、数据存储驱动器和网络设备等。2.2.2算力层三要素AI芯片、AI服务器、数
18、据中心资料来源:CounterpointIDC中国信通院算力硬件要素角色定位核心产品作用AI芯片算力硬件层的基石CPU/GPU/FPGA/ASIC专门用于处理人工智能相关的计算任务,其架构针对人工智能算法和应用进行专门优化,具有高效处理大量结构化和非结构化数据的特征,可高效支持视觉、语音、自然语言处理等智能处理任务AI服务器AI芯片的系统集成服务器AI服务器采用CPU+加速芯片的架构形式,在进行模型的训练和推断时会更具有效率优势数据中心数据中心的计算服务可以承接AI算力需求数据中心是存储计算机及其相关硬件设备的物理位置,承载包括服务器、数据存储驱动器和网络设备等硬件。数据中心是承载AI算力的场
19、所。AIGC模型借助IDC的算力资源,在云端实现模型的训练智能算力核心产品及作用梳理全球AI加速芯片市场以英伟达占据头部地位,2022年其市场份额占比高达82%,国内企业在该领域竞争实力较弱;全球AI服务器市场方面,中国的浪潮信息是头部AI服务器厂商,占据了20.90%的份额;全球各国不断加大在算力领域的战略布局,当前美国、中国为全球算力的第一梯队国家,拥有较为强大的数据计算能力。2.2.2算力层三要素全球竞争格局资料来源:LIFTRINSIGHTSIDC中国信通院英伟达82%AWS8%Xilinx4%AMD2%其他4%美国34.00%中国33.00%欧洲14.00%日本5.00%其他14.0
20、0%浪潮信息20.90%戴尔13.00%HPE9.20%联想5.80%华为4.10%其他47.00%2022年全球AI加速芯片市场竞争格局(单位:%)全球AI服务器市场份额(单位:%)全球算力规模分布情况(单位:%)注:AI服务器市场规模为2021年度数据注:全球算力规模为2021年度数据,算力规模指执行计算任务的计算机资源的数量和性能AI芯片是AI算力的核心,其中训练芯片旨在训练出复杂的神经网络模型,而推理芯片旨在利用模型“推理”出各种结论,芯片领域整体以英伟达、Intel、AMD等海外企业为主导。2022年中国AI芯片份额中,训练芯片占比47.2%,推理芯片占比42.8%。2.2.3AI芯
21、片包括训练、推理芯片资料来源:甲子光年智库AI训练芯片代表性企业AI推理芯片代表性企业2022年中国AI芯片市场份额(单位:%)通过大量的数据输入,构建复杂的深度神经网络模型的一种AI芯片。需要较高的计算性能、能够处理海量的数据、具有一定的通用性,以便完成各种各样的学习任务,注重绝对的计算能力。训练芯片推理芯片推理芯片主要是指利用训练出来的模型加载数据,计算“推理”出各种结论的一种AI芯片,注重综合指标,侧重考虑单位能耗算力、时延、成本等性能。AI训练芯片47.20%AI推理芯片52.80%由于算力需求陡增,以CPU为主要算力的传统服务器难以负荷,巨量的数据使得AI服务器应运而生。2021年中
22、国AI服务器市场规模59.2亿美元,同比增长68.2%,市场份额占全球38%。全球AI服务器头部企业包括浪潮信息、戴尔、HPE等。2.2.4中国AI服务器市场规模占比38%资料来源:IDC156317.920212025E59.2123.420212026E2021-2025年全球AI服务器市场规模(单位:亿美元)2021-2026年中国AI服务器市场规模(单位:亿美元)要点阐述卡的数量普通的GPU服务器一般是单卡或者双卡,但AI服务器为了应对大量的计算,一般配置四块以上的GPU卡,甚至要搭建AI服务器集群P2P通讯普通GPU服务器一般只要求单卡性能,而在AI训练中,GPU卡间需要大量的参数通
23、信,模型越复杂,通信量越大,所以AI服务器出了要求单卡性能外,还要求多卡间的通讯性能特有设计由于AI服务器具有多个GPU卡,需要针对性的对系统结构、散热、拓扑等做专门的设计,才能满足AI服务器长期稳定运行的要求专用技术一台AI服务器会包含很多独有的技术,包括Purley平台更大内存带宽,NVlink提供更大的互联带宽,TensorCore提供更强的AI计算力。AI服务器除了搭载GPU作为加速卡,还可以配置FPGA、ASIC等加速芯片,利用CPU与加速芯片的组合可以满足高吞吐量互联的需求AI服务器特点梳理数据中心三大基础设施包括服务器、存储设备、网络设备,2022年H1,全球数据中心的服务器市场
24、规模达575.9亿美元,占三大设施总规模的72.60%。在云计算服务层面,2022年H1中国公有云整体市场规模165.8亿美元,其中阿里云为中国最大的公有云服务商,市场份额达33.5%。2.2.5中国云计算市场CR5达到73.7%资料来源:AWS官网IDC793.2575.9143.174.30.0300.0600.0900.0数据中心IT基础架构服务器外置存储数据中心网络设备2022H1全球数据中心基础架构市场规模(单位:亿美元)37.9%11.2%10.9%8.3%7.5%24.2%33.5%10.7%11.1%9.4%9.0%26.3%阿里云腾讯云华为云天翼云AWS其他2021-2022
25、年中国公有云市场份额(单位:%)注:内环为2021H1数据,外环为2022H1数据服务器72.60%外置存储18.04%数据中心网络设备9.37%2022H1全球数据中心基础架构份额(单位:%)AIGC涵盖的主流垂直赛道包括文本、图像、音频、视频、游戏、代码、生物技术等,中国市场参与者对文本、图像、音/视频的关注度更高,而美国AIGC产业生态更丰富,多项细分领域均有相关AIGC企业布局。2.3.1AIGC产业垂直赛道加速发展资料来源:LeonisCapitalSEQUOIA赛道赛道细分中国美国关键技术发展评价商业化潜力文本生成写作助手火龙果、WPS智能写作、香侬科技、秘塔Jasper/copy
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- ChatGPT 开启 AIGC 产业 生态 时代
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【Stan****Shan】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【Stan****Shan】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。