2023中国AIGC商业潜力研究报告.pdf
《2023中国AIGC商业潜力研究报告.pdf》由会员分享,可在线阅读,更多相关《2023中国AIGC商业潜力研究报告.pdf(54页珍藏版)》请在咨信网上搜索。
1、2023中国AIGC商业潜力研究报告亿欧智库-李先生(203972)亿欧智库-李先生(203972)亿欧智库-李先生(203972)亿欧智库-李先生(203972)亿欧智库-李先生(203972)亿欧智库-李先生(203972)亿欧智库-李先生(203972)亿欧智库-李先生(203972)亿欧智库-李先生(203972)目录C O N T E N T SAIGC概述1.1人工智能概念梳理1.2生成式人工智能因素分析1.3中外人工智能对比1.4AIGC原子能力变化01AIGC生态底座价值链分析2.1 AIGC生态底座价值拆解2.2 算力价值分析2.3 数据价值分析2.4 算法价值分析2.5 A
2、IGC生态服务商总结2.6 大模型生态底座产业图谱02AIGC原子能力商业潜力分析3.1 AIGC原子能力覆盖行业梳理3.2 AIGC基础模态原子能力分析3.3 AIGC多模态原子能力分析3.4 AIGC原子能力商业潜力评估总结3.5 原子能力产业图谱3.6 优秀企业案例03AIGC商业潜力规模预判4.1 AIGC商业潜力边界模型4.2 边界突破趋势4.3 AIGC未来商业潜力规模预测04亿欧智库-李先生(203972)亿欧智库-李先生(203972)亿欧智库-李先生(203972)亿欧智库-李先生(203972)亿欧智库-李先生(203972)亿欧智库-李先生(203972)亿欧智库-李先生
3、(203972)亿欧智库-李先生(203972)亿欧智库-李先生(203972)6资料来源:公开资料、亿欧智库整理历次AI寒潮沉淀的技术,终在算法、算力、数据三者共振的情况下诞生出大模型u 在1956年的达特茅斯会议上,“人工智能”的概念被首次提出,六十多年以来,历经逻辑推理、专家系统、深度学习等技术的发展,人工智能也经历了数次沉浮,有如日中天的发展时期,也有因技术不足热度退去后的寒潮。而每一次寒潮后,也会经历技术的蛰伏发展,为人工智能带来里程碑式的进步。亿欧智库:AI发展的2.5次寒潮1970年代第1次寒潮当时主要研究集中在逻辑抽象、逻辑运算和逻辑表达等方面,出现许多逻辑证明相关的逻辑程序语
4、言,如著名的Prolog。但是当时研发出来的人工智能系统缺乏实用性,几乎无法解决任何实际问题,无法达到人们期望,政府逐步减少投资,高潮衰落,进入第一次寒冬。1990年代第2次寒潮出现神经系统与专家网络。神经系统在解决复杂问题上能力不足,且训练时需要的数据量较大。专家系统的实用性只局限于特定领域,同时升级难度和维护成本都居高不下。日本推出第五代计算机计划抛弃冯诺依曼架构,采用新的并行架构,采用新的存储器,新的编程语言,以及能处理自然语言、图像的新操作方式,但局限于理论和计算机算力,以及知识完全依靠人工输入和维护,最终宣告项目失败。2010年代第2.5次寒潮存在计算能力不足的瓶颈,以深度学习为驱动
5、力的人工智能技术更多仍停在分类、聚类和预测阶段,能够完全复制人类思维方式的强人工智能依旧发展缓慢。互联网公司对AI的开发便捷程度与先进程度超过许多AI公司,因为互联网可以使用自己的不公开的内部数据进行训练。感知器l神经网络的第一个里程碑算法l可以解决简单的线性分类问题l为后期更复杂的算法奠定基础Hopfield神经网络l一种具有循环、递归特性,结合存储和二元系统的神经网络l提供了模拟人类记忆的模型l在机器学习、联想记忆、模式识别、优化计算等方面有着广泛应用多层前向BP网络l非线性映射能力:适合于求解内部机制复杂的问题l自学习和自适应能力:训练时能自适应的将学习内容记忆于网络的权值中l容错能力:
6、局部神经元受到破坏后对全局的训练结果不会造成很大的影响深度学习l弥补了传统BP神经网络的缺陷,利于可视化和分类,识别精度上升,训练难度下降l无需人工提取规则特征,机器通过海量数据,即可自动实现规则的特征提取,有机器本身完成最复杂的算法归纳芯片&服务器&数据l计算机硬件设施飞速发展,GPU、TPU等新一代芯片及FPGA异构计算服务器,提供强大算力l互联网、物联网发展迅猛,为人工智能提供了规模空前的训练数据,数据可获得性大幅提升ChatGPT出现亿欧智库:AI技术发展里程碑共振:振动频率相同的物体、当一个发生振动时、引起其他物体振动亿欧智库-李先生(203972)亿欧智库-李先生(203972)亿
7、欧智库-李先生(203972)亿欧智库-李先生(203972)亿欧智库-李先生(203972)亿欧智库-李先生(203972)亿欧智库-李先生(203972)亿欧智库-李先生(203972)亿欧智库-李先生(203972)7资料来源:arXiv、亿欧智库整理预学习引发AIGC技术质变u 预学习的出现解决了过去生成式大模型的痛点,但预学习本身存在模型尺寸、小样本数量、微调能力的不可能三角,解决方法也不尽相同:对于极大模型,使用知识蒸馏;对于少样本学习能力,进行数据增强;对于监督训练表现欠佳的模型,进行提示学习。u 以GPT为例,在目前阶段,厂商通常的做法是扩大模型尺寸。亿欧智库:预学习大模型引发
8、AIGC技术质变亿欧智库:预学习之不可能三角与对应解决方案预学习大模型的出现解决了过去各类生成式模型使用门槛高、训练成本高、内容生成简单和质量偏低的痛点,满足真实内容消费场景中的灵活多变、高精度、高质量等需求。预学习思路:将大量低成本收集的训练数据集中,学习其中的共性 然后将其中的共性移植到特定任务的模型中,再进行微调,去学习该特定任务的特性部分合理的模型尺寸(小于10亿参数量)先进的小样本先进微调能力训练任务共性学习特性学习微调特定任务 知识蒸馏 大模型是网络的集合,拥有良好的性能和泛化能力,小模型网络规模较小,表达能力有限 降低模型时延,压缩网络参数:利用大模型学习的知识指导小模型训练,使
9、得小模型与大模型性能相当,而参数数量可大幅降低,从而实现模型压缩与加速 提升模型精度:训练一个更高精度的大模型,用大模型对原模型知识蒸馏,获得更高精度 数据增强 缺少足够的标记数时,可以生成伪标签和伪数据实例,利用这些额外数据,模型能够进行有效的监督训练。提示学习 利用离散提示(离散文本模板)或连续提示(连续参数嵌入)进行微调,在微调期间仅更新离散提示或连续提示中的一种,提高准确度亿欧智库-李先生(203972)亿欧智库-李先生(203972)亿欧智库-李先生(203972)亿欧智库-李先生(203972)亿欧智库-李先生(203972)亿欧智库-李先生(203972)亿欧智库-李先生(203
10、972)亿欧智库-李先生(203972)亿欧智库-李先生(203972)8资料来源:公开资料、亿欧智库整理AI大模型底座驱动AIGC概念落地u 在AIGC概念实际落地的过程中,只有基础大模型与通用技术是远远不够的,还需要能与场景融合匹配,更需要支持应用落地的工具平台和开放包容的创新生态,三者协同优化,加速AIGC落地。u 在全应用流程中,主要通过大量的无标注文本进行共性学习,获得预训练大模型,此后再根据应用场景特征进行微调,更好与项目任务适配。亿欧智库:AI大模型驱动AIGC概念落地工具平台生态大模型特性学习共性学习通过海量无标注文本和自监督学习,进行共性学习,得到预训练大模型通过任务相关少量
11、数据进行精调,进行特性学习通过工具平台支撑生态应用落地通过学习海量无标注文本与数据进行预训练和自学习监督,提高AI大模型在前期学习的范围与深度,提升模型水平,赋能大模型在后续具体任务中的应用共性学习在共性学习“预训练”的基础上,根据具体应用场景的特性,使用少量数据进行微调,高精度地完成任务特性学习 大模型:在技术发展和产业应用方面占据重要地位,主要包含基础、任务和行业大模型,三层大模型相互促进,共同支撑产业转化与发展 工具平台:推出了基于大模型的AI开发平台、工具套件、大模型API等,让更多开发者能够低门槛地将大模型应用于自己的业务中,从而助力开发者效率提升 生态:释放大模型的潜力,推动AIG
12、C技术的广泛应用和产业化 大模型支撑生态发展,而生态反哺大模型进行技术进步模型+工具平台+生态模式需要协同优化,以更好帮助AIGC在不同领域快速落地亿欧智库-李先生(203972)亿欧智库-李先生(203972)亿欧智库-李先生(203972)亿欧智库-李先生(203972)亿欧智库-李先生(203972)亿欧智库-李先生(203972)亿欧智库-李先生(203972)亿欧智库-李先生(203972)亿欧智库-李先生(203972)9资料来源:CSDN、中信建投证券、亿欧智库整理多模态打破多种信息之间的边界并生成质量稳定的内容,提升AIGC内容多样性u 相比于信息模态单一的单模态模型,多模态模
13、型可以同时处理更多模态的信息并将它们相互转化。u 现今多模态模型以图文多模块为主。Transformer虽受制于单模态但其权重共享适用于多模态;ViT模型处理输入图片,使得Transformer可用,从而打破NLP和CV间屏障;BEiT将生成式预训练从自然语言处理迁移到了计算机视觉;扩散模型多用于文本图像生成。亿欧智库:从单模态转向多模态亿欧智库:多模态提升AIGC内容多样性文本声音图像视频信号多模态多模态信息单模态模型:信息来源或形式单一,例如文字、图片、音频等信息媒介和红外、雷达等传感器。因为输入数据的长度有限制,所以基于Transformer的大模型只能基于单一文本模态,不能将其泛化能力
14、迁移到其他如图片、音频的模态上,但其拥有的权重共享理念适用于多模态模型,权重共享指部分模块共享权重参数 在图片和文字的多模态中,图片训练得到的权重参数可以直接用于训练文本,结果有效且无需进一步微调Transformer权重共享适用于多模态,但存在单模态局限 扩散模型包括正向扩散与反向扩散两个过程,填补文本图像生成中的技术空白扩散模型帮助生成文本图像利用ViT解除输入限制,进行特征提取图片分割TransformerEncoderClassViT模型对图片进行线性映射处理,变成Transformer可用的输入,打破自然语言处理和计算机视觉之间的壁垒Position EmbeddingBEiT模型将
15、生成式预训练从NLP迁移到CV图片分割MMMBlockwiseMaskingBEiTEncoderPatch&Position EmbeddingDecoderBEiT将BERT中的掩码语言学习方法应用到图像领域,将生成式预训练从自然语言处理NLP迁移到了计算机视觉CV。BEiT解决了计算机视觉上生成式预训练遇到的问题,解决方法:使用ViT结构处理图像信息亿欧智库-李先生(203972)亿欧智库-李先生(203972)亿欧智库-李先生(203972)亿欧智库-李先生(203972)亿欧智库-李先生(203972)亿欧智库-李先生(203972)亿欧智库-李先生(203972)亿欧智库-李先生(
16、203972)亿欧智库-李先生(203972)10资料来源:CSDN、中信建投证券、亿欧智库整理多模态信息持续融合增加技术多样性,拓宽场景u 多模态在视频分类、情感分析、语音识别等领域都得到了广泛应用,涉及图像、视频、语音、文本等融合内容,未来还将进入交互、感知、内容等更多应用场景。亿欧智库:多模态融合架构用户发出模糊指令用户信息环境信息声纹信息声音中的文字声音中的情感肢体动作人脸信息面部表情嘴唇的动作相对位置环境信息服务1生物识别服务2用户意图感知多模态自然语言理解多模态情感服务3服务呈现音视频输出IoT控制应用场景生成内容跨模态搜索图像、文本图像标注图像、文本转移学习图像、文本跨模态嵌入图
17、像、视频、文本视频分类语音、视频、文本事件检测语音、视频、文本情绪分析语音、视频、文本情感分析语音、视频、文本语音识别语音、视频视觉问答图像、文本图像标注图像、文本图像合成图像、文本视频解码视频、文本亿欧智库-李先生(203972)亿欧智库-李先生(203972)亿欧智库-李先生(203972)亿欧智库-李先生(203972)亿欧智库-李先生(203972)亿欧智库-李先生(203972)亿欧智库-李先生(203972)亿欧智库-李先生(203972)亿欧智库-李先生(203972)11u 在决策式AI方面,中国已经处在第一梯队,中国是发表AI论文最多的国家,且近10年来占比逐年增加。u 而在
18、生成式AI方面,与国外还存在参数量的差距,背后隐含着算力资源、数据质量等基础要素的不足的原因。资料来源:中国信通院、Leonis Capital行研、亿欧智库整理中国决策式AI已达到世界一流水平,而生成式AI还与国外存在基础要素的不足亿欧智库:中国的决策式AI已经达到世界领先水平亿欧智库:中国生成式AI参数量与国外有一定差距中国是发表AI相关论文最多的国家,近十年发表9万余篇,占近10年全球AI论文发表总量的22.7%。在2021年AI受关注论文居前十的企业中,中国企业占到4家。技术2023年,中国的“灯塔工厂”增至50座,占比超过总数的1/3以上,持续排名全球第一。此项目由达沃斯世界经济论坛
19、与管理咨询公司麦肯锡合作开展遴选,“灯塔工厂”也被誉为“世界上最先进的工厂”,具有榜样意义的“数字化制造”和“全球化4.0”示范者,代表当今全球制造业领域智能制造和数字化最高水平。应用2018年1月2018年6月2019年1月2019年6月2020年1月2020年6月2021年1月2021年6月2022年1月2022年6月ELMo940万GPT1.17亿BERT1.1亿ERNIE1.02亿GPT-215亿Meena26亿RoBERTA3.55亿KEPLER1.1亿Generative BST94亿Megatron-LM83亿ERNIE100亿DeBERTa15亿Megatron-Turing
20、NLG5300亿Minerva5400亿GPT-31750亿Chinchilla700亿GLM1300亿10亿100亿1000亿10000亿参数量中国开发者其它开发者中国的生成式AI处于发展的初期,底层技术和国外还有较大的差距。国外芯片龙头公司的断供及次品供应使得中国生成式AI的基础硬件提供不了足够算力。技术虽然国内众多厂商开始布局AIGC,但是目前的商业模式还不成熟。技术层面的不足也限制了应用端的发展。应用020406080100120140国家电网英伟达亚马逊华为技术阿里巴巴集团腾讯控股MetaIBM微软Alphabet2021年受关注论文篇数居前10的企业Fast follower Fi
21、rst in classCopy to China Copy from China中国开发者其它开发者中外大模型参数量对比亿欧智库-李先生(203972)亿欧智库-李先生(203972)亿欧智库-李先生(203972)亿欧智库-李先生(203972)亿欧智库-李先生(203972)亿欧智库-李先生(203972)亿欧智库-李先生(203972)亿欧智库-李先生(203972)亿欧智库-李先生(203972)12资料来源:公开资料、亿欧智库整理AIGC原子能力动态变化曲线u AIGC的原子能力随着时间的变化,内容呈现复杂化、多维化的特征,基础模态原子能力向多模态转变,表明目前AIGC商业应用的尝
22、试正下沉至长尾场景,大模型的泛化能力、实时性、强推理与共情能力正在不断渗透为虚拟人、聊天机器人、知识图谱、合成数据、AIGS进行多维度的赋能,推动通用人工智能时代到来。原子能力:指支撑各类应用、各类场景的要素技术;以生成内容为例,目前大部分应用和场景都需要AIGC的文本、代码输出、图像生成音视频合成的原子能力原子能力维度(内容复杂度)复杂度根据单位内容的token大小时间亿欧智库-李先生(203972)亿欧智库-李先生(203972)亿欧智库-李先生(203972)亿欧智库-李先生(203972)亿欧智库-李先生(203972)亿欧智库-李先生(203972)亿欧智库-李先生(203972)亿
23、欧智库-李先生(203972)亿欧智库-李先生(203972)目录C O N T E N T SAIGC概述1.1人工智能概念梳理1.2生成式人工智能因素分析1.3中外人工智能对比1.4AIGC原子能力变化01AIGC生态底座价值链分析2.1 AIGC生态底座价值拆解2.2 算力价值分析2.3 数据价值分析2.4 算法价值分析2.5 AIGC生态服务商总结2.6 大模型生态底座产业图谱02AIGC原子能力商业潜力分析3.1 AIGC原子能力覆盖行业梳理3.2 AIGC基础模态原子能力分析3.3 AIGC多模态原子能力分析3.4 AIGC原子能力商业潜力评估总结3.5 原子能力产业图谱3.6 优
24、秀企业案例03AIGC商业潜力规模预判4.1 AIGC商业潜力边界模型4.2 边界突破趋势4.3 AIGC未来商业潜力规模预测04亿欧智库-李先生(203972)亿欧智库-李先生(203972)亿欧智库-李先生(203972)亿欧智库-李先生(203972)亿欧智库-李先生(203972)亿欧智库-李先生(203972)亿欧智库-李先生(203972)亿欧智库-李先生(203972)亿欧智库-李先生(203972)14资料来源:专家访谈、国海证券、公开资料、亿欧智库整理短期内算力成本占据生态圈核心,算法与配套的数据价值在远期凸显u AIGC大模型的训练、微调和运营需要大量的计算资源支撑,目前算
25、力占据AIGC生态圈65%成本,数据及算法占据剩下35%的成本。u 从短期看,一头独大的格局不会发生太大变化,大模型新入局玩家的算法训练和老玩家大模型的微调、迭代将会持续刺激算力成本上扬。u 从长期看,有望出现三头并进格局,模型算法的迭代会成为AIGC通往AGI的解决方案,随着应用不断下沉长尾的专用场景,专用算法及场景沉淀的数据将会成为AIGC体验的核心,另外,合成数据及减少算力依赖的框架算法成熟将会加大缓和算力紧张的缺口。亿欧智库:AIGC生态底座价值链AI芯片65%内存17%硬盘4%其他14%数据23%算力65%算法12%数据收集35%数据标注45%数据清洗/存储20%人力算力65%算力层
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2023 中国 AIGC 商业 潜力 研究 报告
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【Stan****Shan】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【Stan****Shan】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。