AIGC专题报告:国内外大模型和AI应用梳理.pdf
《AIGC专题报告:国内外大模型和AI应用梳理.pdf》由会员分享,可在线阅读,更多相关《AIGC专题报告:国内外大模型和AI应用梳理.pdf(38页珍藏版)》请在咨信网上搜索。
1、0AIGC专题四:国内外大模型和AI应用梳理1请务必阅读正文之后的信息披露及法律声明。投资要点:关注大模型迭代带来的应用端投资机会 谷歌I/O上发布一系列生成式AI新进展,科技大厂竞争激烈。5月10日,谷歌I/O开发者大会上发布了包括:新一代语言模型PaLM 2、升级AI聊天机器人Bard、生成式AI实验版搜索引擎、Duet AI for Workspace等。AI艺人迅速出圈,多模态应用充分释放AI潜力,进一步推动商业化落地。1)AI歌手:截至5月14日,“AI孙燕姿”翻唱的发如雪已有超过150万点击量。2)AI网红Caryn Marjorie通过出售AI版本的Caryn,在过去一周的bet
2、a阶段创收7.16万美元,99%的用户是男性。从应用端看,昆仑万维,汤姆猫,中文在线,万兴科技,美图公司等同时兼具跨模态属性和海外业务的公司有望率先实现应用场景落地。昆仑万维:2023年02月公司宣布将与奇点智源合作,在今年内发布中国版类ChatGPT代码开源。旗下Opera浏览器计划接入ChatGPT,截至2022H1,Opera 全球平均MAU达 3.3 亿,美洲市场Q2活跃用户规模同比增长 22%;2022年,Opera GX 的MAU已超过2000万。汤姆猫:汤姆猫家族IP的交互属性与ChatGPT有着较高的契合度。公司团队已尝试应用 ChatGPT 模型进行 AI 交互产品开发的初步
3、测试,测试的模型目前通过 ChatGPT 海外接口接入。中文在线:海量优质数据资产为核心优势;与澜舟科技合力探索AIGC在内容生产方面的技术应用;AI技术已在内容创作、游戏元宇宙等领域落地。海外产品Chapters 和My Escape 已在做接入ChatGPT 测试,应用在故事创作生成、剧本生成及改编、用户与AI 交互聊天等方面。万兴科技:视频创意软件Wondershare Filmora接入OpenAI,Wondershare Filmora12新增功能包括AI抠图、AI音频拉伸和AI音频降噪。软件拥有超过1亿用户,覆盖超过150个国家及地区。3月31日正式面向出海营销领域全球首发AIGC
4、“真人”短视频出海营销神器“万兴播爆”(英文名:Wondershare Virbo),并宣布开启移动端公测。美图公司:AI绘画功能在旗下部分产品中上线,推动产品全球业绩增长。商业化探索包括,1)“AI绘画”免费生成3张绘画,支付2元可解锁五张新效果;2)“百变AI头像”,6.6元50张(5种风格10张);9.9元100张(10种风格10张),12.9元200张(20种风格10张)。随着技术的更新迭代,以及在应用端的持续探索,有望进一步创造新的消费和需求,有利于文娱内容和互联网行业。重点关注:万兴科技、昆仑万维、汤姆猫、中文在线、思美传媒、美图公司、百度集团-SW、商汤-W、腾讯控股、阅文集团;
5、皖新传媒、南方传媒、焦点科技、风语筑、利欧股份、神州泰岳、联络互动、捷成股份、掌阅科技、立方数科、元隆雅图等。风险提示:技术发展不及预期、监管政策变化、知识产权等相关问题。pOmPmMnPsRtQyQnPoOnNnMaQ9RaQnPoOsQnOlOmMrMfQmOrQ9PmNrNMYrNpQxNmOmM2请务必阅读正文之后的信息披露及法律声明。01 海外大模型发展02 国内大模型布局03 AI探索领先者04 投资建议&风险提示目录CONTENTS301海外大模型发展4请务必阅读正文之后的信息披露及法律声明。1.1 微软:投资OpenAI;将AI融入旗下应用模型Swin Transformer
6、v2.0NLP模型CV模型多模态模型Megatron-Turing NLGBEiT-3Transformer-Based参数量530B完成预测阅读理解常识推理自然语言推理词义消歧Transformer-Based参数量3BKosmos-1MLLM参数量1.6B自研OpenAIGPT-4Image GPTCLIPDALL E2应用办公软件Microsoft 365 Copilot浏览器Bing安全软件Microsoft Security Copilot虚拟人小冰营销Microsoft Viva SalesAI编程GitHub Copilot医疗临床笔记DAX Express数据处理Power B
7、IAzure AIAI应用服务API服务基础设施机器学习资料来源:Microsoft AI,Microsoft Azure,Microsoft Research,OpenAI官网等,德邦研究所5请务必阅读正文之后的信息披露及法律声明。1.2 谷歌:大模型基础Transformer的研发者深度学习框架TensorFlow通用AI架构Pathways模型PaLMViTPaLM-E底座NLP模型CV模型多模态模型对话模型 LaMDA应用照片参数量137B训练数据1.56T参数量最高22B将Transformer创新性地用于CV领域,训练方法类似BERTViViT一个模型做多件事多模态稀疏且高效PaL
8、M-540B+ViT-22B=PaLM-E 562B横跨语言、视觉和机器人领域Self-Attention机制对输入进行注意力权重的分配,即決定需要关注输入的哪部分,并对其分配有限的信息处理资源给重要的部分。编码器-解码器编码组件部分由一堆编码器构成;解码组件部分也是由相同数量(与编码器对应)的解码器组成的。TransformerYouTube助手Gmail广告搜索地图Pixel云Bard基于LaMDA的对话机器人模型准备数据构建机器学习模型部署模型实现MLOps2017-06Transformer问世2022-04提出PaLM2022-01LaMDA模型推出2023-03提出多模态模型PaL
9、M-E2020-10将Transformer运用到CV领域(ViT)2015-11开源了第二代机器学习平台TensorFlow2023-02对话机器人Bard发布2018-10Transformer的衍生模型BERT发布资料来源:TensorFlow,GitHub,Romal Thoppilan et al.LaMDA:Language Models for Dialog Applications 等模型相关论文,机器之心公众号等,德邦研究所6请务必阅读正文之后的信息披露及法律声明。1.3 Meta:大模型有望助力公司元宇宙发展模型底座深度学习框架PytorchNLP模型LLaMaCV模型SE
10、ER多模态模型data2vec基础大模型应用模型以较小参数量获得与GPT-3等模型相匹敌的效果LLaMa参数量最大65B用更大量优质训练数据获得更小模型参数训练数据约1.4T Tokens自监督学习模型参数量最高10B充分考虑上下文的自监督学习可以在文本、语音或图像上单独训练Make-A-VideoVisual Acoustic Matching资料来源:PyTorch,Make-a-Video Studio,Hugo Touvron et al.LLaMA:Open and Efficient Foundation Language Models 等模型相关论文,机器之心公众号等,德邦研究所
11、702国内大模型布局8请务必阅读正文之后的信息披露及法律声明。2.1 百度:文心大模型应用模型飞桨文心大模型产品工具开发套件面向开发者开发平台面向下游应用面向用户服务平台产品百度飞桨(Paddle-Paddle)-深度学习平台开源开放产业级市场份额国内第一支撑优化ERNIE 1.0中文效果超越BERT2019-03ERNIE 2.0中英文公开数据集全面领先竞品ERNIE 3.0首个百亿大模型解决语义与生成问题2019-072021-072021-12鹏程-百度文心全球首个知识增强千亿大模型2022-05VIMER系列文心行业大模型基于行业数据知识提升行业适配性文心大模型平均分基础大模型NLP大
12、模型语言理解和创作CV大模型图文OCR,视觉处理多模态大模型视觉、语音、地理语言任务大模型Unified TransformerERNIE搜索信息抽取代码生成PLATO 对话生物计算行业大模型通用文心大模型行业数据挖掘行业数据挖掘ERNIEKitNLP算法定制开发工具集BML智能文本全功能AI开发平台EasyDL-文本零门槛开发平台ERNIE-API大模型API服务文心百中大模型驱动产业级搜索系统文心一格AI艺术与创意辅助平台高质量文生图中国风画作一键部署引擎节省90%人力一站式调用平台面向初级&专家一站式定制平台零代码、可视化一站式定制平台面向有基础者源码级工具集面向专业工程师资料来源:AI
13、GC专题三:国内大模型概览,德邦研究所9请务必阅读正文之后的信息披露及法律声明。应用模型太极平台混元大模型-机器学习生态服务平台万亿级中文NLP模型CLUE1.1总排行榜第一VCR排行榜第一跨模态文字-视频检索AI大模型领域/任务/行业大模型CV大模型(HunYuan-VCR)NLP大模型(HunYuan-NLP)多模态大模型(HunYuan-tvr)模型训练AngelPTMGPU训练加速/4D并行/上线腾讯云模型推理及压缩HCF Toolkit轻量化/蒸馏/推理服务产品套件研发管线数据&模型管理一站式全流程广告搜索推荐游戏翻译对话数据底层微信QQ腾讯广告腾讯云游戏降本增效商业化潜力广告内容理
14、解行业特征挖掘文案创意生成产品业务多2022.04首次披露深入产业落地多元训练数据脱敏/清洗/平台化评测数据和标准共建迭代更快成本更低效果更好腾讯云智能数智人客服主播教师助手导游2.2 腾讯:混元大模型资料来源:AIGC专题三:国内大模型概览,德邦研究所10请务必阅读正文之后的信息披露及法律声明。统一底座多模态统一极致通用性统一学习范式OFA单模型可处理10余项任务升级可处理30余项跨模态任务模块化设计多架构统一多任务统一模块可拆拔高效高性能层次化结构易于迭代部署2021-012020-01M6-OFA2020-06正式启动项目基础模型三亿参数预训练模型百亿参数2021-03KDD2021千亿
15、参数训练损失37%效率90%全球最大的预训练模型10万亿参数训练速度提升7倍2021-102022-01通义-AliceMind正式发布通用模型开源深度语言模型CLUE1.1总排行榜第二NLP大模型(通义-AliceMind)多模态大模型(通义 M6-OFA)业界首个通用统一大模型CV大模型(通义-视觉)上层产业应用中层通用算法底层统一算法架构应用领先的跨模态能力提质增效AI医疗工业视觉智能农业城市大脑手机拍照AIOT3%-5%的应用效果提升电子商务图像搜索万物识别以文生图跨模态搜索交通自动驾驶文生视频VideoFusion17亿参数2.3 阿里:通义大模型资料来源:AIGC专题三:国内大模型
16、概览,德邦研究所11请务必阅读正文之后的信息披露及法律声明。开发平台L0基础大模型L2 细分场景模型-业界首个千亿中文大模型-最大中文语音模型之一科学计算大模型数据处理行业数据预训练底座模型应用L1行业大模型ModelArts Studio全周期AI工作流算法开发AI应用管理和部署模型训练创建部署最大拥有30亿参数判别+生成能力小样本学习性能领先盘古视觉大模型双塔结构独立性强,训练效率高下游任务中更好的精度盘古多模态大模型音频文本语义盘古语音语义大模型语音识别(ASR)语音合成(TTS)文本理解文本生成盘古气象大模型大体量高维度数据处理低成本高效率秒级天气预报MaaS图网络大模型无监督训练赋能
17、产业提质增效高泛化高精度高可解释性终身学习冷启动盘古工作流(快速交付:工作流,增量学习,小样本标注)L0 基础大模型使用授权费L1 行业大模型定制费语音语义舆情分析智能客服企业运营视觉智能巡检智能物流自动生成2.4 华为:盘古大模型资料来源:AIGC专题三:国内大模型概览,德邦研究所122018-11智源研究院成立2020-05智源创新中心成立2020-08智源算力大平台上线2020-10悟道大模型启动2021-09建立10个AI开放实验室2021-06“悟道2.0”发布2.5 智源&智谱:悟道大模型数据语料库数据工具FlagDataWuDaoCorpora200 GB 训练数据+72B汉字清
18、洗标注压缩分析ArabicText模型NLP大模型悟道文源多模态大模型悟道文澜生物大模型悟道溯认知大模型悟道汇悟道2.0参数量1.75万亿(10 x GPT3)训练数据中英双语共4.9TFlagBootAI应用微服务框架应用底座九鼎智算平台算力1000P每服务器400Gbps混合计算任务的调度方法支撑多家厂商AI加速芯片文生图悟道CogViewTransformer+VQ-VAE参数量4BFastMoE万亿模型的基石易用性强灵活性好训练速度快预训练框架 GLM参数量最高10B合作联合FlagStudioStable diffusion文生视频CogVideo以CogView2为基础参数量94亿
19、FlagEval大模型自动评测技术天演生命模型天道物理模型分子模拟模型等资料来源:智源研究院官网,新智元公众号,GitHub,Zhengxiao Du et al.GLM:General Language Model Pretraining with Autoregressive Blank Infilling等,德邦研究所13请务必阅读正文之后的信息披露及法律声明。应用智慧教育5万+学校1.3亿+师生智慧医疗1200+常见病5.5亿次AI辅诊建议人机交互50亿次调用次数多语种技术60+语种研发10+主流语种领跑讯飞开放平台下游应用为上游开发提供数据支撑数据50TB行业语料10亿+人次/天用户
20、交互的活跃应用框架X-Reasoner知识检索阅读理解依据问题和选项从科学知识库中找到最相关的知识索结合检索出的知识、问题和选项进行推理,给出最终答案OpenBookQATOP2弥补大模型记忆模糊模型教育医疗行业大模型人机交互办公翻译工业基础大模型通用认知智能大模型算法研发及高效训练底座平台“N”“1”+NLP模型NLU任务为主多为BERT-based模型图像识别CV模型文字识别人脸识别语音识别语音模型语音合成语音扩展软硬件开发为一体2.6 科大讯飞:通用认知智能大模型赋能产业资料来源:科大讯飞公告,讯飞开放平台官网,科大讯飞集团公众号等,德邦研究所14请务必阅读正文之后的信息披露及法律声明。
21、商汤AI大装置商汤人工智能计算中心(AIDC)OpenMMLab人工智能算法开源体系OpenGVLab通用视觉开源平台OpenDILab开源决策智能平台应用自动驾驶智慧城市与商业元宇宙Al for Science日日新大模型NLP-商量(1800亿参数)CV(320参数)多模态-书生2.5(30亿参数)2.7 商汤:SenseCore商汤大装置&日日新大模型资料来源:OpenMMLab官网,OpenGVLab官网,OpenDILab官网,商汤科技SenseTime 公众号,商汤智能产业研究院公众号,商汤科技技术交流日等,德邦研究所大算力5000+P国产化算力500+P当前算力可支持20个千亿参
22、数模型同时训练MaaS自动化数据标注智能标注效率提升百倍大模型推理部署大模型推理效率提升100%大模型并行训练单集群4000卡-5000亿稠密参数模型大模型增量训练增量微调成本降低90%开发效率开放模型及AI开发工具链“大医”支持导诊、问诊、健康咨询、辅助决策等多场景多轮会话AI代码助手“提升编程效率,简化开发流程。超十亿参数文生图模型+LoRA基于NeRF的3D内容生成平台琼宇:偏向室外场景格物:偏向室内场景以数字人物生成技术为核心,基于商汤多种AI生成能力打造的应用平台,包括文本生成、语音生成、动作生成、图片生成、NeRF等。1503AI探索领先者16基础模型GPT-3应用模型SkyTex
23、tSkyCodeSkyPaintSkyChat文章续写对话风格生成中英翻译推理诗词对联聊天机器人问答第三人称转述中英双语文生图Stable DiffusionCLIPSkyMusic3.1 昆仑万维:致力研究国产开源大模型奇点智源奇点智源致力于实现通用人工智能,目前聚焦于大规模预训练语言模型及开发者API的研发工作1、自然语言大型预训练模型:目前完成千亿级参数的模型训练2、开发者API:开放了百亿级参数模型的API供申请使用模型特色:1、小样本学习。语言模型具备小样本学习的能力,可以通过提示工程实现小样本学习,避免繁琐的微调的工作2、知识问答。模型从海量的公开数据中获取了大量的知识,具备出色回
24、答问题的能力3、文本生成。模型从海量文本中学习到了语言生成的规律,可以根据提示进行文本的生成2020.10开始布局AIGC领域,发起昆仑天工项目,组建了近百人的研发团队,研究通用人工智能(AGI)。2021.08昆仑天工开始研发基于自有大文本模型的对话机器人,并且迅速刷新国内技术指标。2022.12正式发布开源项目昆仑天工,获得了大量的好评,目前已经有中国移动咪咕等公司的测试使用。2023.02昆仑万维宣布,将与奇点智源合作,在今年内发布中国版类ChatGPT代码开源,防止大公司技术垄断。2022.11公司与奇点智源就ChatGPT、图像视频生成等AIGC技术领域达成全面技术战略合作,启动Ch
25、atGPT的联合开发。资料来源:昆仑万维官网,昆仑万维公告,奇点智源官网,财联社,36氪,IT之家等,德邦研究所173.1 昆仑万维:Opera接入ChatGPT,StarMaker探索AI作曲2016年收购Opera浏览器业务2018年Opera在美国纳斯达克挂牌上市2023年2月Opera浏览器与Open AI团队达成合作,正式接入ChatGPT功能。2022年StarX MusicX Lab 完成首批五首完全由AI 作曲的歌曲发布2021年全资子公司昆仑集团购买Star Group的60.65%股权2022年9月StarMaker VR正式上线Oculus APP Lab和Steam等平
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- AIGC 专题报告 国内外 模型 AI 应用 梳理
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【Stan****Shan】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【Stan****Shan】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。