“AI+应用”投资框架.pdf
《“AI+应用”投资框架.pdf》由会员分享,可在线阅读,更多相关《“AI+应用”投资框架.pdf(46页珍藏版)》请在咨信网上搜索。
1、数字经济专题报告2023年4月16日中航证券研究所发布证券研究报告请务必阅读正文后的免责条款部分行业评级:增持六问六答:“AI+应用”投资框架中航证券社会服务团队分析师:裴伊凡证券执业证书号:S0640516120002邮箱:Q1:为什么ChatGPT爆火?答:颠覆传统内容生产的人工智能产品和交互体验。ChatGPT是一个基于语言模型GPT-3.5的聊天机器人,由美国人工智能公司OpenAI推出的一款对话式AI模型,具备上知天文下知地理,还能根据聊天的上下文进行互动的能力,能进行撰写邮件、视频脚本、文案、翻译、代码等任务,可以一定程度上替代搜索引擎,掀起内容生产的范式革命。Q2:GPT产品的演
2、绎路径?答:人工智能算法的迭代推动AIGC的发展,GPT系列属于神经AI,由2018年的GPT第1代迭代至今天的GPT-4。ChatGPT 核心技术包括自然语言生成能力的大模型 GPT-3.5以及训练这一模型的钥匙基于人工反馈的强化学习(RLHF);现在的ChatGPT已经可以接入GPT-4,具备了多模态生成能力,且表现出人类水平的推理能力。Q3:AIGC的底层技术驱动?答:创新生成算法+预训练模型+多模态技术。AIGC是一种利用人工智能技术自动生成内容的新型生产方式,呈现为上游基础层,即由预训练模型为基础搭建的AIGC技术基础设施层,如相关算法/模型研究结构;中间层模型,即垂直化、场景化、个
3、性化的模型和应用工具,在预训练的大模型基础上微调,实现在不同行业、垂直领域、功能场景的工业流水线式部署;下游应用层,即面向C端用户的文字、图片、音视频等内容生成服务等。Q4:AIGC如何重构内容生产力?答:AIGC模型有望成为自动化内容生产的“工厂”和“流水线”。AIGC可分为音频生成、文本生成、图像生成、视频生成及图像、视频、文本间的跨模态生成,细分场景众多,跨模态生成是未来重点发展趋势。随着底层大模型不断对外开放,行业生态日益完善,AIGC加速渗透到千行百业,根据量子位智库测算,2030年我国AIGC市场规模有望超万亿。Q5:看好“AI+”哪些应用场景?答:AIGC可覆盖诸多应用场景,或将
4、率先在传媒、电商、影视、娱乐等数字化程度高、内容需求丰富的行业取得重大创新发展。Q6:如何把握“AI+”时代的投资机遇?答:人工智能奇点将近,引爆AIGC商业变现。GPT产品的更迭标志着人工智能进入了新的发展阶段,AI模型的训练开发将加速推进AIGC商业化进程,掀起“用户-数据-效果”的飞轮效应。全年维度看,随着GPT逐渐从主题转向能够落地的阶段,有望在游戏、内容IP、电商、影视传媒等数字化程度高、内容需求丰富的行业率先商业化落地,赢家将展露头角。重点推荐:游戏(昆仑万维/世纪华通/汤姆猫/神州泰岳/恺英网络);内容IP(中文在线/中文传媒/视觉中国/果麦文化);电商(小商品城/华凯易佰/吉宏
5、股份/值得买);办公(万兴科技/金山办公/泛微网络);影视传媒(上海电影/光线传媒/人民网/新华网);广告营销(蓝色光标/三人行/风语筑);金融(同花顺);酒店(石基信息);数据要素(浙数文化/美亚柏科)。风险提示:行业监管风险、政策收紧的风险、技术发展不及预期的风险、内容生态建设不及预期的风险、变现不及预期风险、舆论炒作风险、市场竞争风险。核心观点oPtQnNuNxPqPtMsNsRsNsQ6MbPaQmOqQpNpMiNpPtPlOnMzR7NrQrNuOqMmPvPtPpO一、为什么ChatGPT爆火?二、GPT产品的演绎路径?目 录四、AIGC如何重构内容生产力?三、AIGC的底层技术
6、驱动?五、看好“AI+”哪些应用场景?六、如何把握“AI+”时代的投资机遇?资料来源:ChatGPT、百度百科,中航证券研究所整理1.1 ChatGPT:全新聊天机器人模型,上线两月用户破亿产品介绍:ChatGPT是一个基于语言模型GPT-3.5的聊天机器人,由美国人工智能公司OpenAI推出的一款对话式AI模型。它会通过连接大量的语料库来训练模型,这些语料库包含了真实世界中的对话,使得ChatGPT具备上知天文下知地理,还能根据聊天的上下文进行互动的能力,做到与真正人类几乎无异的聊天场景进行交流;ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。实际应用上,
7、ChatGPT等文本AI可能帮助文本创造类行业完成智能内容生成,并一定程度上替代搜索引擎。图表1:ChatGPT使用场景展示聊天代码诗词脚本文案翻译邮件ChatGPT对话式AI模型 语言理解 文本生成资料来源:OpenAI官网、ODAILy、央视财经、量子位、DemandSage、瑞银、智东西、Thuvienpc.,中航证券研究所整理1.2 ChatGPT:打造AI生态,商业能力凸显ChatGPT接入插件功能,打造AI生态帝国:美东时间3月23日,OpenAI宣布解除了ChatGPT无法联网的限制,以第三方插件为中介,使ChatGPT能访问其他网站并获取实时信息,还支持执行计算,第一批插件由E
8、xpedia、OpenTable、Shopify等公司提供,这些插件的具体功能包括推荐餐厅、制定出游计划、网上商店购物、企业办公、信息检索、语言教学等,涵盖日常生活的衣食住行各个方面。用户增速创历史记录:2022年11月30日,OpenAI发布了ChatGPT,5天注册用户数就超过100万。瑞士银行巨头瑞银集团的一份报告显示,在ChatGPT推出仅两个月后,月活用户已经破亿,成为史上用户增长速度最快的消费级应用程序。OpenAI预测,公司在2023年预计营收2亿美元,在2024年将达到10亿美元。商业变现模式:2023年2月2日,ChatGPT推出付费订阅版本,每月收取20美元(约合135RM
9、B),让订阅者获得比免费版本更稳定、更快服务,尝试GPT-4功能等。图表2:ChatGPT已接入插件展示图表3:ChatGPT更为史上最快活跃用户破亿的应用资料来源:中航证券研究所整理1.3 ChatGPT:重新定义搜索入口,开启海量应用场景ChatGPT的应用场景多元:ChatGPT潜在的市场规模是空前的,能够覆盖各个领域,包括自然语言处理、对话系统等六个方面。借助其强大的算力和算法分析,ChatGPT有望在教育、科研、游戏、新闻等多个领域发挥作用,并不断拓展其市场潜力。自然语言处理语义分析情感分析实体识别对话系统回答用户提出的问题提供相关信息帮助用户解决问题文本生成自动生成文章自动生成摘要
10、自动生成评论语言翻译+语言模型不同语言之间翻译单词、短语、句子预测信息检索类似于搜索引擎精准匹配内容自动化写作利用预设的模板、关键字或信息,帮助用户自动生成各种类型的文本。教育科研游戏新闻IT游戏营销.图表4:ChatGPT的应用举例对话式AI模型ChatGPT一、为什么ChatGPT爆火?二、GPT产品的演绎路径?目 录四、AIGC如何重构内容生产力?三、AIGC的底层技术驱动?五、看好“AI+”哪些应用场景?六、如何把握“AI+”时代的投资机遇?资料来源:中国信通院、吉林大学学报、Cornrell University、Attention Is All You Need,中航证券研究所整理
11、人工智能算法的迭代推动AIGC的发展:几十年来,AI领域持续探索,1940-1980s符号AI占主导,1980年后,统计AI与神经AI齐头并进,二者竞争发展至今,GPT系列属于神经AI。符号(Symbolic)AI:二十世纪80年代以前属于符号AI时代,开启了以知识建模算法、专家系统算法为代表AI早期发展阶段;统计(Statistical)AI:1985年的贝叶斯网络和1995年的SVM是20世纪机器学习发展的两大标志,但近年来,逐渐成为非主流的研究方向;神经(Neural)AI:经历了1980s-2012年神经网络、2012年后的深度学习两大阶段,深度神经网络和模型大小呈正相关,伴随着模型参
12、数量的增加,相对应深度神经网络的能力将大幅提升,Google Brain的Transformer和OpenAI的GPT系列都属于深度学习领域的代表作。2.1 GPT前世:符号AI-统计AI-神经AI将人类专家的知识和经验转化为计算机可以理解的形式,并利用AI技术来实现手写规则,简单粗暴只能处理非常少量数据知识建模、专家系统找到一些函数或参数分类固定量数据应用于数据分析、预测和分类等任务机器学习1970-1980s 1985至今1980s-2012 2017 2018像人脑一样学习开始尝试大量数据提前标注数据应用于计算机视觉、自然语言处理、语音识别等领域神经网络基于Transformer架构投喂
13、海量学习数据无监督训练方法通用文本预训练GPT系列全注意力机制关注文本序列数据整体注意力Transformer深度学习Neural AIStatistical AISymbolic AI神经人工智能图表5:ChatGPT的应用举例资料来源:Botpress、Walmart Global Tech、量子位、Life Architect,中航证券研究所整理GPT系列的迭代发展,造就了ChatGPT的诞生,初代的ChatGPT为GPT-3.5架构的产物,现仍在持续进化升级。GPT的定义及发展:GPT是一种基于Transformer架构的生成型预训练变换模型(Generative Pre-traine
14、d Transformer),用于解决NLP任务,可预测给定文本下一个单词的概率分布,以生成人类可理解的自然语言。从算法模式的版本上,已经迭代到GPT-4,其在某些方面的性能“可与人类相媲美”,并在大学入学和法律及医学等专业领域的许多模拟考试中优于其前身GPT-3.5。ChatGPT是已经经历了GPT-3.5到GPT-4的过渡,多模态功能推出,已成为深度学习领域的旷世佳作。从GPT-1到GPT-4,它的功能越来越全面,表现也越来越类人,与2018年第一版GPT1.17亿的参数相比,GPT-3.5拥有着1750亿的参数量,GPT-4预计参数量或破万亿,这极大程度提升了GPT的运行规模,让GPT开
15、始能完成一系列令人难以置信的任务。图表6:GPT系列产品升级情况2.1 GPT前世:算力爆发+算法迭代,数字内容创作技术达到新高度模型发布时间参数量Transformer模型层数解码器数预训练数据量技术介绍GPT2018.061.17亿1212约5GB无监督学习,从而对高质量标注数据的要求比较低,有比较强的泛化能力(在没有见过数据的zero-shot中表现更稳定)。GPT-22019.0215亿484840GB多任务学习,验证了通过海量数据和大量参数训练出来的词向量模型有泛化使用而不需要额外的训练。GPT-32020.071750亿969645TB海量参数,从而在无样本或极少量样本情况下完成下
16、游NLP任务,还可以完成数学加法、代码编写等任务。GPT-3.52022.11-使用RLHF(Reinforcement Learning from Human Feedback,基于人类反馈的强化学习)技术,可以进行连续对话。GPT-42023.3约10000亿-一种更加高效、准确和灵活的自然语言生成模型2.2 GPT今生:GPT4功能更强,同时能接受图像和文本输入ChatGPT 核心技术主要包括其具有良好的自然语言生成能力的大模型 GPT-3.5/4 以及训练这一模型的钥匙基于人工反馈的强化学习(RLHF)。GPT3.5建立在3.0的微调之上。据OpenAI披露,GPT-3已有1750亿参
17、数训练,GPT3.5/4在此基础上参数量可能再创新高。2022年4月至7月,OpenAI 开始对code-davinci-002模型进行Beta 测试,其可能是最强大的针对自然语言的GPT-3.5 变体,ChatGPT就是从code-davinci-002进行指令微调得到的。此后ChatGPT在2022 年11 月发布,使用的基于人类反馈的强化学习的版本指令微调模型。资料来源:中国指挥与控制协会、拆解追溯GPT-3.5 各项能力的起源,中航证券研究所整理图表7:大模型参数量迅速增长图表8:GPT3-GPT3.5的演变过程2.2 GPT今生:GPT4功能更强,同时能接受图像和文本输入GPT-3采
18、用无监督学习机制。优点在于无需人工进行数据标注,可以节省模型训练成本,模型泛化能力更强,经过少量样本训练,就可以看到准确度显著提升。加入人类反馈强化学习,GPT3.5/4获得对话能力。定义及优缺点:RLHF无需提前对训练数据进行标注,而只需要人工对模型输出的结果进行评分,虽然需要消耗一定的人力,但是模型结果会更加符合人类偏好;GPT-4训练模型:GPT-4的训练与GPT-3.5类似,包括SFT的预训练、基于RLHF的奖励模型训练和强化学习的PPO算法微调,不同的是使用了基于规则的奖励模型(RBRM),在PPO 微调期间向 GPT-4 提供额外的奖励信号。资料来源:Language Models
19、 are Few-Shot Learners、ChatGPT发展历程、原理、技术架构详解和产业未来,中航证券研究所整理图表9:训练模型由GPT-3的无监督学习,进化到GPT-3.5/4的人工反馈的强化学习资料来源:OpenAI官网、美信全球,中航证券研究所整理 3月15日,OpenAI发布了ChatGPT的最新“升级版本”GPT4模型,OpenAI在官网表示,GPT4是一个能接受图像和文本输入,并输出文本的多模态模型,是OpenAI在扩展深度学习方面的最新里程碑。GPT4的语言理解和生成能力均超过了ChatGPT,可以解答ChatGPT无法完成的问题,同时GPT4可以描述并理解图片。视觉识别能
20、力:GPT-4视觉识别能力突出文本理解和图像识别并行:GPT-4 可以接受文本和图像的提示,允许用户指定任何视觉或语言任务。在一系列域(包括包含文本和照片的文档、图表或屏幕截图)上,GPT-4 表现出与纯文本输入类似的功能。辨别幽默元素:除了能够识别图像内容,GPT-4还能辨别图像中存在的幽默元素,并做出相关解释。图表10:GPT-4视觉识别相关案例2.2 GPT今生:GPT4功能更强,同时能接受图像和文本输入用户:我可以用这些原料做什么?GPT-4:你可以用这些原料做很多选择!一些可能性包括:煎饼或华夫饼、可丽饼、法式吐司、煎蛋卷或菜肉馅煎蛋饼、乳蛋饼奶油冻或布丁、蛋糕或纸杯蛋糕松饼或面包、
21、饼干。这些只是几个例子,但可能性是无穷无尽的!用户:这张图有什么好笑的?一个面板一个面板地描述它。GPT-4:该图显示了带有三个面板的“Lightning Cable”适配器的包装。面板 1:带有 VGA 连接器(一种大的蓝色 15 针连接器,通常用于计算机显示器)的智能手机已插入其充电端口。面板 2:“Lightning Cable”适配器的包装,上面有 VGA 连接器的图片。面板 3:VGA 连接器特写,末端有一个小型闪电连接器(用于为 iPhone 和其他Apple 设备充电)。这张图片中的幽默来自将过时的大型 VGA 连接器插入小型现代智能手机充电端口的荒谬做法。资料来源:OpenAI
22、官网、Life Architect,中航证券研究所整理 语言能力:语言测试中GPT-4完胜其他大模型(Chinchilla,PALM)。英语测试中,GPT-4的准确率为85.5%,高出第二名15pct,取得碾压优势;除英语外的26种语言测试中,GPT-4在24种的准确率获胜,包括拉脱维亚语、威尔士语、斯瓦希里语等资源匮乏的语言,准确率集中在70%-85%,虽与其他模型相比优势突出,但未来仍存在较大提升空间。文字输入限制大幅提升,由基于GPT-3.5的ChatGPT的3000字限制提升至GPT-4的25000字,用户使用将开拓更多使用场景。2.2 GPT今生:GPT4功能更强,同时能接受图像和文
23、本输入图表12:GPT-4在英语测试中优于现有语言模型(准确率)25.0%67.0%69.3%70.1%85.5%随机猜测ChinchillaPALMGPT-3.5GPT-40 2 10 14 0 85%语种个数图表13:GPT-4在除英语外的26种语言测试中,准确率集中在70%-85%图表11:GPT-4文字输入限制提升至2.5万字7681536300024000GPT-1GPT-2GPT-3GPT-3.5GPT-4(8k/32k)字数限制(单位:字)资料来源:OpenAI官网、GPT-4 Technical Report,中航证券研究所整理2.2 GPT今生:表现出人类水平的推理能力 推理
24、能力:已表现出人类水平的性能,较GPT-3.5更进一步。学术和专业基准测试:在与其他模型的对比种,GPT-4除了在阅读理解和算术方面与最佳外部模型略有差距,其他的学术测试表现均获胜,基于日常的常规推理和小学多选科学题的准确度更是达到了95%以上,较外部模型高10pct以上。应试方面展现“恐怖实力”,GPT-4在模拟律师资格考试种进入前10%,SAT的读写&数学得分均在700分以上,GRE接近满分,在GLUE语言理解基准测试上取得了90.1的平均得分,某些性能已经与人类持平甚至超越。GPT-4GPT-4GPT-3.5GPT-3.5最佳外部语言模型最佳外部语言模型最佳外部模型最佳外部模型多项选择题
25、(57个学科)多项选择题(57个学科)86.4%70.0%70.7%75.2%基于日常的常规推理基于日常的常规推理95.3%85.5%84.2%85.6%小学多选科学题小学多选科学题96.3%85.2%85.2%86.5%围绕代词解析的常识推理围绕代词解析的常识推理87.5%81.6%85.1%85.1%Python代码任务Python代码任务67.0%48.1%26.2%65.8%阅读理解和算术阅读理解和算术80.9%64.1%70.8%88.4%小学数学题小学数学题92.0%57.1%58.8%87.3%图表14:GPT-4在学术和专业测试中优于现有模型图表15:GPT-4在各项模拟考试中
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- AI 应用 投资 框架
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【Stan****Shan】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【Stan****Shan】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。