2023年AI现状.pdf
《2023年AI现状.pdf》由会员分享,可在线阅读,更多相关《2023年AI现状.pdf(154页珍藏版)》请在咨信网上搜索。
1、State of AI Report2023智能现状报告2023年10月Air Street Capital前言人工智能(AI)是科学和工程的多学科领域,其目标是创造智能机器。我们相信,在日益数字化、数据驱动的世界中,人工智能将成为技术进步的力量倍增器。这是因为今天我们周围的一切,从文化到消费品,都是智能的产物。Air Street已连续第六年发布人工智能现状报告。我们把这份报告视为所见过的最有趣的事情的汇编,目的是引发一场关于人工智能现状及其对未来影响的知情对话。报告中考虑了以下主要方面:l行业:人工智能的商业应用领域及其商业影响。l研究:技术突破及其能力。l政治:人工智能的监管,其经济影响
2、和人工智能地缘政治的演变。l安全:识别和减轻高性能未来人工智能系统可能给我们带来的灾难性风险。l预测:我们认为未来12个月会发生什么,以及保持我们诚实度的2022年绩效评估。由 Air Street Capital 团队制作。腾讯科技(微信公众号:qqtech)进行了整理汉化,内容有删减。关注腾讯科技微信公众号(qqtech),回复“AI2023”可免费获取本报告PDF版。stateof.ai 2023#stateofai|2划重点行业研究政策|安全|预测关于行业(第6页-第57页)-随着各国政府、初创公司、大型科技公司和研究人员对GPU的贪婪需求,英伟达迈入了1万亿美元的市值俱乐部。-出口管
3、制限制了对中国的先进芯片销售,但主要芯片供应商开发出不受出口管制的替代品。-在ChatGPT的带领下,GenAI应用在图像、视频、编码、语音或CoPilot方面都取得了突破性的一年,推动了180亿美元的风险投资和企业投资。研究(第58页-第115页)-GPT-4落地并展示了专有和次佳开源替代方案之间的能力鸿沟,同时也验证了从人类反馈中强化学习的力量。-用更小的模型、更好的数据集、更长的上下文来克隆或击败专有模型性能的努力越来越多由LLaMa-1/2提供支持。-目前还不清楚人类生成的数据可以维持人工智能扩展趋势多久(有人估计,到2025年,大型语言模型将耗尽数据),以及添加合成数据的影响是什么。
4、锁定在企业中的视频和数据可能是下一个目标。-大型语言模型和扩散模型通过为分子生物学和药物发现带来新的突破,继续为生命科学领域提供礼物。-多模态成为新的前沿,所有参与方的兴奋感大幅增长。政治(第116页-第127页)-全球已经划分出明确的监管阵营,但全球治理的进展仍然缓慢。最大的人工智能实验室正在填补这一真空。-芯片战争有增无减。-人工智能预计将影响一系列敏感领域,包括选举和就业,但尚未看到显著影响。安全(第128页-第145页)-生存风险辩论首次成为主流,并显著加剧。-很多高性能的机型很容易越狱。为了补救RLHF的挑战,研究人员正在探索替代方案,例如自我校准和根据人类偏好进行预训练。-随着能力
5、的提高,对SOTA模型进行一致的评估变得越来越困难。只有共鸣是不够的。划重点stateof.ai 2023#stateofai|3划重点行业研究政策|安全|预测关于回顾Air Street 2022年的预测stateof.ai 2023#stateofai|4划重点行业研究政策|安全|预测关于我们对2022年的预测结果stateof.ai 2023#stateofai|5划重点行业研究政策|安全|预测关于1DeepMind训练一个具有10B参数的RL模型,比Gato大10倍。到目前为止,还没有公开披露过这方面的研究。2英伟达宣布与一家专注于AGI的组织建立战略关系。英伟达没有建立这种关系,而是
6、在许多专注于AGI的组织中加大了投资活动,包括Cohere、In Fliection AI和Adept。3SOTA语言模型在比Chinchilla多10倍的数据点上训练,证明了数据集缩放与参数缩放。我们不确定,但据报道,GPT-4是在13T tokens上训练的,而Chinchilla是14T tokens上训练的。Meta的Llama-2是在2T tokens上训练的。4到2023年9月,生成音频工具的出现吸引了超过10万名开发人员。大型科技企业GAFAM向通用人工智能或开源人工智能公司投资超过10亿美元。自推出以来,ElevenLabs和Resemble.ai都声称拥有超过100万用户。2
7、023年1月,微软又向OpenAI投资了100亿美元。5面对英伟达的主导地位,半导体初创公司面临现实,一家明星初创公司破产或以低于其最近估值50%的价格被收购。有降价,但没有大规模停工或低迷的收购。6监管生物安全实验室(BSL)等通用人工智能实验室的提案得到了当选的英国、美国或欧盟政治家的支持。要求监管的呼声明显提高,但对BSL的支持还没有。7随着我们意识到让人工智能能力领先于安全所面临的风险,明年将有超过1亿美元投资于专门的人工智能校准组织。人工智能研究和安全公司Anthropic在2023年9月筹集了高达40亿美元的资金。8一家主要的用户生成内容网站(如Reddit)与一家人工智能模型(如
8、OpenAI)初创公司协商商业合作,以便对其用户生成内容语料库进行培训。OpenAI已经获得了访问其他Shutterstock训练数据(图像、视频和音乐库以及相关元数据)的6年许可。第一章:行业stateof.ai 2023#stateofai|6划重点行业研究政策|安全|预测关于#stateofai|7划重点行业研究政策|安全|预测关于GPU需求刺激英伟达营收井喷,市值进入万亿美元俱乐部英伟达2023年第二季度营收达到创纪录的103.2亿美元,比第一季度增长141%,比一年前增长171%。尽管该公司2022年营收达到270亿美元,比2021年增长61.4%,但市场对该股曾持悲观态度。英伟达现
9、在的市值为1万亿美元,比10年前的85亿美元高出116倍。stateof.ai 2023比Coachella卖得更快:从新贵基础设施提供商手中抢购GPU#stateofai|8CoreWeave和Lambda是两家选定的英伟达合作伙伴,负责构建和运行GPU数据中心,它们总共有数万颗GPU。Lambda在其点播云中提供了价值9位数美元的H100s,并在一个多小时内销售一空。CoreWeave是市场上最大的GPU运营商之一。该公司今年年底的建造时间表已经排满,正在签订2024年第一季度的合同。划重点行业研究政策|安全|预测关于#stateofai|9划重点行业研究政策|安全|预测关于私营公司正在支
10、持英伟达GPU,并将其作为竞争优势#stateofai|10划重点行业研究政策|安全|预测关于算力是海湾国家的新石油?据称,沙特阿拉伯阿卜杜拉国王科技大学(Kaust)购买了3000多颗H100s来建造超级计算机ShaheenIII。这台超级计算机将于2023年底投入运行。与此同时,阿联酋马斯达尔市的技术创新研究所开发了Falcon LLM,据说也从英伟达采购计算资源。最后,总部位于阿布扎比的G42与总部位于美国的Cerebras达成协议,购买该公司价值高达9亿美元的晶圆级计算系统,并建造9台互联的人工智能超级计算机。未来可能会有更多的支出本报告由腾讯科技整理汉化,内容有删减。关注腾讯科技微信
11、公众号(qqtech),回复“AI2023”免费获取PDF版。stateof.ai 2023计算指数:英伟达 A100集群#stateofai|11自去年以来,大规模英伟达 A100 GPU集群的数量一直在增长,特别是特斯拉和Stability,以及Hugging Face的新集群。划重点行业研究政策|安全|预测关于stateof.ai 2023计算指数:英伟达H100集群#stateofai|12现在还为时尚早,但私营和上市公司正在宣布新的H100基础设施,用于大规模模型培训。截至10月中旬,谷歌和Inflection尚未全面发展,我们知道其他公司包括OpenAI、Anthropic、Met
12、a、Character.ai、Adept、Imbue等都有很大的能力。我们预计不久会有更多的产品上线。划重点行业研究政策|安全|预测关于stateof.ai 2023人工智能研究论文中使用的英伟达芯片比所有替代芯片的总和多19倍#stateofai|13在去年的报告中,我们开始跟踪人工智能研究论文中特定半导体的利用情况。我们发现,英伟达芯片被引用的次数远远多于替代品。2023年,英伟达GPU更受欢迎:比FPGAs多31倍,比TPUs多150倍。划重点行业研究政策|安全|预测关于31x150 xstateof.ai 2023英伟达芯片具有非常长的生命周期价值:从上市到流行达到顶峰需要5年时间#s
13、tateofai|142023年,所有的目光都集中在英伟达新推出的H100 GPU上,它是A100更强大的后继者。虽然H100集群正在建设中(并非没有障碍),但研究人员依赖于V100、A100和RTX 3090。英伟达产品的竞争寿命相当惊人:2017年发布的V100目前仍然是人工智能研究中最常用的芯片。这表明,2020年发布的A100可能在2026年达到峰值,而V100可能会达到低谷。因此,新款H100可能会伴随我们直到下一个十年!划重点行业研究政策|安全|预测关于stateof.ai 2023英伟达是王者,但Cerebras在挑战者当中崭露头角#stateofai|15全球最大的人工智能芯片
14、的创造者Cerebras,参与了若干个开源模型训练和数据集创建项目,这帮助它比竞争对手更受研究人员的欢迎。但总体上,英伟达的竞争者还有很长的路要走。划重点行业研究政策|安全|预测关于stateof.ai 2023超大规模企业将提高人工智能支出所占总资本支出的比例#stateofai|16有传闻称,英伟达将在2024年出货150万至200万颗H100,高于今年预计的50万颗。划重点行业研究政策|安全|预测关于stateof.ai 2023特斯拉迈向全球前五大人工智能计算集群#stateofai|17在我们2022年的计算指数中,特斯拉基于其100 GPU计数排名第四。截至2023年夏天,该公司推
15、出了一个新的由1万颗H100组成的集群,成为迄今为止最大的在线集群之一。划重点行业研究政策|安全|预测关于stateof.ai 2023Meta发布了MTIA,这是该公司第一个基于开源RISC-V架构的内部加速器,可以满足基于深度学习的推荐模型的要求。这是由生产中部署的模型不断增长的规模和复杂性以及GPU提供的缓慢推理速度所驱动的。#stateofai|18越来越多的超大规模公司为内部人工智能工作流开发自己的推理硬件划重点行业研究政策|安全|预测关于#stateofai|19划重点行业研究政策|安全|预测关于英伟达、英特尔和AMD制造向中国出口的非管制芯片根据英伟达首席财务官的说法,中国过去占
16、英伟达数据中心相关产品营收的20-25%(金融时报)。英伟达(及其竞争对手)开发了低于出口清单阈值的芯片。stateof.ai 2023 2022年8月下旬,英伟达的A100和H100该公司在人工智能应用方面最强大的芯片被列入美国商务部的出口管制清单。到当年11月,英伟达已经开始宣传A800和H800芯片,其设计低于美国禁令设定的性能阈值。英特尔对他们的Habana Gaudi 2芯片的新版本做了类似的调整,AMD也表达了类似的意图。因此,中国互联网大公司已经订购价值超10亿美元美元的英伟达A800/H800 GPU。也有报道称中国的A100/H100 GPU流量有所增加,但规模要小得多。Ar
17、m的知识产权支撑着全球99%的智能手机芯片,该公司正在努力重新定位自己在人工智能市场的角色。它已同自动驾驶汽车公司Cruise和英伟达合作开发了Grace Hopper芯片(其技术在其中扮演了配角)。#stateofai|20划重点行业研究政策|安全|预测关于在出售给英伟达的交易被阻后,软银旗下的Arm重新在纳斯达克上市回到2020年,我们预测英伟达将无法完成对Arm的收购。今年9月,Arm在纳斯达克重新上市,开盘时市值达到600亿美元。stateof.ai 2023 然而,这不会一帆风顺。该公司营收与上一财年持平,25%来自Arm中国,这是进入中国市场所需的独立子公司。考虑到其巨大的市场份额
18、,Arm可能有潜力提高其每台设备的专利费,但需要与不断增长的开源替代架构(如RISC-V)进行平衡。由于Arm不销售实物芯片,迄今为止未受任何影响,但无法保证这种情况会持续下去。ElevenLabs现在有超过200万注册用户,并且增长迅速。该公司获得第二个百万用户的速度比第一个百万用户快了一倍。用户累计上传了超过10年的音频内容。ElevenLabs最初面向创作者和出版商,现在正在适应来自人工智能代理、伴侣、娱乐和游戏的大量用例。由人工智能工具驱动的产品设计公司Uizard表示,截至7月23日,该公司录得320万美元的ARR(年度经常性收入),同比增长13倍。该公司4月份的ARR突破了100万
19、美元,3个月内从100万美元增至300万美元。我们在2022年预测:“到2023年9月,生成式音频工具将吸引超过10万名开发人员。”ElevenLabs(英国)和Lemble AI(美国)都超过了这个门槛。另一个领域,产品设计,正在见证生成式人工智能技术的快速整合,这有利于像Uizard这样的快速发展的公司。stateof.ai 20232022年预测:生成式人工智能应用越来越受欢迎#stateofai|21划重点行业研究政策|安全|预测关于视频也是GenAI快速发展的前沿领域。总部位于伦敦的Synthesia成立于2017年,于2020年推出了人工智能优先的视频创作器。该系统生成多语言化身,
20、该化身制定供消费者和企业等使用的脚本。曾经被认为是“边缘”的Synthesia现在被44%的财富100强企业用于学习和发展、市场营销、销售支持、信息安全和客户服务。自2020年推出以来,这项服务已经产生了超过960万个视频。stateof.ai 20232022年预测:生成式人工智能应用越来越受欢迎#stateofai|22划重点行业研究政策|安全|预测关于2020 data starts on 1 May.2023 data stops on 1 Sept.#stateofai|23划重点行业研究政策|安全|预测关于OpenAI的ChatGPT是发展最快的互联网产品之一横轴为产品推出时间#s
21、tateofai|24划重点行业研究政策|安全|预测关于OpenAI当前的赚钱能力惊人但代价是什么?12个月之前,OpenAI在筹集100亿美元资金时所做的营收预测曾遭到了很多质疑。如今,该公司正在超越其目标。这会持续多久?代价是什么?stateof.ai 2023Chegg是一家在纽交所上市的公司,专注于改善学生的学习和学习成果,因ChatGPT的推出而受到重创。该公司在2023年5月表示:“今年上半年,我们没有看到ChatGPT对我们新账户增长的明显影响,我们正在满足新注册的预期。”付钱给Chegg来练习考试并获得作业反馈的学生转而求助于ChatGPT。结果,Chegg的股价暴跌逾 40%
22、。在2023年8月举行的财报电话会议上,Chegg表示:“我们已经让公司转向利用人工智能来更好地为学习者服务。”他们正在与Scale AI合作构建内部大型语言模型。#stateofai|25划重点行业研究政策|安全|预测关于感受ChatGPT的热度:教育首当其冲,Chegg正在反击stateof.ai 2023Stack Overflow在人工智能热潮之前供开发者寻找他们编程问题的解决方案。该网站由于ChatGPT的流行而遭受流量损失,已禁止开发者在Stack Overflow上发布ChatGPT生成的文本。#stateofai|26划重点行业研究政策|安全|预测关于感受ChatGPT的热度:
23、编程是下一个被革命的领域开发人员很喜欢它!Left figure credit:Andre Retterathstateof.ai 2023如果是命中注定的,那就一定会是(不管要花多长时间)。GitHub终于推出了他们的编程助手CoPilot,获得了巨大的好评。这个系统是在数十亿行代码上训练出来的。#stateofai|27划重点行业研究政策|安全|预测关于结果是:GitHub CoPilot显著提高了开发人员的工作效率 2022年9月,GitHub对95名专业开发人员进行了一项实验,将他们随机分成两组,并记录他们用JavaScript编写一个HTTP服务器需要多长时间。这发现了显著的生产率提
24、高。2023年6月,GitHub报告了934533名CoPilot用户的数据。有趣的是,随着Copilot用户熟悉该工具,生产率在显著提高之前略有下降,经验较少的用户受益最大(生产率提高约32%)。麻省理工的一项新研究支持流行观点:ChatGPT有助于写作,特别是对于“中级专业写作”。研究表明,与对照组相比,使用ChatGPT的写作者完成任务的时间减少了40%,输出质量提高了18%。stateof.ai 2023#stateofai|28ChatGPT能提升写作产出划重点行业研究政策|安全|预测关于stateof.ai 2023#stateofai|29某些不太明显的GenAI用例也获得了显著
25、的吸引力划重点行业研究政策|安全|预测关于我们已经看到消费者对用户与定制聊天机器人进行互动的巨大兴趣。A16z支持的Character.AI筹集了1.5亿美元的A轮融资,在推出其应用程序之前,其网站的月访问量达到2亿次。它们的许多用途是良性的例如,它们被用作语法工具或在小说社区中使用,但我们也看到了商业和伦理上的挑战。我们已经看到用户对它们的机器人产生情感依赖的报告,公司努力在露骨内容的受欢迎程度及其对其品牌的影响之间进行权衡。stateof.ai 2023在2022年随着Stable Diffusion的发布而突破性的一年之后,Midjourney和Stability仍然在不断改进它们的模型
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2023 AI 现状
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【Stan****Shan】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【Stan****Shan】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。