2025年亚马逊AWS全栈AI战略:从自研芯片、投资Anthropic到顶层应用布局分析报告.docx
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2025 亚马逊 AWS AI 战略 芯片 投资 Anthropic 到顶 应用 布局 分析 报告
- 资源描述:
-
2025 行业分析报告 行业研究 1市场分析 I深度洞察 2025年亚马逊AWS全栈AI战略:从自研芯片 、投资Anthropic到顶层应用布局分析报告 目 录 1. 生成式 AI 的爆发为云计算行业注入新动能 4 1.1. 云计算发展历程复盘:从企业数字化转型到 AI 加速 4 1.2. 生成式 AI 的爆发,云服务有望升维为企业核心业务创新的战略赋能平台 6 2. 三大云厂占全球云基础设施 2/3 份额,AI 时代巨头集中度有望进一步提升 7 3. 亚马逊:全球云服务领军者,从底层芯片、AI 模型到顶层应用的全栈布局 10 3.1. 亚马逊 AWS:全球云服务市场领导者,先发优势显著 10 3.2. 亚马逊 AWS 云服务为什么成功? 11 3.2.1. 协同效应:与电商平台共同构建一个强大的“技术研发-内部验证-外部商业化”的良性循环 11 3.2.2. 技术优势:体现在对核心底层架构、安全隔离的深刻理解、以及以 API 为核心的设计哲学 13 3.2.3. 定价革命:“按需付费” 较大地降低了客户的创新门槛和试错成本 15 3.2.4. 培育生态系统:涵盖开发者支持以及技术和咨询合作伙伴生态系统化 16 3.3. 自研芯片 Trainium:打造从芯片设计到云服务全链条,提供最具性价比的解决方案 17 3.4. AWSAI 战略:投资 Anthropic 80 亿美元,从底层芯片到顶层应用的全栈控制 20 3.5. 需求旺盛、AWS 增速主要受制于电力供给,CAPEX 预计全年将超过 1000 亿美元 26 图表目录 图 1 :2018-2024 年全球云基础设施服务支出、同比增速(亿美元) 4 图 2:云计算网络架构 5 图 3:企业选择云计算的优势 5 图 4 :2020 年 Q1-2023 年 Q3 全球三大云厂云收入同比增速 6 图 5 :2023 年 Q4-2025 年 Q2 全球云基础设施服务支出同比增速 7 图 6 :2021 年 Q1-2025 年 Q2 全球三大云厂份额变化 8 图 7 :2022 年 Q1-2025 年 Q2 全球三大云厂季度同比增速变化 9 图 8 :2018 年-2025 年 Q2 亚马逊 AWS 云服务收入、同比增速(亿美元) 11 图 9 :2022 年全球在线购物 GMV 平台份额 11 图 10:Amazon S3 系统优势 13 图 11 :Amazon EC2 系统优势 13 图 12:Amazon EC2 核心应用场景 14 图 13:Amazon EC2 多层安全保护 14 图 14:Amazon EC2 安全防火墙 15 图 15:Amazon AWS 付费机制 15 图 16:Amazon AWS 按照模块付费,可选模块共 196 种 16 图 17:Amazon AWS 对于开发者的支持 17 图 18 :AWS Trainium2 与 Trainium1 性能参数对比 18 图 19 :AWS Trainium2 芯片性能参数 19 图 20:Amazon EC2 Trn2 机柜样式及性能 19 图 21:Amazon EC2 Trn2 UltraServers 样式及性能 19 图 22:Amazon EC2 Trn2 UltraClusters 样式及性能 19 图 23 :AWS Trainium 芯片优势 20 图 24 :2022 年-2025 年 7 月大模型初创公司 Anthropic 年化收入 ARR 变化(亿美元) 21 图 25:大模型初创公司 Anthropic 年化收入 ARR(亿美元) 21 图 26 :Claude Opus 4 是 Anthropic 是全球最佳的编码模型之一 22 图 27 :Claude Sonnet 4 在 SWE-bench 上实现了 72.7% 的出色编码效率 22 图 28:全球模型 kimi 、Deepseek、通义、ChatGPT 、Anthropic 各维度对比 22 图 29:微软和 OpenAl、亚马逊和 Anthropic 的竞合关系 23 图 30 :AWS Bedrock 是一个“模型超市”,有 14 家顶尖大模型厂商产品可供选择 24 图 31:Amazon Bedrock Agent Core 包含 Agent 执行实际工作流时所需的基础工具 25 图 32:Amazon Bedrock 工具可以帮用户进行写作创作、文章总结等工作 25 图 33:亚马逊 AWS 人工智能产品分布 26 图 34 :2018 年 Q1-2025 年 Q2 亚马逊 AWS 云服务收入、同比增速(亿美元) 26 图 35 :2018 年 Q1-2025 年 Q2 亚马逊 AWS 营业利润、营业利润率(百万美元) 27 图 36 :2018 年 Q1-2025 年 Q2 亚马逊 AWS 营业利润占公司总营业利润比重 27 图 37 :2025 年上半年 AWS 已宣布或正在进行的关键数据中心项目 28 图 38 :2018 年 Q1-2025 年 Q2 亚马逊资本开支、同比增速(亿美元) 28 表 1 :2018 年-2025 年三大云厂份额变化 8 表 2 :2006-2012 年关键云平台发布时间线 12 表 3:AWS Trainium2、NVIDIA H100 、AMD MI300X 性能参数对比 19 表 4:Anthropic 成立至今融资概览 21 1. 生成式 AI 的爆发为云计算行业注入新动能 1.1. 云计算发展历程复盘:从企业数字化转型到 AI 加速 云计算是一种通过互联网按需交付IT 资源和应用的服务模式,具有较大的灵活性、 可扩展性和成本效益。云计算(Cloud Computing)是一种通过互联网按需交付 IT 资 源和应用的服务模式,使用电力或自来水一样使用公共事业服务,使得企业客户无 需自建发电厂或水库(即购买和维护昂贵的物理服务器、存储设备和数据中心),而 是可以直接从云服务提供商,如亚马逊 AWS、微软 Azure、谷歌云,那里租用计算 能力、存储空间、数据库等资源,并根据实际使用量付费。这种模式的核心优势在 于提供了较大的灵活性、可扩展性和成本效益,使企业和个人能够更专注于业务创 新,而将复杂的 IT 基础设施管理交给云服务商。 在过去十年中,全球云服务市场经历了三个截然不同的增长阶段。 图 1 :2018-2024 年全球云基础设施服务支出、同比增速(亿美元) 数据来源:Canalys ,东北证券 (1)企业数字化转型+疫情(2018-2022 年):企业开始大规模地将其工作负载迁移 至云端 2018 年到 2022 年云计算经历了第一波浪潮,其核心驱动力是企业的数字化转型。 受益于企业追求更高的业务敏捷性、可扩展性和成本效率,摆脱传统本地数据中心 的高扩展成本,企业开始大规模地将其工作负载迁移至云端。同时,企业还可以开 发全新的云原生应用,以提升业务敏捷性和创新能力。在此阶段,云服务被视为实 现弹性、可扩展性和将资本支出(CapEx)转化为运营支出(OpEx)财务模型的关 键工具。客户关注的焦点是基础的计算、存储和网络服务。 图 2 :云计算网络架构 数据来源:51CTO ,CSDN ,东北证券 图 3:企业选择云计算的优势 数据来源:51CTO ,东北证券 2020 年爆发的全球新冠疫情成为这一趋势的又一显著催化剂,为了支持大规模远程 办公、线上协作和数字化的客户互动,企业被迫加速其上云进程,这直接推动了云 支出的快速增长。 根据 Canalys 统计,2019-2021 年全球云基础设施服务支出增速分别为 37.66%、 32.59%、35.00%。 (2)降本增效(2022-2023 年):宏观环境不确定性,使得企业从不计成本的云投 入转向严格的成本控制和运营效率管理 进入 2022-2023 年,由于全球通货膨胀、利率上升和地缘政治不确定性等因素,迫 使企业的经营策略从不计成本的云投入转向严格的成本控制和运营效率管理,使得 云业务增速出现短期波动。 企业客户开始在云服务上降本增效,关闭闲置资源,选择更具成本效益的服务,根 据 Canalys 统计,全球云基础设施服务支出增速从2021 年的 35.00%下降至2023 年 的 8.34%。 图 4 :2020 年 Q1-2023 年 Q3 全球三大云厂云收入同比增速 数据来源:Canalys ,东北证券 1.2. 生成式 AI 的爆发,云服务有望升维为企业核心业务创新的战略赋能 平台 AI 大模型爆火出圈后,客户的核心需求从通用的计算资源,转向能够支持大规模 AI 模型训练和推理的专业化、高性能基础设施。2023 年 2 月 ChatGPT 全球爆火, 市场的核心需求不再是通用的计算资源,而是能够支持大规模 AI 模型训练和推理 的专业化、高性能基础设施。使得客户需求从“水平式”量的扩张转变为“垂直式”深 化,即通过高价值、计算密集型的 AI 工作负载,大幅提升现有云服务的配置深度, 包括作为一次性投资的 AI 模型“训练”,以及作为经常性运营成本的“推理”。 我们认为,这意味着云服务的增长逻辑从 IT 成本端的降本增效,演变为 AI 时代下 的性能追求。在过去企业数字化转型阶段(2018-2023),云在很大程度上被视为一 种 IT 效用设施——一个灵活、可扩展且理想情况下更具成本效益的本地基础设施 替代品,在 2022-2023 年的优化阶段企业对成本进行极致追求,证明了他们将云支 出视同水电费一样,是可以被压缩的开支。 在 AI 时代,云服务的性能、大模型接入情况或者技术优势有望占主导。训练和运 行生成式 AI 模型,其核心诉求不再是寻找最便宜的计算,而是能否获得由数千个 专业处理器(如 GPU/TPU)组成的庞大集群,以及能否使用如 Azure OpenAI 服务、 亚马逊 Bedrock、谷歌 Vertex AI 等先进的AI 平台。据 Canalys 统计,企业客户的关 注焦点从“工作负载迁移”转向了“AI 工作流”、AI 技术“效率和生产力提升”,企业的 采购决策正从关注“单位成本”转向关注“AI 应用的上市时间” 、“模型的性能表现”以 及“对尖端技术的访问权”。 我们认为,云服务已从一个 IT 成本中心,升维为企业核心业务创新的战略赋能平 台,从而使其更高、更专业化的支出变得合理且必要。据 Canalys 分析,云服务的 增长叙事已经从“为了效率上云”转变为“为了AI 驱动的生存和增长而必须上云”,使 得企业重新评估其云战略,并积极追加投资,以避免在新的技术浪潮中处于落后低 位。 2024 年 Q3-2025 年 Q2 全球云基础设施服务支出同比增速连续四个季度超过20% 。 据 Canalys 数据显示,2025 年第二季度全球云基础设施服务支出达到 953 亿美元, 同比增长 22%,连续四个季度同比增长超过 20%。 进入 AI 时代后,企业将重点放在了两大战略重点上:加速云迁移(通过转移更多 工作负载或重启停滞的本地迁移)以及探索生成式人工智能的应用。生成式人工智 能高度依赖云基础设施,其兴起反过来又强化了企业云战略,并加快了迁移进度。 图 5 :2023 年 Q4-2025 年 Q2 全球云基础设施服务支出同比增速 数据来源:Canalys ,东北证券 2. 三大云厂占全球云基础设施 2/3 份额,AI 时代巨头集中度 有望进一步提升 全球云基础设施服务市场中,亚马逊 AWS、微软 Azure 和谷歌云这三大巨头占据了 市场的主导地位,合计控制着全球约三分之二的市场份额。 2018 年至今,全球云基础设施服务市场中亚马逊份额稳定为31-33%左右,微软和 谷歌增速快,份额方面微软从 2018 年的 14%提升至 2025 年 Q2 的 22%,谷歌从 2018 年的 4.2%增长至 2025 年 Q2 的 11% 。2018 年至今,AWS 始终是全球云服务 市场的开创者和长期领导者,其市场份额保持在 31%至 33%的区间。此外,微软 Azure 是最大的市场份额增长者,凭借其深厚的企业客户基础和成功的混合云战略, Azure 在七年内将其市场份额从 2018 年的 14%提升至 2025 年 Q2 的 22%。谷歌云 同样表现出色,通过在数据分析和人工智能领域的持续发力,其市场份额在 2018 年 的 4.2%增长至 2025 年 Q2 的 11%。 三大云厂份额不断提升,充分彰显云服务的强大网络效应、高昂的客户转换成本、 以及较大的资本准入门槛。2018 年至今,三大云服务商的市场份额持续向上攀升, 从 2018 年的 51%提升至 2025 年 Q2 的 65%,“其他”供应商的合计市场份额已显著 萎缩。我们认为,这充分证明了云市场的强大网络效应、高昂的客户转换成本、较 强的客户粘性以及较大的资本准入门槛。 表 1 :2018 年-2025 年三大云厂份额变化 亚马逊 AWS 微软 Azure 谷歌云 其他厂商 2018 全年 32.7% 14.2% 4.2% 48.9% 2019 全年 32.3% 16.9% 5.8% 45.0% 2020Q4 32.0% 20.0% 7.0% 41.0% 2021Q4 33.0% 22.0% 9.0% 36.0% 2022Q4 32.0% 23.0% 10.0% 35.0% 2023Q4 31.0% 26.0% 10.0% 33.0% 2024Q4 33.0% 20.0% 11.0% 36.0% 2025Q1 32.0% 23.0% 10.0% 35.0% 2025Q2 32.0% 22.0% 11.0% 35.0% 数据来源:Canalys ,东北证券 AI 时代的到来有望进一步提升云服务厂商集中度。我们认为,构建和运营大规模 AI 模型训练和推理的基础设施,需要天文数字般的资本支出,用于采购先进的 GPU 和 建设专用的 AI 数据中心,利好资金雄厚的科技巨头。因此,我们认为,云服务的集 中度有望进一步提升。 Canalys 分析指出,随着人工智能从研究阶段转向大规模部署,企业越来越关注推理 的成本效益,并会比较各种模型、云平台以及 GPU 和定制加速器等硬件架构。为 了应对这些挑战,领先的云服务提供商正在加大对 AI 优化基础设施的投资。包括 AWS 、Azure 和 Google Cloud 在内的超大规模云服务提供商已经推出了 Trainium 和 TPU 等专有芯片,旨在提高推理效率并降低 AI 的总体成本。 图 6 :2021 年 Q1-2025 年 Q2 全球三大云厂份额变化 数据来源:Canalys ,东北证券 图 7 :2022 年 Q1-2025 年 Q2 全球三大云厂季度同比增速变化 数据来源:Canalys ,东北证券 AI 时代,三大云厂各自卡位一家大模型顶级公司,AWS 与 Anthropic、Microsoft Azure 与 OpenAI、Google Cloud 与 Google AI (DeepMind) 。在生成式 AI 浪潮初 期,微软通过其对 OpenAI 的数百亿美元投资,获得了巨大的先发优势,其 Azure OpenAI 服务迅速成为企业部署 AI 应用的首选平台之一。与此同时,拥有强大自研 能力的谷歌,凭借其 Gemini 系列模型和 Google Cloud 平台,也构成了强大的竞争 力。2023 年 9 月开始,亚马逊向 AI 大模型初创公司 Anthropic 投资 80 亿美元巨额 资金,Anthropic 预计将亚马逊 AWS 作为其主要云提供商,并使用亚马逊自研芯片 进行模型训练推理,并为 AWS 的客户提供特别模型定制和微调功能的早期访问权 限。 AWS + Anthropic: 依托 AWS 庞大的云市场份额和企业客户基础,结合 Anthropic 在 模型性能和 AI 安全方面的领先地位。 Microsoft Azure + OpenAI: 凭借先发优势和 GPT 系列模型的强大品牌效应,深度整 合入微软的软件和服务生态。 Google Cloud + Google AI (DeepMind): 拥有从芯片(TPU)到模型(Gemini)的全 栈自研能力,技术实力雄厚。 我们认为,未来全球云服务的竞争将不再是单一产品或服务的比拼,而是整个生态 系统的综合实力对抗。 企业的采购决策,不再仅仅是购买虚拟机或存储空间,而是购买一整套集成了顶级 AI 能力的解决方案。过去十年,云服务商之间的竞争主要围绕基础设施即服务(IaaS) 的性价比和平台即服务(PaaS)的丰富性展开。而现在,竞争的焦点正迅速转向 AI 平台即服务(AIaaS)。企业的采购决策,不再仅仅是购买虚拟机或存储空间,而是 购买一整套集成了顶级 AI 能力的解决方案。 云平台的核心差异化优势,正从基础设施的性能,转变为其所能提供的基础模型的 质量、集成度以及安全性。云平台和其上的“杀手级应用”(生成式 AI)正在被打包 成一个不可分割的整体进行销售。 在这场新的战争中,谁能提供最强大、最安全、最易于集成的 AI“大脑”,谁就将赢 得下一代企业工作负载,从而主导未来的云计算市场。 3. 亚马逊:全球云服务领军者,从底层芯片、AI 模型到顶层 应用的全栈布局 3.1. 亚马逊 AWS:全球云服务市场领导者,先发优势显著 亚马逊 AWS(Amazon Web Services)是作为全球云服务市场领导者,2018 年至今 市场份额稳定在 31-33%。 2015-2018 年先发优势显著,定义云计算市场,诸多明星初创公司需要快速、灵活 的基础设施来支持其业务的爆炸性增长。在这一时期,AWS 的增长主要得益于其无 可匹敌的先发优势。很多明星初创公司或者行业头部企业需要快速、灵活且无需前 期资本投入的基础设施来支持其业务的爆炸性增长。在此期间,AWS 不仅提供了核 心的计算(EC2)和存储(S3)服务,还不断扩展其产品组合,例如在 2017 年推出 Amazon SageMaker,为后来的机器学习服务奠定了基础。像 Zynga 和 Reddit 这样的 大规模互联网公司将其基础设施完全迁移到 AWS,这起到了强大的示范效应,巩固 了 AWS 作为网络规模应用首选云平台的地位。 传统企业上云+疫情催生线上需求,2019-2022 年 AWS 收入 CAGR 为 32% 。随着 云市场的成熟,AWS 的战略重心转向了规模庞大、预算充足的大型企业市场,开始 帮助传统企业完成复杂的“上云”迁移。同时,2020 年爆发的新冠疫情显著地加速了 这一进程,远程办公、在线教育和电子商务的激增导致对云服务的需求井喷,AWS 的收入也从 2019 年的约 350 亿美元跃升至2022 年的 801 亿美元,复合增速为32% 。 在这一阶段,AWS 的竞争优势体现在其服务广度上,提供了超过 200 项涵盖几乎所 有 IT 需求的服务,形成了一个强大的生态优势。 AI 大模型催生云服务需求再加速,AWS 通过集成多种大模型、成为客户 AI 模型 的“选择平台” 。在经历了 2023 年的短暂增长放缓和客户成本优化后,AWS 的增长 引擎被生成式 AI 重新点燃。面对微软 Azure 在 AI 领域的强势进攻,AWS 迅速调 整战略,将自己定位为 AI 模型的“选择平台”。通过其 Amazon Bedrock 服务,AWS 不仅提供了自家的 Titan 系列模型,还广泛集成了来自 Anthropic(Claude 模型)、 Stability AI 等第三方领先 AI 公司的模型,为客户提供了极大的灵活性和选择权,。 2023-2024 年全年 AWS 云服务收入增速分别为 13.31% 、18.51%,2025 年 H1 为 17.19%。 图 8 :2018 年-2025 年 Q2 亚马逊 AWS 云服务收入、同比增速(亿美元) 数据来源:wind,东北证券 3.2. 亚马逊 AWS 云服务为什么成功? 3.2.1. 协同效应:与电商平台共同构建一个强大的“技术研发-内部验证-外部商业 化”的良性循环 AWS 的诞生,来源于亚马逊在运营自身电子商务业务时所面临的严峻挑战。在 21 世纪初,A(亚马逊电商平台)的快速增长给其工程团队带来了巨大的 IT 系统扩展压力。这些扩展过程成本高昂且耗时,严重拖累了开发效率。亚马逊的工 程师们必须不断解决复杂的 IT 基础设施规模化问题,这段经历锤炼了他们在构建 和管理可靠、高效、可扩展基础设施方面的核心能力。公司管理层认为,亚马逊所 面临的这些技术挑战是普遍存在的,几乎所有希望在互联网上发展的公司都会遇到 同样的问题,决定将其内部工具商业化,为外部客户提供服务,AWS 的雏形由此诞 生。 图 9 :2022 年全球在线购物 GMV 平台份额 数据来源:RedStag ,东北证券 亚马逊电商平台是云服务 AWS 的“零号客户”,为 AWS 的产品带来了与生俱来的 实用性和可靠性。与后来将云计算视为一个新市场进入的竞争对手不同,AWS 是它 自己服务的“零号客户”。这意味着其最初的服务并非在真空中设计,而是经过了亚 马逊自身超大规模、任务关键型业务千锤百炼的解决方案。这种“自产自用”的背景, 为 AWS 的产品带来了与生俱来的实用性和可靠性,也为其在早期开发者社区中赢 得了无与伦比的信誉和信任。 时至今日,A 仍然是 AWS 最大和最重要的客户之一。例如,亚马逊将其 内部的 5000 个数据库从甲骨文迁移到了 AWS 上,这一方面为 AWS 节省了巨额的 许可费用,另一方面也成为了展示 AWS 处理超大规模关键任务能力的最佳案例。 (2)先发优势:当竞争对手终于推出可行的 IaaS 产品时,AWS 已经是一个功能丰 富、稳定可靠且覆盖全球的成熟平台,从而提升用户替换成本。 AWS 的核心服务于 2006 年推出,而其主要竞争对手则姗姗来迟。谷歌的第一个云 产品 App Engine(PaaS 平台)于 2008 年问世,而微软 Azure 的 IaaS 产品直到2010 年才正式推出。 表 2 :2006-2012 年关键云平台发布时间线 亚马逊云服务(AWS) 谷歌云(Google Cloud) 微软 Azure 2006 S3 (存储) & EC2 (计算) 发布 - - 2007 S3 & EC2 在全球范围 可用 - - 2008 - App Engine (PaaS) 发 布 - 2009 RDS (数据库) & VPC (网络) 发布 - - 2010 - - Azure IaaS (VM Role) 发布 2012 DynamoDB & Redshift 发布 Compute Engine (IaaS) 发布 - 数据来源:Google ,东北证券 当竞争对手终于推出可行的 IaaS 产品时,AWS 已经是一个功能丰富、稳定可靠且 覆盖全球的成熟平台,从而提升用户替换成本。这几年的先发优势,使得 AWS 可 以(1)完善核心产品:不断迭代 S3 和 EC2 ,增加功能并提升性能。(2)扩展服务 组合:陆续推出了关系数据库服务(RDS, 2009 年)、虚拟私有云(VPC, 2009 年)、 NoSQL 数据库(DynamoDB, 2012 年)和数据仓库(Redshift, 2012 年)等关键服务, 满足了更广泛的客户需求。(3)建设全球基础设施:在全球范围内投资数十亿美元 建设数据中心,形成了覆盖多个区域(Regions)和可用区(Availability Zones)的庞 大网络,确保了低延迟和高可用性。 随着客户在 AWS 上构建的应用日益复杂,将其迁移到另一个云平台在技术上和经 济上都变得较有挑战性,从而形成了一道坚固的经济护城河。 3.2.2. 技术优势:体现在对核心底层架构、安全隔离的深刻理解、以及以 API 为核 心的设计哲学 S3 与 EC2 的基础架构为 AWS 云服务构筑规模化的支柱。 Amazon Simple Storage Service(Amazon S3)是一项对象存储服务,具备行业领先 的可扩展性、数据可用性、安全性和性能。 数百万不同规模和行业的客户可以为几 乎任何使用案例存储、管理、分析和保护任意数量的数据,例如数据湖、云原生应 用程序和移动应用程序。借助高成本效益的存储类别和易于使用的管理功能,客户 可以优化成本、组织并分析数据,以及配置精细调整过的访问控制,从而满足特定 的业务与合规性要求。 图 10:Amazon S3 系统优势 数据来源:亚马逊 AWS 官网,东北证券 EC2(弹性计算云)通过虚拟机提供了可扩展的计算资源,有望解决客户“过度配置” 问题。其核心创新在于“弹性”——能够根据需求,通过自动扩展和弹性负载均衡等 功能,按需、自动地增减数量。这直接解决了前云时代因容量规划不准而导致的“过 度配置”问题。 图 11 :Amazon EC2 系统优势 数据来源:亚马逊 AWS 官网,东北证券 此外,EC2 还拥有超过 750 个模块组件,使得客户可选择最新的处理器、存储、联 网、操作系统和购买模型, 以帮助客户最好地满足工作负载的需求。AWS 是首家支 持英特尔、AMD 和 Arm 处理器的主要云提供商,既是唯一具有按需 EC2 Mac 的 云,也是唯一具有 400 Gbps 以太网网络的云。AWS 为机器学习培训提供最佳性价 比,同时也为云中的每个推理提供了最低的成本。与任何其他云相比,有更多的SAP、 高性能计算(HPC)、机器学习和 Windows 工作负载在 AWS 上运行。 图 12:Amazon EC2 核心应用场景 数据来源:亚马逊 AWS 官网,东北证券 相较于谷歌,AWS 为客户 IT 工作负载的迁移创造了更低的门槛。相较于谷歌如原 生容器化的工程理念,AWS 专注于客户需求,为绝大多数现有 IT 工作负载的迁移 创造了更低的门槛。前云时代的互联网世界是建立在运行操作系统的物理服务器之 上的,而虚拟机是这一范式的最直接替换。EC2 提供了弹性和按需供应的新优势, 使得企业可以采用“直接迁移”的方式上云。相比之下,谷歌主张无服务器(App Engine)或容器化(GKE),并将虚拟机视为过时技术,使得企业需要适应 PaaS 或 容器等新范式而彻底重构应用。这种战略上的错位使得 AWS 通过提供解决客户当 前问题、适配其现有架构和技能的工具,成功捕获了庞大的存量市场,而谷歌则难 以挑战其已建立的稳固地位。 Xen 虚拟化技术构筑安全与隔离的基石。公共云最显著的挑战之一是实现安全的多 租户如何在同一台物理硬件上运行多个客户的虚拟机,同时确保它们之间互不干扰、 数据互不可见。AWS 早期的解决方案是采用一个高度定制化的 Xen hypervisor(虚 拟机监控程序)。Xen 通过在比客户操作系统(Guest OS)更高权限的 CPU 环(Ring 0)中运行,而在较低权限的环(Ring 1)中运行客户操作系统,从而提供了强大的 隔离。至关重要的是,hypervisor 负责管理物理资源。它会在内存被释放给另一个客 户之前进行擦除(清零),并对磁盘访问进行虚拟化,阻止客户直接访问底层硬件。 此外,强制性的防火墙也被实现在 hypervisor 层,位于物理网卡和虚拟网卡之间。 这意味着所有网络包都必须经过这一层过滤,从而提供了一个无法从客户操作系统 内部篡改的坚固安全边界。这一系列复杂而关键的技术实现,有助于 AWS 实现更 强大的数据安全、客户隐私信任。 图 13:Amazon EC2 多层安全保护 数据来源:亚马逊 AWS 官网,东北证券 图 14:Amazon EC2 安全防火墙 数据来源:亚马逊 AWS 官网,东北证券 3.2.3. 定价革命:“按需付费” 较大地降低了客户的创新门槛和试错成本 “按需付费”使得客户只需为他们实际消耗的资源付费,较大地降低了创新的门槛和 试错的成本。“按需付费”(Pay-as-you-go)是 AWS 最具颠覆性的商业创新。它将企 业在 IT 上的巨额前期资本支出(CAPEX)转变为可变的运营支出(OPEX)。 客户只需为他们实际消耗的资源付费,计量单位可以精确到秒或小时,无需签订长 期合同或支付复杂的许可费用。这种模式类似于支付水电费,用多少付多少,不用 即停,无额外成本,极大地降低了创新的门槛和试错的成本。开发者可以快速启动 一个项目进行实验,如果失败,损失也微乎其微,这极大地激发了创新活力。 图 15:Amazon AWS 付费机制 数据来源:亚马逊 AWS 官网,东北证券 按需付费模式与资金紧张的初创企业完美契合,许多标志性初创公司,包括 Netflix、 Dropbox 和 Airbnb,都是在 AWS 上构建其整个业务的。例如 Airbnb 在公司成立一 年后,为了“快速行动并保持精简” ,Airbnb 将其几乎所有的云计算功能都迁移到了 AWS。通过使用 EC2 、S3 和 RDS,他们得以将工程资源集中在匹配房东与租客的 核心业务上,而不是耗费在基础设施的日常管理上。再例如 Netflix 作为 AWS 最早 期的“元老级”客户之一,Netflix 将其几乎所有的计算和存储需求都放在 AWS 上, 包括视频转码、数据库和推荐引擎等,充分利用了 AWS 的巨大规模。 这些初创公司也为 AWS 的研发和创新提供新引擎和新场景。例如 Netflix 不断挑战 AWS 平台能力的极限,为 AWS 提供了宝贵的、真实世界的压力测试,并反过来驱 动了新功能和新服务的开发,最终使整个平台受益。例如,Netflix 著名的开源项目 “混沌猴”(Chaos Monkey)就是为了在 AWS 上通过主动制造故障来测试系统韧性 而开发的。这种来自极限用例的反馈和知识,为 AWS 提供了改进可靠性、可扩展 性和性能的路线图。当 AWS 推出像DynamoDB(高性能 NoSQL 数据库)或 Kinesis (实时数据流服务)这样的服务时,正是为了响应这些超大规模客户所展示出的需 求。 目前,Amazon AWS 按照模块付费,可选模块共 196 种,包括容器、数据库、量子 技术、机器人技术、机器学习等多种模块产品。同时,其精细到秒的计费粒度对于 处理短暂或突发性工作负载的客户而言,具有很强的成本吸引力。 图 16:Amazon AWS 按照模块付费,可选模块共 196 种 数据来源:亚马逊 AWS 官网,东北证券 3.2.4. 培育生态系统:涵盖开发者支持以及技术和咨询合作伙伴生态系统化 对于开发者,AWS 提供了全面的文档、活跃的开发者论坛、内容丰富的白皮书以及 针对多种编程语言的软件开发工具包(SDK),极大地降低了开发者的学习和使用门 槛。 图 17:Amazon AWS 对于开发者的支持 数据来源:亚马逊 AWS 官网,东北证券 对于 AWS 合作伙伴,AWS 于 2012 年正式推出的APN,将技术和咨询合作伙伴生 态系统化。这极大地扩展了 AWS 的销售和服务覆盖范围,帮助企业客户进行迁移 和管理,同时也创造了另一层客户粘性——客户不仅依赖AWS,还依赖于围绕 AWS 构建的整个工具和服务生态。 目前,这个生态系统包括数百万活跃客户、数万家合作伙伴以及在 AWS Marketplace 上提供的海量第三方软件和服务。对于新客户而言,选择 AWS 意味着可以立即接 入这个庞大的资源网络,轻松找到所需的技术解决方案和专业服务。 3.3. 自研芯片 Trainium:打造从芯片设计到云服务全链条,提供最具性 价比的解决方案 AWS 在自研芯片领域的持续投入也构成了其关键优势。AWSTrainium 芯片是 AWS 专门为人工智能训练和推理打造的人工智能芯片系列,可在降低成本的同时提供高 性能。 第一代 AWS Trainium 芯片为 Amazon Elastic Compute Cloud(Amazon EC2) Trn1 提供支持,训练成本比同类 Amazon EC2 (用英伟达、AMD 等非自研芯片) 低 50%,包括 Databricks、Ricoh、NinjaTech AI 和 ArceeAI 在内的许多客户都已 通过 Trn1 实现性能和成本优势。 AWSTrainium2 芯片的性能是第一代 Trainium 的 4 倍,可用于训练和部署具有 数千亿至数万亿参数的模型。基于 Trainium2 的 Amazon EC2 Trn2 专为生成式人 工智能而构建,是用于训练和部署具有数千亿至数万亿参数的模型的功能强大的 EC2 。与当前一代基于 GPU 的 EC2 P5e 和 P5en 相比,Trn2 的性价比高出 30- 40%。 图 18 :AWS Trainium2 与 Trainium1 性能参数对比 数据来源:亚马逊 AWS 官网,东北证券 基于 Trainium2 的 Amazon EC2 Trn2 采用 16 个 Trainium2 芯片,这些芯片使 用专有的芯片间互连技术 NeuronLink 进行连接。客户可以使用 Trn2 训练和部署 大型语言模型(LLM)、多模态模型和扩散转换器,以构建广泛的下一代生成式人工 智能应用程序集。Trn2 UltraServers 是一款全新的 EC2 产品非常适合需要比独立 EC2 更多的内存和内存带宽的大型模型。UltraServer 设计使用 NeuronLink 将四个 Trn2 中的 64 个 Trainium2 芯片连接到一个节点。在推理方面,UltraServers 有助 于提供业界领先的响应时间,打造最佳的实时体验。在训练展开阅读全文
咨信网温馨提示:1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前可先查看【教您几个在下载文档中可以更好的避免被坑】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时联系平台进行协调解决,联系【微信客服】、【QQ客服】,若有其他问题请点击或扫码反馈【服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【版权申诉】”,意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:0574-28810668;投诉电话:18658249818。




2025年亚马逊AWS全栈AI战略:从自研芯片、投资Anthropic到顶层应用布局分析报告.docx



实名认证













自信AI助手
















微信客服
客服QQ
发送邮件
意见反馈



链接地址:https://www.zixin.com.cn/doc/12770718.html