分销赏收藏举报申诉 / 71

立即下载 VIP下载

当前位置：首页 > 研究报告 > 其他 > 大模型治理蓝皮报告（2023年）——从规则走向实践.pdf

大模型治理蓝皮报告（2023年）——从规则走向实践.pdf

上传人：Stan****Shan

文档编号：1264765

上传时间：2024-04-19

格式：PDF

页数：71

大小：1.28MB

《大模型治理蓝皮报告（2023年）——从规则走向实践.pdf》由会员分享，可在线阅读，更多相关《大模型治理蓝皮报告（2023年）——从规则走向实践.pdf（71页珍藏版）》请在咨信网上搜索。

1、z中国信息通信研究院政策与经济研究所中国科学院计算技术研究所智能算法安全重点实验室2023年11月大模型治理蓝皮报告大模型治理蓝皮报告（20232023 年年）从规则走向实践从规则走向实践前言近一年来，以 ChatGPT 为代表的大模型技术引发通用人工智能新一轮发展热潮，在带动大规模产业升级、劳动力转移、产品的分配机制等方面均带来深刻变革，成为改变世界竞争格局的重要力量。与此同时，围绕人工智能治理的议题探讨显著增多，全球人工智能治理体系加速构建。党中央国务院高度重视人工智能治理工作，作出一系列重要部署。习近平总书记强调，要共同做好风险防范，形成具有广泛共识的人工智能治理框架和标准规范，不断提升

2、人工智能技术的安全性、可靠性、可控性、公平性。寻找大模型治理的准确定位，构建适应技术发展趋势的治理体系愈加重要且迫切。面对大模型带来的新问题新挑战，传统监管模式面临着 AI 自主演化控制难、迭代快速跟进难、黑箱遮蔽追责难等问题，一劳永逸的事前监管模式已经难以应对不断推陈出新的人工智能发展需求。从治理框架来看，敏捷治理成为回应大模型技术快速迭代的重要治理模式，软硬法协调、多主体协同的治理需求更为突出。构建高质量数据集、创新知识产权制度、探索价值对齐实现方式、维护信息内容安全等成为各方关注的热点问题。美国、欧盟、英国等主要国家和地区加紧推进人工智能治理布局，共同寻求具有共识和互操作性的治理规则。我

3、国围绕人工智能发展、安全、治理三方面提出全球人工智能治理倡议，通过算法备案、评估评测、事后溯源检测等方式，推动人工智能治理从规则走向实践，为全球提供人工智能治理中国方案。希望研究成果为社会各界进一步参与大模型治理实践提供有益参考。目录一、大模型治理的重要性紧迫性凸显.1（一）大模型技术浪潮兴起.1（二）大模型引领数字化变革.3（三）大模型带来的典型风险.5二、技术变革下大模型治理框架日渐明朗.11（一）治理模式：敏捷治理成为国际较为通行的治理方案.11（二）治理主体：激励多元主体协同治理成为全球共识.14（三）治理机制：软硬兼施推进大模型治理.18三、聚焦大模型治理核心议题规则.22（一）数据

4、治理规则.23（二）知识产权保护.32（三）伦理问题治理.36（四）信息内容治理.40四、把握全球大模型治理最新动态趋势.42（一）美国从松散碎片式治理逐步趋向体系化治理.42（二）欧盟继续发挥人工智能治理领域布鲁塞尔效应.45（三）英国力图以促进创新的监管方法引领全球治理.49（四）国际组织在大模型治理国际合作中各显其能.52五、探索我国大模型治理的主要落地工具.55（一）事前备案.55（二）事中全流程评估.57（三）事后溯源检测.60六、完善我国大模型治理体系的思路建议.63（一）确立促进创新的人工智能敏捷治理理念.64（二）聚焦人工智能场景应用细化制度方案.64（三）立足当前治理实践创新

5、人工智能治理工具.65（四）激励企业积极管控风险以推动平台合规.66（五）促进全球人工智能合作治理体系构建.67大模型治理蓝皮书从规则走向实践（2023 年）1一、大模型治理的重要性紧迫性凸显（一）大模型技术浪潮兴起（一）大模型技术浪潮兴起当前，世界人工智能领域科技创新异常活跃，日益成为改变世界竞争格局的重要力量。一批里程碑意义的前沿成果陆续突破，以ChatGPT 为代表的大模型技术引发通用人工智能新一轮发展热潮。1.对大模型的基本认识大模型（LLM，Large Language Model）指的是具有超大参数规模，建立在多头自注意力机制 Transformer 架构之上，以深度神经网络为基础

6、，用海量文本数据预训练而成的语言模型。以 ChatGPT 为代表的大模型能够模拟人类的创造性思维，生成具有一定逻辑性和连贯性的语言文本、图像、音频等内容。大模型基于大数据、大算力、多模态的技术优势，实现从感知世界、理解世界向创造世界的跃迁，推动人类社会加速迈向人机共生的智能社会阶段。大模型体现出三方面技术趋势：一是从决策式 AI 到生成式 AI。决策式 AI 主要是通过分类回归对数据进行分析，主要应用于图像识别、推荐系统、决策智能体等领域。生成式 AI 借助 Transformer 架构等，具有全局表征能力强、高度并行性、通用性强、可扩展性强等优势，主要应用于内容创作、科研、人机交互等领域，实

7、现了从简单感知到内容创造的跃迁。二是从单模态模型到多模态模型。多模态是指通过处理和关联来自多种模态的多源异构数据，挖掘分析信息、提高模型能力的学习方法。典型任务是图像/视频/语言间的跨模态预训练、跨模态定位等，如给定文本生成一段对应的声音、图像/视频与文本大模型治理蓝皮书从规则走向实践（2023 年）2的相互检索或生成等。三是从亿级到千亿、万亿级参数的预训练模型。大模型指的正是模型参数规模庞大，大模型参数规模从亿级发展到百亿、千亿级别，并向着更高规模的参数探索。例如，GPT-3 参数量达1750 亿，文心一言参数规模为 2600 亿等。随着参数规模的增长，模型能力也得到显著提升。2.大模型的变

8、革影响（1）内容生产方式的“颠覆者”大模型实现了高质量、高效率、多样化的内容生产，成为推动内容生产方式变革的重要力量。一是信息内容生产主体发生显著变革。人工智能在信息收集、筛选和整合、推理的全过程都能替代人力，极大地解放人力资源。二是信息内容生产效率快速提升。大算力驱动强算法处理大数据，在自然语言处理、计算机视觉、自动驾驶、等各领域多种任务上，都能高质量作出结果判断，高效率进行内容生成。三是信息内容传播出现颠覆性变化。信息的生产、传播更加便利，尤其是降低了专业知识的获取门槛。信息内容的表现形态更加丰富，利用人工智能创生技术，图、文、代码等相互转换更加自由，可以一键生成“数字人”分身，开启智能互

9、联时代。（2）通用人工智能的“先行者”大模型是迈向通用人工智能的重要技术探索。一是具备了与人类智能相媲美的综合智能能力。大模型的能力不再局限于自然语言、视觉等特定方面，而是具备了执行一般智慧行为的能力，广泛拓展了人工智能技术的适用范围。二是具备了通用型技术能力的潜力。业界普大模型治理蓝皮书从规则走向实践（2023 年）3遍认为，大模型是智能时代的关键基础底座，各领域不再需要单独开发人工智能，仅需调用大模型接口即可。将来可能构建出新的应用生态、创造新的用户接口，并带来潜在商业模式的变革。三是具备了赋能千行百业的适应性。大模型可作为底层技术，垂直应用于各个产业和复杂场景。这种可以嫁接千行百业的智能

10、生产力，正在重塑和影响未来生活。（3）人机交互的“协作者”大模型使得人类行为与机器运行之间的协作更加自然、高效和智能，拓展了更为广阔的人机交互空间。一是呈现出极大的语言表达的自由度。大模型“善于”理解和生成自然语言，人们可以自由提问或表达需求，不必担心特定的格式或指令。这种自由度使得人与机器的交互更为自然、灵活。二是呈现出极为个性化的交互体验。大模型可以通过分析和理解用户的喜好、兴趣和上下文信息，进行定制化的服务和建议。大模型的即时回应和连续对话，给用户提供了实时的帮助和引导。Web 2.0 之父蒂姆奥莱利（Tim OReilly）认为未来的人工智能系统将成为人类工作的协作者，通过人机合作实现

11、更强大的效果。（二）大模型引领数字化变革（二）大模型引领数字化变革大模型体现出强智能性、强通用性、强交互性，为进一步的产业革新与数字政府发展奠定了坚实的基础。根据麦肯锡报告，生成式人工智能每年或将为全球 GDP 增加 2.6-4.4 万亿美元。根据 Markets andMarkets 报告，2023 年全球生成式人工智能的市场规模预计为 110.3亿美元，2028 年预计将达到 518 亿美元，年复合增长率达 35.6%。大模型治理蓝皮书从规则走向实践（2023 年）41.大模型推动产业跨域深度融合凭借大数据、大市场、多场景优势，人工智能与交通、医疗、工业等传统行业深入融合，涌现出一批新业态

12、新模式。在工业领域，大模型实现汽车、建模等设计的自动优化、打造 3D 模型、通过智能物流、智能安防实现智能化管理；在医疗领域，大模型实现蛋白质分子的结构预测、辅助医生影像读片与分析病例报告，推出 AI 陪护与交互式心理咨询；在金融领域，大模型催生了数字员工，借助 AI 客服、AI 投资顾问、AI 财务实现服务的自动化，并进一步优化投资管理与风险管理。据埃森哲预计，2035 年人工智能应用将为制造业带来 4万亿美元额外增长，年增长率可达 4.4%。2.大模型提升公共服务水平当前，公共领域大模型应用如火如荼，为公共服务提质增效。美国、英国、葡萄牙、新加坡等 13 个国家或地区已将 ChatGPT

13、应用于政府内部办公、公共服务提供等场景。据日本野村综合研究所开展的网络问卷调查显示，政府部门对 ChatGPT 的利用率达 17.5%，仅次于信息通信业（32.8%）和制造业（19.2%）。从市场份额来看，根据普鲁杜尔公司（Prudour Pvt.Ltd）数据显示，2022 年各国政府应用大模型的市场份额超过 1 千万美元，预计 2032 年超过 5 亿美元，年复合增长率达 45.8%。大模型技术的引入可以显著提升人机交互的友好程度。同时，大模型在信息收集、数据分析以及语言重塑能力层面的优势，能够有效协助整合政府治理资源，改善政府治理结构，打破政府组织壁垒，实现跨部门、跨层级的协同治理。大模型

14、治理蓝皮书从规则走向实践（2023 年）5（三）大模型带来的典型风险（三）大模型带来的典型风险大模型在提升产业效率与社会生产力的同时，亦伴随着多重风险与挑战，有必要从技术自身缺陷引发的风险、技术应用在不同层面带来的问题与挑战等维度出发，梳理和探讨大模型发展面临的困局。1.大模型自身技术缺陷带来的风险挑战一是大模型的生成“幻觉”问题引发生成内容不可信。生成幻觉通常指模型按照流畅正确的语法规则产生的包含虚假信息甚至无意义内容的文本。幻觉一般被认为是模型生成的文本不遵循原文或不符合事实，在大模型场景下主要指不符合事实，即出现“一本正经胡说八道”的情形。幻觉产生的本质原因是大模型的输出结果是根据概率推

15、理而成的，这导致了大模型可能针对一个原本模糊或者不确定的预测，给出一个“过度自信”的结果。因此，OpenAI 公司首席技术官Mira Murati 亦指出，ChatGPT 和底层大型语言模型的最大挑战是其会编造错误的或不存在的事实。二是大模型的“涌现”效应带来模型能力不可控。所谓智能“涌现”，是指大语言模型在没有经过针对性训练的任务，包括需要复杂推理能力的任务中，同样表现出卓越的性能。这种“智能涌现”能力通常在小模型中未被发现，而只会在具备一定规模的大模型中出现。目前仅能够明确观测到当模型大小超过一定阈值时，模型各方面综合能力得到质变式爆发增长的“涌现”现象，但却无法确定“涌现”的阈值所在，这

16、使现有大模型的“智能涌现”能力具有突发性、不可预测性和不可控性，例如，在某用户故意“激怒”ChatGPT 后，后者威大模型治理蓝皮书从规则走向实践（2023 年）6胁将披露该用户的 IP、居所等个人信息，甚至损害其名誉。不少人工智能研究人员亦发出警告，如果控制不当，足够强大的人工智能模型可能超越人类智能成为地球主导力量，引发灾难性后果。三是大模型的脆弱性和攻击性造成外部安全隐患难以根除。由于技术本身的特性，没有一个系统是永远安全和不可能被攻破的。一方面，随着大模型生成侧的高度发展，对其进行网络攻击日渐增多。例如通过在提示词后增加一些不规则后缀，即可让此提示词绕过大模型的拦截策略，让其生成预料之

17、外的内容。另一方面，大模型应用降低了漏洞查找与系统攻击的难度。如果模型被恶意植入后门，模型的安全也会受到威胁，尤其在大模型应用下，漏洞查找与系统攻击变得更加容易，导致系统安全隐患持续升级。例如，有攻击者利用 ChatGPT生成自动攻击的代码，让它更加高效的利用某个目标系统的漏洞，进行网络攻击。2.大模型在个人维度引发的风险挑战一是加深“信息茧房”并影响公平正义。一方面，以呈现高频次单一信息为生成机制会加深“信息茧房”。过去，个人自主进行信息检索是往往能够获得来源丰富、多种多样的信息以供选择，从而形成对所欲探究事物更全面的认知；而在大模型应用下，个人只能被动接受模型提供的信息，而无法获取样本数量

18、不占优势的“小众”信息，使得大模型生成内容类似于“茧房”，将个体对事物的认知桎梏于有限信息之中。1另一方面，大模型训练数据存在的固有偏见和歧视问1参见 https:/ 年）7题。这是由于大模型对数据高度依赖，所以生成结果会体现出数据源的偏向性。如 GPT-3 显示出了基于宗教信仰的偏见和性别歧视，大语言模型 Gopher 存在职业与性别之间的刻板印象联想，图像生成模型 Dalle-2 则表现出显著的性别和种族歧视。二是技术滥用侵犯人格尊严并阻碍个人发展。一方面，大模型的恶意利用侵犯人格尊严。当前已有大量案例表明，大模型被用于生成虚假的有损公民人格尊严的视频、音频、图像等，进而被恶意应用于网络欺

19、凌、辱骂、造谣等场景下，给当事人带来极大的精神及财产损害。例如，乔治华盛顿大学法学院教授 Jonathan Turley 发现，ChatGPT生成内容显示他在阿拉斯加课程旅行中对学生进行了性骚扰。然而，Turley 教授并未带领学生去阿拉斯加或任何其他地方进行课程旅行，也未曾受到过性骚扰学生的指控。另一方面，大模型的过度依赖阻碍个人发展。当前越来越多个体频繁应用大模型服务完成工作学习任务，例如用 ChatGPT 写论文、写判决书的案例屡见不鲜，且个人对大模型的依赖表现出应用日益广泛、程度日益加深的特征，恐导致个人学习能力以及认知水平可能大幅退化，影响人与社会的长期发展潜力。美国智库布鲁金斯学会

20、刊文指出，ChatGPT 将可能导致人类记忆和批判能力的下降。三是情感计算造成潜在伦理风险并扰乱人际关系。情感计算是模拟某个角色并设定其情绪或心理状态的新型人工智能应用，其发展与普及可能给个人行为、社会关系、伦理道德等诸多领域带来巨大的冲击。一方面，情感计算可能瓦解传统人际关系。以近期众多人工智能大模型治理蓝皮书从规则走向实践（2023 年）8企业推出的“AI 伴侣”为例，该类应用可能导致个人不愿花时间精力与真正的人类进行情感交流，从而导致传统的人际关系与婚姻家庭结构遭到重创，甚至颠覆过往的伦理道德观念。另一方面，情感计算可能不正当地引导个人情绪、行为乃至价值观。人工智能产品可能会有偏见或有目

21、的性地引导某些个体，尤其当人类习惯于长期与机器人交互时，人获取的信息会很自然地被机器所引导，进而影响个人的价值观，或是控制个人的情绪与行为。3.大模型在企业维度引发的风险挑战一是用户过度授权、违规信息使用以及黑客攻击，引发用户隐私与商业秘密的泄露风险。在用户个人隐私方面面临侵权诉讼，当前，大模型的用户使用条款普遍给予企业超出必要限度的个人信息使用权，加大了用户个人信息泄漏的风险，从而担负极大的违规风险。以ChatGPT 为例，其使用条款明确规定，除非用户要求 OpenAI 不对其输入和输出内容进行使用，否则 OpenAI 拥有对任何用户输入和输出内容的广泛使用权，以达成优化训练 ChatGPT

22、的目的。在企业商业秘密方面，企业员工很有可能故意或过失地违反公司保密制度，将公司的营业信息、技术信息、平台底层代码、近期营销计划、公司薪酬体系等信息泄露，黑客也可能利用系统漏洞发起攻击获取海量涉密信息，从而导致企业商业秘密泄露风险。二是内容生成依托海量文本与图像数据，引发版权侵权风险。一方面，大模型生成内容由于缺乏规范的许可使用机制具有侵权风险。由于大模型根据概率推理的生成机制，其使用作品难以逐个、准确地大模型治理蓝皮书从规则走向实践（2023 年）9援引法定许可或合理使用条款，这使得大模型未经许可使用作品的行为可能会侵犯被使用作品的复制、改编、信息网络传播权等权利。例如 2023 年 1

23、月，全球知名图片提供商华盖创意（Getty Images）起诉热门人工智能绘画工具 Stable Diffusion 的开发者 Stability AI，称其未经许可从网站上窃取了数百万张图片。再如，用于谷歌 T5 和 META的 LLaMA 等大模型训练的 C4 数据集，虽然源自公开网站，但也包括至少 27 个被美国政府认定为盗版和假冒产品市场的网站。另一方面，大模型生成内容存在与既有作品“实质性相似”的潜在侵权风险。如果大模型通过分析学习后生成的内容与原始作品过于相似，以至于可能会误导公众或混淆原始作品的来源，其可能会因与他人作品存在“实质性相似”而被认定为侵权，从而导致著作权侵权相关的诉

24、讼，而含有侵权内容的大模型生成内容的使用者亦有可能需要承担侵权责任。2三是应用形态颠覆现有数据收集模式，引发数据安全风险。大模型生成工具的运作机制导致企业纬度的违规数据传输与敏感信息泄露频发。以 ChatGPT 为例，根据其运作原理，用户在输入端提出的问题首先会传输到位于美国的 OpenAI 公司，随后 ChatGPT 才会给出相应回答，因此存在数据泄露风险。如韩媒报道，三星半导体事业部向员工开放使用 ChatGPT 后短短 20 天内即发生多起数据违规输入事件。又如数据安全公司 Cyberhaven 调研显示，不同行业客户的 160万名员工平均每周向 ChatGPT 泄露敏感数据达数百次。2

25、参见 https:/ 年）104.大模型在社会维度引发的风险挑战一是冲击就业市场，提升劳动力转型下的社会不安定性。虽然大模型带来的岗位智能化升级将提升社会生产效率、创造新兴岗位，但也会导致特定领域或人群的失业危机。大模型对初等和中等技能白领岗位需求的冲击较大，从事重复性、机械性等工作的劳动者将极易被大模型工具替代。据高盛研究报告分析，以美国为例，46%的行政工作和 44%的法律工作将受到较高程度的影响。在此趋势下，相当数量的劳动者需在短期内进行与社会新需求相匹配的职业转换，这对他们的经济收入、社会地位、身心健康都可能产生较大影响，如果大规模劳动力转型不当甚至有可能引发社会动荡等风险。二是扩大数

26、字鸿沟，加剧社会分化和不平等。大模型的拥有程度、应用程度以及创新能力的差别将引发信息落差，进而造成新一轮数字鸿沟，甚至加剧社会分化和不平等。从国家与地区层面来看，在大模型加速迭代的进程中，仅有少数发达国家能够能够凭借庞大的数据、算力等资源进一步掌控生产力资源，这将进一步扩大发达国家与发展中国家的差距。例如，美国的 GPT-4 总共包含了 1.8 万亿参数，一次的训练成本为 6300 万美元，非百亿美金公司很难持续跟进。从组织和个人层面来看，大模型服务对于不同群体的可得性是不同的。部分地区或群体可能由于无法获得高质量的互联网连接、教育水平与专业背景不足等原因，无法有效且正确地使用 GPT 技术。

27、这会使得ChatGPT 等技术成为精英阶层提升和优化生产力的有力工具，进一步拉大精英阶层和社会底层、高知分子与普通劳动者之间的差距。大模大模型治理蓝皮书从规则走向实践（2023 年）11型生成机制对于不同群体的“关注度”是不同的。特殊群体及其呼声会在数字化进程中成为被排斥的对象，沦为“数字弃民”，这可能导致未来日益依托于大模型的社会治理框架忽视特殊群体的需求，加剧社会在年龄、地域等纬度的不平等。三是深度伪造与对抗性攻击，危及公共安全与利益。一方面，大模型被用于制作虚假文本、音频、视频等深度伪造内容，损害公共利益。当前，通过 AI 换脸、语音模拟、人脸合成、视频生成等恶意运用手段生成的深度伪造信

28、息，既加剧了公众对于公开信息的不信任感，又导致相关虚假信息与虚假形象被运用于诈骗、政治干预、煽动暴力和犯罪等破坏公共利益的领域，造成了极大的安全风险。另一方面，对抗性攻击的存在威胁着公共安全。大模型容易受到对手生成的对抗样本的“注入式攻击”，即图谋不轨者从算法角度别有用心地构造并注入特定词语、符号或图片，进而诱导大模型逻辑混乱、输出错误，再利用这一漏洞进行欺诈或篡改，甚至直接图谋根源极其隐蔽的安全事故。3例如，研究人员通过在停止信号图片添加细微噪声，就可以欺骗自动驾驶系统错认为速度限制45英里/小时，产生潜在事故风险。二、技术变革下大模型治理框架日渐明朗（一）治理模式：敏捷治理成为国际较为通行

29、的治理方案（一）治理模式：敏捷治理成为国际较为通行的治理方案2018 年，世界经济论坛提出敏捷治理概念，讨论如何应对第四次工业革命中的政策制定问题，敏捷治理理念开始受到广泛关注。敏3参见 https:/ 年）12捷治理是“一套具有柔韧性、流动性、灵活性或适应性的行动或方法，是一种自适应、以人为本以及具有包容性和可持续的决策过程”。一方面，敏捷治理体现为快速感知能力。强调对时间的高度灵敏度，需要时刻准备应对快速发展中的变化，主动接受变化并在变化中学习。能够快速感知到内外部环境的变化，预测内外部面临的风险问题。另一方面，敏捷治理强调参与主体应具有广泛性。治理主体不再局限于政府，而是需要与开发者、部

30、署者、用户等利益相关者密切互动，建立机制持续性监测和讨论政策内容，保持长期可持续性。从治理原则来看，采取原则指引为主、灵活政策为辅的策略。敏捷治理强调在治理原则指导下，使用灵活政策工具作为补充，依据情况及时调整大模型治理方向和落地举措。在治理关系上，监管者和市场主体之间存在重要的相互依赖关系。双方在信任基础上深入密切交流，监管者可以更好了解技术趋势和产业发展走向，准备评估相关风险并制定合理措施。从治理工具来看，治理措施要“下手快”并允许包容试错空间。“下手快”可以减少企业的沉默成本，减少技术路径和商业模式的转变损失。包容试错意味着鼓励企业积极创新，对于风险程度较低的问题，支持企业自行整改消除风

31、险。4在治理模式选择上，灵活感知、动态调适的敏捷治理更契合大模型发展需求。大模型具有突破性、变革性、高风险性等特点，传统监管模式面临着 AI 自主演化控制难、迭代快速跟进难、黑箱遮蔽追责难等问题，一劳永逸的事前监管模式已经难以应对不断推陈出新的人4参见薛澜，走向敏捷治理：新兴产业发展与监管模式探究，中国行政管理2019年第 8 期。大模型治理蓝皮书从规则走向实践（2023 年）13工智能发展需求。开展科技伦理敏捷治理试点工作，是边发展、边治理，边摸索、边修正的动态治理方式，对于平衡安全和创新，在实践中不断提炼和打磨大模型治理方案具有重要意义。欧盟、英国、美国均在不同层面引入敏捷治理以规制大模型

32、风险。美国出台法案细化基于风险的敏捷治理具体实施路径。2023 年 5 月，美国提出建立数字平台委员会相关法案，指出应采用基于风险的敏捷方法，并建立规制技术风险的新机构。法案认为，新机构应效仿企业的敏捷治理做法，制定行为守则，并以透明、反应迅速的方法执行相关标准。法案还为敏捷治理提出了具体的实施路径，例如为准则制定过程设定时间表，确定并量化需要解决的问题，建立多利益相关方专家小组，专家组对政策实施效果进行持续追踪，找出新问题并循环整个过程。英国实行灵活的“按比例监管”以提升在人工智能领域的竞争优势。2023 年 3 月，英国发布促进创新的人工智能监管方式白皮书，明确监管目标为“提供清晰的、有利

33、于创新的监管环境”，强调“按比例监管”的灵活监管方式，力图推动英国成为“世界上建立基础人工智能企业的最佳地点之一”。欧盟总体基调严苛，但仍体现出敏捷治理思路。如人工智能法案第 56b 条款指出，人工智能办公室应对基础模型进行监测，并与开发者、部署者就其合规性进行定期对话，讨论行业自我治理的最佳做法；定期更新将基础模型界定为大型训练模型的判定标准，记录并监测大模型运行的实例。再如，该法案第五章“支持创新的措施”中，提出人工智能监管沙箱制度，要求建立受控环境，在一定时间内推动人工智能系统的开发、测试和大模型治理蓝皮书从规则走向实践（2023 年）14验证。我国采取包容审慎、分类分级监管的敏捷治理模

34、式。两办印发关于加强科技伦理治理的意见，提出敏捷治理的治理理念，要求加强科技伦理风险预警与跟踪研判，及时动态调整治理方式和伦理规范，快速、灵活应对科技创新带来的伦理挑战。国家网信办等七部门出台生成式人工智能服务管理暂行办法，坚持发展和安全并重、促进创新和依法治理相结合的原则，采取有效措施鼓励大模型创新发展，对大模型服务实行包容审慎和分类分级监管。相反，加拿大立法进程中的非敏捷做法遭到外界批判。国际治理创新中心评论文章加拿大人工智能立法草案需要重新修订一文批评道，加拿大正在制定的人工智能与数据法案敏捷性不足，敏捷监管应该是不断迭代和数据驱动的，有明确的程序来评估政策影响并作出调整，但该草案并不具

35、备这些要素。总体来看，作为一种新型治理思路，敏捷治理具备全面性、适应性和灵活性特征，契合大模型的治理需求。如何有效落地敏捷治理理念，是当前需要探索的重要任务。（二）治理主体：激励多元主体协同治理成为全球共识（二）治理主体：激励多元主体协同治理成为全球共识1.国际组织是全球人工智能治理的重要力量越来越多的国际组织开始关注人工智能的全球治理问题。在增进全球利益方面，国际组织有助于推动人工智能的全球应用和普及，提升各地产业发展和社会服务水平，惠及发展中国家和地区。在管理共同风险方面，人工智能具有不受制于国界的风险跨境生成、扩散特征，单纯的国内监管无法有效管控风险，因此，在国际组织推动下，全球大模型治

36、理蓝皮书从规则走向实践（2023 年）15协同制定标准规范、支持和激励最佳国际实践，成为人工智能治理的应有之义。根据欧洲委员会正在推进的关于人工智能规制框架的建议，从 2020 年起国际组织已经超过国家成为主要的人工智能举措的来源；从 2015 年到 2023 年，国家政府层面共发布了 172 项举措，而国际组织5同期实施了 214 项举措，总体数量也超过各国政府。6（见图 1）国际组织在引导形成国际共识、建立国际通行和互操作的治理规则、确保新一轮人工智能发展造福全人类等方面具有重要作用和独特优势。来源：欧洲委员会图 1 2010-2023 年间政府和国际组织发布的人工智能举措数量对比2.国家

37、政府加紧完善人工智能监管架构国家政府在人工智能治理中发挥着领导性作用，从国家层面统领大模型研发、设立专业监管机构、以及政策与法律规则的制定等。国5参见统计数据中的“国际组织”包括欧洲委员会（CoE）与欧盟（EU）、经合组织（OECD）和联合国教科文组织（UNESCO）、G7、G20 等。6参见 Council of Europe,AI Initiatives,https:/www.coe.int/en/web/artificial-intelligence/national-initiatives,visited on 29 August,2023大模型治理蓝皮书从规则走向实践（2023 年）

38、16家政府作为肩负公共事务管理职责的公权力机关，是公共利益和广大民意的代言人，也是国家安全和社会稳定的捍卫者。为更好应对大模型对传统监管架构和机制挑战，部分国家从不同维度加紧推进监管组织机构调整。一是部分国家和地区“另起炉灶”，探索建立专门的人工智能监管机构。欧盟将根据人工智能法案设立欧洲人工智能办公室，负责监督并确保法律的有效实施，协调联合调查等。欧洲人工智能办公室将下设管理委员会（由各成员国代表组成的）、秘书处、咨询论坛（包括企业、民间社会、学术界等利益关联方）三个部分。7西班牙率先成立欧洲首个人工智能监管机构西班牙人工智能监管局（AESIA）。该机构将负责监管算法应用、数据使用以及确保

39、AI 系统遵守道德规范，其首要任务是执行欧盟人工智能法案。二是现有监管部门下设人工智能工作组，规制本部门管辖范围内大模型带来的风险。美国国土安全部成立首个人工智能特别工作组，旨在保护国家免受人工智能技术尖端发展造成的安全威胁。美商务部宣布，国家标准与技术研究院（NIST）将成立新的人工智能公共工作组，集合私营和公共部门的专家力量，重点关注大模型相关风险挑战。8韩国文化体育观光部成立版权制度改进工作组、数字内容人工智能工作组、产业应用工作组，将致力于开发韩文语料库、审查版权侵权行为、开发试点项目等。三是在中央层面加强各行业部门之间的监管协同。大模型技术可被普遍调用于各类行业场景，对政7参见欧盟人

40、工智能法案第六编第一章要求8参见 NIST 制定指导意见，指导在 NIST 发布的 AI 风险管理框架内开展研发等短期目标，中期来看工作组将致力于开展大模型测试评估，长期来看，将探索有效利用大模型解决环境、健康等社会问题的可能性。大模型治理蓝皮书从规则走向实践（2023 年）17府部门的监管协调能力提出更高要求。英国支持创新的人工智能监管方案白皮书指出，由于通用大模型供应链的广泛性，难以将其纳入任一监管机构的职权范围，应加强中央层面的监管协调。英国将重点依靠现有的金融行为监管局、信息专员办公室、竞争与市场管理局、平等与人权委员会、药品和保健产品监管机构展开监管。3.企业站在人工智能治理的最前线

41、最前沿企业在推动人工智能治理规则和标准落地上发挥着决定性作用，是践行治理规则和行业标准的中坚力量。当下人工智能领域内产业界呈现出领先于学术界的发展态势。2022 年，由产业界开发的机器学习模型数量高达 32 个，而学术界则只研发了 3 个。（见图 2）一是建立人工智能行业治理共同体。微软、谷歌、OpenAI 等成立前沿模型论坛，致力于推进人工智能安全研究，确定部署前沿人工智能模型的最佳实践，并促进政企之间的信息共享。9韩国汽车、造船、机器人等十大主要行业领军企业则启动建立了包括政府部门、公共机构及 400 多家国内企业的跨行业人工智能联盟，该联盟将设立行业数据、法律法规两个政策小组以推进人工智

42、能治理。10二是企业内部增设人工智能治理相关组织架构。国内外多家企业均设置了人工智能治理专门工作组。例如，微软设置了三个机构负责人工智能治理事务，分别是 AI 办公室、AI 战略管理团队以及人工智能、伦理与工程研究委员会。IBM 为践行人工智能伦理治理成立了 AI 伦理委员会，9参见https:/ http:/ 年）18以支持公司执行人工智能伦理原则。商汤科技则成立 AI 伦理与治理委员会，统筹推进人工智能伦理治理工作体系建设。三是企业自身推动完善人工智能治理机制。一方面，企业提出治理原则和指南等构建人工智能治理生态系统。2023 年 5 月，微软发布人工智能治理：未来蓝图，提出治理人工智能的

43、五大建议，例如应建立并实施政府主导的人工智能安全框架，为控制关键基础设施的人工智能系统部署安全“刹车”。另一方面，企业不断创新治理工具来落实 AI 治理工作。在 2023 年 RSA 大会上，谷歌推出大模型网络安全套件云安全AI Workbench，将大模型引入网络安全领域。来源：斯坦福 HAI图 2 2002-2022 重要机器学习系统数量（按行业划分）（三）治理机制：软硬兼施推进大模型治理（三）治理机制：软硬兼施推进大模型治理围绕可信可控、以人为本、公平公正等人工智能治理价值目标，全球各国注重“刚柔并济、软硬兼施”，从柔性伦理规范和硬性法律法规等维度发布具体的人工智能规则规范。根据世界经合

44、组织大模型治理蓝皮书从规则走向实践（2023 年）19（OECD）人工智能政策观察站最新统计，已有 69 个国家和地区发布 800 多项人工智能政策。111.以软法为引领的社会规范体系全球在人工智能治理中率先推进“软法”创制，“软法”与促进创新发展的治理需求有着天然的契合性。一般而言，伦理、行业标准等“软法”的制定方式和周期更富弹性，参与主体具有高程度的协商性，内容更细致更具针对性，有助于实现人工智能治理的敏捷化、多元化和场景化。近年来，主要国家和国际组织纷纷发布 AI 伦理原则和规范文件，例如 G20人工智能原则、国际电气和电子工程师协会（IEEE）人工智能设计伦理准则、欧盟可信人工智能伦理

45、指南等。我国在科学技术进步法关于加强科技伦理治理的意见等顶层设计下，积极推进制定人工智能伦理治理规范，落实科技伦理审查、监测预警、检测评估等要求，提升公共服务水平，推动科技伦理治理技术化、工程化、标准化落地。伴随大模型的应用，软法治理体现出以下趋势特点：一是受地域文化、发展水平等因素影响，各国伦理治理重点存在分歧。西方国家更关注算法偏见歧视问题，保障少数族裔免受大模型应用带来的歧视风险。发展中国家更为重视透明度和可解释性，保障新一轮人工智能浪潮下的国家数字主权。二是推进出台可评估、可验证的标准。为同步落实人工智能法案要求，欧盟委员会下发人工智能标准需求清单，欧盟立法委员直接参与标准工作，保障立

46、法到标准的落地。11参见https:/oecd.ai/en/dashboards/overview大模型治理蓝皮书从规则走向实践（2023 年）20爱尔兰政府推出人工智能标准和保证路线图，协助爱尔兰企业以合乎道德的方式使用人工智能。三是提升人工智能的社会化服务水平。国际标准组织 IEEE 面向行业推出了人工智能治理认证制度。英国则发布建立有效人工智能认证生态系统的路线图，建立包括影响评估、偏见审计、认证、性能测试等中立第三方服务，力图培育世界领先的人工智能认证行业。四是出台行为守则、指南文件等作为过渡阶段的适用规则。在出台正式的法律法规之前，部分国家率先发布行为守则等，为企业或政府利用大模型提

47、供指引。例如，加拿大政府发布生成式人工智能行为守则，要求在加拿大人工智能和数据法生效之前，由加拿大公司自愿执行。12美国波士顿发布全球首份政府应用生成式人工智能临时指南，指南适用于除波士顿公立学校外的所有城市机构和部门，列明了政府部门应用大模型的部分示例用例及注意事项，例如不要在提示词中包含机密信息等。2.以硬法为底线的风险防控体系面对大模型风险调整，建立完善“刚性”的硬法约束，通过构建风险防控体系，提前布局、树立起防火墙，把握大模型发展的底线以规避风险的发生。在新一轮人工智能浪潮中，以欧盟人工智能法案、我国生成式人工智能服务管理暂行办法为代表的法律法规均受到各国高度关注。具体来看，体现如下

48、趋势特点：一是总体来看人工智能立法步伐加快，但仍有部分国家采取保守观望态度。斯坦福报告显示，大模型的广泛应用成为推动人工智能立12参见 https:/ 年）21法的关键节点。2016 至 2022 年间全球 AI 法律的数量增加了 36 项，立法程序中提到人工智能的次数增长近 6.5 倍（见图 3、图 4）。美国参议院舒默等召开数次听证会，提出两党人工智能立法框架，以加快立法进程。新加坡、印度则表示暂不监管人工智能，印度信息技术部部长阿什温尼瓦什纳在 2023 年 4 月表示，政府目前并未考虑出台任何法律来规范人工智能在印度的发展。二是基于风险的分级分类方式仍然是大模型治理的重要诉求。在欧盟基

49、于风险的治理理念影响下，分级分类成为平衡创新与发展的重要方式。欧盟-美国贸易和技术委员会发布了一份联合声明，重申“基于风险的（人工智能）方法，以推进值得信赖和负责任的人工智能技术”。日本提出风险链模型（Risk Chain Model），根据不同行业场景提出不同风险分级。德国电力电子与信息技术协会提出 VCIO 模型，指导使用者对应用场景风险等级作出判断。三是后发国家立法注重与已有法律框架的互操作性。加拿大人工智能和数据法立法文件指出，该法案在关键定义和概念、采取以风险为基础的监管路径等方面，均注重与人工智能领域的国际规范相衔接，包括欧盟人工智能法案、经济合作与发展组织人工智能原则和美国 NI

50、ST人工智能风险管理框架等。四是在传统法律框架下探索有效、灵活的执法手段。例如美国注重利用传统立法，例如反歧视法、消费者权益保护法、竞争法等现有法规，来打击诈骗、虚假宣传、欺骗性广告、不公平竞争等行为，并采取相应处罚措施，甚至要求公司删除根据不正当数据训练出的算法。大模型治理蓝皮书从规则走向实践（2023 年）22来源13：中国信息通信研究院根据斯坦福 HAI 报告数据整理图 3 2016-22 年 81 个选定国家立法程序中提及人工智能的次数来源：中国信息通信研究院根据斯坦福 HAI 报告数据整理图 4 2016-22 年 127 个选定国家人工智能相关立法数量三、聚焦大模型治理核心议题规则

下载提示：咨信网仅提供存储空间/不修改/不编辑

【自信AI创作助手】【自信AI导航】
1、请仔细预览页面，基本判断完整性，对于直接下载带来的问题请及时与客服沟通；下载的文档，不会出现我们的网址水印。
2、该文档所得收入（下载+内容+预览）归上传者、原创作者；如果您是本文档原作者，请点此认领！既往收益都归您。

同意并开始全文预览

举报此文档有问题？有机会获“体验VIP”奖励！

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

25 金币 0人已下载

申诉本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请申请举报、认领或删除 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 模型治理报告 2023 规则走向实践

咨信网温馨提示：
1、咨信平台为文档C2C交易模式，即用户上传的文档直接被用户下载，收益归上传人（含作者）所有；本站仅是提供信息存储空间和展示预览，仅对用户上传内容的表现方式做保护处理，对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿，我们不确定上传用户享有完全著作权，根据《信息网络传播权保护条例》，如果侵犯了您的版权、权益或隐私，请联系我们，核实后会尽快下架及时删除，并可随时和客服了解处理情况，尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确)，网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据，平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺，下载前须认真查看，确认无误后再购买，务必慎重购买；若有违法违纪将进行移交司法处理，若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传，付费前请自行鉴别，如您付费，意味着您已接受本站规则且自行承担风险，本站不进行额外附加服务，虚拟产品一经售出概不退款（未进行购买下载可退充值款），文档一经付费（服务费）、不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印，是因预览和防盗链等技术需要对页面进行转换压缩成图而已，我们并不对上传的文档进行任何编辑或修改，文档下载后都不会有水印标识（原文档上传前个别存留的除外），下载后原文更清晰；试题试卷类文档，如果标题没有明确说明有答案则都视为没有答案，请知晓；PPT和DOC文档可被视为“模板”，允许上传人保留章节、目录结构的情况下删减部份的内容；PDF文档不管是原文档转换或图片扫描而得，本站不作要求视为允许，下载前自行私信或留言给上传者【Stan****Shan】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权，请谨慎使用；网站提供的党政主题相关内容(国旗、国徽、党徽－－等)目的在于配合国家政策宣传，仅限个人学习分享使用，禁止用于任何广告和商用目的。
6、文档遇到问题，请及时私信或留言给本站上传会员【Stan****Shan】，需本站解决可联系【微信客服】、【 QQ客服】，若有其他问题请点击或扫码反馈【服务填表】；文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“【版权申诉】”（推荐），意见反馈和侵权处理邮箱：1219186828@qq.com；也可以拔打客服电话：4008-655-100；投诉/维权电话：4009-655-100。