生成式人工智能——Chat...革影响、风险挑战及应对策略_蒲清平.pdf
《生成式人工智能——Chat...革影响、风险挑战及应对策略_蒲清平.pdf》由会员分享,可在线阅读,更多相关《生成式人工智能——Chat...革影响、风险挑战及应对策略_蒲清平.pdf(13页珍藏版)》请在咨信网上搜索。
1、 社科研究与评价重庆大学学报(社会科学版)2023 年第 29 卷第 3 期JOURNAL OF CHONGQING UNIVERSITY(Social Science Edition)Vol.29 No.3 2023Doi:10.11835/j.issn.1008-5831.pj.2023.04.001欢迎按以下格式引用:蒲清平,向往.生成式人工智能 ChatGPT 的变革影响、风险挑战及应对策略J.重庆大学学报(社会科学版),2023(3):102-114.Doi:10.11835/j.issn.1008-5831.pj.2023.04.001.Citation Format:PU Qin
2、gping,XIANG Wang.Opportunities and challenges aroused by ChatGPT as generative AI and strategy for responseJ.Journal of Chongqing University(Social Science Edition),2023(3):102-114.Doi:10.11835/j.issn.1008-5831.pj.2023.04.001基金项目:2022 年度国家社会科学基金高校思想政治理论课研究专项“高校课程思政教学理论与实践研究(22VSZ022);中央高校基本科研业务费项目“伟
3、大建党精神融入思想政治教育的逻辑与路径”(2022CDJSKZX03)作者简介:蒲清平,重庆大学马克思主义学院教授,博士研究生导师,Email:puqingping 。生成式人工智能 ChatGPT 的变革影响、风险挑战及应对策略蒲清平,向 往(重庆大学 马克思主义学院,重庆 400044)摘要:由 OpenAI 研发的生成式人工智能聊天机器人 ChatGPT 一经问世便引起剧烈轰动和广泛热议。ChatGPT 是以深度学习和人类反馈强化学习等技术为基础,经过针对海量数据的预训练,能够根据用户指令,生成内容丰富、风格类人的自然语言文本的大型生成式人工智能语言模型。同其他人工智能聊天机器人相较,C
4、hatGPT 特征鲜明:一是能够保障人机的连续性对话;二是能够在无法理解指令时主动向用户发出追问;三是能够以“人化”而非机器化的话语体系进行自然语言表意;四是能够“记住”用户生产的内容。ChatGPT 作为生成式人工智能的杰作,或将利用强大的自然语言处理能力成为撬动第四次工业革命的一根杠杆,可能引发人类社会的深层次变革。包括:有望通过开辟信息智能化处理的场域,推动产业转型升级、提高劳动者生产力、改进生产工具、优化生产决策以变革生产方式;有助于研究现状梳理、研究思路组织、研究数据处理、研究成果完善以变革科研范式;为教育主体赋能、为教育客体赋权、为教育过程赋魂以变革教育形式;重构劳动生活、消费生活
5、、精神生活以变革生活方式等。科技发展具有两面性,ChatGPT 也会给我们带来系列风险隐患,或将滋生知识产权侵犯、信息窃取、诈骗等法律问题,意识形态安全防线松动、独立思考能力蜕化、价值观塑造遭遇危害等思想问题,劳动者失业、极端事件发生概率增加等社会问题。妥善把握和化解以 ChatGPT 为代表的生成式人工智能带来的机遇与风险,使之增益于国家建设、民族复兴和人民生活,一要在新型举国体制的战略安排下,坚持党的领导、协同“有效市场”和“有为政府”,加强人才队伍建设,凝聚举国之力自主发展生成式人工智能;二要锚向实践,依托落实“赋利应用”机制、“赋值应用”机制、“赋智应用”机制,吸引和支持全社会积极应用
6、生成式人工智能;三要坚持立法先行和严格执法,以法律法规对生成式人工智能的发展和应用进行约束;四要强化思想引导和综合素质建设,引领全民有效应对生成式人工智能带来的危机。蒲清平,等 生成式人工智能 ChatGPT 的变革影响、风险挑战及应对策略关键词:ChatGPT;生成式人工智能;自然语言处理中图分类号:TP18 文献标志码:A 文章编号:1008-5831(2023)03-0102-13生成式人工智能(Generative AI)是通过各种机器学习方法从数据中学习对象的特征,进而生成全新的、完全原创的内容(如文字、图片、视频)的人工智能1。人工智能实验室 OpenAI 研发的人工智能聊天机器人
7、 ChatGPT(Chat Generative Pre-Trained Transformer)于 2022 年 11 月 30 日一问世便凭借着便捷的接入方式和较低的操作门槛,实现了生成式人工智能的“去神秘化”和“去壁垒化”,广泛而迅速地介入人们日常生活的各个方面。2023 年3 月,OpenAI 发布了新一代 AI 模型GPT-4,微软随即宣布,将新模型集成到必应(Bing)搜索引擎中,并将利用生成式人工智能技术来增强 Office 办公套装。2023年 3 月 16 日,百度发布中国版的 ChatGPT 文心一言。与此同时,也出现了对生成式人工智能风险的担忧,以埃隆马斯克为主要代表的一
8、众科技界人士联名呼吁,应暂停训练比 GPT-4 更为强大的人工智能系统,并通过澄清“科技发展社会形态演化”的结构,证明科技向人类社会施加的作用是巨大而深刻的。作为生成式人工智能在自然语言处理方面的先进应用,ChatGPT 正在深度形塑和重构人机交互图式,必将给人类社会带来颠覆性影响和深层次变革。只有深入研究 ChatGPT 的本质、机理和特点,系统研判 ChatGPT 给人类社会带来的机遇与风险,切实探索应对以 ChatGPT 为代表的生成式人工智能的有效策略,才能确保其在新时代服务和增益于以中国式现代化全面推进中华民族伟大复兴的新征程。一、ChatGPT 的内涵、机理与特征ChatGPT 作
9、为生成式人工智能在自然语言处理方面的杰出代表,一经问世便吸引了全世界的瞩目,引发学术界对其内涵、机理和特征的深入研究。(一)ChatGPT 的内涵生成式人工智能起源于 20 世纪 40 年代的控制论,1956 年“人工智能”的概念被首次提出,2012 年生成式人工智能 AlexNet 模型问世,2017 年 Google Brain 团队提出 Transformer 架构,2018 年谷歌的大模型参数过亿,到 2022 年模型参数达到 5 400 亿。2022 年 ChatGPT 作为生成式人工智能的优秀代表脱颖而出。学术界对 ChatGPT 主要有四种代表性认知:(1)ChatGPT“本体论
10、”。学者们从技术支撑、业务逻辑、呈现样态等维度入手,对 ChatGPT 的本质进行抽象和揭秘。Joyjit Chatterjee 等学者认为,ChatGPT是建立在自然语言处理和深度学习之上的对话型人工智能模型2;Eva A.M.van Dis 等学者认为,ChatGPT 是一种大型语言模型,是针对数据开展自动学习的机器学习系统,能够在接受大规模文本数据训练后,生产复杂且看似富有智能性的文本3;Tiffany H.Kung 等学者认为,ChatGPT 是基于训练数据,以自然语言对输入文本作出回应的对话式大型语言模型4;李峥认为,ChatGPT 是基于深度学习算法,能够对用户指令进行理解、扩容和
11、转化,从而生成复杂内容的人工智能应用5。通过对当前学术界关于 ChatGPT 本质的讨论和分析,笔者认为,ChatGPT 是以深度学习和人类反馈强化学习等技术为基础,经过针对海量数据的预训练,能够根据用户指令,生成内容丰富、风格类人的自然语言文本的大型生成式人工智能语言模型。(2)ChatGPT“构成论”。部分学者将 ChatGPT 的落地应用和发展演进归纳为大模型算法、大数据和大算力相互贯通和配合的结果。就算法而言,ChatGPT 遵循“人类反馈强化学301 重庆大学学报(社会科学版)2023 年第 29 卷第 3 期 习”的训练范式,通过人机双向问答的过程,提升该模型针对答案质量的评判能力
12、。就数据而言,ChatGPT 拥有逾亿万单词的人类语言数据的支持,这是其获取语言生成能力、上下文理解能力和新知识生成能力的重要前提。就算力而言,与现实世界中的生产力相似,算力同样在数字世界中承担着基础性的职责,如果算力不足,那么 ChatGPT 的训练和运行便无从谈起。目前驱动 ChatGPT 的算力主要来源于微软云计算服务 Azure AI 的超算基础设施6。(3)ChatGPT“功能论”。部分学者指出,ChatGPT 具备根据用户指令进行自然语言文本生成、信息检索和整合等功能,可以赋能社交、翻译、写作、编程、教育、科研、医疗等领域7。(4)ChatGPT“短板论”。ChatGPT 在自然语
13、言处理方面的先进性已经在一定程度上得到公认,不过,部分学者亦对 ChatGPT 尚存的缺陷作出客观分析。有学者提出“事实性错误说”:用来训练 ChatGPT 的资源是来源于互联网的开放域数据,其正确性无法得到全面保障,这导致 ChatGPT 生成的部分内容中会包含事实性错误3。还有学者提出“通而不专说”:由于拥有千亿级别的模型参量,ChatGPT 的知识域较宽,针对常识性和通识性问题的解答能力较强,而在涉及部分难度和复杂系数极高的专业性问题时,却难以作出高质量回应8,不过,随着数据涵盖范围更加广泛、运行更加稳定、创意性表现更加突出的 GPT-4 的成熟与发布,这种情况将得到改善。(二)Chat
14、GPT 的机理ChatGPT 以大型语言模型(Large Language Model,LLM)为基底,因此,探究 ChatGPT 的机理需要把握住针对大型语言模型的设计、训练及其运行这条主线。(1)设计思路。在模式选择方面,由于中小机构和个人普遍不具备对大型语言模型进行部署和使用微调(Fine-tuning)模式以完成参数修改的资源和能力,于是 ChatGPT 的研发方将大型语言模型打造为公用基础设施,使之以基础设施即服务(Infrastructure as a Service,IaaS)模式运行,以提示词(Prompt)模式完成任务;在规模建构方面,由于对接和满足数量与种类指数化增长的用户
15、诉求是 ChatGPT 的重要旨归,这需要以能够从海量数据中学习和吸收知识的大型语言模型为支撑,因此,必须确保托举 ChatGPT 的大型语言模型拥有数量庞大的模型参数,以完善知识存储效能6。(2)训练过程。首先,研发方选定一款大型语言模型作为原始模型;其次,创建人类偏好数据:标注人员就随机挑选的问题作出高质量回答,生成“人类表达任务结果”的标注数据,将之反馈至原始模型以供学习;再次,训练反馈模型(Feedback Model):标注人员基于问答的相关性、答案的准确性、丰富性和无害性等人类偏好标准,对原始模型就随机挑选的问题输出的答案进行排序;最后,训练打分模型(Reward Model):利
16、用完成标注的人类偏好数据训练打分模型,以对原始模型输出的答案赋予分值,当分值较低时,原始模型将重新进入学习流程。经过循环往复的训练,原始模型优化升级为在自然语言理解、转化和生成方面同人类偏好相啮合的大型语言模型,即ChatGPT6。(3)运行逻辑。当用户向 ChatGPT 发出指令后,大型语言模型将指令转码为数字序列,分析其中的含义和意图,基于既有文本语料,生成数字序列形式的内容,继而将之转化为文本并输出9。(三)ChatGPT 的特征由于在研发初衷、训练方式等方面存在诸多差异性,同其他人工智能聊天机器人相较,ChatGPT 呈现出鲜明特征:(1)保障连续性对话。与仅能够对用户提出的简单问题进
17、行作答的人工智能聊天机器人不同,ChatGPT 能够以自然语言同用户就部分主题展开连续性对话,激发用户的表达欲2,实现人机“意见互掷”模式。(2)发出主动性追问。先于 ChatGPT 出品的人工智能聊天机器人通常直接根据用户指令作答。然而,于 ChatGPT 而言,当对用户指令产生困惑或者对自己的答案信心不足时,会在提供最终答案之前,主动发出追问,请求用户提供更多信息2。(3)实现“人化”式表达。受益于学习和训401蒲清平,等 生成式人工智能 ChatGPT 的变革影响、风险挑战及应对策略练,ChatGPT 在总体上掌握了人类使用自然语言时进行词语搭配、句式结构设计的规则和偏好,因而能够在针对
18、日常习惯用语和专业学术用语的表达方面呈现出“人化”的特质,这使其明显区别于其他话语风格机械、生硬的人工智能聊天机器人7。(4)具备“记忆力”。从老一代人工智能聊天机器人到ChatGPT 的迁跃,表征着人机历次交互时所生产的内容可以实现由相互隔离走向彼此流动,通俗而言,ChatGPT 拥有同人类相似的“记忆系统”,因此,当一位用户再度同 ChatGPT 建立对话时,其能够回忆起二者此前的互动和用户作出的标注2。二、ChatGPT 的变革和影响马克思认为,“随着大工业的发展,现实财富的创造较少地取决于劳动时间和已耗费的劳动量,较多地取决于在劳动时间内所运用的作用物的力量,而这种作用物自身取决于科学
19、的一般水平和技术进步”10。人类数百年来的实践揭示出,科学技术是推动人类社会发展的关键力量。立足于人工智能应用至人类工作和生活的历程,比尔盖茨坚信,人工智能会让人类社会受益11。作为建立在诸多项先进技术之上的生成式人工智能语言模型,ChatGPT 或将利用强大的自然语言处理能力,成为撬动第四次工业革命的一根杠杆。(一)变革生产方式马克思指出,“物质生活的生产方式制约着整个社会生活、政治生活和精神生活的过程”12。生产方式在社会运行体系中占据统摄地位。历史证明,助力实现“生产方式革命化的因素之一”是“机器的发展”13326,即那些能够为人们提供生产辅助的科技产品的发展。ChatGPT 与生产的链
20、接,可能会引发生产方式的根本性变革。一是推动产业升级。ChatGPT 的快速发展,既可以拉动芯片、算法、算力基础设施等环节在内的人工智能技术上中下游产业链的高速发展和刺激新兴产业的涌现,也能通过开拓和优化信息自动化、智能化处理与供给的数字场域,帮助传统产业改进组织运行模式、技术迭代方向、产品设计思路、市场调研方式、市场营销手段等,进而实现转型升级14。二是提升劳动者生产力。“全部人类历史的第一个前提无疑是有生命的个人的存在”15146,劳动者是生产得以发生的根本所在。ChatGPT 可以从生产领域、岗位职责、目标指向等维度入手,生成针对特定劳动者的系统性培训计划,协助生产部门通过挖掘培训资源、
21、改良培训内容、创新培训手段,提升劳动者的理论知识素养和实际操作技能。三是改进生产工具。将 ChatGPT 引入生产,使之同设备、装置、机器人等生产工具建立映射,利用数字孪生技术和数字线程技术,创造模拟生产全生命周期的全息数字空间16,在其中以自然语言对ChatGPT 进行生产工具控制训练,形成“自然语言指令发出ChatGPT 控制生产工具响应”的运行规程,生产工具的智能化、自动化程度将获得提升。四是优化生产决策。生产决策就是对“生产什么”“如何生产”等问题的回答。ChatGPT 拥有极为庞大的模型参数,在一定程度上创造了一个以信息形式存在的现实世界和虚拟世界的镜像。在信息搜集指令的触发下,Ch
22、atGPT 能够实现信息的精确化调取、系统化整合与条理化呈现,由此高效缩小人们与信息之间的鸿沟。在生产实施前,可以立足于业务范围,向 ChatGPT 发出市场调研指令,快速获取客观反映市场行情的政策环境、需求趋势、用户偏好等信息,这有助于节约市场调研成本,将精力和智力凝聚于参照市场行情信息以进行工艺提升、产品设计、产量设定、要素配置等生产决策活动,从而在人501 重庆大学学报(社会科学版)2023 年第 29 卷第 3 期 机配合中增强生产决策的时效性和科学性。(二)变革科研范式习近平总书记强调,“科技是第一生产力”1733。图灵奖得主、数据库专家吉姆格雷依从时间逻辑和实践逻辑,总结出人类从事
23、科研的四种范式:第一范式为实验(经验)科学,即基于实验或者经验阐释自然现象;第二范式为理论科学,即简化实验模型,去除复杂干扰因素,保留关键因素,继而通过建构数学模型以归纳科学定律和定理;第三范式为计算科学,即使用计算机对科学实验进行仿真模拟;第四范式为数据科学,即以庞大的数据为支点,使用计算机挖掘以数据为表征的事物之间的关联性18。其中,第一、二、三范式致力于溯源和厘清因果关系,而第四范式则侧重于发现和利用相关关系。“大数据之父”舍恩伯格指出,在大数据时代,只有放弃对因果关系的探求,取而代之关注相关关系,才能够更好地认识世界19。在大数据时代,遵循以相关关系为推进线索的第四范式,更有利于提升科
24、研质量。麻省理工学院借助深度学习模型识别分子结构之间的相关关系,进而成功研发新型抗生素 Halicin 的事例表明20,以 ChatGPT 为代表的生成式人工智能或将凭借能够敏锐捕捉相关关系的优势,促使科研由第一、二、三范式进一步向第四范式乃至更高范式过渡。一是有利于研究现状梳理。经由持续的训练和学习,ChatGPT 成为海量文献的载体,并且还能够对文献进行智能爬取21。当科研人员就特定研究领域和研究主题发出研究现状梳理指令后,ChatGPT能够以指令为依据,检索和锁定相关文献,挖掘、提取和整合其中蕴含的理论基础、研究方法、实验步骤、实验结果等细粒度信息,实现研究现状的细致化展示,帮助科研人员
25、通过了解既存的研究情况,吸收有益经验、明确创新方向。二是有利于研究思路组织。当科研人员就研究目的、研究准备、研究困境等方面同 ChatGPT 建立对话后,ChatGPT 能够基于对相关文献的解构,生成关于实验工艺选择、实验流程设计、写作结构布局等方面的建议,促使科研人员的研究思路实现从无到有、从杂乱无章到井然有序的蜕变。三是有利于研究数据分析。ChatGPT 拥有先进的算法和算力,能够胜任数据采集、数据整理、数据清洗、数据分析、数据可视化等复杂的研究数据处理工作,协助科研人员快速、准确地总结数据中隐含的规律,把握诸多为时间空间、实验条件和计算能力的限制所遮蔽的相关关系,获得有助于取得研究新发现
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 生成 人工智能 Chat 影响 风险 挑战 应对 策略 清平
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。