GPT语言模型的心智问题、影响与风险——从ChatGPT谈起.pdf
《GPT语言模型的心智问题、影响与风险——从ChatGPT谈起.pdf》由会员分享,可在线阅读,更多相关《GPT语言模型的心智问题、影响与风险——从ChatGPT谈起.pdf(16页珍藏版)》请在咨信网上搜索。
1、GPT语言模型,即通过生成式预训练转化(Generative Pre-Training Transformer)的方式来开展深度学习的一种语言模型。在2018 年发表的对该模式的介绍文章中,OpenAI的研究人员提到,以往的深度学习方法需要大量的手动标记的数据量,而他们为了打破这种既耗时又花费甚巨的模式,探索出了一种半监督(semi-supervised)的语言理解任务方法,即先用语言建模开展神经网络的预训练工作,然后根据目标任务对其进行有 监 督 的 微 调。1该 模 式 基 于 转 化 器(Transformer)架构,通过神经网络的预训练摘要:以ChatGPT为代表的生成式预训练转化语言
2、模型展现出了初步模拟人类心智的能力,并有可能经过持续优化和技术迭代演化成人们日常工作和生活中不可或缺的通用技术。当GPT语言模型开始具有类人心智并且获得产业化运用之后,将带来远超之前时代的新增生产力,乃至能重塑人类社会基本格局。然而,GPT语言模型在推动生产力发展的同时也会带来岗位替代等问题,进而引发技术发展过快而带来的衍生风险。GPT语言模型及其衍生应用融入社会生产生活应当是一个渐进式的稳健过程,从而避免因为缺少缓冲时间对社会造成过大冲击。关键词:GPT;语言模型;类人心智;就业;风险中图分类号:TP18文献标志码:A文章编号:1007-6522(2023)06-0063-16GPT语言模型
3、的心智问题、影响与风险从ChatGPT谈起简 圣 宇(扬州大学 美术与设计学院,江苏 扬州 225009)上海大学学报(社会科学版)Journal of Shanghai University(Social Sciences Edition)2023 年 11 月第 40 卷 第 6 期Nov.2023Vol.40 No.6doi:10.3969/j.issn 1007-6522.2023.06.006收稿日期:2023-06-10基金项目:国家社会科学基金一般项目(20BZX131)作者简介:简圣宇(1981-),男,广西南宁人。扬州大学美术与设计学院教授,哲学博士。研究方向:人工智能美学、
4、当代美学思潮。Transformer架构(Transformer Architecture)在2017年被提出,设计者们尝试以注意力机制(attentionmechanisms)去替换目前的卷积神经网络(CNN)和递归神经网络(RNN),通过跟踪序列数据中的关系来学习上下文,从而理解其中的意义。它的出现让人工智能的深度学习变得更高效和灵活。可参见:Ashish Vaswani,et al.“Attention Is All You Need.”https:/arxiv.org/abs/1706.03762。63上海大学学报(社会科学版)2023 年(Pre-Training)方式,以实时生成的
5、形式呈现出来。由于可以开展无监督的自我学习,而且还能以“迁移学习”“分类”和“特征提取”的主动态势去消化外部信息,它能更进一步地模拟人类的认知过程。随着算法的优化、算力的增强和数据的日益丰富,它模仿出的认知能力甚至可以达到人类这样的高等生物的水准。日后,具有越来越强的类人心智的人工智能将逐步走进人类社会,作为数字助手提高人们的工作效率。只要GPT语言模型在将来持续升级,降低使用成本且与具体应用场景结合,那么它在普及化之后将使得人工智能技术更加深入地渗入人类文明,变成如同电力、互联网之类的人们日常工作和生活不可或缺的通用技术(General-Purpose Technologies,GPTs)。
6、一、预训练转化模式产生的心智议题预训练转化模式在当下取得的一系列成就,让心智议题重新回到聚光灯下。就硅基设备的智能演化路径而言,“认知心智自我意识”是一个主体思维的复杂性逐步递进的过程。对于“意识是否能在计算机中产生”这一科技界长盛不衰的热门话题,学界产生了截然不同的两派观点。相对悲观的一派认为,意识乃是一种机器无法复现的“生物学过程”,2或曰,“意识是神经活动的一种涌现特征”,即它不是一种可以量化的实体,而只是一种动态涌现(emergence)。3还有学者坚称机器即便能拥有智力,也未必能拥有意识,因为“意识深深植根于我们作为生物的本性中,不是我们所知计算机能具备的东西”。4也有学者提醒,人类
7、思维本身就难以真正理解意识,而且人类思维有其复杂性和分科性,难以用统一算法来表达。作为一种综合性认识活动,人类的意识是具身性的,包括感觉、知觉和思维,与身体所发出的感觉、内在的心理体验有着密切关联。5由于人工智能没有身体,所以它即便能产生意识,也与人类意识差异很大。而相对乐观的一派则提出,人类的大脑以及神经系统尽管相当复杂,但其工作原理就是在通过“突触连接(知觉或无意识等)”把感觉信息和行为关联起来,6意识作为一神经网络的预训练,即“先在一个任务或数据集上训练一个模型,然后使用来自该训练的参数或模型在不同的任务或数据集上训练另一个模型”。其应用包括迁移学习(将从一个机器学习问题中获得的知识用于
8、另一个机器学习问题中)、分类(对对象及其所涉及的任务进行分类)和特征提取(使用预训练模型来提取对象的意义特征,然后将这些被提取的特征用在另一个模型的输入上)。详见:https:/ Eloundou,et al.“GPTs AreGPTs:An Early Look at the Labor Market Impact Potential of Large Language Models.”https:/ 人工智能提出了什么哲学问题?,载 文化纵横 2020年第1期,第43-57页。赵汀阳指出:“人的意识包含许多非常不同的系统,科学的、逻辑的、人文的、艺术的思维各有各的方法论,目前还不能肯定人的
9、意识是否存在一种通用的方法论,或者是否有一种通用的 算法。”详见:赵汀阳 人工智能的自我意识何以可能?,载 自然辩证法通讯 2019年第1期,第1-8页。64第6期种涌现,可以在计算机中被模拟出来。所以意识不是一种虚无缥缈的东西,而是可以现实还原的过程。薛定谔认为,意识作为一种信息传递现象,“只不过是一系列单一数据(经历和回忆)的集合”。7由于意识状态可以由稳定激活的神经元所编码,那么按照这个逻辑,理论上说是可以用计算机模拟神经网络的方式来产生出(至少是模仿出)意识的。8李德毅院士也提出:“生命和机器都可以作为认知的载体。”9意识不一定非要从人脑中产生,电脑也可以,不过这样由数字编码产生的意识
10、跟人类大脑的有区别,属于另一种意识生成系统。认知神经科学家斯坦尼斯拉斯 迪昂(Stanislas Dehaene)认为,“意识是一种在全脑范围内的信息共享”。10如果将意识的本质定义为可传递和共享的信息流,则意味着在逻辑上就可以通过诸如人工神经网络等方式将之模拟出来。ChatGPT出现后,学界开始考虑或许GPT语言模型也可能成为人工智能产生心智乃至意识的起点。11认知、心智和意识是一种逐渐递进的发展层次,虽有学者认为“意识即认知”,12但两者存在本质区别:意识是内涵更加丰富的概念,而认知则是一种应用能力。在这三个概念里,认知的定义和内涵是基本确定且获得学界共识的,而被当做实施认知行为的心智还存
11、在一定探讨空间,至于意识,学界则尚存较大争议。实际上,认知和心智是人工智能走入应用领域过程中必须涉及的一个核心内容,但对于人工智能何时能具有自我意识这种略带科幻色彩的话题可暂时 悬置不论,此种实践性话题有待日后的科技实践去回答,故而我们探讨GPT语言模型时应更关注能落到实处的认知和心智问题,更务实地研究人工智能如何能基于硅基从而产生更高级、更复杂的认知能力,乃至相对完整地模拟出心智,产生出某种类人心智。当下 GPT 语言模型实现了一个又一个的技术突破,也让学界看到了迎来类人心智的可能性。类人心智也可被形象地称为硅基心智,即一种在硅基设备上产生的与人类类似但又存在关键区别的心智模式。此处所谓“与
12、人类类似”,是指它作为人类的创造物,是人类参考自己现有的心智模式设计出来的,故而天然与人类心智具有亲缘关系。谷歌首席工程师雷库兹韦尔(Ray Kurzweil)提出:“一台成功模拟人脑复杂性的计算机,也将拥有与人类相同的涌现意识。”详见:美拜伦 瑞希 人工智能哲学,王斐译,文汇出版社,2020年版,第235页。李德毅提出,交互、计算和记忆这三个相互关联的模块构成了认知的内涵。而其中交互认知是主体用以沟通的方式,计算认知的本质是思维,记忆认知则是脑认知的核心。详见:李德毅 InteractiveCognition从图灵测试的漏洞谈开去,载 机器人产业 2016年第5期,第12-22页。所以李德毅
13、院士强调当下应从“学习的能力,以及解释、解决问题的能力”这些能落实的内容去理解“认知、思维或者智能”等概念,在目前科技条件下须将人工智能定义为“人类智能的体外延伸”。详见:李德毅 人工智能基础问题:机器能思维吗?,载 智能系统学报 2022年第4期,第856-858页。参考“大英百科”的定义,心智(mind)是一种涉及感知、记忆、考虑、评估和决定的综合能力,它反映在“诸如感觉、知觉、情绪、记忆、欲望、各种类型的推理、动机、选择、人格特征和无意识等事件中”。所以,讨论“心智”就是聚焦在具体的应用能力上。详见:大英百科“Mind”词条:https:/ 65上海大学学报(社会科学版)2023 年而所
14、谓“存在关键区别”,则是指这种心智毕竟是基于算法、算力和数据产生的硅基心智,与人类基于大脑、神经系统和感官而产生的碳基心智在生成模式上有差异。人类对于人工智能的构建都是以自身构造为模本的,然而当 GPT语言模型衍生到 3.0版本之后,人们开始意识到即便是由人类创造出来的人工智能,其心智模式也可以跟人类有所不同,它完全可以发展出一套独立于且平行于人类模本的硅基心智。这种硅基心智模式能在一定程度上模拟智慧生命的认知和反应过程,故而能在特定场域下如同人类一样去应对动态发生的状况。它虽然在性质上仍与人类这样的高级生物的心智有区别,但在某些功能上已具备乃至超越人类的能力。预训练转化模式在目前以及可见的将
15、来,暂时只能产生认知行为和实施该行为的心智,还不是人类心智,而只是类似于人类心智的所谓类人心智。ChatGPT对于语言的高效能运用引发了从学界到社会面的好奇,甚至有人认为它已具有了人类的部分心智。比如计算机科学家科辛斯基(Michal Kosinski)提出大型语言模型也有产生心智理论(ToM)的可能性。所谓心智理论,即一种将心理状态归因于自己和他人的能力。通俗说来,即一种预判和解 释 对 方 想 法 的 能 力。不 过 他 对 于ChatGPT心智能力的预估过于乐观,它作为一种语言模型,目前只是在形式上具有人类的心智特征,而不是本身就达到了心智所要求的各项指标。我们需要区分清楚心智(有自主意
16、识)和类人心智(必须借助预训练等方式支撑),心智有若干个要素,如独立执行能力、对突发状况的自适应能力等。13人类对于知识采用的是“接受”模式,而目前GPT语言模型采用的则是“接收”模式。正所谓“记忆不是简单存储,记忆是重组”,14人类大脑的认知模式决定了人类对外界信息采用的是筛选、消化、吸收、再理解的所谓“接受”过程,外界信息进入意识之后已发生相当程度的变化,这跟GPT语言模型对外界信息“照单全收”,然后再由人工手动二次调整的所谓“接收”模式存在重大区别。在人类孩童身上,心智即便较弱也都是大卫 普雷马克(David Premack)和盖伊 伍德拉夫(Guy Woodruff)将“心智理论”定义
17、为:“作为人类,我们假设他人想要、思考、相信等,从而推断出不可直接观察到的状态,预先使用这些状态来预测他人和我们自己的行为。据我们所知,这些推断相当于一种心理理论,在人类成年人中普遍存在。”详见:Charlotte Ruhl.“How the Theory of Mind Helps Us Understand Others”.https:/www.simplypsychology.org/theory-of-mind.html。美国学者会以“心智理论”测试法来观测孩子们是否能推测出他人的想法,而科辛斯基就是用了这套方法来测试GPT-3。结果他发现2022年1月和11月发布GPT-3的最新版本
18、(后者即ChatGPT的同源模型)所显示出的心智已分别与7岁和9岁儿童的表现相当。所以他将GPT-3的这种惊人表现称为“分水岭时刻”(watershed moment)。但严格说来,通过心智测试并不必然代表充分具备这样的心智,使用过ChatGPT的用户都能感觉到,它虽聪明,但目前连“自主甄别+主动判断”这个人类心智最基本的要求都达不到,谈所谓分水岭还为时尚早。当然,科辛斯基其实在论文中也为自己的论述留下余地,因为他只是强调ChatGPT符合“心智理论”的标准,但却没敢下定论说它具备了“心智”。详见:Michal Kosinski.“Theory of Mind May Have Spontan
19、eously Emerged in Large Language Models”.https:/arxiv.org/abs/2302.02083。66第6期完整且不断自主更新升级的,但ChatGPT目前的版本并不具备这种心智要素,它只是被动接受投喂给它的信息数据包,而非能主动理解这些信息数据包里的信息,比如甄别其中的真假正误以及道德属性等内容。所以李德毅院士反复强调“智能是学习的能力,以及解释、解决问题的能力”,15“会学习是新一代人工智能的核心”,16只有“会学习”才能变未知为可知,去伪存真,随机应变,依据外界动态发生的状况,实时自主采取行动。更何况,人类的心智并不止于理性和逻辑,还包括感性
20、和情感,后者是目前GPT语言模型尚不能模仿的。因此,ChatGPT虽有马斯克所言“好得吓人”(scary good)的美誉,但其实它仍缺少基本的自觉判别能力,仅是对“既成的知识”的再整合。17它对自然语言的接受和表达仍达不到理解和运用的程度,分析数据和回答问题时常常显示出局限性。OpenAI公司对ChatGPT目前所存在的问题也很清楚,所以直接在其主页上就提醒用户,它经常会给出“看似合理但不正确或荒谬的答案”。由于 ChatGPT 目前尚未真正具备对自己的预训练语料库的自主筛选能力,在吸收知识方面,它更像一株只能在周边土壤被动吸收的植物,而不像一只能主动判断何种食物有益的动物。尽管如此,科辛斯
21、基所提的ChatGPT产生心智理论可能性的问题,确实提醒我们需要重视和思考人工智能的类人心智与人类心智的差异性,从而避免在使用人类心智的标准分析人工智能时张冠李戴。相对而言,在认知、心智和自我意识三者的关系上,人与机器最大的区别就在于人类智能具有一体性特征,而类人智能具有分离性特征。就人类心智而言,它作为一种通过基于有机体演化而来的自然产物,与认知和自我意识具有密切的共生关系。自我意识是人类心智的基础,认知则为心智提供知识获取和更新的途径,三者浑然一体。然而,类人心智却给出了另一条与自然演化不同的路径,认知、心智和自我意识三者之间是可以彼此分离的。在没有自我意识的情况下,在硅基设备上也可以开展
22、(至少是模拟)认知活动。人类的感觉、知觉、记忆、思维、想象和语言等认知元素,可以被计算机以感受器信号转化、介质存储、信息加工、生成式预训练转化和编程语言等形式实现(至少是模拟出来),继而基于这种硅基认知产生类人心智,并且在没有自我意识的情况下,依据类人心智来持续开展能达到(甚至高于)人类智能水准的各项工作。既然人类心智和类人心智在产生基础上大相径庭,如果继续将那些判断人类心智的理论硬套给 GPT语言模型,那么对它的类人心智产生误判就无法避免。所以我们必须依据人工智能类人心智本身的逻辑去对之进行分析,以求更真实、立体、全面地理解它的心智状态,以及这种心智状态将对人类社会造成的系列影响。预训练转化
23、模式的逐步成熟,是人工智能发展史上里程碑式的事件。但目前版本仍有不足,因为它需要人工对数据进行标记,且是基于大型数据库里对已知知识进行比如它的3.5版本最初被问及“红楼梦中贾宝玉适合娶谁”时,它给出的回答居然是“贾母”。详见:可杨 内容不可信与交互成本高,是ChatGPT产业化最大阻碍,载 每日经济新闻,2022年12月13日008版。见ChatGPT的门户网站:https:/ 67上海大学学报(社会科学版)2023 年优化调配。相比之下,人类的学习其实也是一种预训练的过程,但预训练的重点并不是固定而庞大的知识库,而是能灵活运用知识的思维本身。知识只有突破存量的局限,进入增量发展阶段,才能成为
24、真正的“活的知识”。人生没有彩排,面对不确定的世界,无法预先拟出一个完全确定的方案,而只能预先拟出一个提纲。如果人类个体面对的所有场景都需要 GPT语言模型那样通过检索知识库而非通过举一反三来应对,那么个体穷其一生也无法学完如此之多的内容,更不要说还要面对不断涌现出的新问题。人之所以是“人”,就在于人能通过“知识迁移”跳出已知知识内容及其框架的束缚,在全新领域内创构出新的知识,否则他就只是一台无法超越自身的肉体机器。以哲学角度观之,个体无法在有限生命时间内“体验”每一件事情,所以需要运用思维去“体悟”那些未曾进入过自身经验的事情,以及“领会”各种存在的可能性,借助对规则、规律的理解,从而应对千
25、变万化的现实。为了真正模仿出人类的心智,预训练转化的重点内容应当从语料库转向思维模型。就类人心智的发展逻辑而言,如何让人工智能在有限事物中理解无限意义,从特殊对象中理解普遍规律,应当是接下来的GPT模型需要重点突破的难点问题。二、GPT语言模型对人类社会的可能影响与探讨传统的哲学问题相比,探讨新兴的科技事物是一种学术冒险,因为哲学面对的是相对宏观、恒常的研究对象,而新兴科技一直在变化中。本文所探讨的GPT语言模型亦是如此,我们当下对它所做出的论断,很有可能在它接下来的快速迭代之后变得无效甚至可笑。对于人工智能技术而言,大型语言模型只是其发展长河中的一小节;但对于大型语言模型而言,GPT语言模型
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- GPT 语言 模型 心智 问题 影响 风险 ChatGPT 谈起
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。