分销赏收藏举报申诉 / 15

立即下载 VIP下载

当前位置：首页 > 学术论文 > 毕业论文/毕业设计 > ChatGPT和人工智能：从基本原理到教育应用 (1).pdf

ChatGPT和人工智能：从基本原理到教育应用 (1).pdf

上传人：自信****多点

文档编号：303917

上传时间：2023-07-30

格式：PDF

页数：15

大小：1.08MB

《ChatGPT和人工智能：从基本原理到教育应用 (1).pdf》由会员分享，可在线阅读，更多相关《ChatGPT和人工智能：从基本原理到教育应用 (1).pdf（15页珍藏版）》请在咨信网上搜索。

1、第2 1卷第1期2 0 2 3年1月北京大学教育评论P e k i n g U n i v e r s i t y E d u c a t i o n R e v i e wV o l.2 1,N o.1J a n u a r y 2 0 2 3C h a t G P T和人工智能:从基本原理到教育应用克劳斯迈因策尔(慕尼黑工业大学,慕尼黑)摘要本文阐述了C h a t G P T等聊天机器人在教育培训中的性能和局限性。为了确保此类人工智能工具的适当使用,必须全面了解相应算法的基本原理和局限性。本文首先梳理了人工智能领域从E L I Z A、C S I E C到WA T S ON等聊天机器

2、人系统的发展路线,然后介绍了C h a t G P T的功能原理:人类语言的统计概率模型、人工神经网络、基于大规模文本的深度学习算法、应用人类反馈的强化学习算法等。基于以上技术基础,本文讨论了C h a t G P T为代表的新一代人工智能技术对教育政策带来的挑战,包括学生就业招聘、法律和新闻等相关专业教学设计、学生论文写作、学生考试和其他评价方式等,并提出应对这些挑战的方案,以保证未来在教育和培训领域中人工智能技术能够得到合理、有效、公平的应用。关键词 C h a t G P T;教育;培训;人工智能中图分类号:G 4 0-0 5 7 文献标识码:A 文章编号:1 6 7 1-9 4 6 8

3、(2 0 2 3)0 1-0 0 3 5-1 4D O I:1 0.1 2 0 8 8/p k u 1 6 7 1-9 4 6 8.2 0 2 3 0 1 0 0 3一、图灵测试和人工智能英国计算机先驱、逻辑学家和数学家艾伦图灵(A l a n T u r i n g)在1 9 5 0年提出了一个模拟测试(后被称为图灵测试),并以此作为对人工智能的定义。如果一个技术系统在响应和解决问题方面与人类专家无区别,这一技术系统就应该被称为具有“智能”。在图灵之后的几年里,技术研发最初的重点是在计算机上模拟逻辑思维。这背后是认识论的观点,即智力主要与人类思维中的逻辑推理能力有关。为此,人工智能是基于符号

4、表示的逻辑规则和公式,并将其转化为适当的计算机程序。这时的人工智能被称为符号主义指导下的人工智能。符号主义指导的人工智能的一个应用场景是自动推理和证明,即人工智能程序通过逻辑计算模拟人类的逻辑思维(R o b i n s o n,1 9 6 5)。具有满足性的自动推理系统至今仍在工业物流中使用(B i e r e,e t a l.,2 0 0 9;K c h l i n,2 0 2 1)。作者简介:克劳斯迈因策尔(K l a u s M a i n z e r),男,德国慕尼黑工业大学卓越荣休教授,图宾根大学冯魏茨泽克中心客座教授,欧洲科学与艺术院院长。3 6 北京大学教育评论2 0 2 3年

5、二、从图灵到魏茨鲍姆的E L I Z A1 9 5 6年,约翰麦卡锡(J o h n M c C a r t h y)、艾伦纽厄尔(A l l e n N e w e l l)、赫伯特西蒙(H e r b e r t S i m o n)等人工智能的奠基人在美国达特茅斯召开会议,受图灵提出的“机器能思考吗”这一问题的启发,他们第一次提出了“人工智能”的概念,以此来描述通过计算机模拟人类智能的研究领域。人工智能研究的第一阶段是约2 0世纪5 0 年代中期至 2 0世纪6 0 年代中期,研究者对其甚为乐观,积极推动其发展(G r t z,&S c h n e e b e r g e r,2 0 0

6、 3),如尝试设计解决问题的通用程序,然而实际结果令人非常失望。约2 0世纪7 0年代中期至2 0世纪8 0年代中期,基于知识的专家系统脱颖而出,并实现了第一批实际应用。诸如工程师和医生等人类专家的特定范围的、可管理的专业知识在专家系统中被表示出来,并被用于解决日常问题(B o e r s c h,H e i n s o h n,&S o c h e r,2 0 0 7)。基于知识的专家系统的人工智能程序,能存储有关特定领域的知识,并自动从知识中得出结论,以找到具体的解决方案或提供情况诊断(P u p p e,1 9 8 8)。然而,与人类专家不同的是,专家系统的知识仅限于一个专门领域,缺少关

7、于世界的常识性知识和结构性知识。为了建立一个专家系统,专家的知识必须被转化为规则,通过一种编程语言来实现,并用解决问题的策略进行处理。上述方法也适用于通过计算机实现自然语言处理。魏茨鲍姆(J.W e i z e n b a u m)的E L I Z A语言程序就是一个例子(W e i z e n b a u m,1 9 6 6)。E L I Z A设计本意是模拟一个精神病医生,以一个人类专家的身份与病人交谈。它涉及如何用“精神病医生”的特定句型对病人的某些句型做出反应的规则,也即在各种情况下识别或区分规则。在最简单的情况下,必须确定两个符号结构的相等

8、性,这是由关于符号列表的L I S P编程语言中的E QUA L函数确定的。如果符号表达式中包含术语和变量,则存在一种扩展,例如:(x B C)(A B y)这两项相等,因为变量x对应于原子元素A,变量y对应于原子元素C。通过引入变量,模式匹配可以识别一个模式的结构。为此,L I S P中定义了一个单独的运算符MAT CH(匹配)。一个数据与一个结构对应的最简单情况是常数相等,例如列表A B和A B相等:(MAT CH(A B)(A B)=T其中的符号“”表示以下列表不应理解为函数指令,而是符号的枚举。不同的生成元导致类的形成,其作用类似于逻辑或数字中的变量。所以符号“?”可以用来匹配任何对象

9、,例如:(MAT CH(?B)(A B)=T(MAT CH(?B)(A B)B)=T第1期C h a t G P T和人工智能:从基本原理到教育应用3 7 这种结构匹配任何以B为第二个元素的两个元素的列表。生成器“*”是匹配任何元素组成的序列(包括空序列),例如:(MAT CH(*B)(B)=T(MAT CH(*B)(A B C B)=T 上述的结构匹配以B为最后一个元素的所有列表。这就解释了理解算法结构的基本原理,该结构反映了E L I Z A中精神病医生的知识。病人P和E L I Z A之间的对话可以想象为这样:病人:ME N A R E A L L A L I K E(男人都是一个样子)

10、E L I Z A:I N WHAT WAY(何出此言)病人:THE YR E A LWAY S B UG G I NG U S A B OUT S OME TH I NG O R OTHE R(他们总是为某些事情烦扰我们)E L I Z A:C AN YOU TH I NK O F A S P E C I F I C E X AMP L E(你能说出一个具体的例子吗)病人:WE L L;MY B OY F R I E N D MA D E ME C OME HE R E(是,我男朋友让我来的)E L I Z A:YOUR B OY F R I E N D MA D E YOU C OME H

11、E R E(你男朋友让你来的)病人:Y E S;I AM V E R Y S A D(是的,我很伤心)E L I Z A:YOU A R E V E R Y S A D(你很伤心)病人:S A D AN D D E P R E S S E D(悲伤且沮丧)E L I Z A:P L E A S E GO ON(请继续)如果患者使用了某些句型,这些句型通过模式匹配被E L I Z A识别,则以下规则允许推导出E L I Z A的答案:(*AM*B)(A P P E N D(YOU A R E)B)(*A R E*)(I N WHAT WAY)(*A LWAY S*)(C AN YOU TH I

12、NK O F A S P E C I F I C E X AMP L E)(*MY*B ME*C)(A P P E N D (YOUR)(A P P E N D B(C ON S YOU C)(*L)(P L E A S E GO ON)第二条规则是:如果病人的句子中含有A R E,用“WHAT WAY”来回答。在这个输入句子“ME N A R E A L L A L I K E”(男人都是相似的)中,运算符*代表的ME N出现在A R E之前,而A L L A L I K E都出现在A R E之后。第四条规则规定:如果在病人的记录中,单词MY和ME被列表*B3 8 北京大学教育评论2 0 2

13、 3年隔开,并且记录以列表*C结尾,那么E L I Z A会做出反应,首先将YOU和C部分组合在一起(C ON S YOU C),然后将B部分应用,最后将(YOUR)应用。因此,在程序语言L I S P示例中,与E L I Z A的对话只是语法符号列表的派生。从语义上讲,结构的选择与口语的对话习惯相对应。最后一条规则是一种典型的尴尬反应,因为它也发生在实际的对话中:如果任何符号列表(*L)没有被专家识别(也就是谈话中的噪音等等),那么它就会装作一副聪明的嘴脸,说“请继续”。三、从 E L I Z A 到 WA T S ON自魏茨鲍姆的E L I Z A以来,已经有了基于模式识别的文本匹配方法。

14、下一步,该软件将句子分解为单独的短语,并快速计算出将回答模式与问题匹配的概率,或者将一种语言与另外一种语言翻译匹配的概率。一个高效翻译系统的例子是V E R BMO B I L,它是1 9 9 32 0 0 0年由德国人工智能研究中心(D F K I)研发出来(W a h l s t e r,2 0 0 0)。对于人类来说,处理语言要通过多个步骤;而在技术系统中,人们试图模块化地一个个地实现这些步骤。在计算语言学领域(H a u s s e r,2 0 1 4),此过程被表述为一个管道模型:从声音信息(听觉)开始,下一步是生成文本形式。然后将相应的字母字符串记录为单词和句子。在词语形态分析中,

15、要分析人称代词,要将文本中的单词简化为最基本的词根形式。在乔姆斯基语法体系的句法分析中,要强调一个句子的主语、谓语、宾语、形容词等语法要素。在语义分析中,句子意义由乔姆斯基语法的深层结构中表现出来(C h o m s k y,1 9 6 9)。最后,在对话和话语分析中,系统将检查问题和答案之间的关系,以及表达的意图和目的。2 1世纪初,贾积有设计并开发了一款英语聊天机器人系统C S I E C(C o m p u t e r S i m u l a t i o n i n E d u c a t i o n a l C o mm u n i c a t

16、i o n),它基于文本知识和推理,可以随时随地与英语学习者进行英语聊天;它可以根据用户的输入、对话上下文、用户和自己的个性化知识、常识性知识和推理知识生成交流性响应。所有这些知识都以自然语言标注语言(N a t u r a l L a n g u a g e M a r k u p L a n g u a g e,简称N LML)的形式表达,这些 N LML 既可以通过解析文本自动获得,也可以在图形化编辑器的帮助下人工编写。因此,C S I E C系统提出了一种直接通过文本知识的句法和语义分析进行逻辑推理的朴素方法。这种方法比旧式的E L I Z A类关键字匹配机制更具有优势。对六个月以内免

17、费使用该系统的用户聊天日志的分析证明了这一优势。一篇被广为引用的国际期刊论文介绍了C S I E C的系统架构、实现技术以及教育应用效果(J i a,2 0 0 9)。另一个语义问答系统是I BM的WAT S ON程序(F e r r u c i,L e v a s,B a g c h i,第1期C h a t G P T和人工智能:从基本原理到教育应用3 9 G o n d e k,M u e l l e r,2 0 1 3),它使用了并行计算机的计算能力和维基百科知识。与E L I Z A不同,WAT S ON理解上下文和语言游戏的语义。WAT S ON是一个语义搜索引擎,可以捕获用自然语

18、言提出的问题,并在短时间内在大型数据库中找到匹配的事实和答案。为此,它集成了许多并行工作的语言算法、专家系统、搜索引擎、基于大数据存储容量和计算能力的语言处理器。四、统计学习理论和神经网络然而,基于规则的知识并不能完全涵盖我们日常知识中的直觉技能和经验。技能是建立在多种不同经验基础之上的,这些经验绝不是在教科书中以符号和规则的方式来表示的。一名经验丰富的汽车驾驶员会根据许多感官数据直观地掌握情况并做出反应,而不会去解析其中细枝末节的逻辑关系。同样,一名经验丰富的医生或飞行员也能在手术室或飞机驾驶舱内的危急情况下做出反应。人和人之间进行的语言交流,更不可能受到规则和符号表征的有意识应用的引导。哲

19、学家休伯特德雷福斯(H u b e r t D r e y f u s)1 9 7 2年出版了一本书,名为计算机不能做什么人工智能的极限(W h a t t h e c o mp u t e r c a n n o t d o:T h e l i m i t s o f a r t i f i c i a l i n t e l l i g e n c e)。但事实上,他只是展示了符号主义指导下的人工智能在理解人类直觉方面的局限性。作为一名现象学家,他认为自己只能通过定性的现象学方法,而不能通过形式规则来理解人类的直觉。然而,问题出现了:机器可以在多大程度上训练数据中的模式和结构识别以及期

20、望的概率分配,以便模拟人类的直觉?现在,符号主义指导的人工智能中的逻辑规则被人类感官或者计算机传感器的数据所取代,而这些数据的统计相关性和概率是确定无疑的。基于数据的学习是在统计学习理论中以数学方式(m a t h e m a t i c a l l y)被研究的,它的算法是机器学习的基础(V a p n i k,1 9 9 8)。在认识论的术语中,这些对来自感官的数据的学习过程在有意识的逻辑推理之下无意识地运行,因此有亚符号化的人工智能。在数学上,逻辑范式被统计学和概率论所取代。近年来强大的计算机技术使得基于海量大数据的机器学习技术成为可能,并在人工智能应用方面取得了新的突破,例如在药物和疫

21、苗的开发方面,以及在机器人、工业和社会基础设施方面(M a i n z e r,2 0 1 9)。生物体的自组织大脑被认为是编程计算机的反设计。在进化中,网络首先发展为复杂基因和蛋白质网络中的亚细胞供应、控制和信息系统。有了神经细胞后,细胞信息、控制和供应系统最终在神经化学信号处理的基础上发展起来。在没有计算机模型符号表示的前提下,进化过程开发出了有效的解决问题的程序。亚细胞、细胞和神经元的自组织产生了匹配的复杂网络。神经元由图形网络的节点表示,突触连接由边表示(R i t t e r,M a r t i n e t z,S c h u l t e n,1 9 9 1)。在4 0 北京大学教育

22、评论2 0 2 3年模型中,用数值(即权重)来表示神经化学连接的强度。学习就是神经元连接模式的建立过程。这是通过神经网络的学习算法完成的。密集的突触耦合产生的神经元线路模式,与生物体的心理、情感或运动状态相对应。原则上,它们可以通过计算机模型进行模拟。这些模拟基于神经元网络、自动机和图灵机之间本质上的数学等价性。因此,可以证明一个麦卡洛克皮茨(M c C u l l o c h-P i t t s)网络可以用一个有限自动机来模拟(K l e e n e,1 9 5 6)。有限自动机是诸如自动售票机之类的简单系统,可以识别指令的简单语言代码(H o p c r o f t,M o t w a n

23、 i,U l l m a n,2 0 0 1)。相反,一个有限状态自动机的功能也可以通过一个麦卡洛克皮茨网络来实现。在数学上,这样的网络由整数加权。换句话说,一个具备麦卡洛克皮茨网络类型的神经系统的有机体,只能解决一个有限自动机可以处理的复杂性问题。这样的有机体与有限自动机的智能程度一样。根据丘奇(C h u r c h)论题,图灵机是程序控制类计算机的原型,但是哪些神经元网络对应于图灵机?可以证明,图灵机精确模拟了那些突触权值为有理数(“分数”)且具有反馈回路(即“递归”)的神经元网络。反过来,图灵机也可以被具备有理数突触权重的递归神经网络所精确模拟(S i e g e l m a n n,

24、S o n t a g,1 9 9 5)。根据上述证明,如果把图灵机作为程序控制类计算机的原型,那么计算机可以模拟具有有理数突触强度的大脑。反过来,一个图灵机中的程序可以由具有有理数突触强度变量的大脑所复制。换句话说,这种大脑的智能水平与图灵机的智能水平相当。实际上,这种神经网络原则上可以在合适的计算机上进行模拟。今天实际应用(如模式识别)的神经网络,很大程度上仍然是在计算机上模拟的。只有神经形态的计算机才能直接复制神经网络。在统计学习的自动化中,具有学习算法的神经网络起着关键作用。概率网络在实验上与生物神经网络非常相似。如果细胞被移除或独立突触权重发生少量变化,实验证明,它们受到轻微干扰时具

25、有容错性,就像人脑在受到轻微意外损伤之后的表现。人类大脑的工作方式是多层并行信号处理。例如,在感觉输入层和运动输出层之间,存在与外界无关的由神经元信号处理的内部中间步骤。事实上,在技术神经元网络中,通过插入拥有尽可能多由具有学习功能的神经元组成的中间层,可以提高其表现和解决问题的能力。第一层会接收到输入模式(i n p u t p a t t e r n),这一层的每个神经元都连接着下一层的每个神经元。这种相互连接一直持续到最后一层,并最终给出一个活动模式(a c t i v i t y p a t t e r n)(H o r n i k,S t

26、i n c h c o m b e,Wh i t e,1 9 8 9)。当要学习的原型(例如模式的识别)是已知的,并且可以根据它测量相应的误差偏差时,就涉及有监督的学习程序。学习算法必须改变突触权重,直到输出层输出一种与原型偏差尽可能小的活动模式。第1期C h a t G P T和人工智能:从基本原理到教育应用4 1 一种有效的方法是计算输出层每个神经元的实际输出和期望输出的误差偏差,然后将其反向传播到网络的各个层。这就是反向传播算法,其目的是通过足够多的学习步骤,将相对于特定模式的误差降低到零或可忽略的最小值。五、聊天机器人C h a t G P T可以做什么亚符号人工智能的一个引人注目的应

27、用例子是类似C h a t G P T(G e n e r a t i v e P r e-t r a i n e d T r a n s f o r m e r)的聊天机器人。由于C h a t G P T作为自动文本生成器的惊人功能,自2 0 2 2年1 1月3 0日以来,它在几天内拥有比I n s t a g r a m和S p o t i f y等社交媒体更多的关注者,拥有数百万粉丝用户。C h a t G P T可以生成从文法学校级别的学校作业到大学中级阶段的研讨班论文的文本。基于“大型语言模型”(L a r g e L a n g u a g e M o d e l,简称L L

28、M),该人工智能程序可用于谈论商业计划,或创作某种风格的歌曲、诗歌或小说片段。事实上,C h a t G P T的语言模型是基于大量的文本(大数据),这些文本是由人类训练到系统中的。因此,它是一个基于统计学习理论和模式识别的机器学习的示例,就像上一节已经解释过的那样。它的宏伟目标是克服符号主义指导的人工智能的一个关键限制在基于知识的专家系统中,符号主义指导的人工智能仅能转化为基于逻辑规则公式的专业知识(例如特定医学学科的医学专业知识)。随着计算能力和统计学习模型对大数据处理能力的提高,现在的目标是将人类的一般性“世界知识”整合到机器中去。为达此目的,需要借助新闻、书籍、社交媒体、在线论坛、图

29、像、电影和口语中的文本对聊天机器人进行训练。训练数据需要学习算法。聊天机器人可以重现它在存储的数据中识别的文本模式。这与人脸识别中从图像文件中识别人的图像所使用的程序是相同的。将重现的文本与训练中使用的示例文本进行比较,进一步通过强化学习算法逐渐改进文本内容。例如,如果训练数据的相关性导致输出歧视性(d i s c r i m i n a t i o n)文本,就可以予以修正。与被灌输思想的人类相似,由于训练数据集的数量,这种不当行为永远不能被排除。由于这些聊天机器人在社交媒体上被广泛接受,它们也可能制造危险的虚假信息。总的来说,C h a t G P T不过是一台通过模式识别算法重新组合和重

30、新配置数据、文本、图像和口语的随机性的机器。然而,由于现代计算机技术可以存储大量数据并应用快速学习算法,因此产生了大量能够模拟人类背景知识和直觉的惊人的输出结果。但这也揭示了我们的对话和文化世界所基于的机制模式的复制和重组,这些模式在很大程度上可以被机器所采用。即使是社会科学、文化研究和人文学科也不能幸免于此,更不用说新闻业了。维特根斯坦将这些按照某些规则运作的语言输出称为“语言游戏”(l a n g u a g e g a m e s)。原创性往往只存在于通常的语言游戏和“叙述”的微小变化和变异中。在机器学习中,现在有“随机鹦鹉”的说法。因此,

31、从积极的方面来4 2 北京大学教育评论2 0 2 3年说,C h a t G P T暴露了文化产业和新闻业的创生机制它们必须变得更加复杂,以免被机器取代。但是,如果完全基于统计“猜测”(F r i e d e r e t a l.,2 0 2 3),那么C h a t G P T如何解决数学问题?实际上,可能的解决方案取决于存储的文档,可以使用(人工)监督学习算法训练教科书和各种其他文档中的数据。在强化教学的意义上,聊天机器人通过模式识别确定训练文档的新上下文,在被询问时反复重启或改进其提出的解决方案。因此,C h a t G P T只知道数字,如果数字可以从训练的文本中提取。因此,这个系统

32、可以重现一个素数的定义,如果这个定义文本出现在C h a t G P T记忆中的某个位置。但是C h a t G P T只能在有经过训练的文档的情况下,才能得出结论并决定给定的一个数字是否是素数。因此,计算、逻辑和因果思维对聊天机器人来说基本上是陌生的。它仅仅是猜测和联想。在人工智能的局限(G r e n z e n d e r k n s t l i c h e n i n t e l l i g e n z)(M a i n z e r,K a h l e,2 0 2 2)一书中,与数学和逻辑思维相比,统计学习理论和机器学习的这一核心弱点暴露无遗。C h a t G P T仅能通过模仿和

33、重新组合存储的模板和片段来编写和评估计算机程序但其水平高得惊人,即使是“受过教育”的人也无法区分。一个天赋异禀的小学生就已经证明了这个系统与人类思维的区别它在没有被各种教科书“喂食”的情况下,不用聊天机器人的努力和海量记忆就能解决一个数学问题。六、在C h a t G P T的“机房”里从技术上讲,C h a t G P T是一种“大型语言模型”,可以从大量的语言数据中使用深度学习算法生成类人文本。它基于“生成预训练转换器”架构,其中转换器使用神经网络来生成文本。该模型事先使用大量书籍、文章、网页等数据进行训练,以识别自然语言的模式和结构。给定一个输入(也称为“提示”),模型根据先前训练的

34、知识生成合适的文本。通过使用转换器,G P T不同于以前的语言模型,后者在上下文中按顺序预测可能的单词。转换器同时处理所有输入数据。这从根本上说是一个“自我注意”(s e l f-a t t e n t i o n)的过程,该过程参考语言序列中的其他位置,为输入数据的不同部分分配变化的权重。由于计算效率的提高,G P T模型自2 0 1 8年以来已从G P T-1扩展到G P T-4,知识范围越来越大,越来越多样化。“自我注意”方法使用神经网络对输入不同部分的重要性进行加权,并进行预测。输入被映射到对应于学习权重矩阵的多个键、值和查询。然后,模型计算查询与输入所有项的键的标量积。这将为每个项目

35、生成一个分数。然后,这些分数用于计算输入中每个项目的权重(“注意力”)。分数乘以这些注意力权重,将这些产品加起来作为自我注意力过程的输出。该输出与输入相连接,并通过多层次的、实现“自我注意”的前向反馈神经网络(f e e d f o r w a r d n e u r a l 第1期C h a t G P T和人工智能:从基本原理到教育应用4 3 n e t w o r k)进行传导。为更好地将C h a t P C T的输出与用户的意图相匹配,一种来自人类反馈的强化学习(R LH F)算法获得应用,该算法包括三个步骤(O u y a n g e t a l.,2 0

36、2 2):第1步为监督微调模型(S F T)。第1步涉及对G P T-3模型进行微调,方法是雇佣4 0名承包商创建一个监督训练数据集,其中的输入具备一个已知的输出供模型学习。输入或提示是从实际用户条目中收集的。然后,人工标注者对提示编写适当的响应,从而为每个输入创建已知的输出。然后使用这个新的、有监督的数据集对G P T-3模型进行微调,以创建G P T-3.5,也称为监督微调模型。简而言之,步骤1收集演示数据并使用以下部分步骤训练受监督的策略:(1)从提示数据集中采样。提示数据集是先前提交给系统的一系列提示。(2)人工标注者演示所需的输出行为。4 0名承包商被雇来撰写对提示的回复。(3)这些

37、数据用于监督学习,对G P T-3进行微调。这样的输入输出对可以用于训练一个有监督的模型,以使得它对指令产生适当的响应。第2步为奖励模式(RM)。在步骤1中训练监督微调模型后,模型对用户提示生成更好的对齐的响应。接下来的细化是以训练奖励模型的形式进行的,其中模型的输入是一系列的提示和响应,输出是一个标量值,称为奖励。奖励模型是通过强化学习来实现的,学习产生最大化第3步奖励的输出。简而言之,步骤2收集对比数据并通过以下部分步骤训练奖励模型:(1)一个提示和多个模型输出被采样了,输出由监督微调模型生成;(2)人工标注者按照从最佳到最差的顺序对输出进行排名;(3)这些数据被用于训练奖励模型,排名的组

38、合作为批处理数据点被提供给模型。第 3 步为强化学习模型。在最后阶段,模型将收到随机提示并返回输出。输出是使用模型在步骤2中学习的策略生成的。它表明机器已经学会使用一种策略以实现其最大化奖励的目标。根据步骤2中开发的奖励模型,确定提示和输出对的标量奖励值。然后,奖励会反馈到模型中以发展策略。简而言之,步骤3使用具有接近策略优化(P r o x i m a l P o l i c y O p t i m i z a t i o n,简称P P O)功能的强化学习,改进一项策略。它是一种用于强化学习的策略梯度方法,该方法通过与环境的交互在采样数据和使用随机上升优化目标函数之间交替。七、C h a

39、t G P T对教育政策的挑战前文的分析表明,聊天机器人C h a t G P T并非魔法,而是基于可计算的随机算法和统计学习理论产生输出。因此,我们能清晰地评估出它的性能和局限性,所以对C h a t G P T引发的问题过于乐观或悲观都不适宜。目前C h a t G P T已经引起了人们的不安,关于聊天机器人是否会取代某些职业的讨论无处不在,特别是在媒体、文化和教育领域。基于聊天机器人的工作原理,下文将评估C h a t G P T对教育和培训中具体工作概况的重要性。4 4 北京大学教育评论2 0 2 3年各公司的人事经理对于新员工的入职都发挥着核心作用,他们根据书面文件和招聘面试表现评估

40、申请人是否合适。在这个过程中,问题会有一套标准,以及一套理想的标准答案。但是,聊天机器人的功能可以很容易地模拟这套标准化的评估程序。因此,评估中必须避免标准化的问题,交流互动必须比根据标准问卷的书面调查发挥更大的作用。归根结底,人力资源管理不是文本生成,而是决策。但是,人力资源市场会受到C h a t G P T的挑战,它可以用于轻松、专业地撰写招聘广告或求职网站。C h a t G P T已经能在计算机领域编写一些简单的程序。事实上,可以预期编程专业和系统架构师专业不会被人工智能取代,但它们会发生一些变化。C h a t G P T确实已经可以提供简单的编程模块的构建,用于编写更复杂的程序。

41、然而,与此同时,这将对编程职业提出更专业的要求。还应该考虑到的是,聊天机器人的神经网络只是未来改变程序员工作的一个程序的例子。然而,程序检验在今后将更加重要。即使是聊天机器人(如C h a t G P T)“自动”生成的基础构建模块中的最微小的错误,如果不及时识别,也可能会对整个软件产生灾难性影响。因此,具有较高技能的程序员是必不可少的。在媒体和记者行业协会,C h a t G P T有时被视为是一个威胁。事实上,聊天机器人能用完全正确的某个国家的语言写出人们想要的文章或论文,绝对可以自动完成一些常规的文章。如果新闻工作者们愿意,它也可以调整为契合某个特定作家的语言风格。因此,从图灵测试的意义

42、上看,这些文字工作者们是可以被机器替换的。一些该领域的协会要求禁止使用聊天机器人所起的作用微乎其微。相反,人们必须学会利用技术来提高自己的表现。对于高要求的文本,C h a t G P T可以帮助预先构建和合并好一些必要的数据。编辑应该对数据进行管理并负起责任(这也是法律义务),尤其应该清除人工智能复制和传递的虚假信息。一个人可以在网络中设置聊天机器人系统,这些聊天机器人便“自发地”在所需的上下文中发表声明并传递夸张和虚假信息。因此,媒体部门面临的挑战是巨大的,但还是存在提高质量的机会。在新闻业培训中,聊天机器人可以生成有关某些主题的示例文章,然后由学生进行批判性评估,以改进他们以后的工作。在

43、一些使用语言传达情感和同理心的职业中,如心理学家或心理治疗师,聊天机器人会变得特别敏感。魏茨鲍姆早期的语言程序E L I Z A就打算模拟心理治疗师。当时,魏茨鲍姆对这个简单的程序被用作心理治疗师的方式感到震惊:人们将自己的欲望和恐惧投射到了程序之中。有了C h a t G P T后,自动咨询师可以替代人类咨询师。如果心理治疗师大量使用聊天机器人以收取对话费用的话,这种商业模式很有问题,它不仅功利,而且对心理脆弱的患者也极其危险,因为测试表明聊天机器人还会生成虚假和扭曲的信息。聊天机器人可以用来记录对话,或者根据现有数据提供建议,然后必须对这些建议进行严格校对。必须明确的是,聊天机器人在所有应

44、用领域仅基于大量数据通过模式识别进行第1期C h a t G P T和人工智能:从基本原理到教育应用4 5 分析统计。因此,它只能理解和传达以前训练过的文本中讨论到的情感和同理心。在培训中,学生可以批判性地评估聊天机器人的答案,以训练他们自己的心理治疗判断能力。法律工作者(如律师、检察官或法官)也是基于语言的职业,因此商业律师的任务也可以委托给C h a t G P T。如果某公司希望以某种法律形式制定公司组织章程(例如在德国的有限公司),公司通过回答某些标准化的问题来描述其概况,然后聊天机器人会自动起草公司组织章程。在德国,虽然已经有了一些法律数据库,但它们会为问题提供许多答案和选项,律师必

45、须辛辛苦苦地做出选择判断。由于检察官和法官面临很多困扰,例如悬而未决的案件和审判,他们都会非常乐意依赖聊天机器人的快速和看似有效的帮助,但这将是非常危险的。原因很明显,法律领域的工作揭示了当下聊天机器人的显著局限性。法律的语言极其复杂和标准化,对于外行来说,看似合理且精心制定的答案可能是错误的、歪曲的甚至是误导的。因此,与数学专业的“解决数学问题”类似,“解决法律案件”是大学法律专业学生培训的核心能力。在这种情景下,也可以以一种有教学意义的方式使用C h a t G P T,即通过学生在研讨会或练习小组中批判性地分析和讨论聊天机器人的答案,以提高他们自己解决问题的能力。聊天机器人还可以帮助编写

46、用于特定目的的复杂判决和法律案件的语言摘要。但特别是在法律领域,这最终是一个责任和义务问题,不能让自动化的机器人去做。在中小学和大学中,C h a t G P T应用可能引发的问题目前引起了极大的关注。从学校的作业论文,到学士、硕士和博士学位的研究论文,只要是以文本形式呈现的,都能由它生成,这些机器生成的论文从社会科学、文化研究和人文科学角度看水平都很高,通常也能通过图灵测试。一些大学(如在德国和意大利)的措施是禁用C h a t G P T,笔者认为可以理解,但完全错误。相反,我们必须学会把聊天机器人作为一种先进的文化技术来理解和处理。在古代,即使哲学家柏拉图也对使用文字而不是口头对话感到过

47、不安,因为他认为这扭曲了真实的思想。后来出现了印刷技术,然后是在打字机,最后是在个人电脑上进行文本处理。我们这一代人体验过所有这些文化技术(c u l t u r a l t e c h n i q u e s):小学时首先在石板上写字,然后是用铅笔和钢笔做练习册,接着在机械打字机上写论文,最后在个人电脑上进行文字处理。今天,在世界任何地方都可以在线举行会议。当然,这些文化技术各自的优缺点会发生变化。例如,维基百科自成立以来已经有了很大的改进。在最初遭到激烈批评之后,现在也在全球范围内使用,即使是高度专业化的科学家也在使用这个工具来让自己了解某些东西。我们已经学会了明智地使用它来传递信息,

48、而不是盲目依赖它。需要在此强调的是,书籍受到人文学者赞扬的同时,也曾经被西方哲学的4 6 北京大学教育评论2 0 2 3年奠基人之一判断为一种极其可疑的思想交流形式。也许这样想并不牵强,类似于技术在工程领域的作用,文化技术在人文学科中也占有一席之地。在技术方面,桥接技术(b r i d g i n g t e c h n o l o g i e s)在一定时间内证明了自己的先进性,但在条件改变后又被新技术所取代。例如,我们目前正在经历柴油发动机的替代,柴油发动机是过去一百多年间的独创性和革命性的技术,但在如今环境变化之下,面对电动机、电池和可再生能源,柴油发动机的局限性突显。此外,关于电池的辩

49、证性讨论表明,它也不是最终产品,只是另一种可能遇到瓶颈的桥接技术。因此,C h a t G P T在学校和大学的潜在可能性导致的结果不应该是被禁用,而应该是导向一个关键的批判性问题:在一个技术日新月异、工作条件变化的世界中,传统的考试是否仍然是跟得上时代的、合适的?因此,最重要的是进行最基本的关于该技术的可能性和局限性讨论。而评估可能性和局限性,不仅需要了解算法和基本的理论知识,也需要处理这些程序的实际经验。为此,学习者首先应该对机器学习和C h a t G P T等聊天机器人的特殊算法有一个基本的了解,然后他们自己尝试对聊天机器人下命令、并评估它的答案。例如,重要的是要理解什么是强化学习通

50、过不断提问给出新的和修改的答案,在最好的情况下会有所改善。然而,这取决于聊天机器人的知识库,在此前的训练阶段,这些知识库是通过监督学习教给聊天机器人的。因此,聊天机器人的初始响应尚不能直接使用,而需要处理和修正。以这种迭代的方式,可以在与聊天机器人的对话中生成各学科的示例解决方案。因此,在考试中适当使用C h a t G P T取决于某些边界条件(G o g o l,H e c k m a n n,P r e t s c h e r,2 0 2 3)。只有在口试和笔试中,考官才能在很大程度上保证考生没有作弊。然而,这个问题也取决于规模必须督察某些科目中数百上千位

下载提示：咨信网仅提供存储空间/不修改/不编辑

【自信AI创作助手】【自信AI导航】
1、请仔细预览页面，基本判断完整性，对于直接下载带来的问题请及时与客服沟通；下载的文档，不会出现我们的网址水印。
2、该文档所得收入（下载+内容+预览）归上传者、原创作者；如果您是本文档原作者，请点此认领！既往收益都归您。

同意并开始全文预览

举报此文档有问题？有机会获“体验VIP”奖励！

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

10 金币 0人已下载

申诉本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请申请举报、认领或删除 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: ChatGPT和人工智能：从基本原理到教育应用 1 ChatGPT 人工智能基本原理教育应用

咨信网温馨提示：
1、咨信平台为文档C2C交易模式，即用户上传的文档直接被用户下载，收益归上传人（含作者）所有；本站仅是提供信息存储空间和展示预览，仅对用户上传内容的表现方式做保护处理，对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿，我们不确定上传用户享有完全著作权，根据《信息网络传播权保护条例》，如果侵犯了您的版权、权益或隐私，请联系我们，核实后会尽快下架及时删除，并可随时和客服了解处理情况，尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确)，网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据，平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺，下载前须认真查看，确认无误后再购买，务必慎重购买；若有违法违纪将进行移交司法处理，若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传，付费前请自行鉴别，如您付费，意味着您已接受本站规则且自行承担风险，本站不进行额外附加服务，虚拟产品一经售出概不退款（未进行购买下载可退充值款），文档一经付费（服务费）、不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印，是因预览和防盗链等技术需要对页面进行转换压缩成图而已，我们并不对上传的文档进行任何编辑或修改，文档下载后都不会有水印标识（原文档上传前个别存留的除外），下载后原文更清晰；试题试卷类文档，如果标题没有明确说明有答案则都视为没有答案，请知晓；PPT和DOC文档可被视为“模板”，允许上传人保留章节、目录结构的情况下删减部份的内容；PDF文档不管是原文档转换或图片扫描而得，本站不作要求视为允许，下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权，请谨慎使用；网站提供的党政主题相关内容(国旗、国徽、党徽－－等)目的在于配合国家政策宣传，仅限个人学习分享使用，禁止用于任何广告和商用目的。
6、文档遇到问题，请及时私信或留言给本站上传会员【自信****多点】，需本站解决可联系【微信客服】、【 QQ客服】，若有其他问题请点击或扫码反馈【服务填表】；文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“【版权申诉】”（推荐），意见反馈和侵权处理邮箱：1219186828@qq.com；也可以拔打客服电话：4008-655-100；投诉/维权电话：4009-655-100。