ChatGPT和人工智能:从基本原理到教育应用 (1).pdf
《ChatGPT和人工智能:从基本原理到教育应用 (1).pdf》由会员分享,可在线阅读,更多相关《ChatGPT和人工智能:从基本原理到教育应用 (1).pdf(15页珍藏版)》请在咨信网上搜索。
1、第2 1卷第1期2 0 2 3年1月北京大学教育评论P e k i n g U n i v e r s i t y E d u c a t i o n R e v i e wV o l.2 1,N o.1J a n u a r y 2 0 2 3C h a t G P T和人工智能:从基本原理到教育应用克劳斯迈因策尔(慕尼黑工业大学,慕尼黑)摘 要 本文阐述了C h a t G P T等聊天机器人在教育培训中的性能和局限性。为了确保此类人工智能工具的适当使用,必须全面了解相应算法的基本原理和局限性。本文首先梳理了人工智能领域从E L I Z A、C S I E C到WA T S ON等聊天机器
2、人系统的发展路线,然后介绍了C h a t G P T的功能原理:人类语言的统计概率模型、人工神经网络、基于大规模文本的深度学习算法、应用人类反馈的强化学习算法等。基于以上技术基础,本文讨论了C h a t G P T为代表的新一代人工智能技术对教育政策带来的挑战,包括学生就业招聘、法律和新闻等相关专业教学设计、学生论文写作、学生考试和其他评价方式等,并提出应对这些挑战的方案,以保证未来在教育和培训领域中人工智能技术能够得到合理、有效、公平的应用。关键词 C h a t G P T;教育;培训;人工智能中图分类号:G 4 0-0 5 7 文献标识码:A 文章编号:1 6 7 1-9 4 6 8
3、(2 0 2 3)0 1-0 0 3 5-1 4D O I:1 0.1 2 0 8 8/p k u 1 6 7 1-9 4 6 8.2 0 2 3 0 1 0 0 3一、图灵测试和人工智能英国计算机先驱、逻辑学家和数学家艾伦图灵(A l a n T u r i n g)在1 9 5 0年提出了一个模拟测试(后被称为图灵测试),并以此作为对人工智能的定义。如果一个技术系统在响应和解决问题方面与人类专家无区别,这一技术系统就应该被称为具有“智能”。在图灵之后的几年里,技术研发最初的重点是在计算机上模拟逻辑思维。这背后是认识论的观点,即智力主要与人类思维中的逻辑推理能力有关。为此,人工智能是基于符号
4、表示的逻辑规则和公式,并将其转化为适当的计算机程序。这时的人工智能被称为符号主义指导下的人工智能。符号主义指导的人工智能的一个应用场景是自动推理和证明,即人工智能程序通过逻辑计算模拟人类的逻辑思维(R o b i n s o n,1 9 6 5)。具有满足性的自动推理系统至今仍在工业物流中使用(B i e r e,e t a l.,2 0 0 9;K c h l i n,2 0 2 1)。作者简介:克劳斯迈因策尔(K l a u s M a i n z e r),男,德国慕尼黑工业大学卓越荣休教授,图宾根大学冯魏茨泽克中心客座教授,欧洲科学与艺术院院长。3 6 北京大学教育评论2 0 2 3年
5、二、从图灵到魏茨鲍姆的E L I Z A1 9 5 6年,约翰麦卡锡(J o h n M c C a r t h y)、艾伦纽厄尔(A l l e n N e w e l l)、赫伯特西蒙(H e r b e r t S i m o n)等人工智能的奠基人在美国达特茅斯召开会议,受图灵提出的“机器能思考吗”这一问题的启发,他们第一次提出了“人工智能”的概念,以此来描述通过计算机模拟人类智能的研究领域。人工智能研究的第一阶段是约2 0世纪5 0 年代中期至 2 0世纪6 0 年代中期,研究者对其甚为乐观,积极推动其发展(G r t z,&S c h n e e b e r g e r,2 0 0
6、 3),如尝试设计解决问题的通用程序,然而实际结果令人非常失望。约2 0世纪7 0年代中期至2 0世纪8 0年代中期,基于知识的专家系统脱颖而出,并实现了第一批实际应用。诸如工程师和医生等人类专家的特定范围的、可管理的专业知识在专家系统中被表示出来,并被用于解决日常问题(B o e r s c h,H e i n s o h n,&S o c h e r,2 0 0 7)。基于知识的专家系统的人工智能程序,能存储有关特定领域的知识,并自动从知识中得出结论,以找到具体的解决方案或提供情况诊断(P u p p e,1 9 8 8)。然而,与人类专家不同的是,专家系统的知识仅限于一个专门领域,缺少关
7、于世界的常识性知识和结构性知识。为了建立一个专家系统,专家的知识必须被转化为规则,通过一种编程语言来实现,并用解决问题的策略进行处理。上述 方 法 也 适 用 于 通 过 计 算 机 实 现 自 然 语 言 处 理。魏 茨 鲍 姆(J.W e i z e n b a u m)的E L I Z A语言程序就是一个例子(W e i z e n b a u m,1 9 6 6)。E L I Z A设计本意是模拟一个精神病医生,以一个人类专家的身份与病人交谈。它涉及如何用“精神病医生”的特定句型对病人的某些句型做出反应的规则,也即在各种情况下识别或区分规则。在最简单的情况下,必须确定两个符号结构的相等
8、性,这是由关于符号列表的L I S P编程语言中的E QUA L函数确定的。如果符号表达式中包含术语和变量,则存在一种扩展,例如:(x B C)(A B y)这两项相等,因为变量x对应于原子元素A,变量y对应于原子元素C。通过引入变量,模式匹配可以识别一个模式的结构。为此,L I S P中定义了一个单独的运算符MAT CH(匹配)。一个数据与一个结构对应的最简单情况是常数相等,例如列表A B和A B相等:(MAT CH(A B)(A B)=T其中的符号“”表示以下列表不应理解为函数指令,而是符号的枚举。不同的生成元导致类的形成,其作用类似于逻辑或数字中的变量。所以符号“?”可以用来匹配任何对象
9、,例如:(MAT CH(?B)(A B)=T(MAT CH(?B)(A B)B)=T第1期C h a t G P T和人工智能:从基本原理到教育应用3 7 这种结构匹配任何以B为第二个元素的两个元素的列表。生成器“*”是匹配任何元素组成的序列(包括空序列),例如:(MAT CH(*B)(B)=T(MAT CH(*B)(A B C B)=T 上述的结构匹配以B为最后一个元素的所有列表。这就解释了理解算法结构的基本原理,该结构反映了E L I Z A中精神病医生的知识。病人P和E L I Z A之间的对话可以想象为这样:病人:ME N A R E A L L A L I K E(男人都是一个样子)
10、E L I Z A:I N WHAT WAY(何出此言)病人:THE YR E A LWAY S B UG G I NG U S A B OUT S OME TH I NG O R OTHE R(他们总是为某些事情烦扰我们)E L I Z A:C AN YOU TH I NK O F A S P E C I F I C E X AMP L E(你能说出一个具体的例子吗)病人:WE L L;MY B OY F R I E N D MA D E ME C OME HE R E(是,我男朋友让我来的)E L I Z A:YOUR B OY F R I E N D MA D E YOU C OME H
11、E R E(你男朋友让你来的)病人:Y E S;I AM V E R Y S A D(是的,我很伤心)E L I Z A:YOU A R E V E R Y S A D(你很伤心)病人:S A D AN D D E P R E S S E D(悲伤且沮丧)E L I Z A:P L E A S E GO ON(请继续)如果患者使用了某些句型,这些句型通过模式匹配被E L I Z A识别,则以下规则允许推导出E L I Z A的答案:(*AM*B)(A P P E N D(YOU A R E)B)(*A R E*)(I N WHAT WAY)(*A LWAY S*)(C AN YOU TH I
12、NK O F A S P E C I F I C E X AMP L E)(*MY*B ME*C)(A P P E N D (YOUR)(A P P E N D B(C ON S YOU C)(*L)(P L E A S E GO ON)第二条规则是:如果病人的句子中含有A R E,用“WHAT WAY”来回答。在这个输入句子“ME N A R E A L L A L I K E”(男人都是相似的)中,运算符*代表的ME N出现在A R E之前,而A L L A L I K E都出现在A R E之后。第四条规则规定:如果在病人的记录中,单词MY和ME被列表*B3 8 北京大学教育评论2 0 2
13、 3年隔开,并且记录以列表*C结尾,那么E L I Z A会做出反应,首先将YOU和C部分组合在一起(C ON S YOU C),然后将B部分应用,最后将(YOUR)应用。因此,在程序语言L I S P示例中,与E L I Z A的对话只是语法符号列表的派生。从语义上讲,结构的选择与口语的对话习惯相对应。最后一条规则是一种典型的尴尬反应,因为它也发生在实际的对话中:如果任何符号列表(*L)没有被专家识别(也就是谈话中的噪音等等),那么它就会装作一副聪明的嘴脸,说“请继续”。三、从 E L I Z A 到 WA T S ON自魏茨鲍姆的E L I Z A以来,已经有了基于模式识别的文本匹配方法。
14、下一步,该软件将句子分解为单独的短语,并快速计算出将回答模式与问题匹配的概率,或者将一种语言与另外一种语言翻译匹配的概率。一个高效翻译系统的例子是V E R BMO B I L,它是1 9 9 32 0 0 0年由德国人工智能研究中心(D F K I)研发出来(W a h l s t e r,2 0 0 0)。对于人类来说,处理语言要通过多个步骤;而在技术系统中,人们试图模块化地一个个地实现这些步骤。在计算语言学领域(H a u s s e r,2 0 1 4),此过程被表述为一个管道模型:从声音信息(听觉)开始,下一步是生成文本形式。然后将相应的字母字符串记录为单词和句子。在词语形态分析中,
15、要分析人称代词,要将文本中的单词简化为最基本的词根形式。在乔姆斯基语法体系的句法分析中,要强调一个句子的主语、谓语、宾语、形容词等语法要素。在语义分析中,句子意义由乔姆斯基语法的深层结构中表现出来(C h o m s k y,1 9 6 9)。最后,在对话和话语分析中,系统将检查问题和答案之间的关系,以及表达的意图和目的。2 1世纪 初,贾 积 有 设 计 并 开 发 了 一 款 英 语 聊 天 机 器 人 系 统C S I E C(C o m p u t e r S i m u l a t i o n i n E d u c a t i o n a l C o mm u n i c a t
16、i o n),它基于文本知识和推理,可以随时随地与英语学习者进行英语聊天;它可以根据用户的输入、对话上下文、用户和自己的个性化知识、常识性知识和推理知识生成交流性响应。所有这些知识都以自然语言标注语言(N a t u r a l L a n g u a g e M a r k u p L a n g u a g e,简称N LML)的形式表达,这些 N LML 既可以通过解析文本自动获得,也可以在图形化编辑器的帮助下人工编写。因此,C S I E C系统提出了一种直接通过文本知识的句法和语义分析进行逻辑推理的朴素方法。这种方法比旧式的E L I Z A类关键字匹配机制更具有优势。对六个月以内免
17、费使用该系统的用户聊天日志的分析证明了这一优势。一篇被广为引用的国际期刊论文介绍了C S I E C的系统架构、实现技术以及教育应用效果(J i a,2 0 0 9)。另一个语义问答系统是I BM的WAT S ON程序(F e r r u c i,L e v a s,B a g c h i,第1期C h a t G P T和人工智能:从基本原理到教育应用3 9 G o n d e k,M u e l l e r,2 0 1 3),它使用了并行计算机的计算能力和维基百科知识。与E L I Z A不同,WAT S ON理解上下文和语言游戏的语义。WAT S ON是一个语义搜索引擎,可以捕获用自然语
18、言提出的问题,并在短时间内在大型数据库中找到匹配的事实和答案。为此,它集成了许多并行工作的语言算法、专家系统、搜索引擎、基于大数据存储容量和计算能力的语言处理器。四、统计学习理论和神经网络然而,基于规则的知识并不能完全涵盖我们日常知识中的直觉技能和经验。技能是建立在多种不同经验基础之上的,这些经验绝不是在教科书中以符号和规则的方式来表示的。一名经验丰富的汽车驾驶员会根据许多感官数据直观地掌握情况并做出反应,而不会去解析其中细枝末节的逻辑关系。同样,一名经验丰富的医生或飞行员也能在手术室或飞机驾驶舱内的危急情况下做出反应。人和人之间进行的语言交流,更不可能受到规则和符号表征的有意识应用的引导。哲
19、学家休伯特德雷福斯(H u b e r t D r e y f u s)1 9 7 2年出版了一本书,名为 计算机不能做什么 人工智能的极限(W h a t t h e c o mp u t e r c a n n o t d o:T h e l i m i t s o f a r t i f i c i a l i n t e l l i g e n c e)。但事实上,他只是展示了符号主义指导下的人工智能在理解人类直觉方面的局限性。作为一名现象学家,他认为自己只能通过定性的现象学方法,而不能通过形式规则来理解人类的直觉。然而,问题出现了:机器可以在多大程度上训练数据中的模式和结构识别以及期
20、望的概率分配,以便模拟人类的直觉?现在,符号主义指导的人工智能中的逻辑规则被人类感官或者计算机传感器的数据所取代,而这些数据的统计相关性和概率是确定无疑的。基于数据的学习是在统计学习理论中以数学方式(m a t h e m a t i c a l l y)被研究的,它的算法是机器学习的基础(V a p n i k,1 9 9 8)。在认识论的术语中,这些对来自感官的数据的学习过程在有意识的逻辑推理之下无意识地运行,因此有亚符号化的人工智能。在数学上,逻辑范式被统计学和概率论所取代。近年来强大的计算机技术使得基于海量大数据的机器学习技术成为可能,并在人工智能应用方面取得了新的突破,例如在药物和疫
21、苗的开发方面,以及在机器人、工业和社会基础设施方面(M a i n z e r,2 0 1 9)。生物体的自组织大脑被认为是编程计算机的反设计。在进化中,网络首先发展为复杂基因和蛋白质网络中的亚细胞供应、控制和信息系统。有了神经细胞后,细胞信息、控制和供应系统最终在神经化学信号处理的基础上发展起来。在没有计算机模型符号表示的前提下,进化过程开发出了有效的解决问题的程序。亚细胞、细胞和神经元的自组织产生了匹配的复杂网络。神经元由图形网络的节点表示,突触连接由边表示(R i t t e r,M a r t i n e t z,S c h u l t e n,1 9 9 1)。在4 0 北京大学教育
22、评论2 0 2 3年模型中,用数值(即权重)来表示神经化学连接的强度。学习就是神经元连接模式的建立过程。这是通过神经网络的学习算法完成的。密集的突触耦合产生的神经元线路模式,与生物体的心理、情感或运动状态相对应。原则上,它们可以通过计算机模型进行模拟。这些模拟基于神经元网络、自动机和图灵机之间本质上的数学等价性。因此,可以证明一个麦卡洛克皮茨(M c C u l l o c h-P i t t s)网络可以用一个有限自动机来模拟(K l e e n e,1 9 5 6)。有限自动机是诸如自动售票机之类的简单系统,可以识别指令的简单语言代码(H o p c r o f t,M o t w a n
23、 i,U l l m a n,2 0 0 1)。相反,一个有限状态自动机的功能也可以通过一个麦卡洛克皮茨网络来实现。在数学上,这样的网络由整数加权。换句话说,一个具备麦卡洛克皮茨网络类型的神经系统的有机体,只能解决一个有限自动机可以处理的复杂性问题。这样的有机体与有限自动机的智能程度一样。根据丘奇(C h u r c h)论题,图灵机是程序控制类计算机的原型,但是哪些神经元网络对应于图灵机?可以证明,图灵机精确模拟了那些突触权值为有理数(“分数”)且具有反馈回路(即“递归”)的神经元网络。反过来,图灵机也可以被具备有理数突触权重的递归神经网络所精确模拟(S i e g e l m a n n,
24、S o n t a g,1 9 9 5)。根据上述证明,如果把图灵机作为程序控制类计算机的原型,那么计算机可以模拟具有有理数突触强度的大脑。反过来,一个图灵机中的程序可以由具有有理数突触强度变量的大脑所复制。换句话说,这种大脑的智能水平与图灵机的智能水平相当。实际上,这种神经网络原则上可以在合适的计算机上进行模拟。今天实际应用(如模式识别)的神经网络,很大程度上仍然是在计算机上模拟的。只有神经形态的计算机才能直接复制神经网络。在统计学习的自动化中,具有学习算法的神经网络起着关键作用。概率网络在实验上与生物神经网络非常相似。如果细胞被移除或独立突触权重发生少量变化,实验证明,它们受到轻微干扰时具
25、有容错性,就像人脑在受到轻微意外损伤之后的表现。人类大脑的工作方式是多层并行信号处理。例如,在感觉输入层和运动输出层之间,存在与外界无关的由神经元信号处理的内部中间步骤。事实上,在技术神经元网络中,通过插入拥有尽可能多由具有学习功能的神经元组成的中间层,可以提高其表现和解决问题的能力。第一层会接收到输入模式(i n p u t p a t t e r n),这一层的每个神经元都连接着下一层的每个神经元。这种相 互 连 接 一 直 持 续 到 最 后 一 层,并 最 终 给 出 一 个 活 动 模 式(a c t i v i t y p a t t e r n)(H o r n i k,S t
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- ChatGPT和人工智能:从基本原理到教育应用 1 ChatGPT 人工智能 基本原理 教育 应用
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。