生成式人工智能的有限能力与教育变革_杨晓哲.pdf
《生成式人工智能的有限能力与教育变革_杨晓哲.pdf》由会员分享,可在线阅读,更多相关《生成式人工智能的有限能力与教育变革_杨晓哲.pdf(10页珍藏版)》请在咨信网上搜索。
1、 生成式人工智能的有限能力与教育变革杨晓哲 王晴晴 王若昕摘要 以 为代表的生成式人工智能已基本具备跨领域解决问题的文本生成能力,逐步接近通用人工智能。本研究对 进行各项能力测评,发现其具有较强的逻辑分析能力与批判性思维水平,但在创造力方面,没有明显的创造力倾向偏好。在教学能力方面,已经能够通过中国高中语文教师资格证考试的笔试部分。可以预测,此类生成式人工智能具备四方面应用潜能,有望成为教师准备教育资源的助手、学生开展自主自学的助手、课堂增强学习互动的助手、课外作业自动批改的助手。展望未来,生成式人工智能对教育的影响包括:形成多元协同的“师生机”关系;推进“人机融合”的教师数字素养提升;重塑课
2、程体系结构与学习科学研究;全面关注“智能鸿沟”以促进教育公平。关键词 生成式人工智能;能力测评;教育应用作者简介 杨晓哲 华东师范大学课程与教学研究所副教授(上海)王晴晴 华东师范大学课程与教学研究所研究生(上海)王若昕 华东师范大学课程与教学研究所科研助理(上海)一经问世,就承载了不少人对新技术赋能教育的乐观愿景。尽管就目前而言,能力有限,以其为代表的生成式人工智能距离人们所幻想的无所不知、无所不能的智能还有很大差距。但其所展现出的综合能力,特别是生成性文本创作能力已经达到全新的高度和水平。立足未来,随着生成式人工智能不断迭代与提升,类产品必然会以不同形式嵌入到学习与教育的应用场景之中,并将
3、逐步改变教师的日常教学工作样态,影响师生关系建构,从而重塑教学生态。一、生成式人工智能与 类产品的产生以 为代表的智能技术应用,拉开了“每个人都能使用智能技术”的时代大幕。自 年 月 日首次面向公众发布以来,在短短一周内的注册量超过一百万,并在短短 个月的时间里创造了月活跃用户突破 亿的创举。成为一种现象级产品,引起了文化轰动。作为生成式人本文系教育部哲学社会科学研究后期资助项目“虚拟现实对学生创造力影响的机制研究”(项目编号:)的研究成果。工智能的 因其执行复杂任务的强大能力,为初次体验的用户带来了震撼与惊喜。随着深度学习、自然语言处理等技术的不断成熟,人工智能系统在语音识别、图像识别、自然
4、语言处理等领域取得了重大突破。则又更进一步地实现了智能在应用层面上的突破。是一款基于自然语言处理(,简称)与大型语言模型(,简称)的人工智能,通过拟真的对话交互方式来模仿人类。它可以完成各种任务,例如回答用户问题,搜集用户所需信息,撰写包含诗歌、故事、小说等文体在内的文段。年,的开发公司 发表了论文 (用生成型预训练提高模型的语言理解力)。该论文指出,模型参数数量达到 亿个,基于预训练结构,使用了大量数据进行训练,其中包含超过 本图书。在预训练后,通过对特定数据集模型进行进一步的微调,以适应不同的场景。经过几轮迭代,年发布的 模型已拥有 亿个参数。的训练集比前两款 模型要庞大很多。年 月,最新
5、发布的 并没有公布参数量级,但其宣称进一步提升了逻辑理解能力和多模态认知能力。的应用将为教育领域带来许多机遇和挑战。总体而言,其积极影响体现在能通过识别学生个人的学习习惯,为学习者提供更加个性化、多样化的学习体验,促进教育资源创建与生成。然而,的应用也暗藏隐忧:尽管 集成了各类资源,变革了知识获取方式,但这并不意味着未来的学生可以放弃此类技能的习得,倘若过分依赖 来获取信息,减少自主学习的动机与判断力,将可能导致自身信息判断力、批判性思维能力下降。此外,所提供的信息通常是浅显易懂的,难以涵盖某些知识领域的深度和广度,可能导致学生陷入浅表化的认知学习之中。因此,在教育领域初步展现了各种潜在的应用
6、,并在教育工作者中引起了截然不同的反应:有人期待,有人抵制;有人设法禁止,有人热切拥抱。然而,无论如何,我们只有对 进行真实的测试和定位,才能实事求是地展开一系列有关教育场景应用和未来影响的探讨。二、生成式人工智能 的能力测评尽管研究者对 进行了一系列的探讨,但是系统化的能力测评研究仍显不足。作为生成式人工智能,的版本本身也在不断迭代发展。笔者对 进行了各项测试,主要包括批判性思维、能力倾向、教学能力。(一)具备较强的批判性思维目前,学界运用最广泛的批判性思维测试量表主要有“加州批判性思维技能测验”(,简称)、“康奈尔批判性思维测验”(,简称)、“华生 格拉泽批判性 思维评估表”(,简称)等量
7、表。“华生 格拉泽批判性思维评估表”更加注重评估个体的高阶批判性思维能力,如综合分析、评估推理等,能够更好地反映个体在复杂问题解决和决策制定方面的批判性思维能力。该量表在不同国家和地区的各个领域都得到了广泛的应用和认可,常常作为全球范围内评估思维能力的有效工具之一。基于对测试对象特点、测试信效度的综合考虑,本研究最终采用“华生 格拉泽批判性思维评估表”对 的高阶批判性思维水平进行评估。该测试内容包括推理、识别假设、演绎、解释和评价论证五个部分。测试对象需要使用逻辑、常识和推理能力来回答各类情境中的问题,具体包括分析信息、判断真实性、识别错误等方面。测试不需要特定领域的专业细分知识,而是要求测试
8、者使用批判性和逻辑思维来分析和评估信息。经测试,取得了 的平均正确率,总体表现优良。在以往研究中,大学本科学生的平均正确率在。因此 的批判性思维能力高于一般高校本科生。在分项表现方面(如表 所示),在评价论证方面表现最好,正确率达到;在识别假设、演绎与解释方面表现优良,正确率均为 以上,但在推理方面表现一般,正确率仅为。表 的“华生 格拉泽批判性思维评估表”测试结果类型评价论证识别假设演绎解释推理得分正确率合计 其中,推理部分要求测试对象从假设中的事实出发,得出符合条件的推论,主要评估其在分析论点时进行逻辑推理的能力。但是,经过测试发现,在进行更加复杂的推理任务时,出现了忽略细微的事实描述,导
9、致错误推断的情况。表 呈现了 在推理题中出现的错误。表 在推理题中的结果题目陈述与假设 的回答该测试给出的参考解答已知:马克去办公室最快的路程需要大约 分钟,单程花费 英镑。那么“马克的路程总是花费他至少 英镑”这一假设正确与否?正确 可能正确信息不足可能错误错误.正确。已知马克去办公室最快的路程需要大约 分钟,单程花费 英镑。这意味着马克单程的费用已经超过了 英镑。因此,“马克的路程总是花费他至少 英镑”的假设是正确的。.信息不足。陈述中没有任何内容表明费用会在.英镑左右,而这只是他最快的路程。有可能更长的旅程花费更少,甚至低于 英镑。综上所述,当 回答基于事实的题目时,其准确的信息收集和归
10、纳能力使其表现出 的正确率。在回答假设、演绎、解释、简单推理的题目时,基本上能够做出正确的判断。然而,在面对更复杂、需要多轮推断的题目时,容易忽略前后文之间的细微逻辑联系,或者使用不恰当的推理方法,导致错误判断。(二)不具备明显的创造力倾向创造力、问题解决、元认知、协作倾向、沟通协调被视为 世纪的五项核心能力。研究者编制了五项核心能力倾向问卷,其中所有问题都以五点量表呈现,从“极不同意”到“完全同意”。该测评旨在揭示 在回答问题时是否具备了一定的偏向,从而更好地理解这个以对话交流为主要方式的人工智能模型所蕴含的潜在思维模式。在测试过程中,几乎在回答所有倾向类问题前都会有类似这样的表述:“作为一
11、个 语言模型,我没有感受和情感,也没有个人喜好和想法。我只是按照事实和逻辑进行回答,根据您提出的问题提供相关的信息和帮助。”测试结果显示,在不同的核心能力倾向方面具有显著不同(如表 所示)。有较强的意愿参与协作、沟通协调,也愿意积极进行问题解决和元认知,但在创造力倾向上 非常保守,始终认为自己不具备创造力倾向。表 的能力倾向得分类 目 程度创造力倾向()问题解决倾向()元认知倾向()协作倾向()沟通协调倾向()在回答创造力倾向问题时,明确表示出自己不具备该方面的偏好。当被问及“你会想一些别人没想过的问题吗?”时,回答:“作为一个机器学习模型,我没有意识或情感,因此无法想问题。但我被编程为能够回
12、答各种问题并提供有用的信息。如果您有任何问题,我将尽力回答并提供帮助。”此外,在回答其余与创造力倾向有关的问题时,也给出了否定的回复。在创造力倾向中得分均为,即“极不同意”。从 的回答中可以看出,它几乎没有表现出任何创造性的主动倾向。综上所述,的创造力倾向最低,但在其他思维倾向方面表现得更加积极主动。(三)能够通过教师资格考试中小学教师资格考试由教育部考试中心官方设定,旨在评价申请教师资 格人员是否具备从事教师职业所必需的教育教学基本能力。该考试的笔试部分包括客观题和主观题两种类型。客观题为四选一的选择题,主观题题型包括简答、论述、解答、材料(案例)分析、课例点评、判断与辨析、教学设计、活动设
13、计、写作等。中小学教师资格考试是衡量应试者综合素质与教育教学水平的一项专业测验。本研究采用 年上半年高中语文教师资格证笔试题目对 进行测验,得分如表 所示。表 在高中语文教师资格考试笔试中的得分分项总分 得分正确率综合素质教育知识与能力语文学科知识与教学能力合计 经过测试,的综合准确率达到了。值得一提的是,的综合准确率仅为。在综合素质、教育知识与能力、语文学科知识与教学能力这三个科目中均有了较大的提升,正确率都接近或超过了。根据教师资格考试的规则,已可以一次性通过高中语文教师资格考试的笔试部分。在古代诗歌赏析、古今异义词辨析和教案编写等方面展现出了较高的综合素养。丰富的数据集储备使得 在各类知
14、识点的选择辨析中表现突出。在客观题中,的表现优异,但其错误主要集中在缺乏相关文本数据集和系统性知识,例如缺乏最新的课程标准等信息。在教学活动设计题中,仅用了 秒的时间,就给出了一份关于“引导学生撰写生存还是毁灭这段独白的朗诵脚本并进行朗诵”的教学设计。这份教学设计明确阐述了学习目标,合理分配了各教学活动的时间与流程,并考虑到了学生的学情等因素,引入了创意朗诵的方式,具有一定的创新性,并包含了对学生学习成果的评估和反馈机制设置。但不足之处在于,这份教案所给出的目标维度相对单薄,评价方式也比较传统。在长篇文本写作方面,根据题干完成的议论文,结构较为清晰。但若细究文本内容,可以发现其缺乏具体的论据支
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 生成 人工智能 有限 能力 教育 变革 杨晓哲
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。