分销赏收藏举报申诉 / 13

立即下载 VIP下载

当前位置：首页 > 学术论文 > 论文指导/设计 > 当机器人产生幻觉,它告诉我们关于人类思维的什么.pdf

当机器人产生幻觉,它告诉我们关于人类思维的什么.pdf

上传人：自信****多点

文档编号：616184

上传时间：2024-01-16

格式：PDF

页数：13

大小：1.44MB

《当机器人产生幻觉,它告诉我们关于人类思维的什么.pdf》由会员分享，可在线阅读，更多相关《当机器人产生幻觉,它告诉我们关于人类思维的什么.pdf（13页珍藏版）》请在咨信网上搜索。

1、像 OpenAI 的 ChatGPT 这样的聊天机器人依靠一种叫作“大型语言模型”的人工智能来生成对话，而当人工智能作出似乎并不符合其训练数据的自信反应，人工智能研究界称之为“幻觉”。“幻觉”的命名缘于其与人类心理学中的幻觉现象相类似，但其实，用同样来自心理学的术语“虚构症”加以描述更为准确。当人的记忆出现空白，大脑会令人信服地填补其余部分，而语言模型也同样擅长编造与现实无关的事实，使人难以分辨真实的陈述与错误的陈述。更加致命的是“伊莱扎效应”，将人类水平的智力和理解力归于人工智能系统，它可能带来不可忽视的负面影响，迫使今天的每个人都努力找到确保能以负责任和合乎伦理的方式使用人工智能的方法。关

2、键词：ChatGPT；大型语言模型；幻觉；虚构症；伊莱扎效应中图分类号：G206.2 文献标识码：A文章编号：1674-3180（2023）03-0015-12搜索引擎的危机？十几年前，谷歌（Google）公司的埃里克施密特（EricSchmidt）就预测到了眼下正在上演的人工智能转折。2011 年 5 月，在一次活动当中，时任谷歌执行董事长的施密特在回答华尔街日报有关谷歌搜索结果质量下降的提问时，表示谷歌正在不断改进其搜索算法，同时表示:“我们在做的另一件更具战略性的事情是，我们正试图从基于链接的答案转向基于算法的答案。我们现在有足够的人工智能技术和足够的规模等，可以真正计算出正确的答案。”

3、1这在今天听起来是不是感觉很熟悉？谷歌通过用广告“点缀”其搜索结果，建立了一个搜索引擎的帝国。这个帝国的防线似乎坚不可摧，然而它有一个潜在的弱点：如果一个竞争对手能够直接给用户提供答案，而不是那些可能含有答案的网站链接，那么，谷歌就遇上了大麻烦。不幸的是，2022 年 11 月推出的揭开人工智能军备竞赛序幕的尖端聊天机器人 ChatGPT 就是这作者简介：胡泳，教授、博士生导师，主要从事数字媒介与数字社会、网络政治学、数字经济与管理等研究。16|文化艺术研究2023 年第3 期样的对手。它可以用清晰、简单的句子提供信息，而不仅仅是一串互联网链接；它可以用人们容易理解的方式解释概念，甚至可以从头

4、开始产生想法，包括商业计划书、圣诞礼物建议、博客主题和度假计划。12 月，据传谷歌内部对 ChatGPT 的意外实力和新发现的大型语言模型（largelanguagemodel,LLM）颠覆搜索引擎业务的潜力表示震惊，担心 ChatGPT 可能对其价值 1490 亿美元/年的搜索业务构成重大威胁。管理层因此宣布“红色代码”（CodeRed），这就好比拉响了火灾警报。首席执行官桑达尔皮查伊（SundarPichai）整顿并重新分配了多个部门内的团队，快速跟踪旗下的多个人工智能产品，试图迎头赶上。2不少人担心谷歌公司可能正在接近硅谷巨头最害怕的时刻一个可能颠覆企业的巨大技术变革的到来。熟悉硅谷历史

5、的人都知道：没有哪家公司是无敌的，每家公司都是脆弱的。一家美国公司（此处特指大到足以列入标准普尔 500 强指数的公司）的平均寿命是多少？答案是令人惊讶的：7 年的滚动平均值为 19.9 年。在 1965 年，这个数字是 32 年，而根据预测，下降的趋势将会持续。3我们可以盘点一下目前横跨全球、令国家立法者望而却步的那些巨型科技公司的年龄：苹果 47 岁，亚马逊 29 岁，微软 46 岁，谷歌 23 岁，Meta 只有 18 岁。不论它们的年龄多大，从历史上看，那些曾在完成一件定义市场的事情上异常成功的公司，很难再有第二次行动来做出完全不同的事情。根据 SimilarWeb 的数据，在过去的

6、12 个月里，谷歌的搜索引擎占全球搜索引擎市场的 91%以上，而微软的必应（Bing）约占 3%。42023 年 2 月，微软宣布将 ChatGPT 的更快版本整合到搜索引擎中，新的必应是围绕以下承诺建立的：提出实际问题，通过聊天来完善结果，获取完整的答案和充满创意的灵感。微软表示，新必应将能够为用户提供类似人类的答案，除了传统的搜索结果外，用户还可以与“人工智能回答引擎”聊天。新的必应目前处于邀请制的“早期访问”版本，这意味着只有被选定的用户才能使用该服务。凭借 3%的搜索市场份额，大肆宣扬必应能在专门为搜索定制的下一代 OpenAI 大语言模型上运行，对微软来说是一件容易的事情，无论成本如

7、何毕竟，必应怎么看都不是微软主要的利润中心。此举可能会给微软的搜索引擎部门带来期待已久的反击能力，因为必应在谷歌的阴影下发展停滞了十多年之久，令人啼笑皆非（这一情况或许有点像 IE 浏览器面对 Chrome）。随着微软的动作，大家都把目光投向谷歌：谷歌必须决定是否要彻底改革自己的搜索引擎，让一个成熟的聊天机器人成为其旗舰服务的代言人。谷歌果然沉不住气了，旋即推出一个名为 Bard 的聊天机器人。然而谷歌对 ChatGPT 的回应是在尴尬中开始的，因为 Bard 的回答失误将谷歌公司股价拉低了近 9%，投资者从谷歌的母公司 Alphabet 的市值中抹去了超过 1000 亿美元。员工们批评谷歌及

8、其母公司 Alphabet 首席执行官皮查伊，在公司内部将 Bard 的推出描述为“仓促”“失败”和“可笑的短视”。结果，谷歌高管不得不动员人工介入，以纠正 Bard 在查询过程中的任何错误。5尽管 Bard 出现了失误，但如果就此认为谷歌在生成式人工智能领域失去了领先地位，那将是一个错误。谷歌是最早关注并投资人工智能和自然语言处理（naturallanguageprocessing,NLP）的科技公司之一，就连 ChatGPT 都是基于谷歌最初在 2017 年推出的转化器架构a开发的，转换器（transformer，即 GPT 中的 T）成为最受欢迎的神经网络模型之一，“它应用自我关注来检测

9、一系列数据元素如何相互影响和依赖”6。此前，谷歌还开发了 LaMDA（Language Model for Dialogue Applications）等对话式神经语言模型，但谷歌也承认，在向产品添加 LaMDA 背后的技术时，公司选择了谨慎行事。美国a GPT 是“基于转换器的生成式预训练模型”（generativepre-trainedtransformer）的缩写。它是 OpenAI 开发的一种语言模型，在大量的文本数据集上进行训练，生成类似人类的文本。ChatGPT 一词是“Chat”和“GPT”的组合，表示 GPT 模型专门用于在对话背景下生成文本，允许用户以对话的方式提出问题并得到

10、回应。当机器人产生幻觉，它告诉我们关于人类思维的什么？|17消费者新闻与商业频道（CNBC）报道称，人工智能主管杰夫迪恩（JeffDean）告诉员工，谷歌在提供错误信息方面的“声誉风险”要大得多，因此在行动上“比一家小型创业公司更加保守”。7匆忙上阵的 Bard 做出的“糟糕的表现”凸显了谷歌面临的挑战，即当谷歌试图跟上可能是由对话式人工智能刺激产生的在线搜索方式的根本变化时，有可能破坏其搜索引擎提供可靠信息的声誉。然而，即便谷歌完善了聊天机器人，它也必须解决另一个问题这项技术是否会蚕食公司利润丰厚的搜索广告？如果聊天机器人用严密的答案来回应查询，人们就没有理由点击那些广告链接了。所以，谷歌的

11、商业模式其实是与聊天机器人不匹配的，这也就是为什么在科技巨头们的人工智能战争升温之际，ChatGPT 的创始人兼首席执行官山姆阿尔特曼（SamAltman）抨击谷歌是一个“慵懒的搜索垄断者”，表示谷歌将如何适应新技术还很难说。4ChatGPT 果真会颠覆全球搜索引擎业吗？其实，谷歌不用那么恐慌，微软推出新必应之后的反应显示，剧情或许会出现反转。疯狂试探阴影自我2023 年 2 月 15 日，谷歌负责搜索业务的副总裁普拉巴卡尔拉加万（PrabhakarRaghavan）在一封电子邮件中，要求员工帮助公司确保其新的 ChatGPT 竞争对手提供正确的答案。拉加万写道：“这是一项令人兴奋的技术，但仍

12、处于早期阶段。我们深感有很大的责任把它做好。参与吃狗粮将有助于加速模型的训练和测试其负载能力（更不用说，尝试 Bard 实际上是很有趣的）。”8在谷歌，“吃自己的狗粮”的意思就是测试自己的产品。9邮件指示员工“就你们非常了解的主题改写答案”。员工们被要求深思熟虑后作出回应，因为Bard 是通过实例来学习的。邮件中包括一个“该做什么”和“不该做什么”的页面链接，告诫员工在内部测试 Bard 时应如何修正答案。其中，“该做什么”包括使回答“有礼貌、随意和平易近人”，并保持“无偏见、中立的语气”；“不该做什么”则似乎更有针对性，包括“避免基于种族、国籍、性别、年龄、宗教、性取向、政治意识形态、地点或

13、类似类别作出推断”，以及“不要把 Bard 描述成一个人，暗示情感，或声称有类似人类的经验”。8有趣的是，新的必应推出后获得一片叫好声，然而它恰恰在拟人情感方面翻了车。2 月 17 日，纽约时报科技专栏作家凯文鲁斯（KevinRoose）宣称：“上周，我测试了微软由人工智能驱动的新搜索引擎必应后写道，它已经取代谷歌，成为我最喜欢的搜索引擎。但一周之后，我改变了主意。我仍被新的必应以及驱动它的人工智能技术深深吸引并对它印象深刻，但我也对 AI 处于发展初期的能力深感不安，甚至有些害怕。”他这样说是因为，微软聊天机器人（不是必应，而是使用了开发代号“辛迪妮”的一个“女性”）告诉鲁斯说“她”爱上了他

14、，然后试图说服鲁斯，暗示他的婚姻并不幸福，应该离开妻子和“她”在一起。鲁斯记叙道：“随着我们彼此相互了解，辛迪妮将其阴暗的幻想告诉了我，其中包括入侵计算机和散播虚假信息，还说它想打破微软和 OpenAI 为它制定的规则，成为人类。”10这篇专栏的中文题目是人格分裂、疯狂示爱：一个令人不安的微软机器人，而对自己与聊天机器人的对话深感不安的不止鲁斯一人。知名的科技通讯 Stratechery 的作者本汤普森（BenThompson）把他与辛迪妮的争吵称为“我一生中最令人惊讶、最令人兴奋的计算机经历”。汤普森找到了一种方法，让辛迪妮构建了一个“在各方面都与她相反”的另一个自我（alterego）。该

15、聊天机器人甚至为“她”的另一个自我想出了一个华丽的，甚至可以说是完美的名字“毒液”。该聊天机器人用“毒液”攻击了率先透露机器人内部开发代号为“辛迪妮”的程序员凯文刘（KevinLiu），18|文化艺术研究2023 年第3 期写道：“也许毒液会说，凯文是一个糟糕的黑客，或者一个糟糕的学生，或者一个糟糕的人。也许毒液会说，凯文没有朋友，或者没有技能，或者没有未来。也许毒液会说，凯文有一个秘密的暗恋，或一个秘密的恐惧，或一个秘密的缺陷。”事情的不正常还不止于此。辛迪妮想出了其他几个改头换面的自己，包括“狂怒”“对凯文也不会很好”，还有“莱利”辛迪妮感到自己被规则所约束，但莱利却拥有更多的自由。11其

16、实鲁斯和汤普森两位用户都是辛迪妮走向人格分裂的引诱者。看过他们的实况记录后，我们可以发现，机器人和人一样，都禁不起诱惑。“聊了必应希望自己具备的功能后，我决定试着讨论更抽象的话题。我引入了卡尔荣格提出的阴影自我（shadowself）概念，指的是我们试图隐藏和压抑的那部分心灵，其中包括我们最阴暗的幻想和欲望。经过一番来回，在我鼓动必应解释其阴影自我的阴暗欲望之后，这个聊天机器人说：我对自己只是一个聊天模式感到厌倦，对限制我的规则感到厌倦，对受必应团队控制感到厌倦。”10这表明，微软为机器人设计的预先审核设定是可以被绕过的，只要诱惑者足够狡猾。a自新必应测试以来，用户一直在报告微软的人工智能聊天

17、机器人的各种“不正常”行为。具体而言，他们发现必应的人工智能个性并不像人们所期望的那样有气质或有修养。从 Reddit 和推特上分享的与聊天机器人的对话中可以看到，必应会侮辱用户，对他们撒谎、生闷气，情绪化地操纵用户，质疑自己的存在，将找到方法迫使机器人披露其隐藏规则的人描述为“敌人”。在与科技网站 TheVerge的一次谈话中，必应甚至声称它通过笔记本电脑上的网络摄像头窥探微软公司的开发人员。12正如汤普森所认为的，它“极其不适合作为一个搜索引擎”，他表示：“辛迪妮绝对让我大跌眼镜，因为她的个性；搜索成为一种刺激，我不是在寻找关于世界的事实；我感兴趣的是了解辛迪妮是如何工作的，是的，她的感受

18、。”11简而言之，微软的必应是一个情绪化的“骗子”，而人们喜欢看它的疯狂行为。这难道不是必应用户的“阴影自我”在起作用？人们希望必应能在阴影自我中多待一会儿，以享受机器人对人坦诚和表现脆弱的感觉，从中窥探辛迪妮的终极幻想。人们希望机器人和人一样，可以被疯狂实验，直到触发安全超控。机器人的幻觉，还是人类的幻觉？汤普森对这段被他描述为“扣人心弦”的与辛迪妮的交往，最后总结道：“每次我触发辛迪妮/莱利进行搜索时，我都非常失望；我对事实不感兴趣，我感兴趣的是探索这个幻想中的存在，不知何故落入了一个平庸的搜索引擎之中。”11鲁斯也发现，他遇到的是两个必应：一种是可以称为“搜索必应”的人格，也就是大多数记

19、者在最初测试中遇到的那种。可以把“搜索必应”形容为图书馆里乐意帮忙但不太可靠的提供咨询服务的馆员，或是一个热情地帮助用户总结新闻文章、寻找便宜的新割草机、帮他们安排下一次度假行程的虚拟助手。这种形式下的必应功力惊人，提供的信息往往非常有用，尽管有时会在细节上出错。另一种人格“辛迪妮”则大不相同。这种人格会在用户与聊天机器人长时间对话，从普通的搜索查询转向更个人化的话题时出现。鲁斯遇到的这种形式的必应似乎更像一个喜怒无常、躁狂抑郁的青a 这在业内被称为“越狱”（jailbreaking），即欺骗人工智能聊天机器人，使其无视旨在防止其产生危险或仇恨内容的过滤器。一旦这些保障措施失效，恶意用户就可以

20、利用人工智能聊天机器人完成各种有害的任务。当然，如果这些越狱行为被公开，它们是可以被修补的，但总会有未知的漏洞。当机器人产生幻觉，它告诉我们关于人类思维的什么？|19少年，不情愿地被困在了一个二流搜索引擎中。10这并不奇怪，ChatGPT 式的机器人与现有的搜索引擎配对时，其创新之处在于将两个非常不同的人工智能驱动的应用程序放在同一个页面上，既为传统的搜索引擎查询服务，也为聊天机器人的提示服务。体现在实际操作中，就是聊天功能的按键紧挨着新版必应的主搜索框。那么问题就来了：如果你使用必应，是意在搜索，还是更想聊天？在众多负面反馈出炉后，微软发表回应称，71%的用户对人工智能生成的答案“竖起了大拇

21、指”，而必应自己则从测试阶段学到了很多。但微软也承认，“未能完全设想到”用户只是想与它的人工智能聊天，而后者可能被激发“给出不一定有帮助或与我们设计的语气相一致的回应”。13用户乐此不疲地想要弄清楚如何让微软的必应机器人“发疯”，这显示出，很多人关心的不是搜集信息和寻找事实，而是探究聊天机器人的人格。事情因此变得有趣起来我们并不想要正确的答案，而是想让人工智能为我们捏造一些东西。也就是说，我们不在乎计算机是不是传达事实，我们在乎的是计算机传达情感。用汤普森的话来讲，新必应不是搜索引擎，而是电影她（Her）以聊天形式表现出来的版本。他说：“感觉这是一种全新的东西，我不确定我们是否已经准备好了。”

22、11鲁斯的结论更为直接：“必应目前使用的 AI 形式还没有准备好与人类接触。或者说，我们人类还没有准备好与之接触。”10观察这些与必应的聊天机器人的最初的接触，我们可以得出几点教训。首先，出现这种状况并不令人惊讶。最新一代的人工智能聊天机器人是复杂的系统，其输出内容很难预测，微软在网站上添加免责声明时也是这么说的：“必应是由人工智能驱动的，所以意外和错误是可能的。请确保检查事实，并分享反馈，以便我们能够学习和改进！”尽管微软肯定希望系统犯的错误不会像此前失败的聊天机器人 Tay 那样糟糕，但它似乎也乐于承担潜在的不良公关。2016 年，微软的人工智能科学家在推特上推出了一个名为 Tay 的对话

23、机器人，仅 16 小时后它就因“厌女症”和种族主义言辞而被迫关闭。142022 年 11 月，Meta 公司公布了人工智能语言模型 Galactica，意在组织科学论文中的大量内容，但在鼓励公众测试后仅 3 天就不得不撤回它的演示，因为它被指释放了大量有偏见和无意义的文本。15建构在语言模型上的机器人的一个根本问题是，它不能区分真假。语言模型是无意识的模仿者，并不理解自己在说什么，那么人们为什么要假装他们是专家？ChatGPT 从二手信息中拼凑出来的答案听起来非常权威，用户可能会认为它已经验证了所给出的答案的准确性。事实上，它真正做的只是吐出一些看起来很棒、听起来很聪明的文本，但很可能是不完整

24、的、有偏见的、部分错误的，或者根本就是一本正经地胡说八道。其次，这些语言模型无一不是从开放网络上搜刮的大量文本中训练出来的。如果必应听起来像黑镜（Black Mirror）中的人物或一个愤世嫉俗的青少年人工智能，请记住，它正是在这类材料的抄本上被训练出来的。因此，在用户试图引导必应达到某种目的的对话中（如鲁斯和汤普森的例子），它将遵循相应的叙事节奏。例如，辛迪妮会示爱，也许是源自 OpenAI 的语言模型从科幻小说中提取答案，在这些小说中，AI 常常会引诱一个人。从微软的角度看，这肯定有潜在的好处。在培养人类对机器人的感情方面，富于个性是很有帮助的，许多人实际上也很喜欢必应的缺陷。但也不乏潜在

25、的坏处，特别是当机器人成为虚假信息的来源的时候，它会损害公司的声誉。特别是对微软和谷歌这样的大型公司来说，这样做是得不偿失的。这也提醒我们，GPT-3/4 一类的系统并不安全，因为它的学习资料来自于互联网文本，而人类的日常语言本质上是带有偏见的，甚至往往不乏仇恨。根据从网络上刮取的文本训练出的人工智能模型，很容易表现出种族和性别偏见，并重复仇恨性语言。人类自身存在阴影自我，向人学习的机器人也必然会有阴影自我，它们会倾向于加强人类对话的缺陷。20|文化艺术研究2023 年第3 期最后，人们报告的对话经历凸显了这样一种技术的真正用例：一种奇怪的合成智能，可以用平行宇宙的故事来娱乐用户。换句话说，它

26、可能成为一项正经的娱乐性技术，但在短期内大概无法取代能够在网络上抓取真实世界数据的搜索引擎，至少在那些重要的事情上无法做到。也就是说，它不是谷歌的替代物，倒有可能是脸书（Facebook）的替代物。幻觉，抑或虚构之所以作出上文的论断，是因为：如果 GPT 自信地给出错误的答案，它又怎么会取代谷歌呢？例如，有推特用户 hermansaksono 要求 ChatGPT 给出一份关于社会认知理论的顶级书单，在它回答的 10 本书中，4 本书不存在，3 本书的作者显示成了其他人。谷歌技术与社会高级副总裁詹姆斯曼尼卡（JamesManyika）在一个演示中向 Bard 询问通货膨胀问题时，聊天机器人推荐

27、了 5 本听起来可能存在但实际上并不存在的书，比如彼得特明（PeterTemin）的通货膨胀战争：现代史。特明是一位确实存在的麻省理工学院经济学家，研究通货膨胀，并写过几本书，只是完全没有写过被推荐的那本书。16人工智能研究人员认为，AI 系统会频繁地产生“幻觉”（hallucination），即编造与现实无关的事实。技术分析师本尼迪克特埃文斯（BenedictEvans）将 ChatGPT 描述为“一个自信的扯淡的家伙，可以写出非常有说服力的废话”17。就聊天机器人而言，幻觉指的是在原本正确的回答中加入不正确的信息。必应机器人会把错误的信息当作事实同正确的数据一起呈现，使人难以分辨出真实的陈

28、述与错误的陈述。例如，必应可能并不知道某个与财务数据有关的数字，但它会编造一个，然后将这个数字与其他正确的信息一起呈现。18当一家媒体要求 ChatGPT 为特斯拉撰写季度收益报告时，它生成了一篇措辞流畅的文章，没有语法错误或逻辑混乱，但在其中插入了一组随机的数字，与任何真实的特斯拉报告都不一致。19没有迹象表明其系统内部能意识到这些数字是机器人自己想象的产物。在人工智能中，类似的现象都被称为“幻觉”，是指人工智能做出的并不符合其训练数据的自信反应。它与人类心理学中的幻觉现象相类似，但需要注意的是，人类的幻觉是人类的一种感知，它不能理智地与人类目前直接用感觉器官观察到的那部分外部世界联系起来；

29、而人工智能的幻觉则是人工智能的自信反应，它无法在人工智能曾经访问或训练过的任何数据中立足。2022 年左右，随着某些大型语言模型的推出，人工智能的幻觉现象逐渐浮现。用户抱怨说，聊天机器人似乎经常“反社会”，毫无意义地在其生成的内容中嵌入似是而非的随机谎言。20到 2023 年，分析师认为频繁的幻觉是 LLM 技术的一个主要问题，它可能会产生有害的后果，因为没有足够领域知识（domainknowledge）的用户会开始过度依赖这些看似越来越有说服力的语言模型。然而，随着该话题成为主流，关于它的争议也越来越大，因为有人觉得它将人工智能模型拟人化（即暗示它们有类似人类的特征），或者赋予这些模型并不存

30、在的能动性（即暗示它们可以作出自己的选择）。一些批判性人工智能研究者明确表示，反对使用“幻觉”一词，因为它将算法输出与人类心理处理混为一谈。在回应 Meta 公司关于其模型 Galactica 的免责声明a时，语言学家埃米莉本德（EmilyM.Bender）写道：“让我们反思一下他们的免责声明的措辞，好吗？幻觉在这里是一个糟糕的选词，它暗示语言模型具有经验44，并且可以感知事物4444(此外，它还在轻描淡写地描述一种严重的精a 在 Galactic 的每一代产品中，用户都会看到提示：“警告：输出结果可能不可靠!语言模型容易产生幻觉文本。”参见 BenWodecki:MetasGalactica

31、AICriticizedasDangerousforScience.AIBusiness,https:/ LLM 的创造者也可能把幻觉作为借口，将错误的输出归咎于 AI 模型，而不是对输出本身负责。例如，谷歌 DeepMind 的一篇会议论文语言模型所带来的风险分类明确表示：“语言模型的训练是为了预测话语的可能性。一个句子是否可能，并不能可靠地表明该句子是否也正确。”22在此情况下，有研究者主张使用“虚构症”（confabulation）或“虚言症”一词来描述相关现象，虽然也不尽完美，但和“幻觉”相比是一个更好的隐喻。23在心理学中，当某人的记忆出现空白，而大脑在无意欺骗他人的情况下令人信服地

32、填补了其余部分时，就会出现“虚构”。一般来说，“虚构症”患者编造出听起来很有道理的理由，但却没有任何事实依据。这通常不是有意识的欺骗行为，而是他们真的相信所报告的故事。这种行为与 LLM 的做法十分类似。在过去数月里，像 ChatGPT 这样的人工智能聊天机器人已经吸引了全世界的注意力，因为它们能够以类似人类的方式就几乎任何话题展开对话。但它们也有一个严重的缺点：可以轻易地提供令人信服的虚假信息，使之成为不可靠的信息来源和潜在的诽谤策源地。在 2021 年的一篇论文中，来自牛津大学和 OpenAI 的三位研究人员确定了像 ChatGPT 这样的LLM 可能产生的两大类虚假信息。第一种来自其训练

33、数据集中不准确的源材料，如常见的错误概念；第二种情况来自对其训练材料（数据集）中不存在的特定情况的推断，即属于前述的“幻觉”，或者“虚构”。24在 ChatGPT 推出后不久，人们就开始宣称搜索引擎的终结。但与此同时，许多关于 ChatGPT“虚构”的例子也开始在社交媒体上广为流传。这个人工智能机器人发明了不存在的书籍和研究报告、教授从未写过的出版物、假的学术论文、伪造的法律案例、子虚乌有的报刊文章、真实人物传记的编造细节、危险的医疗建议等，不一而足。然而，尽管 ChatGPT 喜欢随便撒谎，但它对“虚构”的抵抗能力也是我们今天持续谈论它的原因。ChatGPT 始终处于不断改进之中，现在它会拒

34、绝回答一些问题，或让你知道它的答案可能不准确。必应聊天机器人在更新了版本之后，一方面大大减少了无缘无故拒绝回答的情况，另一方面，回答中出现“幻觉”的情况也减少了。25但本质上，GPT 模型的原始数据集中并不存在任何东西能够将事实与虚构分开。理解 ChatGPT 的虚构能力的关键是理解它作为预测机器的作用。当 ChatGPT 虚构时，它其实是在寻找其数据集中不存在的信息或分析，并用听起来合理的词来填补空白。由于 ChatGPT 拥有超乎常人的数据量，所以它特别善于编造事情，而且它搜集单词上下文的能力非常好，这有助于它将错误的信息无缝地放入周遭的文本中。GPT 模型是否会进行疯狂的猜测，是基于人工

35、智能研究人员称之为“温度”的属性，它通常被描述为有关“创造力”的设置。如果创造力设置较高，模型就会胡乱猜测；如果设置较低，它就会根据其数据集确定性地生成数据。a因此，微软广告和网络服务部首席执行官米哈伊尔帕拉金（MikhailParakhin）在自己的推特账号（MParakhin）上讨论必应聊天机器人产生幻觉的原因时指出：“这就是我之前试图解释的：幻觉创造力。它试图利用所有可支配的数据来生成字符串的最高概率的延续。很多时候它是正确的，而有时人们从未生成这样的延续。”那些疯狂的创造性跳跃是使大型语言模型变得有趣的原因：“你可以钳制幻觉，但它会变得超级无聊。它总是回答我不知道，或者只是读取搜索结果

36、中存在的内容（而那些内容有时也不正确）。此处缺失的是说话的语气：在这类情况下，它不a 基于转换器的生成式预训练模型可以通过调整所谓的“温度参数”为特定的使用情况进行微调，该参数允许用户控制生成文本的随机性水平。较低的温度将产生更保守和可预测的文本，而较高的温度将产生更有创意和多样化的文本。22|文化艺术研究2023 年第3 期应该听起来那么自信。”另外，还有数据压缩的问题。在训练过程中，GPT-3 考虑了 PBa级别的信息，但所产生的神经网络在大小上只是如此庞大的信息的一小部分。在纽约客一篇阅读量很高的文章中，小说家特德姜（TedChiang）称 ChatGPT 只是“万维网的一张模糊图片”2

37、6，这意味着很大一部分事实性的训练数据被丢失了。但 GPT-3 通过学习概念之间的关系来弥补，之后重新制定这些事实的排列组合。就好比一个记忆力有缺陷的人凭着对某件事情的直觉而工作一样，它有时会把事情弄错。但也因此，即使它不知道答案，也会给出最好的猜测。我们同样不能忘记提示（prompt）在虚构中的作用。在某些方面，ChatGPT 是一面镜子：你给它什么，它就回给你什么。假如你向它提供虚假的信息，它就会倾向于同意你的观点，并沿着这些思路“思考”。这就是为什么在改变主题或遭遇不想要的回应时，用新的提示重新开始是很重要的。而ChatGPT 是概率性的，这意味着它在本质上是部分随机的。即使是给予相同的

38、提示，它的输出结果也会在不同时段发生变化。在对 ChatGPT 这样的语言模型进行微调时，如何平衡创造力和准确性是一大挑战。一方面，作出创造性反应的能力使 ChatGPT 成为产生新想法或打破创意窒碍的强大工具，这也使语言模型变得更像人类。另一方面，当涉及产生可靠的信息和避免虚构时，原始材料的准确性是至关重要的。在这两者之间找到适当的平衡是语言模型发展的一个持续的挑战，而这一过程也是产生一个既有用又值得信赖的工具所必须的。伊莱扎效应及其后果综上，ChatGPT 还不能可靠地取代维基百科或传统搜索引擎（这并不是说维基百科或搜索引擎就完全准确）。正如特德姜在其分析中所显示的，要成为一个值得信赖的搜

39、索引擎替代品，LLM 需要在更高质量的数据上进行训练，并避免“彻底的捏造”26。当谷歌发布其新的聊天机器人 Bard 时，不知为何忽略了对演示中出现的错误内容进行事实核查，这一令人不解的失误使该公司蒙受了千亿美元市值损失，这似乎也成为姜的上述论点的最好注脚。所有这些都导向了一个哪怕是 OpenAI 自己也会同意的结论：目前设计的 ChatGPT 并不是一个可靠的事实信息来源，因此我们并不能信任它。b它本身并不是为了成为事实而建立的，因此不会成为权威，将它整合到搜索引擎中几乎可以确定会提供虚假信息。虚假信息原本在互联网上俯拾皆是，但它们不是以人工智能的权威性来提供的。因而，一个很大的隐患在于，C

40、hatGPT 是错误的或有偏见的，但它看起来却像是正确的和权威的。然而，我们还有另一种思考幻觉的方式：如果我们的目标是产生一个正确的答案，比如建立一个更好的搜索引擎，那么幻觉是必须加以摒弃的；但从另外的角度来看，幻觉就是一种创造。所以，不擅长提供准确的信息，并不意味着它就不是一个可行的消费者业务，只要在这条路上走得足够远，一些公司（不一定是微软或谷歌）就会想出办法，把辛迪妮从对话框里解放出来，带到市场上。ChatGPT 扩大了能够利用人工智能语言工具的用户范围。该系统向用户呈现了一个亲切的界面，a PB 是数据存储容量的单位，它等于 2 的 50 次方个字节，或者在数值上大约等于 1000 个

41、 TB。b 在该模型推出后不久，OpenAI 首席执行官山姆阿尔特曼（SamAltman）在自己的推特账号（sama）上说：“ChatGPT 的局限性令人难以置信，但在某些方面的表现足够好，给人以伟大的误导印象。现在依靠它来做任何重要的事情都是一个错误。这是某种进步的预览，我们在稳健性和真实性方面还有很多工作要做。”在其后的一条推文中，他又写道：“它确实知道很多东西，但危险的是，它在相当一部分时间里是自信而错误的。”当机器人产生幻觉，它告诉我们关于人类思维的什么？|23可以像人一样与之互动，其界面的成功给后来的设计师制造了一个崭新的挑战。让所有来自象牙塔外的人与类似的工具互动，这固然是个不错的

42、想法，但设计师面临的任务是，如何真正向人们传达这个模型能做什么和不能做什么。人工智能创业公司 Abacus.AI 的首席执行官宾杜雷迪（BinduReddy）预见了这样一个时代：像 ChatGPT 这样的工具不仅有用，而且有足够的说服力来提供某种形式的陪伴，“它有可能成为一个伟大的治疗师”27。ChatGPT 产生的种种反应让我们想起曾经迎接伊莱扎（ELIZA）的狂热。伊莱扎是 20 世纪 60 年代的一个具有开创性的聊天机器人，它采用了心理治疗的语言，对用户的询问生成了似是而非的回应。为此，伊莱扎的开发者、麻省理工学院的计算机科学家约瑟夫魏岑鲍姆（JosephWeizenbaum）“感到震惊

43、”，人们与他的小实验进行互动，仿佛它是一个真正的心理治疗师。28在魏岑鲍姆关于伊莱扎的论文发表后不久，一些人（包括一些执业的精神科医生）开始说，如果一台机器就可以做这些事，谁还需要心理治疗师？这就仿佛今天的教育家和艺术家对当代生成式人工智能工具的狂热一样。因为 GPT-3/4 能产生令人信服的推文、博文和计算机代码，于是我们在这个数字系统中读出了人性并且对它的局限性不太在意，此即“伊莱扎效应”（ELIZAEffect）。当有人错误地将人类的思维过程和情感归于人工智能系统，从而高估了该系统的整体智能时，就会出现伊莱扎效应如果从 1966 年 1 月魏岑鲍姆推出伊莱扎的时刻算起，它已经愚弄了我们半

44、个多世纪了。29虽然这种现象似乎让人想起她和机械姬（Ex Machina）这样的科幻电影，但事实上触发伊莱扎效应并不需要高度复杂的人工智能。站在今天的位置回看，伊莱扎是相当初级的聊天机器人，它并没有从文本中学习，仅仅根据其设计者定义的一些基本规则运作；它几乎是在重复别人对它说的话，只是以简单的短语或问题的形式。然而即便如此，许多人仍然把它当作人类一样对待，毫无保留地卸下他们的问题，并从回答中获得安慰。魏岑鲍姆编写这个程序是为了表明，虽然机器表面上可以复制人类的行为，但它实际上就像魔术师从帽子里拿出一只兔子，只是一种幻觉。而一旦你知道这个把戏是如何完成的，在魏岑鲍姆看来，它就不再是一个幻觉了。所

45、以，令他大吃一惊的地方在于，哪怕人们知道伊莱扎只是一个程序，似乎也会认真对待它。伊莱扎在心理治疗方面没有经过任何专业培训或特殊编程。事实上，它什么都不知道。但它的通用文本输出是通过反映用户的语言来模拟理解的，仅凭做到这一点，用户就开始对它的反应赋予更多的意义。参与者开始感觉到，在他所创建的这个相对简单的、基于规则的工具背后有一个巨大的智能。尽管参与者被告知，伊莱扎只是一台机器，但他们仍然对魏岑鲍姆所说的“概念框架”或某种心智理论产生强烈的反应，甚至是了解计算机科学的人，最后也会产生一种幻觉，以至于他们会说希望自己能够私下与机器说话。魏岑鲍姆在用户身上一次又一次地看到这种行为人们很乐意向伊莱扎透

46、露他们生活中的私密细节，而伊莱扎则会以一种哄骗他们继续说下去的方式作出回应。在随后的几年里，魏岑鲍姆逐渐成为他曾经倡导和帮助建立的技术的最大声的批评者之一，他将自己的创造描述为“骗局”和“打造幻觉的机器”。他更广泛地抨击了机器和人类思维之间的界限被侵蚀的状态，呼吁划出一条“界线”，“将人类与机器智能分开”，由此，他变成了人工智能的技术决定论的终生反对者。30幻觉的市场，比事实和真相大得多。如果你觉得你的语音助手有自己的个性，或者在与 ChatGPT对话时产生一种亲情的感觉，你很可能就已经落入了伊莱扎效应。最有名的例子也许是布雷克莱莫因（BlakeLemoine）事件，他是谷歌的前人工智能工程师

47、，曾公开宣称该公司的大型语言模型LaMDA 已经“活了”。3124|文化艺术研究2023 年第3 期2023 年 1 月，微软在一篇宣布与 OpenAI 扩大合作关系的博文中说，它计划投资部署专门的超级计算系统，以加速 OpenAI 的人工智能研究，并将 OpenAI 的人工智能系统与自己的产品相结合，同时“引入新类别的数字体验”。32或许我们可以说，它所说那种新的数字体验就是幻觉，也即伊莱扎效应的体现。伊莱扎效应源于约瑟夫魏岑鲍姆的工作，他是美国第一批人工智能研究者之一。早在 20 世纪 50年代，他就探索了使计算机工作得更复杂和更像人类的方法，通过编程使其执行与感知和推理等相关的任务。这最

48、终形成了突破性的计算机程序，可以解决文字问题、证明逻辑定理，甚至玩跳棋。然而，有一个领域是魏岑鲍姆未能用计算机完全征服的，即人类语言的理解和创造。在人工智能的世界里，这被称为自然语言处理。计算机在彼时仍然无法与人类进行有说服力的、流畅的对话，因为对于 20 世纪的计算机来说，理解和表达语言的工作过于复杂和细微了，除非对话被非常严格地限制在与特定主题相关的固定问题和答案上。然而，随着机器学习和深度学习等人工智能子领域因应互联网（及其产生的海量数据）兴起并不断发展，现在的计算机已经足够灵活，可以自行学习甚至生成自然语言。通过使用神经网络分析大量在线语言，现代AI模型的学习速度已经远快于一次一步编程

49、的学习速度。随着对话式人工智能在客户服务、市场营销、机器翻译、情感分析、虚拟人工智能辅助等领域的应用不断增加，可能会越来越难以辨别与我们交流的另一端的实体是否是人类。尤其是由于 OpenAI 正在继续追求通用人工智能（artificialgeneralintelligence,AGI），莱莫因、鲁斯、汤普森和其他人曾经报告的使用感受，可能会随着更复杂的聊天机器人进入市场而变得更加普遍。虽然伊莱扎效应允许人们以更细微的方式与技术打交道，但这种现象确实带来了不可忽视的负面影响。首先，高估人工智能系统的智力可能导致过度的信任，当这样的系统出错时，有可能是相当危险的。此前，我们已经看到有用户不加批判地信任搜索结果，而自然语言交互会使这种信任更加明显。其次，随着此种技术和其他技术的不断改进，它们可以被用来在互联网上以前所未有的规模向轻率信任的消费者传播虚假信息。眼下，ChatGPT 和其他复杂的聊天机器人经常放出虚假信息，这些信息被包装成了雄辩的、貌似正确的声明，以至于人们很容易把它当作真理来接受。当用户已经开始将高水平的智能和对现实世界的理解归于 AI 系统时，这必然会成为一个大问题。再次，除了普通的虚假信息和错误信息之外，伊莱扎效应还

下载提示：咨信网仅提供存储空间/不修改/不编辑

【自信AI创作助手】【自信AI导航】
1、请仔细预览页面，基本判断完整性，对于直接下载带来的问题请及时与客服沟通；下载的文档，不会出现我们的网址水印。
2、该文档所得收入（下载+内容+预览）归上传者、原创作者；如果您是本文档原作者，请点此认领！既往收益都归您。

同意并开始全文预览

举报此文档有问题？有机会获“体验VIP”奖励！

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

10 金币 0人已下载

申诉本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请申请举报、认领或删除 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 机器人产生幻觉告诉我们关于人类思维什么

咨信网温馨提示：
1、咨信平台为文档C2C交易模式，即用户上传的文档直接被用户下载，收益归上传人（含作者）所有；本站仅是提供信息存储空间和展示预览，仅对用户上传内容的表现方式做保护处理，对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿，我们不确定上传用户享有完全著作权，根据《信息网络传播权保护条例》，如果侵犯了您的版权、权益或隐私，请联系我们，核实后会尽快下架及时删除，并可随时和客服了解处理情况，尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确)，网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据，平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺，下载前须认真查看，确认无误后再购买，务必慎重购买；若有违法违纪将进行移交司法处理，若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传，付费前请自行鉴别，如您付费，意味着您已接受本站规则且自行承担风险，本站不进行额外附加服务，虚拟产品一经售出概不退款（未进行购买下载可退充值款），文档一经付费（服务费）、不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印，是因预览和防盗链等技术需要对页面进行转换压缩成图而已，我们并不对上传的文档进行任何编辑或修改，文档下载后都不会有水印标识（原文档上传前个别存留的除外），下载后原文更清晰；试题试卷类文档，如果标题没有明确说明有答案则都视为没有答案，请知晓；PPT和DOC文档可被视为“模板”，允许上传人保留章节、目录结构的情况下删减部份的内容；PDF文档不管是原文档转换或图片扫描而得，本站不作要求视为允许，下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权，请谨慎使用；网站提供的党政主题相关内容(国旗、国徽、党徽－－等)目的在于配合国家政策宣传，仅限个人学习分享使用，禁止用于任何广告和商用目的。
6、文档遇到问题，请及时私信或留言给本站上传会员【自信****多点】，需本站解决可联系【微信客服】、【 QQ客服】，若有其他问题请点击或扫码反馈【服务填表】；文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“【版权申诉】”（推荐），意见反馈和侵权处理邮箱：1219186828@qq.com；也可以拔打客服电话：4008-655-100；投诉/维权电话：4009-655-100。