万维钢《AI前沿》课程文稿.pdf
《万维钢《AI前沿》课程文稿.pdf》由会员分享,可在线阅读,更多相关《万维钢《AI前沿》课程文稿.pdf(247页珍藏版)》请在咨信网上搜索。
1、发刊词:人,要比 AI 凶 万维钢AI 前沿 欢迎你加入万维钢AI 前沿课。如果你不记得自己在 2023 年 3 月 15 日那天的日程,我建议你现在就回想一下因为若干年后,你的子孙后代可能会问你:GPT-4 发布的那一天,你在干什么?GPT-4 不是“另一个”AI 模型。它的某些能力让最资深的 AI 专家也深感震惊,以至于现在没有人真的理解它为什么这么厉害。它让我们第一次感到通用人工智能也就是 AGI(Artificial General Intelligence)真的要来了。它也让世人第一次切实感受到了 AI 对人类的威胁。2023 年是 AI 元年。事实上我认为在某种意义上 GPT-4
2、已经是 AGI,只是大多数人还没有意识到而已。这一波 GPT 革命每天都有新突破,我们仍然在探索之中。其实我们早就开始探索了。早在 2020 年 7 月 30 日,我在精英日课第四季,就介绍过一个“好到令人震惊的人工智能模型”,OpenAI 公司的 GPT-3。它的功能十分强大,比如可以根据你的一段描述给你写一段程序,可以帮你写段文章,可以相当智能地回答你的问题等等。现在 OpenAI 开放了普通用户注册,推出了对话应用 ChatGPT,然后GPT-3 变成了 GPT-3.5,然后是 GPT-4,然后是有插件的 ChatGPT如果你把 AI 视为人类的敌人,你这段时间应该一日三惊。现在 Cha
3、tGPT 的月活用户数量已经超过了一亿,热潮仍在继续。但是包括某些行业资深人士在内,很多人都不理解 GPT 到底是什么。一个流行的错误认识是把它当成了一个聊天机器人。有人拿各种脑筋急转弯的题目逗 ChatGPT 玩:“树上十只鸟,开枪打死一只鸟,树上现在有几只鸟?”ChatGPT 老老实实地回答“还剩下九只鸟”,人类说,哈!你还是不够聪明啊!其实用这种方式战胜它没啥意思。要知道 ChatGPT 并不是一个聊天机器人它不是一个以陪你聊天解闷为目的的机器人。ChatGPT 是一个以聊天为界面的信息处理工具。它这个界面做的是如此之好,以至于人们把界面当成了主体,这就如同称赞一部手机说“哎呀你这个手机
4、真好看!”要知道聊天只是输入输出手段,处理信息才是目的。现在已经有好几百家小公司用 API 接入了 GPT,可以让它读取特定环境下的文本,完成信息处理。你可以用 GPT 编程(现在普遍认为 ChatGPT 的编程水平比文字处理水平高,这可能是因为编程是一种更规范的活动);以问答的形式学习一门知识;在中英文之间高质量翻译;把文章修改得更加地道;根据你的意图直接写文章;写诗;提供书名、大纲、小说剧情、广告等等文案的创意构思;帮你制定购物清单、旅行建议和健身计划 等等等等。随着 AI 能做的事情越来越多,有一个问题被讨论的也越来越多AI到底减弱了人的价值还是扩大了人的价值。其实,这取决于你怎么用它。
5、把事情直接交给 AI 做,是软弱的而且是危险的。比如你想给人写封信,表达一个意思,你怕自己写的不够礼貌周到,就让 ChatGPT 替你写。它的确可以写得很好,写成诗都可以但是,如果读信的人知道你是用 ChatGPT 写的,或者对方因为也用 ChatGPT,根本懒得读全文,选择让 ChatGPT 给个摘要,那你这封信还有必要走 AI 这道程序吗?难道AI 的普及不应该让大家更珍视坦诚相见吗?正所谓人要比车凶,强势的用法,是把 AI 当做一个助手、一个副驾驶,你自己始终掌握控制权:AI 的作用是帮你更快更好地做出判断。如果你足够强势,当前 AI 对你的作用有三个。第一是信息杠杆。想要了解任何方面的
6、信息都能得到答案,这件事在有搜索引擎以前是不可能的;在有搜索引擎、没有 GPT 之前是费时费力的。而现在你可以在几秒钟之内完成。当然 AI 返回的结果不一定准确,它经常犯错,关键信息还是得亲自查看一下原始文档。但我这里要说的是,快,就不一样。当你每一个问题都能立即得到答案,你的思考方式是不一样的。你会开启追问模式,你会沿着几个方向追踪下去。第二是让你发现你究竟想要什么。科技播客 Tinyfool(郝培强)在一个访谈中描绘了这么一个场景。比如你想买房,你问 AI 哪有便宜房子。AI 返回一些结果,你一看距离公司太远了,你意识到你想要的不只是便宜。于是你又让 AI 在一定区域内寻找便宜房子。AI
7、又返回一些结果,你又想到面积和学区 这种对话的方式能让你想清楚自己到底想要什么。这完全不平凡,因为我们做很多事情之前是不知道自己想干啥的我们都是在外界反馈中发现自我。第三是帮你形成自己的观点和决策。很多人说用 AI 写报告。可是如果报告里没有你自己的东西,这个报告有什么意义呢?如果报告里只有你自己的东西,AI 有什么意义呢?AI的意义是帮助你生成更有你自身特色的报告。主动权必须在你手里,你必须输出主动,但是你的主动需要 AI 帮你发现。AI 能让你更像你。它提供创意,你选择方案。它提供信息,你做出取舍。它提供参考意见,你拍板决策。你这份作品的价值不在于信息量足,更不在于语法正确,而在于它体现了
8、你的风格、你的视角、你的洞见、你选定的方向、你做出的判断、你愿意为此承担的责任。如果学生的作业都能体现这样的个人特色,大学何必禁止 ChatGPT呢?这绝对是上世纪九十年代以来互联网创业最热闹的时刻。如果你有志于做一番大事,成为驾驭强大工具的人,怎样才能不错过这一波机遇?这门小课来自得到的年度专栏精英日课第五季的 AI 专题系列,我们借助几本最新的英文新书,探讨几个大问题:我们该怎么理解这个 AI 大时代的哲学?AI 作为一个新的智慧形态,它的能力边界、它的底牌和命门,究竟是什么?当 AI 渗透进经济活动,如何提升生产力,路径和逻辑又是什么?当 AI 接管了道德甚至法律,我们的社会将会变成什么
9、样子?AI 还在以更快的速度迭代,面对这个局面,教育应该怎么办?公司应该怎么办?人应该怎么办?如果 AGI 和超级人工智能也有了人的意识和情绪,人应该放弃这些能力和价值吗?除了这些问题,我还将在课程里跟你分享实操经验,比如使用 GPT 进行对话式学习、编程、怎样让它成为你的助理,以及跟它沟通的咒语心法。AI 的作用应该是放大你,而不是取代你。当你听完课程,再次使用ChatGPT 的时候,可以试试这个一放一收的套路:*放,是让思绪在海量的信息里自由飞翔,寻找洞见;*收,是找到自我,决定方向,掌控输出。越是 AI 时代,普遍的信息越是不值钱。现在个人搞一个信息保存系统已经意义不大了,只要 GPT
10、训练过,一切唾手可得,整个互联网就是你的硬盘和第二大脑。你真正需要保存的是*自己*每天冒出的新想法,是*你*对信息的主观整理和解读。一切落实到自己。永远假定别人也会用 ChatGPT。这波 GPT 大潮跟我们这一代人经历的所有科技进步有个特别不一样的地方。像 5G、元宇宙、区块链那些东西都是越不懂的人越一惊一乍,懂的人都觉得其实没啥了不起可是对于 GPT,恰恰是不懂的人还在正常化偏误之中,越懂的人却越是暗暗心惊。孤陋寡闻的人不知道 AI,认知固化的人忽视 AI,肤浅的人害怕 AI,热情的人欢呼 AI我们率先使用 AI、探索 AI、试图理解 AI。这个课程既调研了当今最强的头脑,也包括最实用的技
11、能。我们还在继续探索,但是根据目前所知,我们既不是相信 AI 会强大到把人类当宠物的所谓降临派,也不是认为 AI 终究会与人类为敌的幸存派,我们是主张 AI 是人类帮手的拯救派。你不会在 AI 面前失去自我。你不但应该,而且必须,而且可以,以 我为主,使用 AI。邀请你加入这个课程,祝你在课程中有所收获。01 大变局:一个新智慧形态的产生 万维钢AI 前沿 你好,这里是万维钢AI 前沿课。这一讲,我们来讲一个新智慧形态的产生。ChatGPT 让 2023 年成了 AI 之年,正如 iPhone 在 2007 年开启了智能手机时代,我们现在正式进入了人工智能时代。咱们的这门课程就会来跟你聊聊对这
12、个时代的最新理解和思考,以及AI 的应用场景和应对方法。这一讲我们先从 2021 年出的一本书讲起,书名叫AI 时代:以及人类的未来(The Age of AI:And Our Human Future)。这本书的三个作者很厉害,分别是无需介绍的亨利基辛格,Google 前CEO 埃里克施密特,麻省理工学院苏世民计算机学院的院长丹尼尔胡滕洛赫尔(Daniel Huttenlocher)。作者咖位这么高,但这并不是一本献礼式、应景式的书,这书里有真思想,有关于这个时代的高观点。2020 年,麻省理工学院宣布发现了一种新的抗生素,叫 Halicin。这是一种广谱抗生素,能杀死那些对市面上现有的抗生
13、素已经产生耐药性的细菌,而且它自己还不会让细菌产生耐药性。这个幸运的发现,是用 AI 完成的。研究者先搞了一个由两千个性能已知的分子组成的训练集,这些分子都被标记好了是不是可以抑制细菌生长,用它们去训练 AI。AI 自己学习这些分子都有什么特点,总结了一套“什么样的分子能抗菌”的规律。AI 模型训练好之后,研究者用它一个个考察美国 FDA 已经批准的药物和天然产品库中的 61000 个分子,要求 AI 按照三个标准从中选择一种抗生素:1)它具备抗菌效果;2)它看起来不像已知的抗生素;3)它必须是无毒的。结果 AI 最后只找到一个符合所有要求的分子,这就是 Halicin。然后研究者做实验证明,
14、它真的非常好使。它大概很快就会用于临床,造福人类。用传统的研究方法,这件事是绝对做不成的:你不可能测试 61000 个分子,那成本太高了。这只是当代 AI 众多的应用案例中的一个,它很幸运但是它并不特殊。我们之所以先讲这个例子,是因为它带给我们一个清晰的认知震撼 Halicin 可以作为抗生素的化学特征,是人类科学家所不理解的。关于什么样的分子可以做抗生素,科学家以前是有些说法的,比如原子量和化学键应该具有某些特征可是 AI 这个发现用的不是那些特征。AI 在用那两千个分子训练的过程中,找到了一些不为科学家所知的特征,然后用那些特征发现了新的抗生素。那些是什么特征呢?不知道。整个训练模型只是一
15、大堆也许几万到几十万个参数,人类无法从那些参数中读出理论。这可不是特例。AlphaZero 完全不用人类棋手的棋谱,通过自己跟自己对弈学会了下国际象棋和围棋,然后轻松就能打败人类。然后你看看它的走法,它经常会走一些人类棋手匪夷所思、没有考虑过的走法。比如在国际象棋里它看似很随便就可以放弃皇后这样的重要棋子有时候你事后能想明白它为啥那样走,有时候你想不明白。这个关键在于,AI 的思路,不同于人类的理性套路。也就是说,当代 AI 最厉害之处并不在于自动化,更不在于它像人,而 在于它*不像*人:它能找到人类理解范围之外的解决方案。这不是汽车取代马的发明,也不仅仅是时代的进步。这是哲学上的跨越。人类从
16、古希腊、古罗马时代就在追求理性。到了启蒙运动,人们更是设想世界应该是由一些像牛顿定律这样的明确规则确定的,康德以后人们甚至想把道德也给规则化。我们设想世界的规律应该像法律条文一样可以一条条写下来。科学家一直都在把万事万物分门别类,划分成各个学科,各自总结自己的规律,打算最好能把所有知识编写进一本百科全书。然而进入 20 世纪,哲学家维特根斯坦提出了一个新的观点。他说你们这种按学科分类写条文的做法根本不可能穷尽所有的知识。事物之间总有些相似性是模糊的、不明确的、难以用语言说明的。想要丁是丁卯是卯全都理性化,根本做不到。Ludwig Wittgenstein,1889-1951 现在 AI 找到的
17、,恰恰就是一些难以被人所理解,不能用明确的规则定义的智慧。这是柏拉图理性的失败,是维特根斯坦的胜利。其实不用 AI 你也能想明白这个道理。比如说,什么是“猫”?你很难精确定义猫到底是什么东西,但是当你看到一只猫的时候,你知道那是猫。这种认知不同于启蒙运动以来人们说的规则式的理性,但是你可以说这是一种感觉。一种难以明说、无法告诉另一个人的感觉。我们对猫的认识很大程度上是感性的。而现在 AI 有这种感觉。当然,人一直都有这种感觉,这本来没什么,康德也承认感性认知是不可缺的。问题是,AI 通过这样的感觉,已经认识到了一些人类无法理解的规律。康德原本认为只有理性认知才能掌握世界的普遍规律。AI 感受到
18、了人类既不能用理性认知,也感受不到的规律。而且它可以用这个规律做事。人类已经不是世界规律唯一的发现者和感知者。你说这是不是启蒙运动以来未有之大变局。我们简单介绍一下当代 AI 的原理。现在有些人谈论 AI 是把 AI 当做了一种“超级智能”,仿佛神灵一般,说能把人类如何如何那种讨论没什么意义。如果神灵都已经降临人间了我们还在这聊什么?不要高推圣境。现在的 AI 不是什么通用人工智能(AGI),而是一种非常特殊的智能,也就是通过机器学习训练的神经网络系统。上世纪八十年代以前,科学家还在尝试用启蒙运动理性的思路,把解决问题的规则输入给计算机执行。后来发现那条路走不通,因为规则太多了,根本弄不过来。
19、这才有了神经网络。现在是我们根本不用告诉 AI任何规则,也就是把学习世界的过程都委托给机器,有什么规则你自己学去吧。这个思路受到了人脑神经网络的启发,但是并不完全一样。我在精英日课第三季讲过,AI 神经网络的基本概念,它分为输入层、很多中间层和输出层,一般的深度学习网络大概要有 10 层。使用 AI 神经网络分为训练(training)和推理(inference)两部分。一个未经训练的 AI 是没用的,它只有搭建好的网路结构和几万甚至几千亿个参数。你需要把大量的素材喂给它进行训练,每个素材进来,网络过一遍,各个参数的权重就会进行一遍调整。这个过程也就是机器学习。等到训练得差不多了,就可以把所有
20、参数都固定下来,模型就炼制完成了。你就可以用它对各种新的局面进行推理,形成输出。像我写这篇文章的时候,ChatGPT 用的语言模型版本大概是 GPT-3.5,它可能是 2021 年到 2022 年之间训练完成的。我们每一次使用ChatGPT,都只是在用这个模型推理,并没有改变它。GPT-3.5 有超过一千亿个参数,将来还会更多。AI 模型参数的增长速度已经超出了摩尔定律。搞神经网络非常消耗算力。现在有三种最流行的神经网络算法,监督学习、无监督学习和强化学习。前面那个发现新抗生素的 AI 就是监督学习(supervised learning)的典型例子。给一个有两千个分子的训练数据集,你必须提前
21、标记好其中哪些分子有抗菌效果,哪些没有,让神经网络在训练过程中有的放矢。图像识别也是监督学习,你得先花费大量人工把每一张训练图里都有什么内容标记好,再喂给 AI 训练。那如果要学习的数据量特别大,根本标记不过来,就需要无监督学习(unsupervised learning)。你不用标记每个数据是什么,AI 看得多了会自动发现其中的规律和联系。比如淘宝给你推荐商品的算法就是无监督学习。AI 不关心你买*什么样的*商品,它只是发现了买了你买的那些商品的顾客也会买别的什么商品。强化学习(reinforcement learning),是在动态的环境中,AI每执行一步都要获得反馈的学习。比如 Alph
22、aZero 下棋,它每走一步棋都要评估这步棋是提高了比赛的胜率,还是降低胜率,获得一个即时的奖励或惩罚,不断调整自己。自动驾驶也是强化学习。AI 不是静态地看很多汽车驾驶录像,它是直接上手,在实时环境中自己做动作,直接考察自己每个动作导致什么结果,获得及时的反馈。我打个简单的比方 *监督学习就好像是学校里老师对学生的教学,对错分明有标准答案,但是可以不给讲是什么原理;*无监督学习就好像一个学者,自己调研了大量的内容,看多了就会了;*强化学习则是训练运动员,哪个动作出错了立即给你纠正。机器翻译本来是典型的监督学习。比如你要做英译中,就把英文的原文和中文翻译一起输入给神经网络,让它学习其中的对应关
23、系。但是这种学法太慢了,毕竟很多英文作品没有翻译版后来有人发明了一个特别高级的办法,叫平行语料库(parallel corpora)。先用对照翻译版来一段时间的监督学习,作为预训练。模型差不多找到感觉之后,你就可以把一大堆同一个主题的英文也好、中文也好,别管是文章还是书籍,不需要互相是翻译关系,各种材料都直接扔给机器,让它自学。这一步就是无监督学习了,AI 进行一段沉浸式的学习,就能猜出来哪段英文应该对应哪段中文。这样训练不是那么精确,但是因为可用的数据量要大得多,训练效果好得多。像这种处理自然语言的 AI 现在都用上了一个新技术叫 transformer。它能更好地发现词语跟词语之间的关系,
24、而且允许改变前后顺序。比如“猫”和“喜欢”是主语跟谓语的关系,“猫”和“玩具”则是两个名词之间的“使用”关系,它都可以自行发现。还有一种流行技术叫生成性神经网络(generative neural networks),特点是能根据你的输入生成一个什么东西,比如一幅画、一篇文章或者一首诗。生成性神经网络的训练方法是用两个具有互补学习目标的网络相互对抗:一个叫生成器,负责生成内容,一个叫判别器,负责判断内容的质量,二者随着训练互相提高。GPT 的全称是生成式预训练变换器(Generative Pre-trained Transformer),就是基于 transformer 架构的、经过预训练的、
25、生成性的模型。当前所有 AI 都是大数据训练的结果,它们的知识原则上取决于训练素材的质量和数量。但是,因为现在有各种高级的算法,AI 已经非常智能了,不仅能预测一个词汇出现的频率,更能理解词与词之间的关系,有相当不错的判断力。但是 AI 最不可思议的优势,是它能发现人的理性无法理解的规律,并且据此做出判断。AI 基本上就是一个黑盒子,吞食一大堆材料之后突然说,“我会了”。你一测试发现它真的很会,可是你不知道它会的究竟是什么。因为神经网络本质上只是一大堆参数,不可理解性可以说是 AI 的本质特征。事实是连 OpenAI 的研究者也搞不清 ChatGPT 为什么这么好用。要这么说的话,可以说我们正
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- AI前沿 万维钢 AI 前沿 课程 文稿
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【Stan****Shan】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【Stan****Shan】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。