分销赏收藏举报申诉 / 12

立即下载 VIP下载

当前位置：首页 > 学术论文 > 论文指导/设计 > 语言智能视角下的日本人机对...言学知识的融合与应用为核心_毋育新.pdf

语言智能视角下的日本人机对...言学知识的融合与应用为核心_毋育新.pdf

上传人：自信****多点

文档编号：606213

上传时间：2024-01-12

格式：PDF

页数：12

大小：2.65MB

《语言智能视角下的日本人机对...言学知识的融合与应用为核心_毋育新.pdf》由会员分享，可在线阅读，更多相关《语言智能视角下的日本人机对...言学知识的融合与应用为核心_毋育新.pdf（12页珍藏版）》请在咨信网上搜索。

1、引言近年来，智能家居、智能导航系统等活用人工智能技术的产品在日常生活中日益增多。这些智能产品因其突出的便利性与高效性而广受消费者青睐，也为业界带来了巨大的经济效益。起源于1956 年达特茅斯会议的“人工智能（ArtificialIntelligence，AI）”在沉浮数十年以后，再次成为学术界的热门话题。达特茅斯会议发起人之一明斯基将人工智能定义为“是使机器做那些人需要通过智能来做的事情”（李德毅，2018：2）。换言之，人工智能主要是利用计算机或由计算机控制的机器，模拟、延伸和扩展人类的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术和应用系统，其核心技术以机器学习（Mach

2、ineLearning，ML）为主。机器学习是从数据中学习规则性、判断标准，继而依据这些规则和标准预测、判断未知数据的人工智能技术，其包含深度学习（Deep Learning，DL）等技术。当前，应用深度学习技术取得重大进展的领域有图像识别、语音识别、预测和自然语言处理等。上文提到的智能导航系统以自然语言处理为依托，属于语言智能（Language Intelligence）的范畴。语言智能是语言信息的智能化，指运用计算机信息技术模仿人类的智能来分析和处理人类语言的过程（周建设等，2017）。语言智能是人工智能领域的关键核心技术之一（周建设，2020；梁晓波、武啸剑，2021），其研究涉及自然语

3、言（Natural Language），即人们日常使用的语言，与语言学密切相关。人工智能如何影响语言学研究，语言学研究又如何促进人工智能朝纵深发展，日渐成为学者们关注的焦点。本文拟从人工智能的核心语言智能入手，论述语言智能与自然语言处理的关系，介绍日本政府颁布的相关语言智能政策，梳理自然语言处理的典型应用人机对话系统及其在日本的研发现状，以期为我国的日语研究及人机对话系统研究提供咨鉴。语言智能视角下的日本人机对话系统研究以语言学知识的融合与应用为核心西安外国语大学日本文化经济学院毋育新西北师范大学外国语学院李瑶西安外国语大学商学院于富喜摘要语言智能是人工智能的关键核心技术之一，人机对话系

4、统是语言智能的典型应用。本文论述了语言智能与自然语言处理紧密相连的关系，介绍了日本语言智能政策中涉足自然语言处理的内容，梳理了日本学界近20年来的人机对话系统研究成果，探讨了日语与人机对话系统的适配性问题。文章总结出日本语言智能研究存在未平衡好应用性研究与展望性研究的关系、未解决好日语与人机对话系统的适配性问题、未注意到不同人群的语言使用特征等问题。关键词人工智能语言智能人机对话系统语用礼貌NIHONGO NOGAKUSHU TO KENKYU语言研究2023年第1期总224号84DOI:10.13508/ki.jsr.2023.01.014语言研究2023年第1期总224

5、号1语言智能与自然语言处理语言智能基于人脑生理属性、言语认知路径和语义生成规律，利用大数据与人工智能技术对语言信息进行标注、抽取、加工、存储和特征分析，构拟人机语义同构关系，让机器实施类人言语行为（周建设，2020），其离不开计算机对自然语言的处理。自然语言处理（Natural Language Processing，NLP）是利用计算机技术来分析、理解和处理自然语言的技术。它是连接机器与人类沟通的桥梁，旨在实现人机间良好的交流。自然语言处理分为自然语言理解（Natural Language Understanding，NLU）和自然语言生成（NaturalLanguageGeneration

6、，NLG）。前者指机器应具备理解自然语言文本含义的能力，但由于自然语言存在多样性、歧义性、鲁棒性（Robustness）和依赖语境等难点，故NLU至今无法达到人类的语言理解水平；后者则要求机器能以自然语言文本来表达给定的意图、思想等，以跨越人类和机器之间的沟通鸿沟，其包括内容确定、文本结构、句子聚合、语法化、参考表达式生成和语言实现6个步骤。自然语言处理技术的典型应用有情感分析、语音识别、机器翻译和聊天机器人等。1迄今为止，自然语言处理经过了以建立聊天和机器翻译系统等为代表的早期自然语言处理（二十世纪六十至八十年代）、以机器学习（ML）为代表的统计自然语言处理（二十世纪九十年代开始）、以深度学

7、习（DL）为代表的神经网络自然语言处理（2008 年之后）三个阶段（李德毅，2018：166-172）。正如前文所述，语言智能是人工智能领域的关键核心技术之一，而自然语言处理技术在语言智能中占据着不可替代的地位，其在社会生活中越来越扮演着举足轻重的角色。这一点从我国政府颁布的一系列政策性文件也能窥探其重要地位。2017年，国务院印发的新一代人工智能发展规划对自然语言处理技术的任务进行了详细论述，即“重点突破自然语言的语法逻辑、字符概念表征和深度语义分析的核心技术，推进人类与机器的有效沟通和自由交互，实现多风格多语言多领域的自然语言智能理解和自动生成”。2020年，国家标准化管理委员会、中央

8、网信办、国家发展改革委、科技部、工业和信息化部五部门联合印发的国家新一代人工智能标准体系建设指南中指出，关键领域技术（此处着重号为笔者所加）包括“A自然语言处理”“B智能语音”“C计算机视觉”“D生物特征识别”“E虚拟现实/增强现实”“F人机交互”等内容。其中“A自然语言处理”“B智能语音”“F人机交互”与自然语言处理技术密不可分。2日本语言智能政策中的自然语言处理日本是世界上人工智能技术发展水平较高的国家之一（康乐、姚凯博，2022：38）。在2016年日本政府公布的第5个科技发展五年规划第5期科学技術基本計画（20162020）中，就提出以建设“超智能化社会（超社会）”为目标的人工智能战

9、略布局。本节着重介绍2016年后日本政府颁布的一系列政策性文件中有关语言智能的内容。2017年，日本政府公布了新一代人工智能社会实施战略（次世代人工知能社会実装戦略）审议咨询文件，介绍了自然语言处理技术和脑信息通信技术的社会运用现状、相关课题以及发展方向。重点论述自然语言处理技术的内容包括：（1）聚焦医疗、抗灾、（人机）对话、翻译等民生相关领域的社会现状，强调开发用于解决社会课题、为社会做贡献的自然语言处理应用程序的迫切性；（2）提倡使用自然语言处理技术，在医疗领域开发基于问诊内容的诊断辅助系统；在抗灾领域实现基于新信息传递手段的顺畅信息联动，通过构建风险检测引擎确保居民安全；在对话系统领域

10、，开发车载对话智能体，开发基于对话智能体的业务支持、技能提升支持，实现人与对话智能体的有效协作，实现更智能的日常生活辅助智能体的广泛应用；（3）提出了今后自然语言处理技术面向社会实用化时需要解决的课题，如在服务型应用软件中需对不均衡数据采取应对措施，要活用会话数85语言研究2023年第1期总224号据，要提升支持服务型应用软件的基础技术，并解决对话系统、机器翻译等领域的相关问题。2018年，日本政府正式将人工智能列入国家综合创新战略（丁立江，2022：10）。2019年，日本政府公布了 AI战略2019（专家提案）：人类生活、产业、地域、政府的全面智能化（AI戦略2019（有識者提案

11、）人産業地域政府全AI），附件中总结的“今后的研究开发重点项目”包括九项内容。其中第一项“可与人类合作的AI（人協調AI）”涉及的四项具体内容即分析并理解人类的决策过程、AI的人机界面、人类与AI的交流、与人类协同发展的AI，其研发目标均涉及自然语言处理技术。第七项“AI促进融合技术（AI for Inclusion Technology）”明确提到的“语言处理技术基础的开发与实操”要求多语言处理技术应实现包括日语、英语和汉语在内的数十种语言的理解与翻译、口语与书面语的有效交流以及知识获取等目标。2021年6月，日本政府又颁布了 AI战略2021：人类生活、产业、地域、政府的全面智能化（AI戦

12、略2021人産業地域政府全AI）。不同于2019年的简要概述，新文件“核心基础研究开发”部分细化了今后的研发重点，将其分为“AI核心-AI的基础理论和技术（AI Core-Basic Theoriesand Technologies of AI）”“AI核心-AI的设备和产品（AI Core-Device and Architecture for AI）”“AI核心-可信赖的AI（AI Core-Trusted Quality AI）”“AI核心-AI的体系构成（AI Core-System Componentsof AI）”四个板块。其中，第一板块就详述了“革新性自然语言处理技术、语音处理技

13、术的研究开发”。具体而言，革新性自然语言处理技术的研究开发包括从大量文本中抽出句子之间存在的因果关系等知识获取技术，实用性语篇处理技术，基于海量数据做出解答的提问应答、假设生成技术，考虑说话者深层动机及意图的对话数据驱动建模；革新性语音识别与合成技术包括从混合语音/非语音、多位说话者或多种语言的音频中自动转写语音内容的技术，可将正确信息作为无压力的自然语音信息进行输出的语音合成技术，参照现实交际中不可或缺的常识、语境、非语音等信息，开发在聊天、日常会话层面的话语中也能正确识别语音的技术（笔者译）。第四板块中“4-3人类共生型AI（人間共生型AI）”包含的实用性语音对话技术与人机交互技术、连接人

14、类与机器的远程基础技术、与人类协同发展的AI、可打破语言障碍进行翻译的AI和通用多语言自动翻译及同声传译技术等均涉及自然语言处理技术，较 AI战略2019中的“语言处理技术基础的开发与实操”，其表述更为详实具体。2022年4月，日本政府进一步修订了该文件，在新文件 AI 战略 2022（AI 戦略2022）中明确提到，NICT（日本信息通讯研究机构）的目标是开发以自然语言处理为基底的对话技术、多语言翻译与语音处理技术、构建并应用以实现无障碍交际为目标的脑认知模型，同时要求这些技术在世界范围内达到领先水平。由上述文件可以看出，日本政府紧跟时代发展，逐步细化了语言智能中自然语言处理领域的研究要点与

15、研究目标，这一举措不但为人工智能领域的技术专家指明了研发的方向，也为语言学家重新审视人工智能时代背景下的语言信息提供了新视角。3自然语言处理的典型应用人机对话系统以智能体（Intelligent Agent）为代表的人机对话系统（Human-machine Dialogue System）是自然语言处理技术的典型应用，其开发、应用是目前人工智能领域的研究热点之一。所谓人机对话系统，就是“模仿人际间对话方式，与用户（User）进行自然对话，从而实现人与计算机之间的信息交流”（曹君阔、陈国莲，2017：1）。人机对话系统的名称就已经定位了其性质：人与机器互相对话的系统。对其进行建构需厘清系统内部的

16、运行机制，即人与机器的话语特征、双方开展对话时应具备的条件、通过何种语言策略推动更加自然的交流等。由其性质可以看出，人机对话系统也是语言智能研究的重点。人机对话系统研究肇始于1950年的图灵测试（The Turing Test）。尽管美国学者魏泽鲍姆早在86语言研究2023年第1期总224号1966年就开发出了临床治疗中用于模仿心理医生的人机自然语言交际电脑程序ELIZA（Weizenbaum，1966），但直到二十世纪七十年代以后语言学知识才被引入人工智能领域，其后催生出了研究人与智能体交际行为的“人机交互（Human-agentInteraction）研究领域”。自二十世纪八十年

17、代以来，该领域的研究日趋活跃，产出了ALICE（Artificial LinguisticInternet Computer Entity）、Apple Siri、微软Cortana等众多任务型人机对话系统。“任务型（人机）对话系统主要应用场景为个人助理，通过语音或文字与对话系统进行交互，实现个人事务的查询及代办功能，如天气查询、空气质量查询、定位、短信收发、日程提醒、智能搜索等，从而更便捷地辅助用户的日常事务处理”（车万翔、张伟男，2018：79）。与之相对，“开放域聊天系统”就是“在无限制主题及无明确对话目的的背景下，可基于检索或生成的方法进行人机对话的交互”（陈鑫、周强，2021：1）。

18、近年来，随着开放域聊天系统的兴起，人们对进行持续而有效的人机友好交流的需求日益明显，让机器具备情感也成为现阶段语言智能研究的重点。因此，现阶段人机对话系统应用的总体趋势呈现出通过聊天建立人与机器之间的信任，机器在聊天中对用户进行画像，进而支持后续的场景化任务执行需求等特征（车万翔、张伟男，2018；Srinivasan&Takayama，2016）。同时，人机对话系统领域也开始出现关注人和智能体感情交流、如何建立协作关系的研究（Inaba&Takahashi，2016；小林峻也等，2016）。总体而言，人机对话系统研究的出发点和最终归宿在于最大限度地模拟和逼近“人际”间的自然语言对话，核心问题

19、是探讨如何合理地形式化对话现象，尽可能从对话过程中抽取出最基本的结构规律，使系统所采用的形式框架既能够满足各种情况下语言的表现需要，具有充分的表达能力；同时又可以计算，在工程上具有有效的实现手段（曹君阔、陈国莲，2017：4）。4日本人机对话系统的研究成果近20年来，日本人机对话系统研究呈现出较为多元的发展态势，我们可将其总结为展望性视角和应用性视角。4.1展望性视角日本学术界针对语言智能的展望性研究极少。据笔者管见，目前只有宇佐美真有美博士（宇佐美）提出语言学研究应与人工智能“对话系统”相结合的观点。宇佐美博士为日本国立国语研究所教授，是国际学术界知名的礼貌现象（Politeness，）研究

20、者，其提出的话语礼貌理论（Discourse Politeness Theory，理論）2，不但有专门的研究方法即综合性会话分析法（総合的会話分析）（宇佐美，2015），也有跨文化对比研究方法论如汉日对比研究方法论（毋育新，2019b，2020），另有一系列实证性研究（毋育新，2014；李瑶等，2021；李瑶，2022；李宇霞，2021）证明其具有较强的可操作性，可以说该理论是话语礼貌研究领域较前沿的理论之一。近年来，宇佐美博士敏锐地觉察到日本语言智能研究的短板，即：人工智能研究领域缺少语言学家的积极参与，该领域的研究成果和语言学研究成果“脱轨”，因语言学研究成果不能有效赋能人工智能研究，导致

21、智能体产出的话语难以朝着更自然的方向发展。于是，自2018年起，宇佐美博士积极对接以日本人工智能学会为首的人工智能科研团体与科研机构，开始联合AI技术专家攻克智能体话语中存在的难题，研发以自然语言处理技术为基底，能广泛适配不同用户需求的人机对话系统，具体成果可参见下文4.2的宫本友树等（2018、2019）。经过一系列实证性研究之后，宇佐美（2019）系统回顾了话语礼貌的研究路径，并对现有话语礼貌研究成果的不足之处进行补充说明，在明确话语礼貌研究的意义、功能、问题的基础上，结合当前快速发展的人工智能“对话系统建构”的研究成果，提出将话语礼貌理论中的“基本态（Default，基本状態）”活用于人

22、机对话系统的构想。4.2应用性研究视角不同于展望性成果的乏善可陈，日本国内关87语言研究2023年第1期总224号于语言智能的应用性成果偏多，且多涉及人机对话系统中的语言研究，涵盖语言学的诸多侧面。我们从以下三个角度对人机对话系统的相关成果进行简要概括。4.2.1词汇与句法研究如何处理词汇、句法是自然语言处理的经典课题，也是日本学者在语言智能领域探讨的热点之一。关于词汇研究，体词（名词）和用词（动词、形容词）等实词3研究无疑是人机对话系统领域的重点课题。因为人类的智能活动主要是获得并运用知识。知识是智能的基础，而知识由概念组成，概念是构成人类知识世界的基本单元（李德毅，2018：12

23、-22）。我们知道，概念多由实词承担，故而实词方面的研究较多。中野哲宽、荒木雅弘（2015）使用文本离散表示中的word2vec，按照从专有名词、一般名词到其他名词的顺序来提取话题词汇的信息，也就是解析用户话语中使用MeCab的词素后，解析输入的单词，继而根据其结果从学习的文本离散表示中获得信息，使用上述信息生成系统应答，最后通过实验验证了该系统的有效性。浅见一树、杉本彻（2017）为明晰聊天中触发话题转换时联想功能的性质与条件，参考大型语料库现代日语书面语平衡语料库（現代日本語書言葉均衡）中的词汇表，从出现频率较高的单词中选定8个名词，以其作为诱发性词汇，通过自由联想收集联想词，进而收集与

24、话题词汇具有高余弦相似度的关联词，根据收集到的联想词和关联词与话题词汇之间的语义关系，对联想词和关联词进行分类、比较之后实施了调查这些联想词和关联词是否适用于话题转换的实验，最终探讨了自动获取联想词的方法以实现自然的话题转换。近年来的研究呈现由实词扩大至虚词（助词、助动词）的趋势。如国分芳宏等（2010）提出使用词库来判定术语之间语义距离的方式。具体而言，构建术语标准化或关联词正规化的系统，通过尝试调查助词、助动词来还原省略的主语、赋予“句节意图”，进而实施相关实验验证其有效性。该研究还介绍了词库中术语之间的关系（如同义词、反义词等）以及系统所使用的解析词典中的词汇分类方法。更多的研究涉及叹词

25、等语气表述，如伊藤敏彦（1999）聚焦于自言自语（独話）和对话中存在的语气词（間投詞），从“话语中的语气词对受话者具有何种功能”“语气词在合作性系统的应答句生成过程中是否有效、是否必要”等角度出发，展开实验调查后发现，在语音对话系统中，语气词在确保应答句的生成时间、维护发话权以及作为表示系统正在运行的标志等方面发挥着重要作用。神谷优贵等（2011）发现构建舒适的车载对话系统时，需要系统在驾驶员说话过程中积极附和其话语，也需要系统在适当的时间主动生成附和，该研究以此为出发点，构建了附和词语料库，并基于该语料库提出使用统计学方法检测叹词（感動詞）何时出现最为恰当的方法。关于句法研究，吉野信一郎等（

26、2011）以网页新闻等文本信息为对象，聚焦谓语结构的信息提取技术，开发出可检索、推荐信息的语音对话系统。具体而言，首先探得每个域（Domain）中有用的谓语结构模式提取指标，然后以谓语结构模式提取指标为依据决定谓语结构的优先度，进而计算出谓语项之间的相似度，通过实验验证该方法的有效性后，指出该对话系统框架利用了谓语结构这种普遍的信息结构，并能从语料库中获得相似性，故该框架具有高度的域移植性。山口贵史等（2016）致力于构建根据语境能正确使用叹词进行附和的倾听对话系统，分析了附和的形式和先行话语（先行発話）的句法结构、韵律特征之间的关系，从这些先行话语的特征出发实施了预测、生成附和的形式。作者首

27、先收集了8组学生和心理咨询专家的商谈对话（相談対話），建成语料库，界定了间歇停顿单位（間休止単位，IPU）和句节单位（節単位）2种发话单位，并将附和分为“1次应答（応答系1回）”“2次应答（応答系2回）”“3次应答（応答系3回）”“表达感情（感情表出系）”等4个范畴，接着以扩充能附和某一会话的附和形式为目的，让3名标注者对其中4组对话进行追加标注，追加标注位置限定为生成附和的句节末尾、没有生成附和的句节末尾和非句88语言研究2023年第1期总224号节末尾的IPU，继而以说话者话语分节中出现的附和为对象，分析先行话语的句法结构和附和形式之间的关系。结果表明，句节、句法结构对区分附和形

28、式有用。基于这一观点，进一步实施了通过机器学习是否能从先行话语特征中预测出附和形式的实验，具体而言，将商谈对话语料库中8组对话中的1组用于评价，对其余7组对话实施机器学习的交叉验证。评价数据是前文进行追加形式标注的4组对话，分类器中使用了逻辑回归。评价中使用精确度、召回率以及它们的调和平均数F值，计算出上述四个范畴的三种数值。评价时，不仅将原来的形式作为正解，也将仅在生成附和的句节末尾通过标注认定为追加形式的附和范畴作为正解。计算召回率时的参数是心理咨询专家实施的原附和，但是在某个预测位置中，并非将原形式，而是将源于追加标注的形式作为正解。结果表明，机器学习可有效预测附和形式。随后，以可能出现

29、附和的所有位置为研究对象进行的同类预测实验表明，与随机生成的方法相比，机器学习可有效预测附和形式的分类。该研究还调查了人们对使用该系统生成的附和语音数据的印象评价。结果表明，相较于随机生成的方法，该系统在附和的“自然性（自然）”“理解（理解）”“共情（共感）”等表达中获得较高评价。4.2.2话语研究如果说如何处理词汇、句法层面的问题是人机对话系统领域研究的基础，属于微观层面，那么如何处理话语（Discourse）层面的问题则是该领域难点所在，属于宏观层面。正如奥斯汀（2013：59）所言，“任何单独而又简单的语法标准或词汇标准都会使我们陷入死胡同”，因而更多的研究者跳出了微观层面，从宏观层面，

30、即话语层面展开了人机对话系统的相关研究。菊池英明等（2001）收录了有意引发系统误解状态的模拟对话，分析了用户应答话语中的应答种类、应答速度、应答话语的力度、音调等后发现，应答种类存在订正性话语随着对话次数的增加而增加的倾向，应答速度整体存在发生误解时会出现延迟的倾向，尤其是在初次发生误解时这一特征更加明显，应答话语的力度和音调在初次发生误解时达到了最大值。河源达也（2013）从 IVR（Interactive Voice Response，交互式语音应答）入手，回顾语音对话系统的发展历史，分析了语音对话系统取得进步的原因主要在于连续语音识别技术的发展，提出了语音对话系统的发展方向，即智能语音

31、对话系统今后应该朝交互性对话系统发展，同时也要致力于思考并开发由系统提示信息从而引起对话的系统主动型语音对话系统。山内祐辉等（2014）使用与当下话题相关的术语和诱发性话题相关的术语，通过以概念词典（记录术语关系的词典）为基础的研究方法和使用网页检索的方法来获得可能自然诱发话题的词汇组，为调查基于属性单元的话题诱发应答句生成法的有效性，构建了话题诱发对话系统，并对其进行了评价。稻叶通将等（2016）提出了自动生成“自言自语”的方法：先输入任意话题，从推特数据中获取与之相关的适切话语，通过机器学习判定两话语之间的联结性，通过连接有联结性的话语生成自言自语，依据自言自语中话语的幽默性、意外性以及对

32、象话题的特殊性对生成的自言自语进行排序，将位于前列的自言自语视为恰当的自言自语。宫崎千明、佐藤理史（2019）从（原形：）等音变表达是语音智能体话语以及小说台词自动生成中赋予出场人物性格特征的有力手段这一观点出发，探讨了如何使用音变表达赋予人物话语个性化特征。该文首先收集人物话语中出现的音变表达，将其细分为137种模式，通过调查确认上述模式涵盖了小说、漫画中80%以上的音变表达，最后用实验手法验证了音变表达作为赋予人物性格的手段是可行的。赤间怜奈等（2019）致力于构建辅助高龄者显现生活质量（Quality of Life，QOF）的系统，首先提出用以大规模收集高龄者生活质量显现话语的语料库收

33、集方法，对其实施调查并验证其有效性之后，构建了附有QOL标签、由52079句话语组成的会话语料库，继而在控制使用QOL标签传达特定QOL信息的同时，构建显现高龄者QOL应答的系统，最后通过实验证明该系统有效。89语言研究2023年第1期总224号4.2.3人机关系建构研究人机对话系统研究不仅要考虑到语言本身的词汇、句法与话语研究，还要考虑到超越语言的人机关系建构研究，此处从人机语用距离调节和人机情感协作构筑两个维度介绍人机关系建构。（1）人机语用距离调节方面的研究主要有大内昴等（2018）、宫本友树等（2018，2019）等。大内昴等（2018）从现有智能音箱、聊天机器人等人机对话系

34、统的话语输出形式趋向单一，不符合日语随交际场景、人际关系等因素的变化而变化的特点出发，考察了人们对使用不同语体的智能音箱所持有的印象。该文依据Brown&Levinson（1987）的礼貌策略理论（Universal Theory of Politeness，理論），将句末的敬体（体）视为消极礼貌策略中的“表达敬意”，将简体（体）视为积极礼貌策略中的“使用集团身份标志语”，实施个人与智能音箱一对一交流的实验，通过问卷追踪调查的方式表明，受试者认为相较于使用“表达敬意”的智能体，“使用集团身份标志语”的智能体对良好的人机交往发挥积极作用。宫本友树等（2018）聚焦智能体和用户之间的关系建构，以人

35、与智能体的交际现状为基础，建立以下假设：智能体在交际过程中通过使用可缩短交际距离的“开玩笑”等积极礼貌策略，可以使人减轻与机器对话的不适感。为了验证该假设，该文还比较了人们在初次见面的场景中对使用积极礼貌策略的智能体和使用消极礼貌策略（不改变交际距离）的智能体所持有的印象，并对受试者进行了主观评价方面的实验，实验中使用了具有人型外表、通过语音合成技术发话的智能体和通过在屏幕上呈现文本进行发话的智能体。结果表明，使用积极礼貌策略的智能体获得较高评价，同时，用文本方式呈现话语的智能体在开玩笑时，可以使人减轻与机器对话的“违和”感。虽说人型智能体实施同一行为时的效果不如前者，但也可以看到同样的倾向，

36、即智能体通过开玩笑的方式可以让人减轻与机器对话的感觉。最后得出以下结论：通过使用语言策略可减轻人与机器对话的感觉，这一感觉所产生的效果对构建人与智能体之间的亲密关系发挥着有效作用。宫本友树等（2019）聚焦于礼貌策略理论中积极礼貌策略和消极礼貌策略可调节交际距离的功能，以其为基础选择相应的语言策略，在考虑驾驶员的年龄、性别、性格、驾龄、驾驶特征等信息的基础上，提出使用语音合成话语来辅助驾驶的智能体开发建议，通过调查发现，受试者认为使用非敬体的智能体可有效提升其与人之间的亲密度，使用敬体的智能体能正确传达信息，但给人一种谨慎、呆板的印象。（2）人机情感协作构筑方面的研究主要有平冈拓也等（2012

37、）、后藤优介等（2019）、永井望等（2020）等。平冈拓也等（2012）使用马尔可夫决策过程（Partially Observable Markov Decision Processes，POMDP）的随机建模和以其为基础的系统应答决定处理，构建对话管理模块，将话题诱发、控制向用户提示信息的会话策略、在会话中动态变化的兴趣推断等策略作为说服性会话的特定手段导入对话控制模块，进一步构建小规模说服性会话系统，通过实验评价其性能。结果表明，该方法可以提高任务成功率、用户满意度和会话自然性。后藤优介等（2019）回顾对句子赋予性格特征的相关调查后，聚焦语言的“灵动性（）”，对其进行定义并阐释赋予“灵

38、动性”的变换路径，在此基础上开发出使用深度学习赋予句子“灵动性”的系统，通过实证调查验证其有效性，结果表明，该系统可对50%的句子赋予一定的“灵动性”。永井望等（2020）基于礼貌策略理论开发了优先输出积极礼貌词汇（如朋友用语）和消极礼貌词汇（如敬语）的“礼貌词汇优先系统”，以及根据积极礼貌和消极礼貌对句子进行分类、学习的“礼貌话语学习系统”。礼貌词汇优先系统在句子中优先使用积极礼貌词汇和消极礼貌词汇，礼貌话语学习系统依据上述两种词汇对数据集的句子进行分类、学习。对两个系统的印象评估结果表明，优先积极礼貌词汇的系统能引起人的共鸣，学习积极礼貌表达的系统可表现出对会话的兴趣、对用户的亲近感；优先

39、消极礼貌词汇的系统让人感觉礼貌、拘束，学习消极礼貌表达的系统使人产生对礼貌和措辞要求较高的印象。90语言研究2023年第1期总224号5日语与人机对话系统的适配性问题日语具有“高度发达的、成体系化的敬语，这一点在世界数千种语言中也是鲜见的”（菊地康人，1996：13，笔者译）。作为日语的一大特色，敬语在日语自然会话中不可或缺。要探讨日语与人机对话系统的适配性问题，就绕不开敬语，特别是语体选择和语体转换。自二十世纪五十年代以来，针对日语敬语语用功能的探索及研究得到了极大的发展与强化。虽然得体表达方式（Taiguhyogen，待遇表現）、礼貌策略理论、话语礼貌理论等各种新概念和新理论被频

40、繁引入日语敬语研究中，明显促进了敬语研究的发展，但是Leech（2014：105-108）指出，日语敬语属于二价礼貌体系（Bivalent Politeness），与以英语为代表的三价礼貌体系（Trivalent Politeness）存在很大不同。具体而言，日语敬语属于型礼貌（标示型礼貌，Discernment）（井出祥子，2006），使用时要充分考虑会话参与者之间的亲疏距离、上下关系以及交际场景的正式与否等社会规范的约束。与之相对，而隶属于三价礼貌体系的言语礼貌（Linguistic Politeness）即语言策略，无需桎梏于这一藩篱，更多强调的是个人意志达成的交际意图。日语句末语体

41、形式（敬体/简体）的选择和转换充分体现了日语敬语的标示型特征，故而西方语用学礼貌理论不能直接套用于日语中。语言智能开发中必须考虑日语的这种特殊性。在日语自然话语中，说话者必须选择一种语体进行交际，此谓“语体选择”，选定的语体在一定情况下又可转换为另一种语体，此谓“语体转换（Speech-level Shift）”。日语存在语体选择和语体转换等特殊现象，故相较汉语、英语，其自然会话处理呈现出更多的复杂性。如在自动驾驶人机对话系统中，当汽车经过车流量较大的路口，智能体提醒用户安全驾驶且想引起用户的好感时，使用敬体的気付（请注意安全）还是简体的気（多加小心啊）就牵涉到语体选择的问题。人机对话中的

42、开放域聊天系统要求智能体不仅要有智商，还要有情商。而在日语中，智能体如要有情商，就需使用语体选择、语体转换、受话者敬语、句末助词等诸多敬语相关要素来正确调节其与人之间的语用距离。在语言学领域，语体选择和语体转换的相关研究较多，代表性成果有生田少子、井出祥子（1983）、宇佐美（1995）、冈本能里子（1997）、陈文敏（2003）、伊集院郁子（2004）、宫武（2007）、刘雅静（2013）、毋育新（2013，2019a）等，这些研究多聚焦于三价礼貌体系的语用学理论来研究语体转换现象及其影响因素，并未上升到自然语言处理层面。另外，虽然语体选择和语体转换是日语语用距离调节的主要手段（滝浦真人，2

43、005；毋育新，2019a），但就目前的研究来看，这种调节机制机理并未完全反映到日语语言智能研究中，除宇佐美真有美博士团队之外，几乎没有研究涉及日语人机对话系统中的语体问题。通过上文4的文献综述，我们可以看出日本人机对话系统的建构大致经历了从词汇、句法到语篇（即本文所言的“话语”），再到追求良好人机关系建构的发展过程。AI技术专家试图通过这些研究使得系统生成的话语更加自然，也更能促进人机良好互动，然而从现有成果来看，目前存在AI领域和语言学领域条块分割、各自为政的情况，故日语人机对话系统中的语言适用研究仍然是一个悬而未决的问题。虽然日本人工智能学会、日本国立国语研究所等科研团体和科研机构注意到

44、了该问题，且开始联合攻关，试图通过引入语言学理论提出解决方案（大内昂等，2018；宫本友树等，2018、2019），但目前处于初步探索阶段，关键领域仍未实现重大突破。6日本人机对话系统研究的问题所在包括人机对话系统在内的语言智能研究属于交叉学科，涉及语言学、计算机科学、逻辑学、数学、心理学等多个学科。自然语言的理解和生成需要语言学理论及其成果的支撑，反之，计算机科学等领域的研究也会对语言学产生反拨效应。综91语言研究2023年第1期总224号合应用语音、语法、语义、语用等语言学各方面知识的自然语言处理技术可促进语言学研究快速发展。通过前文的探讨与分析，我们认为日本人机对话系统领域的研

45、究存在以下问题：（1）未平衡好应用性研究与展望性研究的关系据笔者管见，日本人机对话系统领域的应用性研究成果数量压倒性地多于展望性研究成果，这一点也可从本文4的文献综述中窥见一斑。究其原因，是因为人工智能应用（此处着重号为笔者添加）是日本的战略核心（邓美薇，2022）。同时，日本“非常强调人工智能的产业发展与应用”（丁立江，2022：12）。加之日本政府于2017年颁布的新一代人工智能社会实施战略中涉及语言智能的内容也强调应用型研究的具体实施情况，这就导致日本学术界和产业界都将人机对话系统的研究重心放在应用方面，而或多或少地忽视了从更高站位对该领域研究的整体把控。（2）未解决好日语与人机对话系

46、统的适配性问题计算机对自然语言进行分析和处理的内容可分为“语音和文字”“语法”“语义”“语用”4个层次（曹君阔、陈国莲，2017：4-6）。我们通过分析发现，日本人机对话系统目前最突出的问题集中在第4层，即“语用”层面。具体而言，尽管以日语礼貌为首的日语语用学研究历经多年发展形成了完整的理论体系，但因语言学家“画地为牢”，未能实现跨学科合作，导致其研究成果拘泥于语言学界，未能充分体现在人机对话系统中，难以为人工智能应用提供有力支撑。就日语口语中不可或缺的敬语而言，尽管研究者使用礼貌原则（Politeness Principle，原則）、礼貌策略（PolitenessStrategy，）等三价礼

47、貌体系内的语用学理论从不同角度对其展开探讨，但是均忽略了日语敬语属于二价礼貌体系的“个性”，导致其研究成果难以精准应用于人机对话系统。此外，不管是任务型聊天系统，还是开放域聊天系统，都未涉及到言语行为的考察，也未提及语用的核心问题，即字面含义与言外之意的区别，更未论述虚假不礼貌（擬似）等语言策略对人机关系建构的影响。（3）未注意到不同人群的语言使用特征日本AI技术专家通过活用网页和动漫中的语言资源来展开人机对话系统中机器话语的研究，但其均忽略了网络语言和自然语言在不同语境中使用时所存在的不同之处，也忽略了动漫人物使用的语言所具有的特殊性。另外没有考虑到未上网人群的语言使用特征以及人机对话系统的

48、使用人群本身所呈现出来的身份特征。总体而言，虽然日本的人机对话系统研究存在一些问题，但关注该领域的研究者也在努力攻克各种难题，比如自2018年起，日本国立国语研究所宇佐美博士团队就和AI技术专家开始联合攻关，试图解决智能体话语中语言生硬、机器腔过浓等问题，这标志着日本语言智能领域步入多学科联合互动研究的新阶段。然而，我们必须清楚地认识到，这些尝试仍然处于初步探索阶段，尚未解决的问题不胜枚举。明确智能体话语特征、语用距离调节机制和人机情感协作构筑模式，探索其背后的生成机制及交际效果，为日语人机对话系统中的良好“人机”交流关系构筑提供语言学支持是今后语言学领域的研究重点所在。7结语语言智能化事关国

49、家语言能力的强弱4。语言智能、自然语言处理与人机对话系统密不可分。本文论述语言智能与自然语言处理的关系后，介绍了日本语言智能政策中涉及自然语言处理的内容，继而概览了近20年来日本人机对话系统研究的相关成果，进一步探讨了日语与人机对话系统的适配性问题。简言之，尽管日本人机对话系统研究的成果林林总总，可圈可点，但是也存在一些问题，如重视应用性研究而轻视展望性研究，语言学界和人工智能学界条块分割、各自为政的现状导致在日语的适配性问题上语言学界的研究成果不能及时反映到AI技术层面，语言学界至今未解决好日语二价礼貌体系的特殊性问题，AI92语言研究2023年第1期总224号技术专家忽略了不同人

50、群的语言使用特征等。值得关注的是，日本学术界也出现了跨领域协作研究人机对话系统的现象。我们可以预测，在语言学理论的赋能下，日本的人机对话系统研究可能会加速朝纵深发展。这不但能促进日本语言智能整体研究水平的提高，也能为我国的语言智能研究提供可资参考的视点与范式。本文为2021年国家社科基金项目“面向人机对话系统的日语语用距离调节机制研究”（批准号：21XYY009）的阶段研究成果。项目主持人：毋育新注 1 参见：https：/easyai.tech/blog/59pdf-nlp-all-in-one/。（2022年9月24日浏览）2 宇佐美.21世纪礼貌现象研究的可能性话语礼貌理论的新发展J.李

下载提示：咨信网仅提供存储空间/不修改/不编辑

【自信AI创作助手】【自信AI导航】
1、请仔细预览页面，基本判断完整性，对于直接下载带来的问题请及时与客服沟通；下载的文档，不会出现我们的网址水印。
2、该文档所得收入（下载+内容+预览）归上传者、原创作者；如果您是本文档原作者，请点此认领！既往收益都归您。

同意并开始全文预览

举报此文档有问题？有机会获“体验VIP”奖励！

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

10 金币 0人已下载

申诉本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请申请举报、认领或删除 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 语言智能视角日本人机知识融合应用核心毋育新

咨信网温馨提示：
1、咨信平台为文档C2C交易模式，即用户上传的文档直接被用户下载，收益归上传人（含作者）所有；本站仅是提供信息存储空间和展示预览，仅对用户上传内容的表现方式做保护处理，对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿，我们不确定上传用户享有完全著作权，根据《信息网络传播权保护条例》，如果侵犯了您的版权、权益或隐私，请联系我们，核实后会尽快下架及时删除，并可随时和客服了解处理情况，尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确)，网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据，平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺，下载前须认真查看，确认无误后再购买，务必慎重购买；若有违法违纪将进行移交司法处理，若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传，付费前请自行鉴别，如您付费，意味着您已接受本站规则且自行承担风险，本站不进行额外附加服务，虚拟产品一经售出概不退款（未进行购买下载可退充值款），文档一经付费（服务费）、不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印，是因预览和防盗链等技术需要对页面进行转换压缩成图而已，我们并不对上传的文档进行任何编辑或修改，文档下载后都不会有水印标识（原文档上传前个别存留的除外），下载后原文更清晰；试题试卷类文档，如果标题没有明确说明有答案则都视为没有答案，请知晓；PPT和DOC文档可被视为“模板”，允许上传人保留章节、目录结构的情况下删减部份的内容；PDF文档不管是原文档转换或图片扫描而得，本站不作要求视为允许，下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权，请谨慎使用；网站提供的党政主题相关内容(国旗、国徽、党徽－－等)目的在于配合国家政策宣传，仅限个人学习分享使用，禁止用于任何广告和商用目的。
6、文档遇到问题，请及时私信或留言给本站上传会员【自信****多点】，需本站解决可联系【微信客服】、【 QQ客服】，若有其他问题请点击或扫码反馈【服务填表】；文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“【版权申诉】”（推荐），意见反馈和侵权处理邮箱：1219186828@qq.com；也可以拔打客服电话：4008-655-100；投诉/维权电话：4009-655-100。