人工智能专利的多层次框架式检索研究.pdf
《人工智能专利的多层次框架式检索研究.pdf》由会员分享,可在线阅读,更多相关《人工智能专利的多层次框架式检索研究.pdf(7页珍藏版)》请在咨信网上搜索。
1、研究目的对人工智能专利进行检索是相关情报分析、实证研究的基础。该文结合现有检索方法,研究了人工智能专利的多层次框架式检索方案,以期提供全面、准确、噪音低且包含确定检索字段和检索语法的人工智能专利检索方案。研究方法对人工智能技术进行了系统的层级划分及各层级内容梳理,并根据各技术层级特点,采用关键词与分类号组合、关键词与关键词组合的方式,充分拓展关键词和分类号,强化对各类技术名词的研判,同时考虑噪音控制。研究结论人工智能专利多层次框架式检索方案具有灵活性高、适用性广的优点,最后给出相应的检索实例以供参考。关键词:人工智能;专利检索;人工智能技术;层次框架;多层次检索中图分类号:G354.2摇 摇
2、摇 摇 摇 摇 文献标识码:A摇 摇 摇 摇 摇 摇 摇 文章编号:1002-1965(2023)09-0172-07引用格式:李文红,唐摇 春.人工智能专利的多层次框架式检索研究J.情报杂志,2023,42(9):172-178.DOI:10.3969/j.issn.1002-1965.2023.09.024Research on Multi-Level Frame Retrieval of Artificial Intelligence PatentsLi Wenhong1摇Tang Chun2(1.Shanghai International College of Intellectua
3、l Property,Tongji University,Shanghai摇 200092;2.School of Intellectual Property,East China University of Political Science and Law,Shanghai摇 201620)Abstract:Research purpose The retrieval of artificial intelligence patents is the basis of relevant information analysis and empirical re鄄search.Based o
4、n the existing retrieval methods,a multi-level frame retrieval scheme for artificial intelligence patents is proposed in thispaper,aim to provide a comprehensive,accurate,low noise artificial intelligence patent retrieval scheme,including the determinate searchfields and search syntax.Research metho
5、d The artificial intelligence technology is systematically divided into levels and the content ofeach level is sorted out,and according to the characteristics of each technical level,the combination of keywords and IPC classificationnumber and combination of keywords and keywords are adopted.keyword
6、s and IPC classification number are fully extended,and the re鄄search and judgment of various technical terms is strengthened.Besides,noise control is considered.Research conclusion The schemehas the advantages of high flexibility and wide applicability.In the end of this paper,the corresponding retr
7、ieval examples are given forreference.Key words:artificial intelligence;patent retrieval;artifical intelligence;hierarchical framework;multi-level retrieval0摇 引摇 言随着以 ChatGPT 等为代表的人工智能应用出现,人工智能技术研究进入新一轮高潮,其中,人工智能专利信息利用起到了重要的基础作用。人工智能专利是人工智能技术信息的重要载体。例如,自然语言理解是人工智能认知环节的关键技术,相关专利包括了语言数据语法分析、自然语言处理与转换、
8、机器翻译、自然语言模型等;作为近年来人工智能技术研究的热点,深度学习主要包括深度学习算法、模型框架以及在不同领域中的应用,相关专利布局侧重于图像识别、语音识别、情感认知等领域,且以应用性专利居多1。此外,大数据技术、云计算技术、模式识别、人机交互等相关专利也涉及人工智能的核心技术2。这些专利信息的充分利用,对于相关技术领域理论研究、核心技术学习、技术前沿把握、技术发展走第 42 卷摇 第 9 期2023 年 9 月摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇情摇 报摇 杂摇 志JOURNAL OF INTELLIGENCE摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇Vol.42摇
9、No.9Sep.摇 2023向预判等都具有重要的意义。专利信息充分利用的前提是全面、准确的专利检索。目前已有很多基于人工智能专利检索进行技术信息分析的文献,但基本以关键词检索为主。有学者通过构建中英文关键词的方式进行检索3,还有学者仅通过英文关键词在专利标题中进行检索4,此外,还有通过将 artificial intelligence*设为检索主题并结合德温特手工代码进行检索的2,或者以 Artificial Intelli鄄gence OR AI 为关键词在专利的标题、摘要、权利要求中进行检索5。在检索具体技术领域时,有直接通过关键词进行检索的,例如 TS=(Machine Learning
10、)6,也有通过国际专利分类号(IPC)检索的,例如“采用神经网络模型的计算机系统冶专利的国际专利分类号为G06N3/027,也有通过中英文同义词在标题中进行检索的8。现有的大部分检索方案相对简单,缺乏对人工智能技术的进一步理解和体系化考虑,仍有一定优化空间:首先,现有的检索方案大多仅罗列了一些与人工智能相关的关键词,并未对技术层级进行划分,容易造成遗漏;其次,关键词拓展不够丰富,除聚焦于具体技术领域外,在对人工智能整体技术进行检索时,特定技术领域大多仅采用一个关键词;再次,现有检索的关键词大都忽略了更专业具体的技术词汇,例如公开号为CN114418101A 的题为“一种贝叶斯网络推理方法及系统
11、冶的专利,标题和摘要中虽不含“人工智能冶,但其却是明显的人工智能算法专利,“贝叶斯网络冶为关键技术词汇;最后,部分检索未与分类号结合,或者仅将检索范围限定在标题等。上述几点都会影响检索的全面性和准确性,可能导致后续分析的偏差。本文通过人工智能技术层级划分和各层级技术内容梳理,充分解构人工智能技术,在关键词和分类号拓展的基础上,将其灵活组合,分层检索,构建了人工智能专利的多层次框架式检索方案。该专利检索方案能够为学术界人工智能技术的理论研究、实证分析等提供借鉴,也可供实践中人工智能技术的研发人员参考。1摇 人工智能专利检索的多层次框架专利检索的前提是深入“理解冶技术。人工智能作为一门新兴技术,纵
12、向上,融合了芯片设计制造、基础理论研究、算法模型构建和训练、行业场景应用等;横向上,涉及计算机视觉、文本及语音识别、各行业智能化应用等。丰富的技术分支造就了人工智能的庞大体系。此外,概念上的概括性、模糊性,也虚化了人工智能边界,使更多技术被纳入人工智能技术体系,提高了人工智能技术的复杂度。因此,对人工智能技术的理解难以采用常规的功能模块式技术拆解方法。为了实现全面而准确的检索,本文结合现有检索思路,研究了人工智能专利的“多层次框架冶式检索方案。首先通过技术层级划分以及各层级技术内容梳理,全面、系统地理解人工智能技术;其次,根据不同技术层级的特点,灵活采用“层关键词和层分类号组合冶“多层关键词组
13、合冶的检索框架;再次,对相关关键词和分类号进行充分拓展并去噪,强化各类技术名词的研判,提高对专利文献的命中率;最后,通过确定检索字段、构造检索语法等,进一步提升检索的全面性和准确性。摇 1.1摇 人工智能技术分层综合 腾 讯 研 究 院9、36 氪 研 究 院10、亿 欧 智库11、世界知识产权组织的WIPO 技术趋势 2019-人工智能12及其参考的计算分类方案13等机构和组织报告、文献资料和多位学者的观点14-17,根据人工智能技术发展的结构,本文认为人工智能技术应当分为基础层、技术层和应用层,如表 1 所示。表 1摇 人工智能技术场景体系层级划分生态层级分类内容AI 应用层智能场景智慧城
14、市、智能交通、智能制造、公共安全、智能家居、智能医疗、智能物流、智慧生活、智能教育、智能金融、智能营销、智能机器人等智能方案TO B 类整体解决方案(金融、政府、安防、医疗等)TO C 类整体解决方案(教育、零售、互联网等)AI技术层AI 功能算法AI 算法模型AI 技术细分领域人脸识别类、图像识别类、文字识别类等;语音识别、语音合成等;机器翻译、内容推荐等应用算法计算机视觉、语音识别、自然语言处理、知识图谱、综合算法、新算法等理论算法传统机器学习、深度学习、强化学习、联邦学习等AI 框架各类开源框架、各 AI 厂商自研框架、半开源及其他类型框架AI 基础层数据资源大数据(数据库)等算力平台操
15、作系统、云计算平台、边缘计算、大数据平台等硬件设施智能芯片、网络资源、存储资源、智能传感器等摇 摇 AI 基础层包括硬件设施、算力平台、数据资源等。硬件设施主要为人工智能应用提供强大的算力支撑,包括计算资源如 GPU、FPGA、AISC 等加速芯片,网络资源,存储资源,以及各种传感器件;算力平台包括操作系统、云计算平台、大数据平台等;数据资源主要为大数据,其能够为人工智能技术提供充足的数据支持。AI 技术层可细分为两层,分别是包括 AI 框架、理论算法的 AI 算法模型层和包括应用算法、AI 技术细分领域的 AI 功能算法层。作为目前人工智能产业的核心,这些技术直接决定了行业应用落地的效果。其
16、中,AI 框架包括国内外主流开源框架等;理论算法包371摇 第 9 期摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 李文红,等:人工智能专利的多层次框架式检索研究括近年来比较主流的深度神经网络算法、图算法等,其研究主体是学术界和大型互联网公司,这些基础理论的突破加速了人工智能技术的发展;应用算法的主要研究领域包括计算机视觉、语音识别、自然语言处理、知识图谱、决策判别等,涉及感知、认知、思维、决策等不同的智能方向;在每个研究方向,又诞生出很多 AI技术细分领域。AI 应用层体现人工智能技术与行业的深度结合,包括智能方案、智能场景等。智能方案能够实现 TO B与 TO C 具体场景的智能化;智能
17、场景涉及金融、安防、医疗、交通、教育、生活等方面17。也有一种分类是将“算法模型冶(对应表 1“AI 技术层冶中的“AI 框架冶)归于 AI 基础层18,其余则无差异。摇 1.2摇 人工智能技术各层级检索方式AI 应用层、AI 技术层中 AI 功能算法以及 AI 算法模型的分类号具有一定的集中性,且现有文献提供了相关参考,故统一采用“关键词+IPC 分类号冶的检索方式。IPC 分类号(International Patent Classification,国际专利分类)能够指示专利所属的技术领域,“关键词+IPC 分类号冶的检索方式能够降低单一检索要素带来的噪音,提升检索准确性。其中 AI 应
18、用层的关键词为 K2,分类号为 C2;AI 技术层中 AI 功能算法、AI 算法模型的关键词分别为 K11、K12,分类号分别为 C11、C12。为避免引入不属于该层级的人工智能技术,AI应用层、AI 技术层的关键词中均不包含关键词“人工智能冶。出于检索全面性和准确性的综合考虑,K2、K11、K12 均限定在标题或摘要中检索。AI 基础层采取“相关硬件关键词+AI 应用、技术层关键词冶的检索方式。AI 基础层主要涉及硬件设施、算力平台、数据资源等,主要硬件包括智能处理器、智能芯片等。相关硬件关键词例如张量处理器等与人工智能技术高度相关,具有明确的指向性,将其限定在标题中即可达到较好的检索结果。
19、若采用结合分类号的方式,则有可能因分类号拓展不全而排除了相关专利。因此,对 AI 基础层仅采用关键词检索。为了更好地体现同人工智能的相关性,采用相关硬件关键词 K0结合“AI 应用、技术层关键词 K冶的形式,其中 K 集合了 AI 应用层、AI 技术层的关键词 K2、K11、K12,并且补充了关键词“人工智能冶。由于相关硬件关键词 K0常作为其他技术的一部分出现在专利摘要中,为提升检索的准确性,将 K0 的检索范围限定在标题中,K 仅需在专利全文中提到即可。各层次的关键词和分类号见下文。摇 1.3摇 人工智能技术检索的框架结构综上,人工智能技术检索的层次框架如表 2 所示。总体人工智能技术的检
20、索式为 AI 基础层、AI 技术层、AI 应用层检索式的集合。表 2摇 人工智能技术检索的层次框架技术层级关键词IPC 分类号检索式AI 应用层K2C2K2 and C2AI 技术层AI 功能算法K11C11K11 and C11AI 算法模型K12C12K12 and C12AI 应用、技术层KC/AI 基础层K0 and K/K0 and K总体人工智能技术K0,KC(K2 and C2)or(K11and C11)or(K12 andC12)or(K0 and K)注:K 为:K2 or K11 or K12 or“人工智能冶;C 为:C2 or C11 or C122摇 各技术层级关键
21、词设计关键词设计按照“词集初建-分层归类-扩充去噪冶的逻辑,共分为 3 步:第 1 步,初步构建关键词集。通过以下途径可构建初步关键词集:首先,借鉴、采纳部分现有人工智能领域专家提供的关键词3;其次,根据现有人工智能报告中列出的英文关键词,翻译相应的中文关键词;最后,从各类人工智能技术研究资料中提取相应关键词。除常见的人工智能关键词外,还注重对人工智能可能涉及的专业技术(例如“贝叶斯网络冶等)词汇的收集。第 2 步,关键词分层归类。充分参考表 1 中各人工智能技术层级内容,结合相应关键词含义,将初步关键词划分到对应层级。其中 AI 应用层关键词多为“智能/智慧+应用领域冶的结构;AI 技术层中
22、,AI 功能算法关键词主要体现为各类物理信息处理,例如图像识别、语音识别等,AI 算法模型的关键词主要与算法和模型有关,重点包括各类机器学习算法;AI 基础层关键词主要涉及各类智能芯片和处理单元。第 3 步,词集扩充与去噪。首先,确认相关关键词是否覆盖了表 1 中所列的具体技术,若无则进行相应补充;其次,对各具体技术关键词进行同义扩充、上下位扩充、关联扩充等,例如,“计算机视觉冶可拓展出“机器视觉冶,“物体追踪冶可拓展出“目标跟踪冶“对象跟踪冶“对象追踪冶等。在英文关键词拓展上,需注意单词同义替换及单复数形式等,还可借助邻近算符提高检索的全面性;再次,可通过阅读试检索结果中相关专利的表达以补充
23、关键词;最后,在扩充过程中,结合人工阅读,将部分噪音较多的关键词排除,或者增加检索条件限制,以提升检索的准确性。人工智能各技术层级的关键词如表 3 所示,其中471 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 情摇 报摇 杂摇 志摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 第 42 卷邻近的中文关键词互为同义词或近义词,后接对应的英文关键词。表 3摇 人工智能各技术层级关键词技术层级关键词AI应用层K2(智慧城市 OR smart city OR smart cities OR 智能交通 OR(intelligent OR s
24、mart)0W(transportation OR traffic)OR 智能制造 OR(intelligent OR smart)0W(manufactur+)OR 智能医疗 OR(intelligent OR smart)0W(medical)OR 智能家居 OR(intelligent ORsmart)0W(household OR domestic OR home)OR 智能物流 OR(intelligent OR smart)0W logistics)OR 智能教育 OR(intelligent ORsmart)0W(education OR teaching)OR 智慧生活 OR(
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 人工智能 专利 多层次 框架 检索 研究
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。