知识图谱互联互通白皮书.pdf
《知识图谱互联互通白皮书.pdf》由会员分享,可在线阅读,更多相关《知识图谱互联互通白皮书.pdf(334页珍藏版)》请在咨信网上搜索。
1、?I目 录目 录前 言.IV第一章 知识图谱互联互通的背景.1一、技术层面.1(一)基础共性技术问题.1(二)行业应用技术问题.3二、产业层面.6三、政策层面.11(一)国际层面.11(二)国家层面.17(三)行业政策层面.23第二章 知识图谱互联互通的内涵与外延.27一、知识图谱互联互通的内涵.27(一)定义.27(二)知识图谱互联互通互操作等级.31二、知识图谱互联互通的外延.33(一)存在的利益相关方.33(二)潜在的影响.35第三章 知识图谱互联互通的任务与约束.39一、互联互通的模式.39二、互联互通的活动构成.41(一)活动流程框架.41(二)任务流构成.42三、互联互通的质量评估
2、维度.45四、互联互通的实现类型.46五、互联互通约束条件.50(一)技术层面约束条件.50(二)非技术层面约束条件.53第四章 知识图谱互联互通的典型应用场景.56一、知识融合与计算.56二、知识联合检索.61三、知识发现.66四、知识生成.73五、综合应用服务.79第五章 知识图谱互联互通的实践案例.91第六章 互联互通的难点与挑战.93第七章 知识图谱互联互通的统一架构.108一、知识图谱互联互通架构.108(一)互联互通交互模型.108(二)互联互通逻辑架构.113II(三)知识消息描述与处理框架.115二、知识图谱互联互通安全保障.128第八章 面向知识图谱互联互通的知识表示框架.1
3、32一、整体表示框架.132二、知识表示规范化.133(一)概念模型.133(二)实体模型.134(三)事件模型.135三、谓词表示规范化.135(一)谓词框架.136(二)实体谓词规范化.136(三)谓词结构规范化.137(四)谓词语义规范化.137四、知识交换格式表示规范化.137第九章 面向知识图谱互联互通的本体模型注册流程.142一、本体涵义及其分类.142二、本体构建工具.142三、本体模型构建流程.143四、开放本体模型注册流程.145(一)总体原则.145(二)注册流程.146(三)注册平台结构.147(四)本体模型实例.148第十章 基于知识图谱互联互通的知识融合与知识计算流程
4、.150一、基于互联互通的知识融合流程.150(一)知识融合分类.150(二)知识融合流程.151二、基于互联互通的知识联合查询/计算流程.153(一)概述.153(二)知识联合查询/计算流程.154(三)任务构成.155第十一章 展望与建议.159一、技术发展展望.159(一)知识图谱互联互通支持大规模预训练模型的发展.159(二)知识图谱互联互通支持智能问答/对话的发展.166(三)知识图谱互联互通支持智能内容生成的发展.169(四)知识图谱互联互通支持智能推荐的发展.172二、政策支持建议.175(一)国家政策支持.175(二)行业政策支持.177三、标准化需求建议.178四、产业推广措
5、施建议.179III附录 A:知识消息编码示例.182一、基于段的知识消息编码.182二、基于 XML 的知识消息编码.183附录 B:知识图谱互联互通的实践案例详情.187一、智慧纪检:知识共享实践案例.187二、智慧纪检:知识关联分析实践案例.192三、智慧金融:反洗钱实践案例.198四、智慧金融:声誉风险金融知识融合实践案例.202五、智慧金融:金融领域知识图谱数据和服务融合案例.208六、智能金融:新一代银行知识管理系统.214七、智慧金融:金融机构客户尽职调查.222八、智慧能源:油气勘探开发知识中心.230九、智慧医疗:共享平台实践案例.238十、智慧医疗:智能医保审核实践案例.2
6、49十一、智慧医疗:基于知识图谱的医药智能知识平台.254十二、智能通信:知识共享实践案例.259十三、智慧情报:智慧情报知识图谱互联互通实践案例.266十四、智慧情报:科技情报智能分析与监测实践案例.269十五、智慧汽车:智能售后服务实践案例.280十六、智慧能源:电力设备缺陷知识图谱知识共享实践案例.285十七、算力:服务器智能运维知识互联互通实践案例.293十八、智慧家居:家电知识互联互通实践案例.301十九、智慧城市:新型基础测绘知识图谱互联互通实践案例.309二十、轨道交通:智能运维知识互联互通实践案例.313IV前 言前 言尊敬的读者:我们很高兴向您介绍知识图谱互联互通白皮书。本白
7、皮书旨在探讨知识图谱互联互通的重要性和实现方法,以及它对于推动人工智能技术发展和应用的意义。知识图谱是人工智能技术的重要组成部分,它是将各种数据和信息进行结构化、标准化、语义化处理后形成的一种知识表示形式。知识图谱的建立和应用可以帮助我们更好地理解和利用数据,从而推动人工智能技术的发展和应用。然而,由于不同领域、不同机构、不同国家之间的数据格式、标准、语义等方面存在差异,知识图谱之间的互联互通面临着很大的挑战。本白皮书旨在探讨这些挑战,并提出了一些实现知识图谱互联互通的方法和建议。我们希望,本白皮书能够为各位读者提供有价值的思路和启示,推动知识图谱互联互通的实现,进一步促进人工智能技术的发展和
8、应用。祝愿您阅读愉快!知识图谱互联互通白皮书编写组知识图谱互联互通白皮书编写组注:该前言由 ChatGPT 生成。由于知识图谱技术发展迅速,白皮书编制时间和注:该前言由 ChatGPT 生成。由于知识图谱技术发展迅速,白皮书编制时间和作者学识限制,恐有纰漏或不严谨之处,敬请谅解和批评指正。作者学识限制,恐有纰漏或不严谨之处,敬请谅解和批评指正。V编写组成员编写组成员单位名称参编人员中国电子技术标准化研究院郭楠、韩丽、李瑞琪、李湘、胡成林、陈艳利东软集团股份有限公司、沈阳东软智能医疗科技研究院有限公司王伟光、汤一凡、赵耕弘、蔡巍深圳市矽赫科技有限公司洪鹏达、洪宝璇、林叠守蚂蚁科技集团股份有限公司
9、郭智慧、梁磊、周俊、廖博森郑州中业科技股份有限公司李介、张恒星、刘向宇网智天元科技集团股份有限公司贾承斌、艾青中国医学科学院生物医学工程研究所蒲江波、姚博、李婷北京智通云联科技有限公司高艳、谭培波、张学龙北京京航计算通讯研究所宋明艳、马静、白洋、姚帅中电科大数据研究院有限公司曹扬、王华、蔡惠民、闫盈盈、熊子奇华为云计算技术有限公司薛海威、周玉晶、金斌斌中译语通科技股份有限公司陈自岩、程国艮、彭旋中国电力科学研究院有限公司马震媛、张英强、何可嘉、谈元鹏中国电子科技集团公司第十研究所崔莹、代翔中国兵工物资集团有限公司吴波、张烜通深圳工业总会黄永衡中国电子科技集团公司第二十八研究所严红上海合合信息科
10、技股份有限公司徐升上海市人工智能行业协会王逸浩、陈曦、钟俊浩中国医学科学院医学信息研究所李姣、吴萌星环信息科技(上海)股份有限公司伊人、杨一帆、唐剑飞、夏正勋河北大学张彬北京中企智造科技有限公司蔡志伟、张燕南京航空航天大学周福辉、袁璐广州拓尔思大数据有限公司马谅、岳松深圳市洲明科技股份有限公司白莹杰富泰华工业(深圳)有限公司张学琴、史喆浙江创邻科技有限公司周研、马超昆明市儿童医院刘晓梅、敖凌翔北京海致星图科技有限公司杨娟、邵伯仲、熊蕙国际商业机器(中国)有限公司(IBM)程海旭、陈栋、孙腾北京大学医学信息学中心于娜、李毅泰瑞数创科技(北京)股份有限公司刘俊伟、王金兰、罗伊莎浙商银行股份有限公司
11、陈嘉俊、钟礼斌、汪雷领美的集团(上海)有限公司牟小峰、蔡亚森重庆警察学院刘彦飞云知声智能科技股份有限公司史亚飞、刘升平北京文因互联科技有限公司张玉洁、余姗、段文静、贺余龙超聚变数字技术有限公司吴施楷、梁永贵VI同方知网数字出版技术股份有限公司尹青云、刘剑兰海乂知信息科技(南京)有限公司胡芳槐、李一斌南瑞集团有限公司高若寒、于聪、张万才、施雨、石超中国南方电网有限责任公司超高压输电公司李强达观数据有限公司王文广、贺梦洁暗链科技(深圳)有限公司吴刚、蔺静茹深圳思谋信息科技有限公司刘枢、张驰、陈鹏光嘉信达资产管理有限公司吴凯棋、童庆广州柏视医疗科技有限公司颜子夜绿盟科技集团股份有限公司袁军、顾杜鹃中
12、电莱斯信息系统有限公司宋文韬山东亿云信息技术有限公司李成梁各章节编辑:各章节编辑:第一章中国医学科学院生物医学工程研究所 蒲江波第二章郑州中业科技股份有限公司 李介第三章北京京航计算通讯研究所 马静第四章北京中企智造科技有限公司 张燕第五章深圳市矽赫科技有限公司 洪鹏达、洪宝璇第六章中国电力科学研究院有限公司 马震媛、张英强第七章沈阳东软智能医疗科技研究院有限公司 王伟光第八章蚂蚁科技集团股份有限公司 郭智慧第九章中电科大数据研究院有限公司 闫盈盈第十章华为云计算技术有限公司 薛海威第十一章网智天元科技集团股份有限公司 贾承斌附录深圳市矽赫科技有限公司 洪鹏达、洪宝璇星环信息科技(上海)股份有
13、限公司 唐剑飞之江实验室王海涛1知识图谱互联互通知识图谱互联互通第一章 知识图谱互联互通的背景第一章 知识图谱互联互通的背景一、技术层面一、技术层面(一)基础共性技术问题(一)基础共性技术问题1、知识多样性1、知识多样性知识资源是通过智力劳动发现和创造的,进入经济系统的人类知识。现今,知识已经成为社会变革的核心。每个人的发展、组织结构和形态的变化、社会生活方式,甚至包括人们的价值观念,都需要从工业时代机械的方式向有利于知识潜力的开发方式转变。知识不等同于信息,而是从噪音中分拣出来数据,转化为信息,升级为知识。这是信息从无序到有序的管理和分类过程1(图 1-1)。在广义上,数据要素包括知识资产和
14、知识要素等,在数据驱动时代,数据要素的价值越来越被重视。通过收集、存储和分析数据,可以发现其中的模式、趋势和关联性,进而提取知识并应用于实际问题中。知识资产和知识要素在数据中扮演着重要的角色,帮助组织和个人做出更明智的决策,创造更大的价值。图 1-1 从数据到智慧的层次等级知识资源的类型多种多样,涵盖多个行业、领域并体现了学科间的交叉融合。其中,显性知识是可以明确、清晰地表达和传递的知识,它是形式化和结构化的,易于记录、编码和共享的知识形式,通常以文字、图像、音频、视频等可见或可感知的形式存在。显性知识可以通过书籍、1叶继元,成颖.情报的概念及其与信息链、DIKW 链的关系探讨J.中国图书馆学
15、报,2022,48(04):39-51.第 一 章 知 识 图 谱 互 联 互 通 的 背 景第 一 章 知 识 图 谱 互 联 互 通 的 背 景2文件、数据库、培训课程等形式进行传递。科学原理、法律条款、技术规范等都属于显性知识。这种知识相对容易被传递和学习,可以通过教育和培训来获取。与显性知识相对,隐性知识往往是直觉性的、难以定义的、主要基于经验的知识,是个人经验、洞察、直觉、技能和专业知识的一部分,通常是非结构化的、内化于个人思维和行动方式中的知识。隐性知识难以用语言或符号直接表达。例如,骑自行车、游泳、驾驶汽车等技能都属于隐性知识。转换隐性知识为显性知识的过程称为知识转移或外显化。显
16、性知识和隐性知识相互依存,共同构成了知识的完整体系。合理管理和整合这两种知识类型对于组织和个人的发展和竞争力提升至关重要。在企业的发展过程中,涉及到各种不同类型和不同模态的知识,包括业务系统数据、公司制度文档、合同文档、标准规范等。这些知识在组织内部以及与外部环境的互动中起着关键作用。然而,随着企业发展,这些知识不断增加,对知识管理提出了挑战。另外,这些知识往往分散在不同的地点和业务系统中,没有进行有效的挖掘和关联,降低了知识的可利用价值。这导致了知识的孤立和碎片化,使得企业无法充分利用这些宝贵的资源。因此,有效的知识管理变得至关重要。它涉及对知识进行收集、整理、存储、分析和共享的过程。通过建
17、立知识管理系统,企业可以将分散的知识整合起来,建立知识库或知识图谱,以便更好地组织和查找知识,提高知识的可访问性和可利用性,促进跨部门和跨系统的知识共享和合作。同时,采用技术手段如数据挖掘、自然语言处理和人工智能等,可帮助企业发现隐藏在大量数据和文档中的知识,提供洞察和决策支持。通过实施知识管理,企业可以更好地利用各种类型和模态的知识,加强内部的学习和创新能力,适应快速变化的商业环境,提高竞争力。2、知识适用性2、知识适用性3知识图谱互联互通知识图谱互联互通知识是在具体场景下的应用,知识不一定放之四海皆准。适用性是指知识在不同场景和情境中的适用能力。适用性是依赖于领域的,适用性越高的知识信息能
18、得到越广泛的应用。知识图谱帮助企业自动构建行业图谱,摆脱原始的人工输入,可以应用于智能搜索、文本分析、机器阅读理解、异常监控、风险控制等场景,达到真正的智能和自动2。3、知识归一化3、知识归一化为了实现知识体系的互联互通,需要对多种渠道来源和不同行业领域的知识进行归一化。知识的归一化是指通过汇聚、组织和融合有效资源,使用匹配规则或相似度等方式对不同信息进行对齐。这可以通过建立信息名称库来实现,将抽取的信息统一对应到库中,并统一表述方式。归一化的主要原因是知识库中存在实体的同义词、同义异形、简写、缩写等情况,而实体归一化后,具有相同或相近意义的实体将映射为知识库中的统一实体。实现语义的互操作性是
19、知识体系互联互通的另一个关键。这意味着通过使用一套通用标准,各个系统能够自主交换和整合具有普遍意义的数据。在语义化的过程中,数据被赋予了一种正规的通用表示方法,使其能够描述自身的含义。数据的消费者可以通过查找特定的词汇表来从数据中获取真正的含义。这些通用的表示方法主要围绕知识图谱展开,包括本体、RDF(资源描述框架)和语义图等。通过归一化和语义互操作性,不同来源和领域的知识可以更好地交流、整合和共享,从而促进知识的传播和创新。这为企业和组织提供了更广阔的知识基础,加强了合作和决策的基础,推动了业务发展和创新的进程。(二)行业应用技术问题(二)行业应用技术问题1、知识孤岛1、知识孤岛知识孤岛是指
20、在组织中由于信息资源得不到有效的交叉融合,知识2金岩.网络信息计量学方法研究D.中国科学院文献情报中心,2001.第 一 章 知 识 图 谱 互 联 互 通 的 背 景第 一 章 知 识 图 谱 互 联 互 通 的 背 景4板块之间相互割裂而形成的无序状态,仿佛大海中的一个个“孤岛”。在我国,当前存在许多“知识孤岛”的现象。社会中知识共享性、知识扩散性、知识传播性、技术扩散性和网络创新性都不发达,部门所有、地方所有、单位所有、条块分割、各自为战,“创造”了一个个“科研知识孤岛”、“产业群知识孤岛”和“企业知识孤岛”等。大学虽然知识丰富,却同当地经济、企业联系不强,以基础性知识文化传播为主,校企
21、合作性差,知识产业化水平低。行业之间、机构之间和部门之间或多或少存在着信息和知识孤岛,而知识孤岛直接导致机构整体利益受损、效率低下、透明度差和资源浪费。在市场经济中,企业要适应市场的变化,快速调整战略并采取协调行动,必须具备有较高透明度的知识交流系统。面对知识孤岛所造成的瓶颈,必须实现知识关联:通过知识求助和协作,整合来自组织内外的专家经验和最佳实践等,实现知识互联互通。然而,大多数企业的数据信息往往只停留在归档整理阶段,未能得到充分的挖掘和利用。孤岛现象是企业和政府部门在信息化、数字化发展过程中普遍存在的,通常可分为物理性和逻辑性两种形式。物理性的孤岛指的是数据在不同部门之间相互独立存储和维
22、护,彼此之间缺乏互联互通,形成了物理上的隔离。逻辑性的数据孤岛则是指不同部门从各自的角度理解和定义数据,导致相同的数据被赋予不同的含义,增加了跨部门数据合作的沟通成本。在许多传统行业中,专家经验传承通常仅限于口述传递,未能有效沉淀。而员工离职、调动往往会导致专家经验和企业专业知识的中断或缺失。此外,企业员工普遍缺乏知识共享意识,文档和案例难以有效传递,知识难以被有效复用,进一步形成了知识孤岛。随着企业的不断发展壮大,档案资料不断膨胀,相关数据未能及时更新,进一步加剧了孤岛效应。解决数据孤岛问题需要企业采取积极的措施。这包括建立统一的数5知识图谱互联互通知识图谱互联互通据管理平台,促进部门间的数
23、据共享和协作,制定统一的数据标准和定义,以及推行知识共享文化,鼓励员工之间的交流和合作。同时,利用先进的技术工具,如数据挖掘和人工智能,可以帮助企业发现和利用数据中的潜在价值。通过打破数据孤岛,企业可以更好地利用自身的信息资源,加强内部协同和创新能力,提高决策的准确性和效率,从而在竞争激烈的市场中获得竞争优势。2、知识标准化2、知识标准化标准化的目的是为了在既定范围内实现最佳秩序,促进共同效益,并确立共同使用和重复使用条款以及编制、发布和应用文件的活动。随着知识经济时代的到来,知识管理的重要性和复杂性不断增加,如何有效地促进不同行业和部门之间的知识共享成为知识管理的核心主题和目标。知识管理的目
24、标在于实现知识的共享和创新,因为只有通过共享,知识才能不断创新,产生更大的价值。在知识共享的过程中,知识体系向着标准化的方向发展。标准化在知识管理中具有重要作用。知识图谱是一种将知识以图形结构的形式进行建模和表示的方法。它通过连接不同的知识元素,形成一个网络,使得知识之间的关系和联系得以清晰展现。通过标准化的方法,可以对知识图谱中的知识进行统一的表示、分类和交互,从而实现不同行业、不同部门之间的知识互联互通。标准化可以确保知识的一致性和可共享性。通过制定统一的标准,不同的组织和个体可以使用相同的语义和结构来表示和交流知识。这样,知识图谱中的知识可以在不同系统和平台之间无缝地共享和集成,避免了信
25、息孤岛和数据隔离的问题。此外,标准化还有助于推动知识创新和发现。通过建立共享的知识标准,不同行业和部门之间可以更加便捷地发现和利用彼此的知识,促进知识的交叉融合和创新。标准化还可以促进知识的持续更新和演化,使得知识体系能够与时俱进,适应不断变化的环境。第 一 章 知 识 图 谱 互 联 互 通 的 背 景第 一 章 知 识 图 谱 互 联 互 通 的 背 景6因此,通过知识图谱的标准化互联互通,可以实现知识共享、知识创新和知识持续发展。这将为组织和行业带来更高效的知识管理和创新能力,推动知识经济的持续发展。为了实现知识互联互通和广泛共享,需要通过制定和遵守统一的标准,使不同组织和部门之间的知识
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 知识 图谱 互通 白皮书
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【Stan****Shan】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【Stan****Shan】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。