本体在村级数据资源共享中的应用.pdf
《本体在村级数据资源共享中的应用.pdf》由会员分享,可在线阅读,更多相关《本体在村级数据资源共享中的应用.pdf(6页珍藏版)》请在咨信网上搜索。
1、引用本文格式薛晓娟,邸小康,王剑,等本体在村级数据资源共享中的应用 J农业工程,2023,13(7):29-34 DOI:10.19998/ki.2095-1795.2023.07.005 XUE Xiaojuan,DI Xiaokang,WANG Jian,et alApplication of ontology in village-level data resource sharingJAgricultural Engineering,2023,13(7):29-34本体在村级数据资源共享中的应用薛晓娟,邸小康,王剑,王晓丽,王淼,程旭,唐朝,王彩虹(北京市数字农业农村促进中心,北京 1
2、00101)摘要:针对多源、异构农业农村数据资源难以有效相互理解和共享利用的问题,提出了一种基于本体论的数据组织方法。从村级数据资源组织和共享的角度出发,探讨构建所需本体的方法路径。基于案例试验,阐述了如何将本体应用于村级数据资源的组织、共享,以及将基于规则的本体推理应用于村级数据资源开发利用,最后提出了本体在农业农村数据资源管理、共享、挖掘中的应用场景展望。关键词:本体;村级数据资源;数据共享;本体推理中图分类号:S126文献标识码:A文章编号:2095-1795(2023)07-0029-06DOI:10.19998/ki.2095-1795.2023.07.005Application
3、of Ontology in Village-level Data Resource SharingXUE Xiaojuan,DI Xiaokang,WANG Jian,WANG Xiaoli,WANG Miao,CHENG Xu,TANG Chao,WANG Caihong(Beijing Digital Agriculture Rural Promotion Center,Beijing 100101,China)Abstract:Aiming at effectively understanding,sharing and utilizing multi-source and heter
4、ogeneous agricultural and rural data re-sources,a data organization method was proposed based on ontologyFrom perspective of organizing and sharing village-level data re-sources,method path for constructing required ontology was exploredBased on case experiments,how to apply ontology to organiza-tio
5、n and sharing of village level data resources,as well as how to apply rule-based ontology reasoning to development and utilization ofvillage level data resources was elaboratedFinally,it proposed an application scenario outlook for ontology in management,sharing,and mining of agricultural and rural
6、data resourcesKeywords:ontology,village-level data resource,data sharing,ontology-based reasoning 0引言随着信息技术在农业农村经济社会发展中的应用推进,农业农村数据资源整合共享的重要性日益显现。数字乡村发展战略纲要数字农业农村发展规划(20192025 年)等文件均指出,要推进数据融合、挖掘与应用,推动农业农村基础数据整合共享。未来越来越多的多源、异构的数据汇聚后,如何有效地理解、组织和应用,是当前面临的一个难题。本研究应用计算机科学领域的本体论探讨解决方案。本体是共享概念模型的明确形式化规范说明
7、,是用人和计算机都可以识别的术语及关系描述某一领域内的实体、概念、属性,以及概念实体之间的相互关系1。通过本体形式化、规范化的表示,不同的数据设计者和使用者可以对数据的表达和使用方式达成共识,实现知识融合和数据融合。WACHE H 等2提出了利用本体将不同异构的数据源中的数据/信息有效整合。这种方法在生物信息学和生物医药学领域已得到大量的实践,在大数据整合与复用的过程中发挥着日益重要的作用3。另外,在交通异构数据集成、政务异构数据集成等领域也有相关研究4-5。在农业领域,联合国粮农组织(FAO)自 2001 年开始建设农业本体论服务(AOS)项目,在多语种农业叙词表的基础上构建农业本体。本体在
8、农业信息分类、信息库和知识库构建、智能搜索引擎研发及信息协同服务等方面具有广泛的应用前景6。已开展的研究主要应用在农业科研文献检索、农业生产知识服务系统、农业知识库构建7-11。收稿日期:2023-03-03修回日期:2023-06-15作者简介:薛晓娟,高级工程师,主要从事农业信息化研究E-mail:邸小康,通信作者,工程师,主要从事农业信息化、农村创新创业及社会化服务体系有关数据监测、分析研究E-mail:第 13 卷 第 7 期农业工程Vol.13No.72023 年 7 月AGRICULTURAL ENGINEERINGJul.2023本体在数据融合、共享、检索和分析等方面具有重要的应
9、用价值。本研究将本体论应用于村级数据资源的组织、共享和利用,通过行政村本体的案例试验,探讨构建所需本体的方法路径,提出基于本体的村级数据资源整合方法,以及基于本体推理进行数据利用和知识共享。1领域本体构建方法以斯坦福大学提出的七步法为指导,结合领域本体构建案例所采用的具体方法,以行政村本体为例,探讨构建村级数据资源整合共享所需本体的方法。1.1确定本体专业领域和范畴 1.1.1构建本体目标以行政村本体为例,是对行政村数据资源的模式提练,服务于农村政务部门对村级数据资源的组织和管理,应用于各方面村级数据资源的整合和共享。1.1.2本体所要覆盖的领域范畴从根本上来说,本体构建是一个从客观世界信息世
10、界计算机世界的映射过程。其构建的根本原则即,本体是关于真实世界中的现实模型,本体中的概念需要反映这些现实。行政村是依据中华人民共和国村民委员会组织法设立的村民委员会进行村民自治的管理范围,是我国基层群众性自治单位。因此,行政村本体应是描述行政村及其管理范围内的各类管理对象的特征和内在逻辑关系的模型,其范畴是行政村本级及其基本属性,和行政村空间内的人、地、财、物、事等方面中市级政务部门关注的实体,以及它们之间的关系。1.1.3本体中信息所要解答的问题本研究的行政村本体,是要探讨在计算机世界中如何描述行政村及其空间内的事物,支撑从数据层对行政村各方面特征的刻画。1.2考查复用现有本体的可能性在领域
11、本体方面,已有的研究多是农业领域的,并且构建的本体未在网络空间共享。在可能转化为本体的资源(如已有文献多采用的主题词表、斜词表等)方面,目前搜集到的可利用的是北京市地方标准农村基础信息数据元系列(DB11 T 699.162010),该标准对农村基础信息数据单元 12 项属性的定义详尽,包括定义、语境、数据类型和同义名称等,但缺乏关系的描述,可作为主要的术语提取来源。综上所述,未找到可直接复用的本体。1.3列出本体中的重要术语按照七步法,本体构建的第 3 步是要列出一个想要阐述的术语清单,并明确具体要讨论哪些术语。在以往国内的研究中主要的术语来源是叙词表、主题词表。关于行政村目前尚未找到可用的
12、叙词表或主题词表。而本研究要满足的是农村政务数据资源管理的需要,因此进一步考虑从政策文件、信息资源分类体系、相关数据标准或统计数据中提取。资源分类体系方面目前农村领域仍没有权威的论述,政务信息资源目录体系(国标)中仅有城乡建设、农业两个相关主题。数据标准方面目前较全面和权威的是北京市地方标准农村基础信息数据元,包括个人基础信息、组织基础信息、经济基础信息、社会基础信息和自然资源基础信息。因此,最终采用的提取术语的来源包括:北京市地方标准农村基础信息数据元、北京市农业农村局的机构职能及发文、北京农村年鉴、中国农村统计年鉴及第三次全国农业普查中行政村普查指标。1.4定义类和类的等级体系采用自顶向下
13、的方法定义类的等级体系,从上述查阅得到的术语清单中,首先按照客观性原则,对照客观事物初步提取关键类,包括行政村、农村人员、基层组织、农业经营主体、农村资源、农村基础设施和农村经济,其次定义这些关键类之间的关系,如行政村管理农村人员、基层组织和农业经营主体位于行政村、行政村拥有村集体资源和农村基础设施、行政村产生农村经济。形成的核心概念模型如图 1 所示。图 1核心概念模型Fig.1 Core concept model scheme 在核心概念模型的基础上将清单中的术语进行层次整理,填充到概念体系中。如自然资源、人文历史资源是农村资源的子类,土地资源、土壤资源、林木资源、农村能源和气候资源等是
14、自然资源的子类,特色人文活动、特色建筑与遗址遗迹、特色特产与工艺是人文历史资源的子类,农村生活性基础设施和农村社会发展基础设施等是农村基础设施的子类,公厕、户厕、太阳能浴室、污水处理站、供水站、街坊路、照明灯杆和照明灯具等是农村生活性基础设施的子类,农村义务教育、农村卫生、农村文化基础设施等是农村社会发展基础设施的子类等。30 农业工程信息与电气化 1.5定义类属性由于村级数据资源的覆盖面较广,需要根据实际的需求展开,因此仅以行政村本身的属性为例进行定义,包括统计用区划代码、常住户数、常住人口、户籍户数、户籍人口、劳动力人口、村域面积、地理位置、地形地貌、政策称号(全国特色景观旅游名村、中国传
15、统村落、北京最美乡村等)及村庄类型(集聚提升类村庄、城郊整合类村庄、特色保护类村庄、搬迁撤并类村庄等)等。在实际应用中,可以根据需要对类的属性进行扩展。1.6定义属性限制即定义属性的值类型(字符型、数字型、布尔型、枚举型)和值域。如统计用区划代码是字符型,只能有唯一值,政策称号可以有多个字符型的子属性等。最终定义的行政村属性及其限制如图 2 所示。图 2属性及其限制Fig.2 Object properties and restrictions scheme 1.7创建实例建立概念层模型后,可以创建相应的实例,图 3为一个简单的实例及实例层与概念层关系的展示。从实例层来看行政村本体的实例化是关
16、于每个行政村的知识图谱。2基于本体的村级数据资源共享应用围绕如何将上述构建的行政村本体应用于村级数据资源整合共享进行探讨,从方法论和案例说明两个维度展开,一是整体阐述基于本体的村级数据资源整合的方法,二是以美丽休闲乡村创建相关数据为例具体说明如何应用本体进行数据整合和共享,以及如何通过基于规则的本体推理进一步应用数据整合成果得到新的知识和实现知识共享。2.1基于本体的村级数据资源整合共享方法基于本体的数据整合是通过建立数据源到本体的映射关系及不同本体之间的集成或映射来建立数据源间的统一语义关联。一般有 3 种方式:一是基于单本体的整合,二是基于多本体的整合,三是基于全局局部本体的整合。抽取各个
17、数据源之间的共同知识建立一个全局顶层本体,各数据源可以拥有自己的本体,称为局部本体,局部本体可以在全局本体的基础上根据自己的需要扩充,只需要建立局部本体与全局本体之间的映射,实现本体之间的互操作。鉴于村级数据资源来自多个系统或其他来源,覆盖面广,同时为确保局部本体之间的互操作,本研究认为村级数据整合宜采用全局局部本体的方式。主要环节包括村情全局本体构建、数据映射和局部本体构建、本体映射和实例融合。2.1.1村情全局本体构建所构建的行政村本体旨在应用于村级数据资源整合共享,正是这里所指的村情全局本体,其中定义了行政村与各类反映村情的要素之间的关系,不同的数据源可以对应到不同的村情要素,不同的要素
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 本体 级数 资源共享 中的 应用
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。