突发公共卫生事件中的应急政策知识图谱.pdf
《突发公共卫生事件中的应急政策知识图谱.pdf》由会员分享,可在线阅读,更多相关《突发公共卫生事件中的应急政策知识图谱.pdf(11页珍藏版)》请在咨信网上搜索。
1、第 22卷 第 9期2023年 9月Vol.22 No.9Sept.2023软 件 导 刊Software Guide突发公共卫生事件中的应急政策知识图谱管雨涵1,刘勘2(1.华中科技大学 管理学院,湖北 武汉 430074;2.中南财经政法大学 信息与安全工程学院,湖北 武汉 430073)摘要:构建面向突发公共卫生事件的政府应急管理政策知识图谱,利用知识互联及可视化优势,分析梳理各管理部门的应急政策发布、传递及部署措施,建立多元输入协调联动机制,提高突发公共卫生事件的应急治理效率。以新冠疫情为例,通过本体模式构建、BiLSTM+CNN-CRF算法进行实体关系抽取、数据填充,基于规则和表示进
2、行知识推理,以及基于Neo4j进行可视化图谱构建。对图谱的抽检结果表明,图谱构建质量良好,推理情况均符合逻辑。基于该图谱,可以构建出信息传递网络,改进突发公共卫生事件中政策信息传递混乱无序、政策措施缺少关联、政策发布部门缺少协调等常见问题,提供应急管理政策制定、发布与流转的快速应急通道,为克服特殊时期应急管理的不足带来新的途径。关键词:突发公共卫生事件;知识图谱;应急管理;可视化图谱构建DOI:10.11907/rjdk.221983开 放 科 学(资 源 服 务)标 识 码(OSID):中图分类号:TP391 文献标识码:A文章编号:1672-7800(2023)009-0113-11Kno
3、wledge Graph of Government s Management Policies in Public Health EmergenciesGUAN Yuhan1,LIU Kan2(1.School of Management,Huazhong University of Science and Technology,Wuhan 430074,China;2.School of Information and Security Engineering,Zhongnan University of Economics and Law,Wuhan 430073,China)Abstr
4、act:This paper takes the advantage of knowledge interconnection and visualization to construct a knowledge graph of the government s emergency management of public health emergencies.It combed the emergency policies transmission and deployment measures of various management departments,established a
5、 multi-input coordination and linkage mechanism to improve the governance efficiency of public health emergencies.The policies on COVID-19 were taken as examples,a huge knowledge database of emergency management policy was constructed through the process of ontology modeling,BiLSTM+CNN-CRF algorithm
6、 for entity relationship extraction,knowledge reasoning based on rules and representations,and neo4j for graph s visualization,etc.Its proved to have a great quality by sampling results of the graph.In this way a visual information transmission network is presented,which improves the status quo of t
7、he lack of relevance of common policies and disorderly information transmission in public health emergencies.It creates a fast emergency response channel for the formulation,release,and circulation of emergency management policies,and overcomes the shortcomings of emergency management in special per
8、iods.Key Words:public health emergencies;knowledge graph;emergency management;visualization graph construction0 引言突发公共卫生事件多指有扩散趋势、严重危害公众安全的突发性重大传染疾病等,这类事件影响力大、危害程度高、涉及范围广,将严重危害经济发展、人民健康及社会安定1。面对突发公共卫生事件,需要依据国家政策快速制定和部署综合性的应急管理方案,及时响应和解决可能出现的各类突发问题。2020年初期,新冠疫情暴发,国务院及各地政府不断发布各项应对政策和通告,指导各级部门采取相应措施;后疫
9、情时期,在大多数国家选择与“病毒共存”的趋势下,中国仍坚持“动态清零”,总体应急管理取得显著成效。不可忽视的是,疫情初期由于信息输入渠道单一、跨域部门收稿日期:2022-08-21基金项目:国家自然科学基金项目(72174156);中央高校基本科研业务费专项资金项目(2722021EK016)作者简介:管雨涵(1999-),女,华中科技大学管理学院硕士研究生,研究方向为知识工程、优化理论;刘勘(1970-),男,博士,CCF会员,中南财经政法大学信息与安全工程学院教授,研究方向为机器学习、知识工程、社交网络。本文通讯作者:刘勘。2023 年软 件 导 刊协调薄弱等原因,导致“信息疫情”暴发,政
10、策发布落后于谣言传播,群众陷入恐慌状态,各种“信息孤岛”也导致后续应对策略发布迟缓,疫情管控和应急处理处于弱势地位。此外,由于政府应急管理实行分级条块管理模式,应急中心分散,地方决策参与和风险分担机制不足,部门间尤其是横向部门间协调能力低,合作机制运行不畅,导致部分处理政策出现程序不明确、多头同质化处理、权责混乱的情况,极大降低了政府应急管理效率2。基于此,本文以新冠疫情治理为例,构建突发公共卫生事件应急政策知识图谱。知识图谱及其实体、关系的多层次性能较好地匹配应急政策中的多主体、多主题、多对象,因此,考虑将知识图谱运用于政府应急政策。应急政策知识图谱能通过多元的输入信息、综合的共享信息,帮助
11、政策快速传播流转,构建跨部门的应急联防联控机制网络;同时,通过在图谱中对防控政策进行归纳、分类,形成应急政策知识深度关联,更好地聚焦应急政策核心,辅助中央地方联合响应、共同决策,改进应急政策部署和执行效率。本文主要贡献在于:构建应急管理知识图谱的Schema模式框架;利用深度学习和文本处理技术,形成SPO(Subject To Object)政策三元组知识结构,进而通过推理发现政策信息传递流向,构建突发公共卫生事件管理政策知识图谱;对应急政策通过知识图谱结构化、规范化,建立基本应急政策知识库,实现专业应急部门的快速查询、更新及可视化分析,并为突发公共卫生事件的应急管理提供方案生成、自动推荐等决
12、策支持。1 相关工作知识图谱可以被看作是一种特殊的语义网络,形成一种以信息为节点、关系为边的有向图,它能将数据凝练整合形成智能型知识库,清楚呈现每一条知识的全息结构,同时利用推理机制发现数据关系及其逻辑关联。知识图谱的研究主要从理论与应用两个方面展开。理论研究主要探讨知识抽取、知识融合、知识推理等构建方法中的关键步骤3。在知识图谱构建上,Hogan等4详细介绍了知识图谱的完整构建过程与构建方法。随着机器学习领域的发展,越来越多的技术被运用在了知识图谱构建中,刘峤等5介绍了一些最新的知识抽取、融合、加工技术。在知识抽取方面,目前多采用依存句法分析6、深度强化模型7等方法进行实体与关系识别;将知识
13、通过 Trans 模型8进行表示,再通过基于逻辑规则、深度学习和强化模型9的方式进行实体关系的发现与推理;对于构建完成的知识图谱,则多采用Neo4j或Gephi数据库进行可视化5,或直接使用CiteSpace软件构建整体关系知识图谱。应用研究则可以分为通用知识图谱和领域知识图谱应用。其中,通用知识图谱的构建已经较为成熟,目前典型的通用知识图谱包括国外的 YAGO、DBpedia、Freebase和国内的zhishi.me、CNDBpedia和OpenKG等项目,包括谷歌、百度、搜狗在内等企业都构建了基于知识图谱的搜索引擎,如谷歌搜索引擎、搜狗知立方等10。这些知识图谱,将无规则语言转化为高度结
14、构化可用知识并用于深度搜索和知识问答,有效地提高了网络检索的效率与质量。近年来,领域知识图谱应用越来越多,针对2020年初暴发的新冠肺炎疫情,研究人员构建了病毒传播知识图谱11、医疗用药知识图谱12。国内 OpenKG 平台14则建立了新冠知识图谱专题,包含病毒科研知识、临床方案、防控常识等14。这些知识图谱在疫情传播控制15、疫情舆论引导16、风险防范管理17等方面发挥了重要作用。关于应急管理图谱,李纲等18关注重大国家安全事件构建图谱,全面监控掌知全局安全动态。张海涛等19-20以新冠疫情和大旱事件为例构建事件图谱,探究国家安全事件图谱的态势状态提取方法。正是由于图谱的强关联性,能较好地着
15、重于事件发生状况和发展状态,与政策文本处于发展传递状态相匹配,故而考虑构建政策知识图谱。此外,由于政策的格式规整性,知识图谱对于政策文件有较好应用。Wang等21基于规则和机器学习抽取实体关系,构建政策图谱分析平台。韩娜等22聚焦于“开放数据”和“数据安全”主题,利用规则关联和定量分析对政策文本进行协同性语义推理。张雨等23构建科技垂直领域知识图谱,更好发挥科技政策引领科技发展。单晓红等24构建政策影响事理图谱,找出关键节点有效进行政策管控。霍朝光等25利用TF-IDF和强化字典构建新冠肺炎政策知识图谱,归档重大突发公共卫生事件处理方案,追溯政策法律渊源。目前政策图谱多聚焦于政策计量,集中于关
16、联分析和归档处理,多采用人工或简单规则方式26,灵活性与完整性较差;而知识图谱构建方面少有聚焦于重大突发公共卫生突发事件,且未有完整的可以重复利用的应急管理框架以供未来参考和回溯。在应急管理方面,尽管目前新冠疫情在国内得到了良好的控制,但是不可忽视疫情初期的无序状态。丁荣嵘等27提出当前政府应急管理效率低下,需要建立一个统一的应急管理体系标准,健全协同管理体系,对政策信息智能分类、简化归口、直达直报。杨雯等28认为疫情期间政策发布制度不完善,逐级政策发布导致跨域部门沟通不充分,建议应建立应急治理中心指挥枢纽,加强行政系统内部合作,共享信息协调多部门联合调动。王媛29强调对于突发公共卫生事件,政
17、府应急管理缺乏内部主动性,过度依赖上级决策,同时应急预案制定沟通不充分,跨区域协调困难,提出中央和地方、多地方、多机构、多部门合作平台的亟需性。基于此,本文聚焦于上述问题,利用知识图谱在构造和应用上的独有特征,构建突发公共卫生事件中应急政策知识图谱。114第 9 期管雨涵,刘勘:突发公共卫生事件中的应急政策知识图谱2 知识图谱构建2.1Schema构建在逻辑上,知识图谱分成两个层系:Schema本体模式层和 Data 数据层。其中,Schema 层是知识图谱构建的核心与重点,它定义了各类实体间以及实体属性间的关系,通常使用本体库进行管理。本体库相当于知识库的模型,良好的 Schema层次为知识
18、图谱的构建搭建了框架,这样形成的知识冗余少、泛化能力强,推理出的关系也更全面。而Data数据层由基本的事件、事实构成30,是知识的基本存储单位,一般情况下,使用SPO三元组形式来表达知识。华斌等31结合政策精准性四大要素,将政策分为主体、客体、目标、工具四大类。本文针对疫情应急管理知识图谱设计的 Schema本体则需要考虑两个因素:每则政策公文的结构层次体系;执行部门对政策的落实要求。政策数据实体关系如图 1 所示,包括部门、标题、内容、附件等。本文设计6种实体类型和9种属性类型,各类实体的定义与实体间的映射关系如表1、表2所示。政策文件的实体间关系较为简单,华斌等31将政策实体间关系主要分为
19、六类,张雨等23则分为四大类。根据构建的以上实体及属性,本文主要设计了6种关系类型,将实体之间连接起来,其关系映射如表3所示。这样,通过对实体、关系、属性的定义,将来源于国务院和各省政府政策文件库的半结构化数据和部分非结构化数据转换为知识图谱所需的结构化格式,通过实体间关系与属性,可以实现政策知识的统一表示,使分散的管理政策相互联系。2.2知识抽取知识抽取过程中可以将实体与关系分别抽取,也可以采用联合抽取模型,联合抽取能同时考虑实体与关系之间的联系,故而犯错较少。但由于本文实验中使用大量半结构化数据,可以通过简单的规则提取出部分实体与关系,因而采用实体与关系分开抽取的流水线模型。2.2.1实体
20、抽取本文采取基于 BiLSTM+CNN-CRF 的实体抽取32算法,先用NLPIR汉语工具33识别出主要实体,再用少量人工标注语料训练BiLSTM+CNN-CRF模型实现命名实体抽取,这样能在极大减少人工标注的基础上得到有效的实体识别效果。BiLSTM+CNN-CRF 模型由 CNN、BiLSTM 和 CRF 3 个模块组成。首先将输入文本通过Word2vec分布式嵌入方式将每个词处理为n维词向量;然后将处理好的词向量分别输入CNN模块,提取出文本的字符级特征,再输入BiLSTM模块,提取出全局特征,将得到的字符向量和词向量进行拼接,输入全连接层和CRF模块进行解码,利用已有标签,选取一个最优
21、的标记序列。只使用BiLSTM时,如果输入过长,会对较前的输入丢失较多的特征,因此引入CNN先输入文本的局部特征,减少信息丢失。同时,CRF相比于 Softmax可以更好地考虑标签间的影响与偏置,综合计算每个词X的得分s(X,y),得到实体标签的概率p(y|X),在训练过程中,使用对数似然最大化正确概率p(y|S),计算公式如式(1)所示,尽可能地优化标签序列如式(2)中的结果y*。实体2(通知大标题)实体3(通知主题)实体4(子部门对象)实体5(通知内容)实体6(附件)关系关系1 1发布关系关系2 2包含的主题关系关系3 3通知的对象关系关系4 4通知实体7(通知大标题)关系6 参考的通知实
22、体1(部门)关系关系5 5 附录 Fig.1Policy data entity relationships图1政策数据实体关系Table 1Knowledge graph entity types and examples表1知识图谱实体类型及样例实体类型DepartmentSubordinateTargetTopicAnnouncementContents中文含义部门主体(部门主体下)子部门小对象主题通知主体涉及细节内容样例教育部、财政部、交通运输部总务处、后勤处招生场所工作人员、考务人员考试组织管理2020年全国普通高校招生工作考试组织、物资管理Table 2Knowledge grap
23、h attribute types and examples表2知识图谱属性类型及样例属性类型create_datepublish_timesubjecttypefromauthoritynocontentsaccessory中文含义成文时间发布日期公文分类主题分类来源发文机关发文字号通知具体内容附件样例2020年3月31日2020年科技、教育、工业、交通、其他通知、公告海关总署网站教育部教电 2020 150号认真研判7月初疫情情况,制定疫情新冠肺炎疫情相关租金减让会计处理规定Table 3Knowledge graph entity relationships and examples表3
24、知识图谱实体关系及样例实体关系模型do_realse(发布)subtitle_of(包含)theme_of(主旨)notify_to(通知)include_of(属于)refer_to(参考)中文含义发布包含的内容属于的主题类别通知的对象从属的对象引用参考样例、1152023 年软 件 导 刊log(p(y|S)=s(X,y)-log(yYes(X,y)(1)y*=argmax(S(X,y)(2)BiLSTM+CNN-CRF模型进行实体抽取的算法如下:对政策文本进行序列标注的具体处理过程如图 2所示。2.2.2关系抽取关系抽取主要是为了得到应急管理政策公文、实施部门等实体间的关系。本文关系抽取
25、通过卷积神经网络CNN实现。将对政策信息实体抽取完成后得到的词向量和相对位置特征作为输入,加入到CNN中获得句子级向量表示,这个句向量通过非线性全连接层计算输出进行关系分类,通过上述模型训练得到实体间的关系。关系抽取流程如图3所示。2.3知识表示与推理在进行知识推理前,首先要通过实体链接和实体对齐等方法,统一实体名称、合并同义三元组,消除知识冗余。由于本文构建知识图谱源数据为政策类文件,格式较为工整,并无太多相似或冗余知识,通过定义一些简单的规则即可进行消歧,如将实体“新冠”“新型冠状”“COVID-19”看作是同一个实体,将“省政府”“省人民政府”看作同一对象等。数据经过人工检测已基本不存在
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 突发 公共卫生 事件 中的 应急 政策 知识 图谱
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。