政策文本研究:从内容计算到功能理解.pdf
《政策文本研究:从内容计算到功能理解.pdf》由会员分享,可在线阅读,更多相关《政策文本研究:从内容计算到功能理解.pdf(8页珍藏版)》请在咨信网上搜索。
1、1452023年第4期/第40卷/总第214期政策文本研究:从内容计算到功能理解A Review on Policy Text Research:From Content Computation to Function Comprehension胡吉明1,2,3HU Jiming(1.武汉大学信息管理学院,武汉,430072;2.武汉大学信息资源研究中心,武汉,430072;3.武汉大学大数据研究院,武汉,430072/1.School of Information Management,Wuhan University,Wuhan 430072;2.Center for Studies of
2、 Information Resources,Wuhan University,Wuhan,430072;3.Big Data Research Institute of Wuhan University,Wuhan,430072)摘要:目的/意义 从内容挖掘的角度总结与提炼政策文本研究的主题与方向,把握政策文本研究趋势并推动创新。研究设计/方法 主要以国内外研究论文为分析对象,采用系统性综述方法阐释政策文本领域的研究进展,经评析后展望其后续发展重点。结论/发现 在多学科融合的政策量化与信息学研究推动下,政策文本研究的计算科学体系逐渐形成,在大数据、深度学习、人工智能等支撑下,政策文本计算和语
3、义挖掘研究不断深入,进一步延伸至其文本功能理解和推理等方向,体现出理论、方法和技术多层面支撑的研究体系,其内在逻辑和社会应用的研究将得到加强。创新/价值 梳理和归纳了文本内容层面的政策研究,指出了当前政策文本研究的主题以及未来的发展方向,进一步丰富了政策研究的理论与实践体系。关键词:政策文本;政策信息学;内容计算;语义挖掘;功能理解中图分类号:G250DOI:10.13366/j.dik.2023.04.145引用本文:胡吉明.政策文本研究:从内容计算到功能理解 J.图书情报知识,2023,40(4):145-152.(Hu Jiming.A Review on Policy Text Res
4、earch:From Content Computation to Function ComprehensionJ.Documentation,Information&Knowledge,2023,40(4):145-152.)Abstract:Purpose/Significance The purpose of this paper is to systematically summarize and refine the research themes and directions of policy text from the perspective of content mining
5、.It will benefit to grasp trend and promote innovation of policy text research.Design/Methodology Taking domestic and foreign research articles as samples,a systematic review was conducted to elaborate the research advances of policy texts,and the key points of follow-up development were looked forw
6、ard on the basis of the assessment.Findings/Conclusion Driven by the research on policy quantification and informatics based on multidisciplinary integration,the computational science system of policy text research has gradually developed.Meanwhile,with the support of big data,deep learning and arti
7、ficial intelligence,research on computing and sematic mining of policy text has been continuously deepened.And the research on text function comprehension and inference also rises further and has received more attention.The research system of policy text is supported on multiple levels by theory,met
8、hodology and technology.Research on its internal logic and social application will be strengthened.Originality/Value This paper summaries the advance of policy research on the level of text content and reveals the current themes and development directions of policy development directions.This will f
9、urther enrich the theoretical and practical system of policy research.Keywords:Policy text;Policy informatics;Content computation;Semantic mining;Function comprehension 基金项目 本文系湖北省青年拔尖人才培养计划项目“文本智能计算与政务精准服务”(20211011)的研究成果之一。(This is an outcome of the project Text Intelligent Computing and Governanc
10、e Accurate Service(20211011)supported by a grant from the Young Top-notch Talent Cultivation Program of Hubei Province.)通讯作者 胡吉明(ORCID:0000-0001-6491-1995),博士,教授,研究方向:文本智能计算与政务信息学,Email:。(Correspondence should be addressed to HU Jiming,Email:,ORCID:0000-0001-6491-1995)在政府政务数字化和智能化转型的推动下,挖掘与利用政务信息资源,
11、支撑政府科学决策成为研究热点。作为政务信息资源的重要形式政策,因其在我国行政机关开展各类政务活动中具有特殊作用,既传达贯彻了国家的方针、决议等,也真实反映了政府处理公共事务的意图和行为印迹,以及国家或地区在一定历史时期内政治、经济、文化和社会发展等状况,已成为政府、学界等关注的重要研究对象。从结构与作用上看,政策是多要素组成的有机系统,包括政策依据、主体、客体、工具等;多要素间因功能需要的相互作用而共同支撑了政策的全过程,体现为科学化和规律化的政策运作机理。从具体存在形式上看,政策是记述政策意图和政策过程的客观凭证和记录文献,既包括国家和地区各级权力或行政机关以文件形式颁布的法律、法规、部门规
12、章等官方文献,也包括政策制定者或政治领导人在政策制定过程中形成的研究、咨询、听证或决议等公文档案,甚至包括政策活动过程中因辩论、演说、报道、评论等形成的舆情文本。因此,作为蕴含政策要素特征和作用机理的载体,政策文本反映了政府执政和治理的逻辑和行为,是追溯和观察政策过程的重要途径之一。而政策文本具有结构化特征鲜明、信息密度大且内涵主旨分布不均衡政策文本研究从内容计算到功能理解A Review on Policy Text Research:From Content Computation to Function Comprehension146的特点,深层次的内容语义理解与挖掘一直是研究者关注的
13、关键问题。在研究发展中,政策文本研究表现出了多学科、多领域集成化和融合性的典型特征,既具有情报学或信息学研究的一般规律,也体现了政府这一社会领域以及政治学、公共管理与公共政策等学科范畴的独有特征。基于此,本文以政策内容挖掘与价值作用发挥的研究脉络为主线,从学科融合的基础性研究、深层次语义挖掘、功能理解与推理三个层面,系统梳理政策文本研究的主要成果,进一步探讨政策文本研究未来发展的重点方向。1 多学科融合的政策文本量化与信息学研究学术界持续推进了政策文本分析的理论、方法及技术手段的跨学科融合探索,涉及情报学、语言学、信息科学、计算机科学、公共管理学、政治学等,形成了基于文本的政策量化和政策信息学
14、的研究体系。1.1政策文本量化研究政策文本量化研究是将非结构化政策文本转换成抽象化、特征化的计算机可处理的结构化数据,利用数学模型进行分析,极大降低了大样本量政策文本研究的人力成本,提高了结果的可复制性。从研究范围看,政策文本量化是政策研究、计算机科学等领域交叉融合产生的新领域;从研究方法看,政策文本量化是从计算机科学、文献计量学到政策科学的多领域方法迁移。2015年,黄萃等较早使用了“政策文献量化”这一词汇,认为是公共政策研究的新方向1,并正式提出“政策文献计量”(policiometrics)的概念2。它以政策文本为研究对象,借助文献计量、社会网络分析以及可视化技术,对大规模政策文本的内容
15、属性和外部属性进行量化分析,揭示政策文本中所反映的要素特征3。当前学者应用政策量化方法主要针对以下问题进行研究:政策分布特征,包括时间分布、效力级别分布、文种分布4;政策工具的选择和运用5、组合与效果以及评估政策实施绩效6;政策的目标意图与影响,利益的分配和博弈过程7;政策嬗变的内在逻辑和历史规律8,政策主题的演化与变迁9;政策主体的行为与关系10、合作模式;政策体系的结构与演进11,等等。政策量化在研究方法上属于描述性推论,即利用显性的观察值来推导隐性的、难以直接观察到的结论,帮助政策研究者和制定者获得客观、可重现、可验证的研究结果,在宏观层面上揭示政策演进规律,明确政策影响范围和把握政策发
16、展趋势。未来,政策量化的分析单元将从文献数据转向更为细粒度的知识单元,更加注重政策执行层面的文本量化计算12。1.2政策信息学研究2020年,我国国家自然科学基金委员会在北京成功举办了以“政策信息学与政策智能”为主题的第260期双清论坛,指出作为国际前沿交叉领域,政策信息学愈来愈受到重视,发展潜力大。在传统的政策制定和实施中,经验直觉、小规模沟通和有限民意调查是其常用手段,难以克服信息的不完整和滞后、政策刚性诉求的交互不畅等问题13。信息技术特别是大数据技术的发展14,深刻影响着政府决策过程15;同时信息科学与政策科学的融合,催生了政策信息学这一新兴学科16。政策信息学是在政策制定过程中,充分
17、利用相关的海量信息,以期更好地解决复杂的政府治理问题,推动治理流程和制度创新17。国内学者认为,从概念继承和发展的角度看,政策议题日趋复杂,政策相关数据的规模逐渐从小样本扩展到大数据,政策分析也逐渐从传统的政策量化转变为政策计量,再转变到政策信息学18。政策信息学主要围绕海量多源异构数据,通过使用机器学习、大数据、知识图谱等前沿技术19,提供政策过程分析服务和支撑政府基于充分信息的决策20。目前政策信息学研究主要集中于以下方面,即政策大数据的基础分析方法、特定政策场景的知识发现、政策决策模式与决策过程的重构策略21、政策选择模拟与决策效果评估,重点包括政策变迁和演化规律22、政策府际关系和政策
18、博弈23、政策研究和科学研究间的关系24、政策分布态势及注意力分配25等,为政策的制定、调整以及完善提供重要的理论支撑和决策依据26。2 大数据推动下的政策文本计算与挖掘研究当前,社会科学计算研究理念的推广与现实应用,情报信息与共享/Intelligence,Information and Sharing1472023年第4期/第40卷/总第214期推动了政策研究领域中的数据分析和计算思维发展。政策研究中的大数据技术应用已成为学者的普遍共识27,特别是自然语言处理、人工智能、知识挖掘与可视化等技术的发展,使大样本、细粒度的政策文本计算成为可能28。如何从已发布的政策文本数据中快速提取重点内容,
19、挖掘文本中的潜在知识资源,用大数据思维和方法推动政府决策与服务水平的整体提升,是当前政策研究的重要方向29。2.1政策文本计算研究政策文本计算在政策研究领域占有重要地位,主要运用自然语言处理的基本理论与方法30,挖掘海量政策文本并计算分析;主张采用语篇编码、概念与词语的映射关系,分析内容中的词、语句、段落以及篇章,进行政策概念的自动识别和处理,从而映射出政策概念主题、政策义素等显性政策内涵,最终构建从政策文本到政策语义的自动解析框架31。政策文本计算是大规模体系化的政策文本语义分析方法,挖掘蕴含在政策交流系统中的语义与价值情感,以此获知和解读政策主题、政策热点、政策立场、意识形态、政策倾向、政
20、策价值、政策情感、政策态度等深层次政策内涵32。相对于政策文本量化分析,政策文本计算在一系列大数据分析模型和方法的支撑下,分析规模和精度都大幅提升,也避免了主观判断带来的偏差,弥补了现有政策量化研究的不足33。当前政策文本计算研究主要集中于政策文本语料库和政策文本数据挖掘两个方向。首先,政策语料库以及语料库语言分析是政策文本计算分析的基础34,跨语料分析和实时语料分析能够从多类型且复杂的政策文本中发现政策驱动问题35,提升政策预测的时效性和精准度36。其次,政策文本数据挖掘注重在大量文本数据集合中发现分类或聚类特征、关联知识或规则,并注重深层潜在语义的知识发现,以此分析政策行为37、政治领导人
21、的政策情感倾向38、公众政策意见39和评估政策结果40。2.2政策文本语义挖掘研究传统思辨性和量化的政策文本研究方法具有局限性,对政策文本语义挖掘的研究欠缺,以及政策文本多源异构、关联分析缺失等问题,制约了政策资源的智能化处理和知识关联。政策文本挖掘的研究方式源于文献解读,即在思辨的基础之上结合学者的专业素养和政策领悟,通过分析政策文本的谋篇布局以及修辞和表述方式41,探测出政治立场,并基于此进行深度解读或政治变迁的预测与估量42。但是,定性的、思辨形式的文本解读具有研究的模糊性和经验主义,无法满足政策分析理性和科学的诉求。因此,学者在政策文本分析的深度方面不断探索,从基于政策文本外部结构属性
22、的分析逐步深入到对文本内部语义特征的挖掘。政策文本中单词、符号、主题以及意义独立的词组、句子或段落43,反映了政策语义与政策文本内容之间的关系,是可结构化的重要元素分析单元44,学者们从单个词到自然段落再到单篇文档,再从单篇文档到整个政策文本语料库,对政策文本进行了多粒度、多层次的挖掘研究45。当前研究主要融合语句分析、政策构件提取方法,基于多维聚类、主题模型46、神经网络模型47进行政策文本细粒度分析,识别政策文本中各个组成部分的语义重要性和主题贡献度,将现实事件与主题变化相对应48,揭示政策的部署重点,剖析政策实施过程及政策与实践存在的脱节问题49。更进一步,相关研究将文本分解成可处理的基
23、本单元,通过词嵌入或词向量,利用字符级和词级卷积神经网络模型(CNN)以及结合Doc2Vec50,融合自注意力机制(Self-Attention)和双向长短期记忆模型(BiLSTM),利用Word2vec结合TextCNN模型,计算政策文本向量相似度等51,有效实现了政策主要内容提取52、政策文本自动分类53、政策实体间关系挖掘54、观点意图提取55和政党立场识别56。3 基于深度学习的政策文本功能理解与推理研究政策文本的逻辑结构性较强,对其分析是深层次理解政策主旨思想乃至政府运作机理的重要途径。进一步,基于大规模政策文本挖掘的关联知识和规则发现,能够揭示深层次的政策语义内涵和运作机理,有助于
24、政策优化与辅助决策。3.1政策文本的结构功能与理解研究众所周知,不同领域或类型的文本具有不同的语言组织方式和组织层次57,如以时空、问题或因果为政策文本研究从内容计算到功能理解A Review on Policy Text Research:From Content Computation to Function Comprehension148序,按总分、并列和递进层次58,这都表现了文本思想内容的次序结构及其逻辑关系59,也表达了特定的功能60。但文本内容因在主旨分布上是不均衡的61,每一个部分(如章节)所反映的功能逻辑具有特定性和差异62。通过分析标题、章节、段落63、句子、词汇和它们的
25、关系64,以及句子内容的上下文特征65,实现从文本物理结构到逻辑结构的识别66,对改进文本自动摘要67、文本检索及文本过滤与推荐具有重要作用68。目前基于深度学习方法69,如CNN和RNN70、BERT与层次Attention71、BiLSTM和CRF72,能够在整体上提升结构功能的识别效果73。政策文本的结构化程度往往较高,具有较强的规范性和严密的内部逻辑结构,其形式特征包括发文主体、发文时间、文件标题、文件主题词、文件参照关系等。通过对上述特征的分析,研究者可以挖掘丰富的政府管理与政府政策规律74。其次,政策文本的语词、句法依存及段落内容结构具有相对独立的意义或内涵75,且之间相互作用而构
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 政策 文本 研究 内容 计算 功能 理解
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。