基于文本挖掘的我国绿色金融政策研究.pdf
《基于文本挖掘的我国绿色金融政策研究.pdf》由会员分享,可在线阅读,更多相关《基于文本挖掘的我国绿色金融政策研究.pdf(8页珍藏版)》请在咨信网上搜索。
1、基于文本挖掘的我国绿色金融政策研究廖玉清(上海理工大学 管理学院,上海200093)摘要:以我国 20172019 年绿色金融相关政策为数据源,通过提取政策文件的文本行特征词和高频关键词,构建词云图、共现矩阵,采用高频词社会网络分析等方法,实现对这三年绿色金融相关政策内容信息的量化分析,从政策制定侧重点及政策内容上对文本进行总结。结果表明,我国 20172019 年绿色金融政策体现了政府对绿色金融企业机构激励机制及监管制度的完善,体现出这三年绿色金融发展的侧重点。关键词:绿色金融;文本内容挖掘;词云;共词分析中图分类号:C 939 文献标志码:A文章编号:1009 895X(2023)02 0
2、219 08DOI:10.13256/ki.jusst.sse.2023.02.017Chinese Green Finance Policy Research Based on Text MiningLIAO Yuqing(Business School,University of Shanghai for Science and Technology,Shanghai 200093,China)Abstract:With the relevant policies of green finance in China from 2017 to 2019 as the data source,
3、thequantitative analysis of the content information of green finance related policies is conducted by extractingthe text line feature words and high-frequency keywords in documents,constructing the word cloud map,co-occurrence matrix,high-frequency word social network,and summarizing the text from t
4、he policyformulation focus and policy content.The results show that during 2017-2019 Chinas policy of greenfinance improves the governments incentive mechanism and regulatory system for green financeenterprises and institutions,and reflects the focus of green finance development in the past three ye
5、ars.Keywords:green finance;text mining;word cloud;co-occurrence analysis 自改革开放以来,我国的经济得到迅速发展,经济实力排名跻身世界前列。但是,伴随我国经济的高速发展而来的是自然资源的大量开采以及生态环境的严重破坏。为应对气候变化并节约集约高效利用自然资源,我国开始探索绿色经济的发展道路。金融作为现代经济的核心,在社会资源配置中起着至关重要的作用。绿色金融能够引导资金从高耗能、高污染行业逐步退出,更多地流向绿色环保产业,是推动经济可持续发展和产业升级转型的有力保障1。绿色金融的实质是围绕绿色投融资、项目和风控开展的一揽子
6、金融产品、市场制度以及各种政府监管措施的统一有机结合体2。目前我国环境质量任务繁重,环保投资需求巨大,构建绿色金融体系正当其时3。通过对我国绿色金融相关政策及制度 收稿日期:2020 08 18作者简介:廖玉清,女,博士。研究方向:技术转移。E-mail: 第 45 卷第 2 期上 海 理 工 大 学 学 报(社会科学版)Vol.45No.22023 年 6 月Journal of University of Shanghai for Science and TechnologyJun.2023的梳理,可以看出我国已将绿色金融作为国家的战略目标,并通过出台各项政策,制定相关规定来保障国内绿色金
7、融的发展4。但与先进国家相比,法律法规体系建设滞后、财政资金补贴力度有限、政策性机构作用发挥不足等问题依然存在5。因此,应激发地方政府推进绿色产业和绿色金融发展的积极性,并确保信息沟通的有效性和绿色金融政策的一致性,提升可测度的监管质量6,以完善绿色金融体系的建设。近几年,伴随着“一带一路”政策以及乡村振兴战略的逐步推进,绿色金融的政策体系逐渐完善。本文主要对 20172019 年绿色金融相关政策进行分析研究,梳理在政策引导下的绿色金融产业的发展侧重点,以展示这三年绿色金融政策的发展格局。一、研究回顾基于政策解构视角,王凤荣等认为政府绿色金融政策主要分为两个维度的政府行为,一方面是来自经济领域
8、的政府行为,包括财政项目拨款、税收优惠等经济手段,另一方面是来自于管控投资方向、绿色产品属性、生产数量限定等方面的行政手段和法律手段7。Fischer 认为绿色金融产品能够拉动社会资本投入绿色环保领域,但企业环境行为的信息披露不足使污染事件屡禁不止,不利于绿色金融发展8。Ghisetti 等认为良好的法律环境是绿色金融健康发展的重要保障,配套的法律制度不健全将会使绿色金融的效果大大降低9。在政策量化研究的领域中,文本挖掘已经得到广泛应用,尤其在海量的政策文本研究中产生了大量研究成果。现有研究主要是基于绿色金融投入主体的相关指标来测算绿色金融发展水平。Miao 等认为绿色金融发展离不开中小企业市
9、场的支持力量,但绿色金融理念却在中小企业中没有得到广泛应用,这在很大程度上抑制了经济发展转型和绿色金融产品创新10。丁杰将双重差分法引入绿色信贷政策有效性研究,证明了绿色信贷抑制了重污染企业的信贷融资11。在排污权交易方面,也有学者关注政策监管问题。黄韬等发现在现有的金融市场和金融法治格局下,监管权力分散、制度不完善等因素会导致绿色债券市场存在的监管套利问题12。随着计算机方法的引入和应用,政策文本分析所能处理的素材量和处理精度得到了大幅提升,并引入了新的方法和理念13。文本挖掘技术可以从海量政策数据中抽取隐含的知识,解读和获知政策的立场、倾向以及广义的政策比较分析14。系统性、客观性、定理性
10、是内容分析法的特点和优势,胡嫣然基于文本挖掘,采用内容分析法对我国铁路运输企业的财税支持政策进行量化分析和研究15。赵公民等通过引入扎根理论和文本挖掘的研究方法,对政策文本进行词频分析、语义网络分析和中心性分析,研究广东省科技金融系统的运行模式16。通过梳理现有文献,发现大部分学者在绿色金融政策领域的研究为定性研究,对政策文本的定量研究缺乏。因此,本文以基于文本挖掘的文本可视化分析方法,对这三年我国绿色金融政策的发展侧重点进行梳理以呈现发展格局。二、数据来源和处理方案(一)数据来源本文所分析的政策文本数据来源于“法律之星”网站收录的绿色金融政策文件,使用“八爪鱼”数据爬取工具,爬取 20172
11、019 年绿色金融相关的政策文件,共获得这三年的政策文本数据量 1 509份,其中包括中央政策文件、部门规章以及各省市政策文件。笔者将得到的政策文本进行梳理,剔除重复文件,最终得到 1 487 份绿色金融政策文本。(二)文本处理方案本文以 20172019 年我国绿色金融政策文件为实验文本数据,利用内容挖掘系统 ROSTCM6 和社会语义网络分析工具 UCINET,通过文本预处理、文本高频词提取、高频词共现性分析、社会语义网络构建这四个步骤,得到可视化的高频关键词词云图和社会语义网络来分析这三年我国绿色金融政策的发展趋向和侧重点。其具体的实验步骤如下。(1)文本预处理。由于收集到的文本数据包含
12、噪声,须对文本进行预处理。首先,对文本进行去重,删除如“”“?”“”“”等无意义符号,获得简单清洗后的文本。其次,由于收集到的文本数据为中文,故须进行中文分词。本文利用ROSTCM6 提供的分词工具进行中文分词。最后,对分词后的文本进行去停用词操作,得到预处理后的文本数据。(2)文本高频词提取。词汇频率不仅是文本的基本单位表征,而且反映了文本的语义和关注焦220上 海 理 工 大 学 学 报(社会科学版)2023 年 第 45 卷点。文章中的高频关键词往往能反映出文章作者对某一领域的关注程度。本文利用 UCINET 工具对预处理后的文本数据进行词频统计分析,得到20172019 年绿色金融政策
13、文件的高频词汇。(3)高频词共现性分析。基于提取到的绿色金融政策文本数据中的高频关键词,统计同一时间维度下两个关键词之间的共现频率构建文本高频词共现矩阵,结合统计到的高频关键词的共现矩阵来分析政策文件的核心内容。(4)社会语义网络构建。为了挖掘高频关键词间的联系,本研究利用 UCINET 工具结合 NET-DAW 工具,经程序后台处理,自动绘制绿色金融政策文本中高频词共现关系矩阵的社会语义网络,以表现关键词间的内在逻辑。三、绿色金融政策文本挖掘(一)分词提取及词频统计首先,笔者在剔除重复文件之后,删除各发文机构、附件流程及人名等无实际意义的干扰词语;其次,由于现有的内容挖掘系统内置的自定义词表
14、以及停用词表与本研究主题关联不大,为保证分析结果的有效性,本文以前期搜集到的政策文件解读为依据,比如将“绿色信贷”“信用信息”“碳金融”等词语添加至自定义词表,并利用 ROSTCM6分词功能反复修改并更新自定义词表,以得到更准确的分词结果;最后,分别对这三年的政策文本进行分词、词频统计分析,得到共现关键词如表1 所示。表 1 绿色金融政策文本共现关键词部分例表Tab.1 Examples of co-occurrence keywords in green finance policy text2017年2018年2019年关键词词频关键词词频关键词词频创新6 327创新6 242创新5 17
15、2农业4 484资源4 984资源4 314改革4 082科技4 975工业3 928金融机构2 526工业4 127监管3 727农产品1 375农业3 722环境3 645金融服务1 263生态3 529科技3 502养老服务1 163监管3 526安全2 926大数据1 033开发3 409农业2 839环境保护998金融机构2 347生态2 737小微企业921旅游2 336教育2 621 (二)共现性分析为展现这三年政策文本关键词之间的联系,以词语之间的联系来表示政策文本的核心内容。统计两两关键词之间在同一年的政策文本中共同出现的频次,构成文本高频词共现矩阵,其频次越高,说明两两关键
16、词之间的关系越紧密。但是,仅靠关键词之间的频次高低反映词语之间的联系紧密程度太过单薄,要进一步将原生共现矩阵转化为相似矩阵。相似矩阵中的数值范围在 0,1,数值越接近 1,说明两个关键词的距离越近,关联程度越高。以2017 年政策文本高频词相似矩阵为例,如表 2所示。本研究进一步对整个关键词网络进行密度测量,密度的取值范围在 0,1 之间,密度越接近 1,表示整个关键词网络节点连接紧密且整个网络的复杂性较高。使用 UCINET 的密度测量工具对 20172019年政策文本的网络密度进行测量,得出:这三年的网络密度值分别为 0.612 0,0.513 8 和 0.469 1,说明这三年的绿色金融
17、政策文本具有较复杂的网络体第 2 期廖玉清:基于文本挖掘的我国绿色金融政策研究221系,且关键词网络各节点之间的联系密切,文本信息内容主题较丰富;均值方差分别为0.203 9,0.481 8和 0.472 9,说明较 2017 年相比,2018 年和 2019年的关键词网络中的主要关键词之间维系小范围的紧密程度,绿色金融政策发展的侧重点有明确的主题分布。四、政策文本挖掘的社会网络分析绿色金融政策文本的分析法主要有以下三种:(1)定性政策文本分析,多为对话语性和语义的分析,即从某一视角对政策文本资料中的某个词语进行解读和分析;(2)定量分析,通过定量来识别政策文本中可能出现的使用次数较多的关键词
18、语,将其中的定义综合作为关键词或政策的核心关键词,进而不断分析和挖掘政策文本背后可能隐含的信息;(3)政策的综合分析,此方法主要集合了政策的定性分析与定量分析,除了对制定政策的文本内容进行主观的定性分析外,也同时包括定量的研究以及对未来政策的发展趋势的综合预判。由于本研究的政策文本数据量较大,内容主题维度较高,为更好地呈现高频主题关键词的可视化效果,笔者先对政策文本进行提取行特征词操作,剔除意义不大的高频关键词,以从文中抽取的特征词进行量化来表示文本信息,如表 3 所示;再将20172019 年的文本行特征词分别导入到词云图生成网站 WordArt,构建相应的词云图。笔者将整理好的政策文本行特
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 文本 挖掘 我国 绿色 金融 政策研究
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。