基于文本和回归分析的中国城市科技创新发展的政策因素影响研究.pdf
《基于文本和回归分析的中国城市科技创新发展的政策因素影响研究.pdf》由会员分享,可在线阅读,更多相关《基于文本和回归分析的中国城市科技创新发展的政策因素影响研究.pdf(18页珍藏版)》请在咨信网上搜索。
1、科 技 情 报 研 究SCIENTIFIC INFORMATION RESEARCH第5卷第3期Vol.5No.32023年7月Jul.2023基于文本和回归分析的中国城市科技创新发展的政策因素影响研究曹树金孙立宝曹茹烨中山大学信息管理学院,广州 510006摘要:目的/意义 探究影响科技创新发展的政策因素,对各地不断完善科技创新政策体系,激发创新活力以及促进经济社会发展具有重要意义。方法/过程 首先,基于科技创新环境与创新生态系统理论,构建科技创新发展的政策因素影响模型。然后,选取国内 300 个地级及以上城市作为样本,利用文本挖掘、内容分析等方法对政策文本的数量、发布机构等外部特征,以及政
2、策工具、对象和注意力等内容特征进行量化。最后,使用相关性分析和多元回归分析对影响因素模型中变量间的关系进行实证检验。结果/结论 政策发布机构数量、效力级别、发布频率、政策工具和政策对象对科技创新发展都具有正向显著的影响;政策数量、政策注意力与科技创新发展具有正向相关关系。关键词:城市科技创新;科技创新发展;科技创新政策;文本分析;政策因素中图分类号:G358文献识别码:A文章编号:2096-7144(2023)03-0049-18DOI:10.19809/ki.kjqbyj.2023.03.005收稿日期:2023-02-09修回日期:2023-03-15作者简介:曹树金,男,1962 年生,
3、博士,教授,博士生导师,主要研究方向:信息组织与信息行为、情报检索,E-mail:;孙立宝,男,1998 年生,硕士研究生,主要研究方向:信息分析与情报服务,E-mail:;曹茹烨,女,1992 年生,博士研究生,主要研究方向:信息组织,E-mail:。1引言科技创新在当今世界经济增长、综合国力提升、国际竞争等各方面都发挥着至关重要的作用,已经成为国家和地区经济社会发展关键的驱动力,为此我国正加快实施创新驱动发展战略1。科技创新作为高投入、高风险的活动,需要国家和政府的引导和支持。在此过程中,科技创新政策在各级政府贯彻国家创新驱动发展战略和促进科技创新发展中具有重要的作用。因此,有必要通过对我
4、国城市科技创新发展的政策文本进行分析,总结各地科技创新政策的特征,并结合当地科技创新发展实际情况进行相关性分析,探究科技创新政策对科技创新发展产生影响的机制。从而为政府进一步合理制定科技创新政策、完善科技创新体系提出建议,使其更好地服务科技创新工作,促进国家和地区的经济社会发展。已有研究表明,国家科技创新发展和创新活动显著受到政府科技创新政策的影响2-3,但创新政策49科 技 情 报 研 究第5卷第3期与科技创新发展之间的影响关系和影响机制研究还比较欠缺,尤其是利用客观数据进行实证分析的研究几乎没有,因此,进一步探究科技创新政策与科技创新发展之间的客观关系,对政府开展科技创新治理工作具有重要的
5、现实价值。本文将采用内容分析法对各地科技创新政策的外部特征与内容特征进行提取,并通过相关分析与回归分析,探究影响科技创新发展的政策因素,从理论层面研究科技创新的政策因素提取及影响机制,提供量化分析的新视角。从实践层面为城市改进科技创新政策管理工作和促进科技创新发展提供参考。2文献综述2.1科技创新政策内容分析从内容上看,现有研究对科技创新政策文本的内容分析主要围绕政策目标、政策工具、政策对象等内部特征,以及发布部门、政策时间、效力级别等外部特征展开。其中,基于政策工具视角的研究较多,最为经典的政策分析框架是 ROTHWELL 等4提出的供给型、需求型和环境型 3 类政策工具,后续诸多学者在此基
6、础上不断深化,如李田丰等5基于政策工具框架对上海市科技创新政策文本的关键内容进行编码,分析各类工具的使用情况,也有学者从政策工具和创新价值链、政策工具与科技产业价值链等多维度构建政策文本的分析框架6-7。除了政策工具要素以外,还有从政策年度分布、参与部门、文种类型等外部特征方面,对科技创新政策进行分析8,从国家科技创新政策历史演进、政策层级、政策主体等角度,探讨政策群的协同状况9,以及对科技创新政策主题进行识别,分析科技创新政策的演化过程10。2.2科技创新政策量化研究科技创新政策量化是政策研究的难点,学者们利用各种工具对政策量化的方法进行了探索。早期政策量化所采用的主要方法是,以专家打分法为
7、代表的主观评价方法。之后,国外学者 RUIZ ESTRADA等11提出了 PMC 指数,能够较好地结合主客观角度对政策进行量化分析。张永安等12基于此方法对区域科技创新政策进行了量化研究。此外,对政策文本中的政策工具、政策对象、政策主体等内部特征进行频数统计分析,是十分常见的量化研究方法。也有学者使用计量学方法对科技创新政策的内容特征进行分析,如陈慧茹等13建构了基于政策属性与关键词权重的加权共词网络模型。还有采用政策注意力测量的方法,通过对政府工作报告文本内容进行量化分析,研究了政府对科技创新、基础研究和科技人才创新创业的注意力14-16。2.3科技创新发展影响因素研究影响科技创新发展的因素
8、具有多元化的特点,但以对经济要素的探究较多。研究表明,金融集聚17、产业集聚程度18、科技财政支出占比19等对科技创新效率有显著正向影响。其次,有研究发现,科研人员学历水平、科研经费和研究院所数量等科研资源因素对科技创新效率有显著的影响20。除此以外,有学者对影响科技创新的政策因素进行了一定的探索,如董克勤等21以 50 个国家创新型县(市)为研究对象,利用 Tobit 回归模型对创新型县(市)科技创新效率的影响因素进行了研究,发现创新政策中的税收减免额度与县域科技创新水平呈显著正相关关系。张荣天22使用回归模型探索城市科技创新效率的影响因素,得出政策支持力度显著影响科技创新效率的结论。综上所
9、述,现有研究对科技创新政策的内容分析只针对政策文本本身,未与科技创新实践活动的实际情况相结合,对政策有效性的讨论缺少客观性。针对科技创新发展影响因素的研究,大多是从金融经济因素视角出发,对政府能够直接掌控的政策因502023年7月图1 研究思路素研究较少。为弥补现有研究的不足,本文结合文本挖掘和统计分析方法,从多个维度探究影响科技创新发展的政策因素。3研究设计3.1研究思路本文的总体研究思路,如图 1 所示,包括影响因素模型构建与实证检验 2 个模块。首先,基于科技创新环境与创新生态系统理论,构建科技创新发展的影响因素模型;其次,确定研究样本并获取政策数据,对收集到的数据进行预处理;再次,结合
10、城市科技创新指数进行影响因素分析,探究科技创新政策对科技创新发展的影响机制;最后,基于研究结论,为政府制定科技创新政策和完善政策体系提出建议。3.2理论基础与模型构建3.2.1科技创新环境与创新生态系统理论科技创新活动总是在一定的创新环境中进行,创新活动的各个环节无不受到创新环境的制约和影响。创新 3.0 时代背景下,形成了更为典型的创新生态系统理论,该理论将创新环境概括为:一个包括创新主体、创新组织和创新环境等多种创新要素在内,并且各种要素之间相互依赖、相互作用和协同演化的动态性开放系统23。创新生态系统理论强调政府在生态系统中发挥的重要作用,如政府在形成创新生态系统过程中起到引导和统筹作用
11、,为具有潜力的基础研究领域提供资助等24-25。而政府干预创新生态系统最重要的手段就是政策手段,有研究指出科技创新创业环境是由政策环境、金融环境、市场环境等曹树金,孙立宝,曹茹烨:基于文本和回归分析的中国城市科技创新发展的政策因素影响研究51科 技 情 报 研 究第5卷第3期几种要素构成26。因此,政府有必要通过制定和执行各种科技创新政策参与到科技创新活动中,对科技创新投资市场、科技创新生态环境进行纠正和调节,为创新活动提供鼓励、刺激或保障。3.2.2影响科技创新发展的政策因素分析科技创新生态中有着丰富多样的创新要素,如创新主体、创新活动、创新成果等,这些要素都是政府需要通过科技创新政策进行平
12、衡调节的对象,即政策对象。而政府为了达到政策目的,干预科技创新生态系统中各种创新要素所采取的种种措施、方法等,在科技创新政策中集中体现为政策工具的运用。此外,政策对不同内容主题的关注存在差异,这种政策注意力的分配差异体现着政府干预科技创新内容的区别。因此,政策对象、政策工具以及政策注意力是体现科技创新政策中政府的关注重点、战略方向、方法手段的重要内容,是探究科技创新政策影响科技创新发展中不可忽略的要素。尤其是政策发布机构本身已经成为科技创新发展的参与主体,政策数量、发布频率和效力级别等政策外部特征又影响着政策发挥作用的效果,所以外部特征也是必须考虑的因素。综上所述,本文分别从政策外部特征和政策
13、内容特征2个方面,对影响科技创新发展的政策因素进行分析研究,提出影响科技创新发展的政策因素变量,并构建影响因素模型,如图2所示。图2 科技创新发展的政策影响因素模型3.3研究假设依据政策影响因素模型中自变量与因变量之间的关系,从政策的外部特征和内容特征2个方面提出7条研究假设,并对其进行说明。政策法规体系是经过不断积累与完善形成的,政策法规数量越多,说明政策对科技创新发展的支持和保障涉及范围越广,进而能够为科技创新发展营造更加适宜的生态环境。由此,提出假设 H1:科技创新政策数量越多,城市科技创新发展越好。科技创新政策的制定和实施需要多方协同、资源共享,涉及财政、税收、人才、金融等多个部门。参
14、与科技创新政策制定所涉及的部门越多,表明该地区各方面的创新资源协调、联动更加充分,进而能够为科技创新的发展创造更加适宜的政策生态环境。由此,提出假设 H2:科技创新政策发布机构涉及越多,城市科技创新发展越好。在我国条块结合的政府组织架构下,上级政府主管部门对下级政府部门有着领导、监督和管理的权力。政策制定主体在行政组织结构中所处的相对位置,以及政策文本的效力级别决定了政策向下执行过程中的顺畅程度进而影响政策效果27。可以推断,具有更高效力级别的科技创新政策向下执行过522023年7月程中更受重视,进而影响当地科技创新发展。由此,提出假设H3:高效力级别的科技创新政策比重越大,城市科技创新发展越
15、好。政策法规具有一定的时效性,只有与时俱进,能够适应历史进程的科技创新政策,才能够更好地满足科技创新主体和活动的实际需求,发挥更大的效能。因此,科技创新政策发布频率的高低,也会对城市科技创新的发展产生一定影响。由此,提出假设H4:科技创新政策发布频率越高,城市科技创新发展越好。政策工具是为了实现政策目标所使用的具体手段和方法,是政府影响科技创新最为直接的手段和方式。丰富多样的政策工具意味着更加系统、全面的科技创新政策支持环境,能够为科技创新发展提供更加稳定的保障,减少创新主体需要承担的成本和风险,进而更好地激发创新的积极性。由此,提出假设H5:科技创新政策的政策工具越丰富,城市科技创新发展越好
16、。科技创新的主体包括科研院所、企业、政府、中介机构、金融机构等多种类多领域的机构,它们共同构成了科技创新发展的生态环境。涉及政策对象更加完整、全面的政策体系能够避免生态链的断裂,充分激发各类主体的创造性。由此,提出假设H6:科技创新政策的政策对象越全面,城市科技创新发展越好。科技创新政策的内容丰富多样,涉及不同的主题。政府在构建科技创新政策体系时需要兼顾多方面的主题,将政策注意力相对均衡的分布,从多角度保证创新生态环境协调运转,进而推动科技创新发展的进步。由此,提出假设 H7:科技创新政策的政策注意力越全面,城市科技创新发展越好。4实证分析4.1数据收集与预处理基于上述所构建的影响因素模型,本
17、文利用我国地级及以上城市的数据进行实证检验。直辖市、地级市等城市在我国行政级别中处于承上启下的重要位置,也是组织科技创新活动和承载科技创新主体的主要单元,承担推进科技创新发展的重要职能。因此,研究地方科技创新发展具有较强的代表性。并且地级市具有样本数量更丰富、研究数据公开易获取的特点,能够开展更具有统计意义的实证研究。考虑到数据可获取性和数据质量的问题,本研究并未覆盖所有地级及以上城市,而是选取了337个城市作为研究对象(包括北京市、上海市、广州市、呼和浩特市、重庆市、泰安市等),其中济宁市、三沙市等 37 个城市因为现行有效的政策文本数据缺失予以剔除,共保留300个城市作为研究样本。科技创新
18、政策文本数据主要来源于北大法宝地方法规数据库,并通过地方政府官方网站和搜索引擎进行查漏补缺。检索时,限定效力级别为地方性法规、地方政府规章、地方规范性文件。然后,构建检索式“(科技 or 技术 or 科学)and(创新 or 发展 or 进步 or成果 or 孵化 or 奖励 or 优惠)”进行主题检索,并按照北大法宝地方法规数据库的分类体系,将政策类型限定为“科技类”,政策发布及生效时间限定在 2021年以前。在获取原始数据集后,剔除科技普及、科技教育、科技推广、成果认定等与推进科技创新没有直接关系的政策,以及区县发布的政策、活动和工作通知类文件。最终,共获取3 083篇现行有效的政策文本。
19、4.2科技创新发展与政策因素变量测量4.2.1科技创新指数选择中国城市科技创新综合指数对因变量科技创新发展进行代理。科技创新指数来源于北京科技创新中心研究基地和国家科技资源共享服务工程技术研究中心联合发布的 2021 年中国城市科技创新指数报告,由综合指数、总量指数、效率指数组成,以1个主榜曹树金,孙立宝,曹茹烨:基于文本和回归分析的中国城市科技创新发展的政策因素影响研究53科 技 情 报 研 究第5卷第3期和2个副榜的形式呈现,能够真实、客观、全面反映中国城市科技创新发展水平28,具体如图3所示。图3 2021年中国城市科技创新指数指标体系4.2.2科技创新政策因素变量测量自变量以科技创新政
20、策的量化指标为主,具体量化方法,见表 1。需要说明的是,在对效力级别的测量中,认为地方人大(及其常委会)和地方政府发布的纲领性政策为较高效力级别,地方政府及其派出机构、其他地方行政部门发布的具体实施性的政策为一般效力级别;在对发布频率的测量中,使用包含现行有效、已失效、部分失效、已被修改等全部在内的科技创新政策来计算发布频率,年份信息缺失的政策取该城市其他政策年份中位数进行补全;在统计政策工具类型时,首先对政策文本进行分词和词频统计,提取出能够反映科技创新政策工具特征的关键词,然后将政策工具分类与提取得到的关键词进行对照,有对应关键词的分类则认为是政策使用的工具类型;在测量政策对象特征时,使用
21、科技创新政策中涉及到的科技创新主体、科技创新支持主体等政策对象类型数量测量,其方法与政策工具类型的统计相同。4.3科技创新政策外部特征统计分析在 300 个城市中,政策数量分布情况,如图 4 所示。其中,发布科技创新政策数量最多的是北京市,共 165 篇。除北京市外,政策数量超过 100 篇的城市还有上海市和重庆市。政策最少的城市仅有 1 篇,包括大庆市、张家口市等 39 个城市。政策数量少于 10篇的城市占样本城市的大多数,说明大部分城市科技创新政策数量偏少。城市科技创新政策发布机构数量分布情况,如图 5 所示。涉及分布机构最多的同样是北京市,涉及56 个机构;其次是上海市涉及 46 个机构
22、,广州市涉及 42 个机构;其他城市涉及均少于 40 个机构。涉及政策机构少于 10 个的城市占全部城市的 90%以上,说明大部分城市所涉及政策发布机构都是偏少的542023年7月图5 城市科技创新政策发布机构数量分布情况状态。从城市科技创新政策的发布频率来看,北京市同样是政策发布频率最高的城市,全部政策平均频率为每年 6.87 篇,其次是年均 5.24 篇的上海市和年均 4.29 篇的深圳市。其他城市年均发布政策数均少于 4 篇,说明大部分城市发布科技创新政策的频率较低。从现行有效的政策效力级别分布情况来看,地方规范性文件在科技创新政策中占比较高,地方性法规、地方政府规章等较高效力级别的政策
23、占比较少。4.4科技创新政策文本内容分析4.4.1政策文本预处理科技创新政策文本的预处理包括文本分段、分词和构建 TF-IDF 向量空间 3 个步骤。首先,利用Python 对政策文本进行分段,将 3 083 篇政策拆分为182 624 个独立文档。其次,利用 Jieba 分词的精确模式及新词发现功能对分段后的政策文本进行分词,并添加自定义词典以及哈工大停用表。自定义词典表1 自变量测量自变量类型外部特征内容特征变量名称政策数量发布机构数量效力级别发布频率政策工具特征政策对象特征政策注意力特征变量测量统计所在城市发布的现行有效的政策文本数量(篇)统计所在城市的政策文本中列出的发布机构数量,重复
24、出现的机构仅计1次(个)统计所在城市的地方性法规、自治条例及地方政府规章等较高效力级别的政策数量占全部政策数量的比重(%)统计所在城市最早的科技创新政策发布年份至2021年期间平均每年发布的政策数量(部/年)从所在城市科技创新政策中提取使用和涉及的政策工具,并统计政策工具的类型数量(种)从所在城市科技创新政策中提取涉及的政策对象,并统计政策对象的类型数量(种)通过聚类发现全部城市科技创新政策内容主题,计算所在城市科技创新政策涉及的内容主题类型数量(种)数据来源北大法宝数据库、政策文本统计数据政策文本内容分析图4 城市科技创新政策数量分布情况曹树金,孙立宝,曹茹烨:基于文本和回归分析的中国城市科
25、技创新发展的政策因素影响研究55科 技 情 报 研 究第5卷第3期由科技创新政策相关论文的关键词、各市科技创新政策中的机构名、人工补充的常见词构成。然后,对分词结果进行词频统计,部分结果,见表2。从表2可以看出,出现频次最多的是“企业”“项目”“技术”和“单位”等表现科技创新政策扶持对象的名词,表明在我国城市科技创新活动中,企业占据了重要的地位,是政府重点推动和鼓励的对象。“奖励”“资金”“服务”和“管理”等关键词,则能够一定程度上反映政府支持科技创新发展的方法和手段。最后,使用 Python 的Sklearn机器学习工具包构建TF-IDF向量矩阵。图6 K-means聚类簇内误差平方和与轮廓
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 文本 回归 分析 中国 城市 科技 创新 发展 政策 因素 影响 研究
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。