基于偏最小二乘回归的吉林省农民收入影响因素研究.pdf
《基于偏最小二乘回归的吉林省农民收入影响因素研究.pdf》由会员分享,可在线阅读,更多相关《基于偏最小二乘回归的吉林省农民收入影响因素研究.pdf(4页珍藏版)》请在咨信网上搜索。
1、问题研究182023.3一、引言乡村振兴战略是实现全体人民共同富裕的必然选择。农民收入的持续稳定增长,是实现农民生活富裕的有效保障,是推进城乡融合发展,扩大国内经济循环的重要条件。地处中国黄金玉米带的吉林省,拥有肥沃黑土地的自然优势,是产粮大省,也是农业人口大省,保障吉林省农民收入,对促进和提高吉林省以及全国农村经济的发展具有重要意义。许多学者对农民收入问题做了不同方面的研究,刘琼等1建立脱钩模型、SVAR 模型,再运用脉冲响应等方法分析各类农村居民收入与畜禽养殖碳排放的动态响应关系。杜鑫等2采用基于内生转换回归的收入模拟法,得到土地流转对农村居民收入分配的影响。陈雨露等3研究了改革开放之后制
2、造业中心对农村居民收入的区域辐射影响,并且通过半参数回归模型,分析了制造业中心对农村居民收入的辐射作用以及空间衰减情况。陈湘满等4基于空间计量模型,实证分析了农村产业融合对农民收入空间效应的影响。陈一鸣等5分析了宏观经济增长对农村居民增收理论机制的影响。影响农民收入的因素很多,当各因素之间存在严重的多重相关性时,常见的多变量回归模型则不适用。另外由于客观因素对样本量的制约,导致样本量无法满足机器学习方法的较高要求6。为避免多重相关性摘要:乡村振兴战略背景下,农民收入持续稳定增长是实现农民生活富裕的关键。基于2 0 0 7 2 0 2 1 年吉林省农民收入的现实情况,建立偏最小二乘回归模型对吉林
3、省农民收入的影响因素进行分析。首先利用椭圆图和标准化模型距离对模型的合理性和适用性进行检验,再借助变量投影重要性测量影响因素的重要性,最后对模型进行精度评估。实证分析结果表明,农业机械总动力、农村居民人均消费支出、人均生产总值、第三产业增加值、城镇化率、农作物总播种面积和农业支出 7 个因素是影响农民收入的重要因素,且均为正向影响。根据实证结果,从统筹城乡发展,耕地保护,生产效率以及农村消费市场四个方面提出政策性建议。关键词:乡村振兴;农民收入;影响因素;偏最小二乘回归DOI:10.19456/ki.tjyzx.2023.03.005基于偏最小二乘回归的吉林省农民收入影响因素研究凤强周彦秋邓皓
4、云陈卓基金项目:吉林省社会科学基金项目“乡村振兴战略下吉林省异质性农民收入的融合分析及对策研究”(2 0 1 9 c 2 4);广西壮族自治区自然科学基金项目“大数据下超高维复杂数据降维分析的方法、理论与应用”(2 0 2 0 A C 1 9 1 5 1)。问题研究192023.3和样本量带来的局限性,本文运用偏最小二乘回归方法,以吉林省农民收入现实情况为例,进行实证研究。二、模型介绍本文只有一个因变量,所以只介绍单因变量偏最小二乘回归模型构建原理和辅助分析技术7。1.模型构建原理因变量 Y=y 和自变量 X=(x1,x2,xp)在进行偏最小二乘回归建模时,首先对原始数据进行标准化处理,把标准
5、化处理后的自变量 X 记为 E0=(E01,E02,E0p)np,因变量 Y 记为 F0=(F0)n1。记 E0的第一个成分记为t1,t1=E0w1,且 w1=1。F0的第一个成分记为 u1,u1=F0c1,且 c1=1。要求 t1,u1能分别很好的代表X 和 Y 中数据信息,则有方差 Var(t1)max 以及方差 Var(u1)max。同时要求 t1对 u1有最大的解释能力,则 t1和 u1的相关系数 r(t1,u1)max。偏最小二乘回归以迭代法逐步提取成分,在提取了第一对成分 t1和 u1后,分别对 E0和 F0求关于 t1的两个回归方程。如果不满足迭代停止条件,继续提取第二对成分,用
6、 E0被 t1解释后的残余信息 E1以及 F0被 t1解释后的残余信息 F1分别替代 E0和 F0重复上一步过程。为停止迭代,以及确定成分 th的提取个数,采用交叉有效性 Q2h作为判断条件。当 Q2h 0.0975时,引进新的成分 th会明显改善模型的预测能力。如果矩阵 X 的秩为 A,在得到成分 t1,t2,tm(mA)后,由于 t1,t2,tm均为 E0的线性组合,所以还原成 y*=F0关于 x*j=E0j的回归方程形式为 (1)其中 j为 x*j的回归系数。2.辅助分析技术(1)变量投影重要性因变量 Y 在被自变量 xj解释时的重要性,可用变量投影重要性测量,记为(2)其中,p 是自变
7、量的个数,m 是提取的成分个数,th代表第h个成分,Rd(Y;th)是th对因变量Y的解释能力,Rd(Y;t1,t2,tm)是 t1,t1,tm对 Y 的累计解释能力。当 VIPj大于 1 时,则表明自变量 xj对解释因变量 Y 有更加重要的作用。(2)特异点的发现T2椭圆图如果样本点 i 对成分的构成贡献太大,就会引起分析发生偏差。记为样本点 i 对每个成分 t1,t2,tm的累计贡献率,由统计量 (3)可知,当 (4)此时可以认为在检验水平为 95%上,样本点 i 对成分 t1,t1,tm的贡献过大,称样本点 i 为特异点。特别地,当 m=2 时,由公式(4)可知,这是一个椭圆。所以,可以
8、在二维平面 t1/t2上做出 T2椭圆图。当样本点位于 T2椭圆图中时,就能够认为样本点的分布是均匀的;反之,T2椭圆图之外的样本点是特异点。(3)数据重构质量分析如果提取了 m 个成分 t1,t1,tm,可以分别测量样本点 i 在 X 上和在 Y 上的重构质量。样本点 i 在 X 上的标准化模型距离定义为,(5)其中 DModXi是样本点 i 在 X 空间中与模型的距离,SX为所有样本点重构平均质量的平方根。同样地,样本点i在Y上的标准化模型距离定义为,(6)服从 F 分布,F 的临界值常在 2 附近,当或比 2 大许多时,则认为样本点 i 的重构质量是不理想的。三、实证分析1.数据来源农民
9、收入受到社会、经济等因素的复合影响,借鉴以往的相关研究,以及数据的可获性,选取人均生产总值(x1)8、第一产业增加值(x2)9、第三产业增加值(x3)10、城镇化率(x4)11、农业支出(x5)12、农村居民人均消费支出(x6)13、农业机械总动力(x7)14、农作物总播种面积(x8)15、有效灌溉面积(x9)16和绝收面积(x10)17共 10 个变量作为解释变量。数据全部来源于吉林省统计年鉴。2.模型建立和分析通过 SIMCA-P 14.1 软件,用标准化之后的数据建立偏最小二乘回归模型,首先进行成分提取,提取的成分个数由交叉有效性来判断,具体如下表 1。问题研究202023.3由表 1
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 最小 回归 吉林省 农民收入 影响 因素 研究
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。