基于RF-BP组合模型的混合型基金预测研究_何英洁.pdf
《基于RF-BP组合模型的混合型基金预测研究_何英洁.pdf》由会员分享,可在线阅读,更多相关《基于RF-BP组合模型的混合型基金预测研究_何英洁.pdf(6页珍藏版)》请在咨信网上搜索。
1、第 51 卷收稿日期:2022年8月5日,修回日期:2022年9月15日基金项目:北京市自然科学基金项目(编号:4202014)资助。作者简介:何英洁,男,硕士研究生,研究方向:机器学习,基金预测等。王世民,男,副教授,硕士生导师,研究方向:数据网挖掘等。1引言混合型基金作为开放式证券基金的一种,因其复杂多变的组织形式和介于股票和债券之间的投资风险受到广大人名群众的追捧。同时在推动我国经济发展之中,相对于股票的不稳定性而言,数量庞大的混合型基金以其灵活多变的投资风格也发挥着更大的作用。基金市场作为一个开放性的大市场,不仅受到系统性的风险,还受到投资者心理,基金公司财务状况等非系统性的风险。因此
2、,大多数的基民在投资基金时,往往很难选择,或者人云亦云,造成了巨大的损失,也造成了我国证券市场的不健康发展。混合型基金净值波动的研究主要集中在对基金预测方法的应用上,如于立媛、宋锋把灰色模型与马尔科夫链组合起来,其组合模型要优于单一的灰色模型1;向莹、王雅萍把ARIMA模型应用到华安上证180ETF、预测效果较好2;肖国荣证明了改进型BP神经网络的预测精度要优于传统的BP神经网络3;翟育明、邹亚平、周俊文、冯旖旎提出将遗传算法(GA)与传统BP神经网络组合成一种自适应遗传神经网络模型来对基金净值进行了预测4;何树、红吴迪、张月秋证明了RBF神经网络的预测效果要优于 BP神经网络5;崔琳证明了
3、PSO优化后 RBF神经网络模型要优于传统的 BP、RBF模型6。乔宝明、黄晶、范雯将改进的小波阈值理总第 401 期2023 年第 3 期计算机与数字工程Computer&Digital EngineeringVol.51 No.3基于 RF-BP 组合模型的混合型基金预测研究何英洁王世民(北京工商大学电商与物流学院北京100048)摘要针对传统的预测方法在处理混合型基金净值时存在指标选择困难,预测周期长,误差大等问题。提出将随机森林算法与改进型BP算法组合成RF-BP模型对混合型基金的周净值进行了预测。通过对A基金为代表的数只不同类的混合型基金的仿真研究表明,该组合模型的预测精度达到98%
4、,较好地预测了基金净值的变化趋势,且具有较好的泛化性和普适性,为投资者、管理者提供了投资参考。关键词随机森林;特征选择;神经网络;RF-BP模型;基金预测中图分类号TP183;F830.91DOI:10.3969/j.issn.1672-9722.2023.03.038Research on Hybrid Fund Prediction Based onRF-BP Portfolio ModelHE YingjieWANG Shimin(School of E-commerce and Logistics,Beijing Technology and Business University,B
5、eijing100048)AbstractThere are some problems in the traditional forecasting methods,such as difficulty in index selection,long forecasting period and large error,when dealing with the net value of hybrid fund.A RF-BP model combining random forest algorithm andimproved BP algorithm is proposed to pre
6、dict the weekly net value of hybrid funds.The simulation study of several different types ofhybrid funds represented by a fund shows that the prediction accuracy of the portfolio model reaches 98%,and the variation trendof the net value of the fund is well predicted.Moreover,it has good generalizati
7、on and universality,providing investment referencefor investors and managers.Key Wordsrandom forest,feature selection,neural network,RF-BP model,fund predictionClass NumberTP183,F830.917422023 年第 3 期计算机与数字工程论与自回归模型相结合,其预测效果要优于单一的自回归模型7;景阳将小波分解理论与多元回归算法相结合成一种新的基金预测模型,其预测效果要好于传统ARMA、小波去噪自回归模型8。综上所述,这些
8、方法主要集中在对方法的改进以及应用上,但是实际的应用场景并没有考虑。基金的种类繁多,指标和方法的选择不当会影响预测的精度,甚至是导致预测失败。在结合前人对于基金净值预测研究的基础上,提出将随机森林算法与改进型的BP神经网络组合成RF-BP模型来对混合式基金进行预测。结果证明该模型对于混合型基金净值的预测要优于传统的BP神经网络。2基金预测模型设计2.1特征选择算法随机森林算法能够处理高维度的数据,且具有较强的泛化性,能够兼顾基金净值各影响指标之间的耦合作用,消除冗余度大和不相关的属性。采用随机森林算法从构建的特征库中,能够筛选出对基金净值有重要影响的指标。选择分类回归树(CART)作为决策森林
9、的基树。采用 MSE(均方误差)作为结点分裂的依据来搭建随机森林做特征重要性度量。计算方法如下910:1)对于随机森林中的每一棵回归树,使用相应的OOB(袋外数据)数据来计算它的误差(预测值与真实值之间的误差),记为 error1。袋外数据指的是,每次建立决策树时,以重复抽样的方式得到一批数据用于训练决策树,最终会留下大约1/3的袋外数据没有被利用。2)随机对袋外数据D2的所有样本的特征加入噪声干扰(随机改变样本在特征x处的值),再次计算袋外数据误差,记为而error2。3)假设我们构造的随机森林有n棵基树,则特征的重要性为feature_importances=(abs(error2-err
10、or1)/n用它来判断每个特征的重要性,是因为在加入随机噪声后,袋外数据(OOB)的准确率会大幅度减少,减少越多说明对预测结果的影响越大,就越重要。4)利用上述方法计算出所有特征的重要性,并按升序进行排列,然后采用后向迭代的方法,每次去掉一个重要性最低的特征,再对剩余的特征进行重要性评估,重复进行上述操作,直到遍历完所有特征,然后选取袋外误差最小(OOB_SCORE_分数最高)时的特征,作为最后选定的指标体系。2.2BP神经网络利用随机森林对特征进行提取后,采用BP神经网络作为预测模型,相较于ARIMA、灰色模型、回归模型3,其能够较好地拟合出基金净值的波动规律。BP神经网络是一种按预测误差不
11、断进行反向调节的多层前馈神经网络。其结构如图1所示。输入输入层隐藏层输出层输出X1X2XnbiWnW1bY图1BP神经网络结构图2.3BP神经网络算法及其改进针对传统的BP算法,训练时间长、梯度消失造成训练失败等问题,本研究采用改进型的BP算法,以变学习率动量梯度下降算法为优化算法,TANSIG为输出层到隐层的激活函数,PURELIN为隐层到输出层的激活函数,经证明,在隐层采用S型函数,在输出层采用线性函数具有逼近任何连续函数的特性。其算法又分为前向传递和后向传递两部分,如过程1)、2)所示。设有12个特征变量Xi(i=1,212),一个输出 Y,共有(Xik,Yk)(k=1,2,N)个样本,
12、隐藏层节点输入O(j(1),输出为Oj(j为隐藏层节点数),隐藏层和输出层偏置bj和b2。1)前向传递过程如下:隐藏层输入为Oj(1)=bj+iXikWij(1)隐藏层输出为Oj=f(Oj(1)=2/(1+e-2Oj(1)-1(2)输出层为Yk=b2+jOjWj(3)隐层激活函数(TANSIG)f(x)=21+e-2x-1(4)输出层激活函数(PURELIN)f(x)=x(5)平方误差公式为(MSE)11743第 51 卷E=1n1NWk(Yk-Yk(t)2(6)其中Yk(t)为网络实际输出。可具体表示为Ek=(Yk-Yk(t)2(7)2)反向传递过程(根据链式法则,损失函数对各个需要更新的参
13、数求偏导,反复迭代,直至损失误差达到预期值):=EkYk(8)可以推出,隐藏层到输出层权重更新公式以及输出层到隐藏层的为Wjw(K+1)=YkWj+W(K)(9)Wij(K+1)=-YkOjOjWij+Wij(K)(10)对偏置 b 采取同样的更新方式,这里不再赘述。改进在于对反向求导过程,选择变学习率动量梯度下降算法。动量梯度下降算法降低了网络对于误差曲面局部细节的敏感性,而且把动量项作为阻尼项,在综合考虑上几次权值的基础上,减小了学习过程中的振荡趋势。同时,在动量梯度下降算法中引入自适应学习速率,根据所处的不同误差曲面区域,学习率能够实时自主调节,降低训练次数,能够避免跳出最佳极小值的情况
14、。对比原始的梯度下降法,变学习率动量梯度下降算法能够克服在训练过程中发生的震荡,且具有训练时间快、泛化性强,不易陷入极小值等特点,具体算法又可分为两部分。1)增加动量项:W(K+1)=W(K)+(1-a)Dk+aD(k-1)(11)W(k)为连接权系数;Dk=-Ek/Wk为k时刻的负梯度;D(K-1)是k-1时刻的负梯度,u为学习速率,u0;a是动量因子。2)自适应调节学习率:设一初始学习率u,若经过一批次权值调整后使总误差 E 变大,则本次调整无效,且(k+1)=k(1)。3实例仿真分析3.1初步特征选择在参考王敏基于BP神经网络对基金净值预测研究13;张纲等从基金经理特征和基金公司特征的双
15、重视角下对基金业绩的研究14;张洁琼、杨孔雨基于面板数据的开放式基金净值影响因素的研究 15;朱冰、朱洪亮对积极开放式基金的规模与收益的关系研究16;高金窑、张晓雪对我国证券投资基金预测能力的决定因素研究17,以及国泰数据库、天天基金、晨星网对于相关数据的解读的基础上,初步选取了基金份额净值、基金份额累计净值、基金份额复权单位净值、基金份额累计净值周增长率(%)、基金份额复权单位净值周增长率(%)、沪深300指数、持股比例、持债比例、现金比例、净资产规模(亿元)、基金换手率(%)、持仓行业集中度(%)、上一周净值、上一周累计净值、基金份额复权单位净值(上一周)、收益率标准差(%)、Sharpe
16、率、市场组合平均收益率(%)、Beta值、詹森指数-Alpha值、特雷诺指数(%)、TM模型择时能力gamma、TM 模型选股能力 alpha、CL 模型熊市择时能力gamma1、CL 模型牛市择时能力 gamma2、CL 模型择时能力gamma、CL模型选股能力alpha、CPI(居民消费价格指数),28项作为研究基金净值波动的指标库。3.2特征筛选如图2所示,初步选取的28个特征,进一步采用随机森林回归做出的特征重要性图表(以对混合型A(平衡)基金第一次迭代为例)。为消除研究样本的单一性这里增选混合型(偏股)B、(偏债)C两只基金进行对比和泛化研究,依据袋外数据误差最小(OOB_SCORE
17、_分数最高)准则,见图3,发现当特征数为12时,OOB_SCORE_分数最高,预测结果的准确性主要与基金份额净值(X1)有关,其次是上一周的净值(X2)、市场组合平均收益率(X3)、基金换手率(X4)、基金份额累计净值(X5)、基金份额复权单位净值(X6),CL模型熊市择时能力(X7)、上一周累计净值(X8)、沪深300指数(X9)、特雷诺指数(X10)、收益率标准差(X11)、居民消费价格指数(X12)。3.3数据预处理以混合型 A(平衡)基金为例,参照(偏股)B、(偏债)C两只混合式基金,截取从2013年3月22号到2019年6月30号共323周的数据作为样本,最终筛选出3.2小节所示的(
18、X1X12)共12个特征作为BP神经网络的输入变量。由于选取的特征具有不同的物理意义和量纲,为使训练伊始各输入分量同等重要,避免输入数据落入饱和区域,本文将原始数据利用式(12)进行0,1 归一化4。何英洁等:基于RF-BP组合模型的混合型基金预测研究7442023 年第 3 期计算机与数字工程0.97000.96750.96500.96250.96000.95750.95500.9525分数27 25 23 21 19 17 15 13 11 97531特征个数图3OOB_SCORE_分数走势Xi=Xi-XminXmax-Xmin(12)3.4实验方法选择选取已处理数据中的前315周数据为训
19、练集,余下8周为测试集,以X1X12为输入变量,以Y为输出变量。在BP神经网络训练中,隐藏节点的选取参考经验式(13)11:node=n+m+a(13)其中:n为输入节点数;m为输出节点数,a为110之间的整数。本文中n为12,m为1,则节点的取值范围是 4,13,分别取该范围内的值建立神经网络,其他参数,学习率设为0.25,训练次数为10000,精度设为 0.0012,动量因子设为 0.95。经验证,当节点为4时,预测值的均方误差最小为0.00678。本研究采用时间移动仿真法,每次仅预测一周,预测完后,该周加入训练,从而预测下一周,直至第八周预测结束,可以充分考虑到基金净值近期波动影响因素,
20、减小预测误差11。3.5实证结果的分析利用 Matlab R2019a 软件编程实现 RF-BP 组合模型,对混合型A(平衡)基金进行了预测并与参考文献 13 中固定指标的传统BP神经网络进行了对比。同时对偏股型B和偏债型C两只混合型基金进行了预测。1)混合型 A(平衡)基金的预测结果及分析RF-BP 模型与传统 BP 预测的拟合效果如图 4 所示。图4改进型BP与BP预测拟合效果图(混合型A(平衡)基金)RF-BP组合模型相较于传统的BP算法对混合型A基金净值的预测有明显的优势,结果验证其平均绝对误差降低了340%。2)模型的泛化性和样本的多样性增选偏股型B和偏债型C两只混合型基金的预测效果
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 RF BP 组合 模型 混合 基金 预测 研究
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。