分销赏收藏举报申诉 / 7

立即下载开通VIP

当前位置：首页 > 学术论文 > 论文指导/设计 > 基于深度集成学习的甘蔗压榨抽出率预测方法.pdf

基于深度集成学习的甘蔗压榨抽出率预测方法.pdf

上传人：自信****多点

文档编号：649219

上传时间：2024-01-23

格式：PDF

页数：7

大小：2.18MB

《基于深度集成学习的甘蔗压榨抽出率预测方法.pdf》由会员分享，可在线阅读，更多相关《基于深度集成学习的甘蔗压榨抽出率预测方法.pdf（7页珍藏版）》请在咨信网上搜索。

1、收稿日期:2 0 2 3-0 2-2 5基金项目:国家自然科学基金(6 1 7 6 3 0 0 1,5 1 4 6 5 0 0 3,1 2 0 6 2 0 0 1);广西自然科学基金(2 0 2 1 J J A 1 1 0 0 4 1)通信作者:蒙艳玫(1 9 6 3-),女,教授,博士,博士生导师,主要从事过程检测与控制研究.E-m a i l:g x u_m e n g y u n 1 6 3.c o mD O I:1 0.1 3 3 9 3/j.c n k i.i s s n.1 6 7 2-9 4 8 X.2 0 2 3.0 4.0 1 6引用格式:蒙艳玫,张月,段青山.基于深度集成学

2、习的甘蔗压榨抽出率预测方法J.三峡大学学报(自然科学版),2 0 2 3,4 5(4):1 0 1-1 0 7.基于深度集成学习的甘蔗压榨抽出率预测方法蒙艳玫1 张月1 段青山2(1.广西大学机械工程学院,南宁 5 3 0 0 0 4;2.广西大学轻工与食品工程学院,南宁 5 3 0 0 0 4)摘要:先进的甘蔗压榨建模方法能够给生产提供指导,有利于提高糖厂的经济效益并节约能源.本文选择深度极限学习机(D E LM)和长短期记忆网络(L S TM)作为基学习器,极端梯度提升(X G B o o s t)作为元学习器,构建了S t a c k i n g深度集成学

3、习模型,用于甘蔗压榨抽出率的在线预测;并通过计算和实验,验证该方法的可行性和有效性.与其他模型相比较,本文所提模型的预测精度高5%1 2%,并且对数据的敏感性更低,泛化性更好,能够适应甘蔗压榨的不同工况.关键词:甘蔗压榨抽出率;集成学习;深度学习;数据驱动建模中图分类号:T P 2 7 3 文献标志码:A 文章编号:1 6 7 2-9 4 8 X(2 0 2 3)0 4-0 1 0 1-0 7开放科学(资源服务)标识码(O S I D):P r e d i c t i o n M e t h o d o f S u g a r c a n e E x t r a c t i o n R a t

4、 e B a s e d o n D e e p I n t e g r a t e d L e a r n i n gME N G Y a n m e i1 Z HAN G Y u e1 DUAN Q i n g s h a n2(1.C o l l e g e o f M e c h a n i c a l E n g i n e e r i n g,G u a n g x i U n i v.,N a n n i n g,5 3 0 0 0 4,C h i n a;2.C o l l e g e o f L i g h t I n d u s t r y a n d F o o d E

5、n g i n e e r i n g,G u a n g x i U n i v.,N a n n i n g 5 3 0 0 0 4,C h i n a)A b s t r a c t T h e a d v a n c e d m e t h o d o f s u g a r c a n e p r e s s m o d e l i n g c a n p r o v i d e t h e g u i d a n c e f o r t h e p r o d u c t i o n,i m p r o v e t h e e c o n o m i c b e n e f i t

6、 o f s u g a r m i l l s a n d s a v e t h e e n e r g y.I n t h i s p a p e r,d e e p e x t r e m e l e a r n i n g m a c h i n e(D E LM)a n d l o n g a n d s h o r t t e r m m e m o r y n e t w o r k(L S TM)a r e s e l e c t e d a s t h e b a s e l e a r n e r a n d e x t r e m e G r a d i e n t L

7、 i f t(X G B o o s t)i s c h o s e n a s t h e m e t a-l e a r n e r.T h e d e e p i n t e g r a t e d l e a r n i n g m o d e l i s c o n s t r u c t e d f o r o n l i n e p r e d i c t i o n o f s u g a r c a n e e x t r u s i o n r a t e.T h e f e a s i b i l i t y a n d e f f e c t i v e n e s s

8、 o f t h e p r o p o s e d m e t h o d a r e v e r i f i e d b y t h e c a l c u l a t i o n a n d t h e e x p e r i m e n t s.C o m p a r e d w i t h o t h e r m o d e l s,t h e p r e d i c t i o n a c c u r a c y o f t h e p r o p o s e d m o d e l i s 5%-1 2%h i g h e r,a n d t h e s e n s i t i

9、v i t y t o t h e d a t a i s l o w e r,t h e g e n e r a l i z a t i o n i s b e t t e r,a n d i t c a n a d a p t t o t h e d i f f e r e n t c o n d i t i o n s o f s u g a r c a n e p r e s s i n g.K e y w o r d s e x t r a c t i o n r a t e o f s u g a r c a n e p r e s s;i n t e g r a t e d l

10、e a r n i n g;d e e p l e a r n i n g;d a t a-d r i v e n m o d e l i n g 甘蔗压榨抽出率是指甘蔗中已被提取的蔗糖对甘蔗中蔗糖的质量百分数,被广泛用来评价压榨过程的效果.目前对甘蔗压榨的研究主要集中在对压榨机理的探索.段青山1针对压榨过程中混合料特性会发生改变的情况,提出了一种基于进化材料特性的改进D r u c k e r-P r a g e r C a p模型,对混合料特性的改变进行了模拟,为压榨过程中的重要参数提供了更准确的预测.Q i u等2基于任意拉格朗日-欧拉算法模拟了甘蔗研磨的动态过程.随着人工智能的兴起,机

11、器学习技术在建模方面得到了广泛应用,逐渐有学者将数据驱动建模的方法应用在制糖业.T a r a f d a r等3开发了一个具有1 2个隐藏层神经元的组合ANN-GA模型,用于在实验变量范围内预测微流化甘蔗汁的流变特性.M e n g等4建立了基于核极限学习机的数据驱动模型,用于预测甘蔗汁大时延非线性澄清过程中无法在线测量的果第4 5卷第4期2 0 2 3年8月三峡大学学报(自然科学版)J o f C h i n a T h r e e G o r g e s U n i v.(N a t u r a l S c i e n c e s)V o l.4 5 N o.4A u g.2 0 2

12、3汁比重纯度和清汁色值.然而,上述浅层学习方法在学习复杂大规模工业过程特征的数据方面存在局限性5.与传统的数据驱动方法相比,深度学习(D L)的发展为数据驱动建模提供了更多的选择性,在例如储能系统6、智能电网7-9、暖通空调系统1 0-1 1、建筑节能1 2-1 4等领域已得到广泛应用,并取得了很好的效果.尽管如此,大多数D L的研究都仅仅使用一个单独的D L模型,考虑到D L方法的随机性,它们可能存在不稳定、对初始参数高度敏感和过度训练等问题.集成学习通过将不同的算法组合在一起,在聚合过程中消除了来自模型的误差、数据噪声等,有效地解决了上述问题,逐渐成为更好的建模方法1 5.目前,集成学习在

13、甘蔗压榨领域还未得到应用,同时也还未建立起甘蔗压榨抽出率的预测模型,因此建立甘蔗压榨抽出率的预测模型具有重要意义.考虑到甘蔗压榨中,物料变化复杂、控制复杂、多级运行,是一个复杂的工业过程,本文基于最大相关最小冗余(mRMR)和增量特征选择(I F S)的方法,在甘蔗压榨大数据中提取用于建模的特征集;然后建立以长短期记忆网络(L S TM)和深度极限学习机(D E LM)作为基学习器,X G B o o s t作为元学习器的S t a c k i n g集成学习模型,用于预测甘蔗压榨的抽出率;最后,通过对比论证了该模型的优越性.1 预测方法1.1 S t a c k i n g集成学习S t a

14、 c k i n g是W o l p e r t引入的一种集成学习方法1 6,由两个层次的算法组成.首先,基础学习器在原始数据集上进行训练,收集每个基学习器的预测结果以创建新的数据集.随后,第二级元学习器使用此数据集提供最终预测,元学习模型通过纠正基学习器输出的预测结果,纠正基学习器带来的误差,还可以避免过度拟合,从而有效降低模型的方差和偏差.1.2 深度极限学习机极限学习机(E LM)是求解单隐含层前馈神经网络的一种算法,通过随机输入权重和隐含层偏置,计算得到输出层权重,学习速率快.D E LM相当于多个E LM连接在一起,通过最大限度地降低重构误差使输出可以无限接近原始输

15、入,经过每一层的训练,可以学习到原始数据的高级特征,相较于E LM更能全面捕获数据之间的映射关系,从而提高其精确度.且D E LM没有反向调优的过程,这样训练网络的时间就会大大减少1 7.D E LM网络结构如图1所示.-图1 D E LM网络结构1.3 长短期记忆网络长短期记忆网络(L S TM)在循环神经网络(R NN)的基础上通过引入细胞状态和门控概念,有效解决了传统R NN所存在的梯度爆炸、梯度消失与长期依赖问题.L S TM单元结构如图2所示,主要由细胞状态、遗忘门、输入门和输出门组成.细胞状态也称为记忆单元,类似于传送带,为信息的传递提供通道.L S TM通过

16、忘记门、输入门和输出门来保护和控制细胞状态.L S TM已成功应用于许多领域,例如故障诊断、负荷预测等1 8-1 9.图2 L S TM结构1.4 极端梯度提升X G B o o s t是C h e n和G u e s t r i n于2 0 1 6年提出的一种基于梯度提升决策树的监督机器学习算法2 0,通过不断迭代,生成新树来拟合前一棵树的残差,因此随着迭代次数增多,精度在不断提高.X G B o o s t所用树模型是C A R T回归树模型.设X G B o o s t模型为:yi=mm=1fm(xi),fmF,F=f(x)=wq(x),q:RT,wRT(1)式中:m为树的数量;F为所有

17、C A R T树的函数空间;fj函数值为样本点所在叶节点的得分;q为多个样本点映射到各叶子结点的函数;T为叶子结点的个数;w为叶子结点的得分.目标函数通常分为损失项和正则化项:201三峡大学学报(自然科学版)2 0 2 3年8月O b j(f)=L(f)+(f)(2)式中:L是损失函数;是正则化项.损失函数用于衡量模型在训练数据上的性能,可以由式(3)表示.正则化项旨在控制每棵树的复杂度之和,即模型的复杂程度,由式(4)计算得到.L(f)=ni=1yi-yi(3)(f)=T+12Tj=1w2j(4)式中:和是超参数,用于控制叶子节点的个数和分数.为了得到目标函数的最优解,对损

18、失函数进行二阶泰勒展开后求偏导,得到更新后的目标函数为:O b j(f)=Tj=1Gjwj+12(Hj+)w2j +T(5)式中:Gj为所有数据在损失函数上的一阶导数;Hj为所有数据在损失函数上的二阶导数.利用贪心算法枚举可行的分裂点对子树进行分裂,使模型获得更高的增益,从而使目标函数更小,通过不断迭代找到最优的树模型.1.5 基于m RMR和I F S的特征选择方法研究采用最大相关最小冗余(mRMR)方法来分析不同特征的重要性.mRMR方法由P e n g等开发2 1,被认为是机器学习中最强大的过滤器之一.在mRMR中,每个特征都可以根据其与目标变量的相关性进行排序,并且排

19、序过程能够同时考虑这些特征的冗余.“好的”特征被定义为与目标变量的相关性最大且冗余最小.mRMR根据特征的重要性给出特征排序后,仍然不知道应该选择多少个特征.为了确定最佳特征数量,本文使用增量特征选择(I F S),对具有排名的特征变量进行增量特征选择:集合中的特征按照重要性从高到低逐一添加,如果增加一个特征,得到一个新的特征集,那么会得到N个特征集,对每一个特征集构建S t a c k i n g深度集成模型进行测试,根据测试的结果确定最终的模型特征.2 基于深度集成学习的甘蔗压榨抽出率预测模型2.1 数据来源在线数据、文本数据、离线数据共同组成了甘蔗压榨过程大数据.在线数据主要是车间已安装

20、的分布式控制系统(D C S)收集的压榨系统运行数据,包括蔗刀机转速、压榨机转速、渗透水流量、泵阀压力、温度、电流等,这些数据能够反映出压榨系统的实时运行状态;离线数据主要由化验数据和计算数据组成,包括甘蔗抽出率、甘蔗蔗糖份、蔗汁p H值、车间能耗等;文本数据主要包括甘蔗的产地、值期、品种等.具体特征见表1.表1 甘蔗压榨过程特征集序号特征描述1x11号蔗刀机电流2x22号蔗刀机电流3x33号蔗刀机电流(东)4x43号蔗刀机电流(西)5x5一级带电流6x6一级带转速7x7二级带电流8x8二级带转速9x91号双辊转速1 0 x1 01号榨机电流1 1x1 11号榨机转速1 2x1 22号榨机电流

21、1 3x1 32号榨机转速1 4x1 43号榨机电流1 5x1 53号榨机转速1 6x1 64号榨机电流序号特征描述1 7x1 74号榨机转速1 8x1 85号榨机电流1 9x1 95号榨机转速2 0 x2 06号榨机电流2 1x2 16号榨机转速2 2x2 26号双辊电流2 3x2 36号双辊转速2 4x2 4渗透水流量2 5x2 5渗透水对蔗比2 6x2 6甘蔗蔗糖份2 7x2 7甘蔗非糖份2 8x2 8甘蔗纤维份2 9x2 9甘蔗产地3 0 x3 0甘蔗品种3 1x3 1甘蔗值期3 2x3 2蔗汁p H值2.2 数据预处理数据处理是特征选择和建模前的重要环节,数据质量的好坏直接

22、影响到模型的准确度.首先利用O r d i n a l E n c o d i n g的方法将文本特征转化为数字特征.由于离线数据、文本数据和在线数据不是同时获取的,各自的记录形式不一样,存在着采样的时间差异,导致数据时序不匹配,因此需要进行时序匹配.以离线测量值抽出率为基准点,匹配同一时刻的在线数据和文本数据,将同一时刻的在线数据、文本数据和离线数据融合成同时序的样本数据;然后利用拉伊达准则对数据的异常点进行清理;最后,为了消除维度差异对相关性分析的不利影响,提高训练过程中的收敛效果,对数据进行m i n-m a x标准化处理.2.3 特征选择根据1.5节所述,对表1中

23、3 2个特征分别计算其mRMR值,归一化后排序见表2.基于mRMR的输出,为3 2个子特征集构建了2 0个单独的特征集来预测甘蔗压榨抽出率.第一个特征集包括重要性前6的特征(x1 1、x8、x4、x1 4、x1 6、x2 3),第二个特征集(x1 1、x8、x4、x1 4、x1 6、x2 3、x1 7)在第一个特征集的基础上增加重要性第7的特征(x1 7).以此类推,得到I F S结果,如图3所示.301第4 5卷第4期蒙艳玫,等基于深度集成学习的甘蔗压榨抽出率预测方法表2 基于m RMR值的特征重要性排序序号重要性特征11.0 0 0 x1 720.9 9

24、 4x2 030.9 9 4x2 640.9 9 2x1 550.9 9 2x1 460.9 8 6x2 770.9 8 5x2 380.9 8 1x490.9 7 7x3 11 00.9 7 5x2 11 10.9 7 5x1 11 20.9 7 5x81 30.9 7 4x2 81 40.9 7 1x3 01 50.9 6 9x2 51 60.9 6 6x7序号重要性特征1 70.9 6 4x31 80.9 5 4x1 91 90.9 4 6x92 00.9 3 3x2 22 10.9 3 2x12 20.9 3 0 x2 92 30.8 9 7x1 02 40.8 9 6x2 42 50

25、.8 7 8x1 82 60.7 9 7x1 32 70.7 5 2x1 62 80.7 0 7x62 90.6 6 3x53 00.6 5 8x3 23 10.6 2 8x23 20.6 2 7x1 2图3 I F S结果图当使用1 4个特征时,模型的R2=0.9 7 1,优于其他模型,因此这1 4个特征被认为是预测模型的最优特征集(见表3),作为S t a c k i n g深度集成学习模型的输入特征.表3 甘蔗压榨过程深度集成学习模型的输入及输出特征序号符号描述单位范围1x43号蔗刀机电流(西)A5 3,6 62x8二级带速度m/s6.1,7.83x1 11号榨机转速m/s4.9,6.

26、24x1 43号榨机电流A7 8 8,9 3 45x1 53号榨机转速m/s3.5,5.66x1 74号榨机转速m/s4.1,6.27x2 06号榨机电流A6 3 1,8 0 48x2 16号榨机转速m/s3.9,4.89x2 36号双辊转速m/s3.3,4.21 0 x2 6甘蔗蔗糖份%1 4.1 9,1 4.9 11 1x2 7甘蔗非糖份%2.1 6,2.5 91 2x2 8甘蔗纤维份%1 0.1 6,1 0.5 0续表3 甘蔗压榨过程深度集成学习模型的输入及输出特征序号符号描述单位范围1 3x3 0甘蔗品种N/A 桂糖4 2、桂糖4 6、柳城1 3 6、粤糖1 5 91 4x3 1甘蔗值

27、期N/A 新植、宿根1 5y抽出率%9 6.4 8,9 7.0 82.4 S t a c k i n g深度集成学习模型的构建本文提出的S t a c k i n g模型是一个两层模型的框架.第一层由D E LM和L S TM两个深度学习模型构成,其输入是原始训练数据集.从基学习器获得的模型输出值是下一层元学习器进一步训练的新特征.因为深度学习的计算量大,多层S t a c k i n g带来的性能提升相较于计算成本不具有优势,因此只选择一层S t a c k i n g.在第二层框架中,元学习器利用第一层基学习器得到的新特征进行训练,在原始测试数据集上进行测试后,获得最终的预测结果.元学习器

28、以基学习器的预测结果作为数据集进行学习,元学习器的泛化能力和准确性对集成效果有重要影响.本文选择多个元学习器分别在数据集上测试其性能,最终选定效果更好的X G B o o s t作为元学习器.S t a c k i n g模型的伪代码如下:输入:数据集X=x1,x2,xm,;基学习器算法:m o d e l1,m o d e l2,m o d e ln;元学习器算法:M o d e l;S t e p 1:f o r t=1,2,TS t e p 2:rt=m o d e lt(X)S t e p 3:e n dS t e p 4:f o r i=1,2,mS t e p 5:f o r i=

29、1,2,TS t e p 6:zi t=rt(xi)S t e p 7:X=X(ri1,ri2,ri t),yi)S t e p 8:e n dS t e p 9:r=M o d e l(X)输出:R(x)=r (r1(x),r2(x),rT(x)2.5 模型训练甘蔗压榨数据集来源于2 0 2 2年广西某糖厂甘蔗压榨车间.当年榨季从1 1月中旬开始到次年4月初结束,由于榨季初和榨季末压榨设备运转状态具有较大的波动,因此收集了1 1月底到次年3月底的数据,共有1 1 8 6组数据,3 2个特征,其中在线数据2 4个,离线数据4个,文本数据4个,经预处理后得到9 4 2组有效数据.式(6)是两个基

30、学习器的输入和输出,分别对应着经过特征选择后的输入数据集和基学习器的输出,即甘蔗压榨抽出率预测值.X=x4,x8,x1 1,x1 4,x1 5,x1 7,x2 0,x2 1,x2 3,x2 6,x2 7,x2 8,x3 0,x3 1T401三峡大学学报(自然科学版)2 0 2 3年8月Y1=yD E LM,yL S TMT(6)式中:yD E LM,yL S TM分别是D E LM和L S TM模型在测试集上的输出值.数据被分成了5份大小相同的子数据集,使用5折交叉验证对训练数据的不同子集进行训练,每个模型训练5次并做出5次预测.在第一次训练中,用前4个子数据集作为训练集,最

31、后一个子数据集作为测试集;在下一次训练中,用倒数第2个子数据集作为测试集,其他4个子数据集作为测试集.以此类推,完成5次测试,得到两个模型的5组预测结果Y2:Y2=yD E LM1yL S TM1yD E LM5yL S TM5T(7)式中:yD E LM1、yD E LM5是D E LM模型在第一折和第五折训练集上的输出值;yL S TM1、yL S TM5是L S TM模型在第一折和第五折训练集上的输出值.将Y2作为输入数据,X对应的抽出率y作为标签数据,构建元学习器所要的数据集.将数据集划分为训练集和测试集,完成训练后得到S t a c k i n g模型对甘蔗压榨抽出率的预测值Y,整个

32、训练过程如图4所示.图4 训练流程超参数在模型的性能中起着至关重要的作用,可以采用优化算法来获得机器学习模型在数据集上表现最好的超参数,从而提高模型性能.研究结合麻雀搜索算法对机器学习模型的超参数进行了优化2 2.3 结果与分析为了评价压榨模型的性能,定义3种常用的模型评价标准:平均绝对误差(EMA)、根均方误差(ERM S)、可决系数(R2).3.1 元学习器对S t a c k i n g深度学习模型性能的影响为了验证X G B o o s t模型作为S t a c k i n g模型元学习器的适用性,本节将通过改变S t a c k i n g模型中的元学习器来测试不同元学习器对最终模型

33、性能的影响.基学习器仍然使用D E LM和L S TM模型,修改后重新训练S t a c k i n g模型.根据图4,分别将X G-B o o s t模型替换为线性回归、决策树、装袋回归器、A d a B o o s t、S VM.不同元学习器的堆叠模型的预测结果如图5所示.从图5可以看出,使用X G B o o s t模型作为元学习器的S t a c k i n g深度集成模型具有最好的效果.图5 模型在6种不同元学习器下的性能3.2 模型预测结果根据3.1节,D E LM和L S TM模型被选为深度集成模型的基学习器,而X G b o o s t模型被用作元学习器.本文所提供的运行环境:

34、C P U为AMD处理器,R 9-3 9 0 0 X 3.7 9GH z;R AM容量为1 6G B;操作系统为W i n d o w s 1 0;编码环境为P y t h o n 3.9 5.D E LM和L S TM模型的输入层有1 4个节点,对应1 4个输入特征,输出为工艺指标,激活函数均为S i g m o i d函数;D E LM模型具有9个隐藏层,每层的节点数为1 2;本文采用S S A对D E LM的输入层权值和阈值进行寻501第4 5卷第4期蒙艳玫,等基于深度集成学习的甘蔗压榨抽出率预测方法优,对L S TM的神经元个数和学习率进行寻优,S S A的迭代次数设置为1 0

35、0,种群数量为5 0,警戒者的占比为0.1,预警值为0.7,寻优维度为2,适应度函数是计算模型的期望输出与实际输出之间的最小误差,即找到一组网络超参数,使得D E LM和L S TM在数据集上的误差最小.X G B o o s t的树模型为3 0,学习率为0.1,树最大深度为6,正则a l p h a为0.0 3,正则l a m b-d a为1.本文所提出的深度集成模型在训练集上的验证结果如图6所示.可以看到测试集上模型的预测值和真实值之间的相关性,其中ERM S=0.0 1 61,EMA=0.0 1 2 4,R2=0.9 7 1,说明所构建的模型误差较小,拟合效果好,可以用来精准预测甘蔗压榨

36、的抽出率,为生产监测和优化提供可靠的参考.图6 深度S t a c k i n g模型对抽出率的预测结果3.3 模型性能评估为了验证本文所提模型的优越性,选择了多项式回归、S VM、D E LM,作为比较对象,分别对应传统回归模型、传统机器学习模型、单一深度学习模型.对这些模型都用S S A进行了参数优化以达到它们的相对最优性能.模型经过训练后,在剩下3 0%“陌生”的数据上进行测试,这几种模型预测结果的EMA、ERM S、R2见表4.表4 4种模型在案例1上的性能比较模型EMAERM SR2X G B o o s t0.0 1 2 40.0 1 6 10.9 7 1多项式回归0.0 4 7

37、60.0 6 2 70.5 6 2S VM0.0 2 6 20.0 3 3 10.8 5 0D E LM0.0 2 0 20.0 2 8 30.9 2 3 如图7所示,与其他算法相比,本文提出的深度集成学习模型有着更好的表现.为了进一步探究模型的泛化能力,收集了该糖厂上一年的压榨数据,共1 2 3 7组,由于不同年份甘蔗的品种,收割时间以及压榨设备等诸多因素均不相同,因此这1 2 3 7组数据可以看作是案例2(训练模型的数据作为案例1),将训练好的模型应用在这1 2 3 7组数据上,根据结果可以看出各模型在面对新情况时的适应能力,即泛化性.图7 案例1下4种模型的预测性能如表5和图8所示,在案

38、例2中,由于这几种模型并未针对上年数据进行训练,性能均出现了下降,但是深度集成学习仍然具有最好的性能.表5 4种模型在案例2上的性能比较模型EMAERM SR2X G B o o s t0.0 1 2 90.0 1 6 90.9 2 2多项式回归0.0 5 2 60.0 6 4 10.5 1 0S VM0.0 2 7 90.0 3 5 20.7 9 3D E LM0.0 2 1 50.0 2 6 90.8 6 1图8 案例2下4种模型的预测性能如图9所示,本文提出的模型性能下降了3.9%(以R2计算),其他几种模型性能下降了6.3%9.8%不等.从中可以看出,本文所提出的模型对输入数据的敏感

39、性更低,泛化性更好,更能适应甘蔗压榨的实际生产情况.图9 4种模型在案例2下R2的变化601三峡大学学报(自然科学版)2 0 2 3年8月4 结论通过传统化验的方法获取甘蔗压榨的抽出率精度有限,操作繁琐,并且有较大的时滞性,不能实时反映出压榨的效果,准确的抽出率预测对于甘蔗压榨系统的优化运行与控制具有重要意义.为了克服单一预测方法的局限性,提升抽出率的预测精度,并且在不同数据集上有更好的泛化性,本文提出了基于S t a c-k i n g集成学习的甘蔗压榨抽出率预测方法.首先,通过基于mRMR和I F S的特征选择方法得到最佳的特征数量;然后,通过对比不同元学习器的组合方式

40、,构建出预测性能最佳的S t a c k i n g模型,该模型的基学习器为D E LM、L S TM,元学习器为X G B o o s t.测试结果表明,本文构建的甘蔗压榨过程抽出率预测S t a c-k i n g模型的R2比传统机器学习模型S VM高1 4%,比单一深度学习模型D E LM高5%,并且对数据的敏感性更低,泛化性更好,能够适应不同的工况,为工艺优化和实时控制提供了可靠指导.参考文献:1 段青山.甘蔗压榨过程耦合模型构建及三维仿真与压榨辊设计方法的研究D.南宁:广西大学,2 0 1 9.2 Q I U M M,ME NG Y M,Q I N J,e t a l.D y n a

41、 m i c s i m u l a-t i o n o f s u g a r c a n e m i l l i n g p r o c e s s b a s e d o n A r b i t r a r y L a-g r a n g i a nE u l e r i a n a l g o r i t h mJ.B i o s y s t e m s e n g i n e e r-i n g,2 0 2 1,2 0 6:1 6 2-1 7 4.3 T A R A F D A R A,KAUR B P,N EMA P K,e t a l.U s i n g a c o m b i

42、n e d n e u r a l n e t w o r k g e n e t i c a l g o r i t h m a p p r o a c h f o r p r e d i c t i n g t h e c o m p l e x r h e o l o g i c a l c h a r a c t e r i s t i c s o f m i c r o f l u i d i z e d s u g a r c a n e j u i c eJ.LWT,2 0 2 0,1 2 3:1 0 9 0 5 8.4 ME N G Y M,YU S S,WAN G H,e t

43、 a l.D a t a-d r i v e n m o d-e l i n g b a s e d o n k e r n e l e x t r e m e l e a r n i n g m a c h i n e f o r s u g-a r c a n e j u i c e c l a r i f i c a t i o nJ.F o o d s c i e n c e&n u t r i t i o n,2 0 1 9,7(5):1 6 0 6-1 6 1 4.5 L I U C L,WAN G K,Y E L J,e t a l.D e e p l e a r n i n g

44、 w i t h n e i g h b o r h o o d p r e s e r v i n g e m b e d d i n g r e g u l a r i z a t i o n a n d i t s a p p l i c a t i o n f o r s o f t s e n s o r i n a n i n d u s t r i a l h y d r o c r a c-k i n g p r o c e s sJ.I n f o r m a t i o n s c i e n c e s,2 0 2 1,5 6 7:4 2-5 7.6 S HAN G C,

45、YAN G F,HUAN G D X,e t a l.D a t a-d r i v e n s o f t s e n s o r d e v e l o p m e n t b a s e d o n d e e p l e a r n i n g t e c h-n i q u eJ.J o u r n a l o f p r o c e s s c o n t r o l,2 0 1 4,2 4(3):2 2 3-2 3 3.7 李志军,陈伟根,周湶,等.基于改进深度学习混合网络与小波分析的电机故障诊断方法J.三峡大学学报(自然科学版),2 0 2 1,4 3(6):9 4-9 9.8

46、顾晓东,唐丹宏,黄晓华.基于深度学习的电网巡检图像缺陷检测与识别 J.电力系统保护与控制,2 0 2 1,4 9(5):9 1-9 7.9 周念成,廖建权,王强钢,等.深度学习在智能电网中的应用现状分析与展望 J.电力系统自动化,2 0 1 9,4 3(4):1 8 0-1 9 1.1 0秦浩森,于震,李太禄,等.基于深度强化学习的热泵供热系统节能控制J.建筑科学,2 0 2 2,3 8(1 2):1-6.1 1WAN G J Z,Z HOU Y L,L I Z W.H o u r-a h e a d p h o t o v o l-t a i c

47、 g e n e r a t i o n f o r e c a s t i n g m e t h o d b a s e d o n m a c h i n e l e a r n i n g a n d m u l t i o b j e c t i v e o p t i m i z a t i o n a l g o r i t h mJ.A p p l i e d e n e r g y,2 0 2 2,3 1 2:1 1 8 7 2 5.1 2周璇,雷尚鹏,闫军威.基于深度学习的办公建筑照明插座能耗多步预测J.华南理工大学学报(自然科学版),2 0 2 0,4 8(1 0):1

48、9-2 9.1 3杨学红,杨朝磊.基于深度学习的建筑能耗预测方法研究J.建筑经济,2 0 2 1,4 2(5):1 1 7-1 2 0.1 4冉均均,袁磊.基于深度学习的大型建筑中央空调能耗预测系统J.自动化技术与应用,2 0 2 2,4 1(1 2):1-4.1 5徐继伟,杨云.集成学习方法:研究综述J.云南大学学报(自然科学版),2 0 1 8,4 0(6):1 0 8 2-1 0 9 2.1 6WO L P E R T D H.S t a c k e d g e n e r a l i z a t i o nJ.N e u r a l n e t-w o r k s,1 9 9 2,5(

49、2):2 4 1-2 5 9.1 7TANG J X,D E N G C W,HUAN G G B.E x t r e m e l e a r n-i n g m a c h i n e f o r m u l t i l a y e r p e r c e p t r o nJ.I E E E t r a n s a c-t i o n s o n n e u r a l n e t w o r k s a n d l e a r n i n g s y s t e m s,2 0 1 6,2 7(4):8 0 9-8 2 1.1 8杨剑文,朱林,林凌雪,等.基于R NN-R BM模型的配网

50、馈线长期负荷预测方法J.三峡大学学报(自然科学版),2 0 2 2,4 4(3):6 7-7 3.1 9刘荣伟,何伟挺,汪琳琳,等.基于C E EMD-L S TM的离心泵偏工况诊断方法研究 J.振动与冲击,2 0 2 2,4 1(1 9):1 1 4-1 2 1.2 0CHE N T Q,GU E S T R I N C.X G B o o s t:a s c a l a b l e t r e e b o o s t i n g s y s t e mE B/O L.2 0 1 6:a r X i v:1 6 0 3.0 2 7 5 4.h t-t p s:/a r

下载提示：咨信网仅提供存储空间/不修改/不编辑

【自信AI创作助手】【自信AI导航】
1、请仔细预览页面，基本判断完整性，对于直接下载带来的问题请及时与客服沟通；下载的文档，不会出现我们的网址水印。
2、该文档所得收入（下载+内容+预览）归上传者、原创作者；如果您是本文档原作者，请点此认领！既往收益都归您。

同意并开始全文预览

举报此文档有问题？有机会获“体验VIP”奖励！

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

10 金币 0人已下载

申诉本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请申请举报、认领或删除 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 基于深度集成学习甘蔗压榨抽出预测方法

咨信网温馨提示：
1、咨信平台为文档C2C交易模式，即用户上传的文档直接被用户下载，收益归上传人（含作者）所有；本站仅是提供信息存储空间和展示预览，仅对用户上传内容的表现方式做保护处理，对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿，我们不确定上传用户享有完全著作权，根据《信息网络传播权保护条例》，如果侵犯了您的版权、权益或隐私，请联系我们，核实后会尽快下架及时删除，并可随时和客服了解处理情况，尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确)，网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据，平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺，下载前须认真查看，确认无误后再购买，务必慎重购买；若有违法违纪将进行移交司法处理，若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传，付费前请自行鉴别，如您付费，意味着您已接受本站规则且自行承担风险，本站不进行额外附加服务，虚拟产品一经售出概不退款（未进行购买下载可退充值款），文档一经付费（服务费）、不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印，是因预览和防盗链等技术需要对页面进行转换压缩成图而已，我们并不对上传的文档进行任何编辑或修改，文档下载后都不会有水印标识（原文档上传前个别存留的除外），下载后原文更清晰；试题试卷类文档，如果标题没有明确说明有答案则都视为没有答案，请知晓；PPT和DOC文档可被视为“模板”，允许上传人保留章节、目录结构的情况下删减部份的内容；PDF文档不管是原文档转换或图片扫描而得，本站不作要求视为允许，下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权，请谨慎使用；网站提供的党政主题相关内容(国旗、国徽、党徽－－等)目的在于配合国家政策宣传，仅限个人学习分享使用，禁止用于任何广告和商用目的。
6、文档遇到问题，请及时私信或留言给本站上传会员【自信****多点】，需本站解决可联系【微信客服】、【 QQ客服】，若有其他问题请点击或扫码反馈【服务填表】；文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“【版权申诉】”（推荐），意见反馈和侵权处理邮箱：1219186828@qq.com；也可以拔打客服电话：4008-655-100；投诉/维权电话：4009-655-100。