1、 ()年 第 卷 第 期 收稿日期:基金项目:国家科技部重点研发计划();重庆市科委一般自然基金项目()作者简介:王永海,男,硕士,工程师,主要从事电气自动化研究,:;通信作者 王华秋,男,博士,教授,主要从事节能优化与智能控制研究,:。本文引用格式:王永海,李云峰,董军,等 改进的深度回声网络在空调负荷预测中的应用 重庆理工大学学报(自然科学),():,(),():()改进的深度回声网络在空调负荷预测中的应用王永海,李云峰,董 军,关爱章,王华秋,向 力(湖北中烟工业有限责任公司襄阳卷烟厂,湖北 襄阳;重庆理工大学 两江人工智能学院,重庆;重庆太和空调自控有限公司,重庆)摘 要:针对深度回声
2、状态网络的输入权值随意性太大、中间状态数量庞大、关键参数凑试决定等问题,运用灰色关联度计算属性间的相关性从而确定输入权值。采用聚类算法简化中间状态,并用坐标轮换法搜索最佳的深度网络层数和储备池个数,对算法进行改进。通过 标准数据集的实验,发现改进后的算法提升了预测精度和速度。采用改进的深度回声网络预测卷烟厂空调负荷,通过当前时刻的内外部条件,解决由于负荷数据周期性波动所造成的预测效率低的问题,及时准确地预测出了下一时刻的空调负荷,提前对冷水机组的运行策略进行了调节,从而达到空调节能的目的。关 键 词:深度回声状态网络;灰色关联度;聚类;坐标轮换法;空调负荷预测中图分类号:;文献标识码:文章编号
3、:()引言现代卷烟行业依赖暖通空调来调节温湿度,因此能源消耗量相当巨大。空调负荷主要是指末端冷热需求,还要考虑到管路损耗和室外环境等因素。这些需求可以通过空压机、制冷机、蒸发器和负压机等暖通设备以被动方式提供,目的是尽可能少地消耗能量,同时满足卷烟生产并符合工艺标准。空调系统的调节策略要符合负荷需求和能源供给的最佳匹配原则,这样系统才是最节能的。其方法就是调节空调系统的冷冻水量,使得空调实际负荷与预测负荷匹配,因此,准确预测空调负荷非常重要。国内外学者已在空调负荷预测方面做过大量研究,有基于统计的参数回归法、时间序列法和小波分析法等;也有基于数据挖掘的聚类法和随机森林法等;还有基于网络结构的极
4、限学习机、支持向量机、深度信念网络和深度循环网络 等的负荷预测方法。空调负荷预测方法逐步智能化,但是仍然有需要改进之处,比如无法准确预测周期性变化数据、训练耗时过大造成模型更新缓慢、没有考虑输入输出数据之间的相关性,从而影响预测模型的精度。等学者在深度学习框架和基于泄漏积分型回声状态网络的基础上,于 年提出了一种多层储备池依次连接成的深度网络。这种多层的结构体现出了深度时间序列特性,其状态动力学特性高于传统的浅层网络,立即引起许多学者的高度关注,已经应用于许多领域,但是目前用于空调负荷预测方面的研究仍然比较少。因此,本文采用改进的深度回声网络(,)来预测某卷烟厂空调负荷,通过当前时刻的冷冻水和
5、冷却水供回水温度、冷冻水和冷却水流量、室外温湿度和风速等参数,预测出下一时刻的空调负荷。并且运用灰色关联度计算属性间的相关性从而确定输入权值,用坐标轮换法搜索最佳的深度网络的层数和储备池个数,解决由于负荷数据周期性波动幅度所带来预测效率低下的问题。最后将该预测模型与相关的新型算法进行了对比,验证了 网络的优越性,同时也讨论了其局限性。深度回声状态网络研究为了提高回声状态网络的特征表达能力,深度回声状态网络(,)于 年被 等提出。深度回声状态网络的储备池是串行排列的,因此每个储备池状态主要依赖于前一时刻的状态以及前一储备池的输出信息,深度回声状态网络结构如图 所示。从 的结构图可知,包括输入层、
6、中间状态层和输出层。设 有 个输入神经元,层储备池,个输出神经元,每层储备池有 个神经元。在 时刻,输入数据为:()(),(),()输出数据为:()(),(),()的多层储备池状态为:()()()()()()()这里,()()()()()()()(),代表第 个储备池的 个神经元状态。表示输入权值,()表示第 个储备池的内部权值,()表示第 个储备池到第 个储备池之间的连接权值,表示输出权值。图 深度回声状态网络结构 由于回声状态都依赖于输入信号的历史值,因此,都是在 ,范围内随机选择的。每一层的回声状态按照下列公式进行更新:()()()()()()()()()()()()()()()()()
7、()()()()()()()()()()()()()()()()()()()()()()()()()()()()()式中,是泄漏率,取 ,是正切激活函数。以上公式可以归纳为:当 时:()()()()()()()()()()当 时:()()()()()()()()()()()()这样,各层各个时刻的回声状态总和就是:()()()()()()()()()()()()()()()()()()()|由 组中间状态汇聚起来后,网络就可以采用如下计算输出:()其中:()()()()()()()()()|。在深度回声状态网络中,只有输出权值需要通过回归算法训练。)如果采用最小二乘法算法训练,输出权值的计算式
8、为:()()如果采用岭回归算法训练,可以克服过拟合现象,输出权值的计算式为:()()式中:为正则化系数,一般取 。的训练过程如下:输入:具有 个时刻的训练样本输出:输出层权值 参数设置:输入神经元为 个,输出神经元有 个,储备池有 层,每层储备池有 个神经元,泄漏率是,正则化系数是。初始化:,都是在,范围内随机选择的。样本时间序列 式()计算 式()计算 ()()()()()()()()()()()()()()()()()()首先,算法根据设置的参数随机初始化权值,在每一时刻的训练中,输入数据进入第一个储备池,因此各个中间层储备池的状态发生变化。接着,得到所有训练样本的全部储备池的状态,根据输
9、出数据来训练输出权值。的预测过程就比较简单了,根据已有参数和权值,首先用测试输入经过多层储备池的状态转换,得到最终状态,再乘以训练得到的输出权值,如下式所示:()()其中 是预测步长,这样就可得到预测输出了。深度回声状态网络的改进为了建立更准确可靠的负荷预测模型,针对深度回声网络的输入权值、网络层次、储备池大小以及中间状态等方面进行了改进。按灰色关联度初始化输入权值根据输入和输出之间的关联程度,从而决定输入变量对于输出的重要程度,因此采用灰色关联度法计算输入权值,而没有采用原来的随机初始化方式。将输入变量和输出变量组成一个关联度矩阵,如是多个输出,则取输出的平均值作为 的第一列:|为了消除每一
10、列的量纲,将每一列除以平均值,得到平均后的矩阵?:王永海,等:改进的深度回声网络在空调负荷预测中的应用?|把?中的自变量和因变量分别设为 和,为了便于下一步减法运算,对 进行重复扩充,使其大小和 相等。将自变量序列减去因变量序列取绝对值,得到减序列:()()()()找 出 减 序 列 中 的 最 大 值 和 最 小值:()()()()计算每个样本的每个指标与因变量序列的关联度:()()()其中,为分辨率。每一条样本都会有一个输入与输出之间的关联度,因此关联度数值和样本数量一样多。这不利于从整体上分析输入和输出之间的关联程度,所以有必要将各个样本的关联系数集中为一个值,即求其平均值。作为输入与输
11、出数列间关联程度的数量表示,每一个输入和输出值之间的关联度 如下:()()然后组成一个关联度向量:,得到的关联度范围都在,之间,将这些关联度作为深度回声状态网络的输入权值。将关联度向量做一个简单的,之间的等距分箱,每个分箱的间距为 ,统计每个分箱的分布情况,就可以把不为零的分箱区间数作为下一步 聚类的中心个数。中间状态聚类深度回声状态网络中间层比较多,造成中间状态矩阵 比较大,这对于后一步求逆容易出现误差,而且运算速度也会受影响,不利于输出权值的回归求解。因此,采用 聚类对中间状态进行聚合,可以减少无效的中间状态对输出权值的影响,减少求逆时间和误差,从而提高预测精度和速度。计算 的聚类中心,为
12、聚类中心数。对中间状态 进行 聚类,根据矩阵 的每一行所属的类,得到中间状态的 个聚类中心。中间状态矩阵可以转换为:()()()()()()()()()|其中聚类个数 。用这 个聚类中心代替中间状态进行下一步的输出权值回归运算。这样就降低了求广义逆的复杂度,也可以尽量保留重要中间状态的信息,从而提高算法的拟合能力。网络层数和储备池大小的坐标轮换法搜索层数和储备池大小是深度回声状态网络的 个重要参数,其值影响了预测的精度和性能,因此采用坐标轮换法搜索这 个参数。本文将储备池层数,每层储备池神经元个数 的搜索方向作为坐标轴的梯度变化方向,从这 个方向上对储备池层数和每层储备池神经元个数进行搜索寻优
13、,搜索目标是:(,)()约束条件:,其中 表示,表示,和 分别是训练集的均方根误差和平均相对泛化误差。计算步骤如下:)给定初始点()(,),初始步长(,)(,),缩放因子 ,步长精度 ,自变量精度 ,搜索次数 ;)令()(),从 开始,根据步长 沿着坐标轴 的正方向寻优,令()(),如果取得的()使(,)减小,并且 在其约束范围之内,则步长加倍,加速向前搜索直到(,)不再减小,转第 步。如果沿坐标轴 的正方向搜索得不到使得(,)减小的点,则转向坐标轴 的负方向搜索,然后转第 步;)如果沿坐标轴 的正负方向都搜索不到使得(,)减小的点,则将搜索步长减小,令 ,转第 步;)依次沿其他坐标轴进行同样
14、的搜索,最终求得这轮搜索的最优点;)如果(),转第 步,否则令(),转第 步;)如果步长(),则()为最优点,否则令,转第 步。以上就是本文的 个改进之处,由于整个预测算法计算比较复杂,图 给出了改进的深度回声状态网络预测模型的总体流程图。图 改进的网络模型计算流程 工业负荷预测和分析 数据预处理和评价指标由于本文的数据都是能耗负荷数据,所有的变量都是连续数值,而且没有缺失值或者异常值,因此数据不需要太多的预处理。采用 归一化方法去除数据的量纲。(,)(,)?()由于是针对深度回声状态网络的改进,为了对比算法性能,本文另外选择了几种新型的深度回声状态学习算法进行预测建模,其参数设置和参考文献中
15、的一致。)文献的 是一种基于多重投影编码的分层网络结构,其投影层和编码层之间交替重复而成为储备层,特点是利用每个储备层的时间特性来表示时序数据的多尺度动态性。)文献的 是一种异步深度储备层计算模型,它由多个子储备层组成。这些子储备层依次连接,并在每 个相邻子储备层之间插入延迟模块,由于链路延迟,网络中的每一层都异步处理信息。)文献的 是一种宽深度回声状态网络,该网络具有多个并行和堆叠配置的储备层,并且使用粒子群算法优化了网络架构和关键参数。)文献的 是一种增长型深度回声状态网络,结合互信息和全秩准则,通过以输出为目标的监督学习确定网络的深度和宽度。本文的 算法的关键参数设置如表 所示。表 本文
16、算法关键参数设置参数寻优的储备池层数 寻优的每层储备池大小 泄漏率 正则化系数 激活函数 正切函数输入权值 采用关联度 初始化内部权值 ,随机分布层间权值 ,随机分布迭代次数 采用平均相对泛化误差(王永海,等:改进的深度回声网络在空调负荷预测中的应用,)和均方根误差(,)作为预测模型的性能评价指标。平均相对泛化误差计算公式如下:()均方根误差计算公式如下:()()建筑物冷热负荷预测与分析空调控制着建筑物的气温,消耗了建筑物的主要能源,因此预测建筑物的冷热负荷有助于节能。为了验证本文预测模型的有效性,采用了 标准数据集对模型进行测试。所使用的数据是模拟 种不同建筑负荷情况得到的能耗数据,通过模拟
17、上述特征的不同取值,以获得不同的建筑物负荷情况。建筑物数据分析数据集包含 条样本,每一条样本包含 个输入属性,分别用(相对密实度)、(表面积)、(墙面面积)、(屋顶面积)、(总高度)、(方位)、(玻璃区域面积)和(玻璃面积分布)表示,还包含 个输出响应,分别用(热负荷)和(冷负荷)表示。预测模型的作用是用 个输入属性正确预测 个输出响应。示例数据如表 所示。表 部分建筑物能耗数据 建筑物负荷预测模型建筑物在玻璃面积、玻璃面积分布和方向以及其他参数方面有所不同。这些物理特性对建筑物的能耗性能有很大影响。因此,本文将 到 都作为预测模型输入,和 作为输出。训练集和测试集分别包含 和 条。对于训练集
18、和测试集数据,各种不同的模型预测性能、和耗时如表 和表 所示。表 建筑能耗训练数据预测性能比较算法训练集 耗时 表 建筑能耗测试数据预测性能比较算法测试集 耗时 如表 和表 所示,从拟合程度来看,无论是训练集,还是测试集,的 和 都是最低的。这说明 模型拟合程度最高,其次是,拟合度最低的是。拟合度较 低的原因是:其编码层接收了前一个储备层的回声状态作为输入,并将高维回声状态通过 编码到低维特征空间中。这一步可能丢失了一些数据特征,而 并没有破坏其内部各层的状态,因此预测精度较其他几种算法高。从时间消耗性能来看,模型并不是最低的,这是因为 进行了网络结构的搜索寻优,增加了运算量。但是 训练耗时已
19、经明显低 于、了,耗时最多的原因是:使用了粒子群算法优化网络架构和参数。这必然降低运算效率,而 采用坐标轮换法就可以快速获得最佳层数和储备池个数。因此,在性能提高的同时并没有降低运算速度。对于测试集,运算速度也较快,说明 通过中间状态聚类简化了预测输出的矩阵运算,从而提高了速度。综合可知,建筑能耗预测性能优于、。能耗预测性能如图 所示。图 能耗预测性能 对于测试集数据,采用本文预测算法得到的预测值和期望值的对比曲线如图 所示。图 能耗负荷预测性能 由图 可以看出,对于这 条测试数据,数据总体上表现出一定的周期性。算法很好地跟踪这种周期性,具有出色的泛化能力。不仅能拟合平缓变化的数据,且在数据突
20、变时也能迅速攀升,其快速拟合能力得到体现。卷烟厂空调负荷预测与分析空调系统节能的基本思想是根据调节冷冻水流量,使得负荷的需求和供应最佳匹配,当系统的负荷需求和负荷提供量相等时,系统是最节能的。空调负荷数据分析本文收集了秋季工况数据,其中包括外部环境数据和冷水机组的运行数据,数据采样从 点到 点,每小时采集一次,这样每天获得 条数据,可以采集超过 条的数据,基本上涵盖了工作时间空调系统的工况。本文选择了具有代表性的 条空调负荷样本,每一条样本包含 个输入属性,分别用(室外温度)、(室外湿度)、(室外风速)、(冷却水供水温度)、(冷却水回水温度)、(冷冻水供水温度)、(冷冻水回水温度)、(冷冻水流
21、量)和(冷却水流量)表示,还包含 个输出响应,用(空调负荷)表示。预测模型的作用是用 个输入属性准确预测 个输出响应。示例数据如表 所示。表 部分空调负荷数据 空调负荷预测模型基于负荷预测的冷冻水流量动态控制,是一种基于末端服务质量的能量平衡和最佳输出的能量控制。因此,将 到 都作为预测模型输入,作为输出。经过整理,得到训练集和测试集分别有 和 条。对于训练集和测试集数据,各种不同的模型预测性能、和耗时如表 和表 所示。王永海,等:改进的深度回声网络在空调负荷预测中的应用表 空调负荷训练数据预测性能算法训练集 耗时 表 空调负荷测试数据预测性能算法测试集 耗时 如表 和 所示,从拟合程度来看,
22、通过灰色关联度初始化输入权值以及坐标轮换法寻优层数和储备池大小,提高了深度回声状态网络拟合程度,的 和 都是最低的,次之。将储备层和前馈层逐一交替添加到网络中来,每个前馈层都以输出为目标进行监督学习预训练,从而自动确定网络的深度和宽度,但是有监督训练就会增加耗时,而且这种方法容易造成过拟合而增加预测误差。采用无监督聚类将中间状态聚合,提取出的有效状态更能反映数据特征,因此拟合效果优于。从时间消耗性能来看,将中间状态聚类,从而简化了输出权值的计算,提高了深度回声状态网络的运行速度。在模型训练阶段,的耗时仅比 稍高,低于、的耗时。但是在测试阶段,由于不需要再进行求逆运算,因此速度提升效果不明显。在
23、每 个相邻储备层之间插入延迟模块,在储备层中生成中继存储模式,扩展了短期记忆容量,而且没有动态调整网络结构,因而耗时最短,需要动态搜索网络的层数和储备池大小,因此耗时较 长。综合可知,空调负荷预测性能优于、。负荷预测性能如图 所示。图 负荷预测性能的对比 为了验证 负荷预测模型的泛化性能,采用没有参与训练的 条测试数据预测负荷输出。图 反映了测试样本数据拟合效果。图 空调负荷预测性能 这 条负荷测试数据表现出一定的规律性,即工作时段的负荷需求比较大,而在休息时段,负荷需求则比较小。这时如果降低冷水机组的冷冻水流量,仍然能满足系统负荷需求。因此可以通过降低冷冻水泵的转速,甚至关闭某些运行的机组,
24、减少多余的冷量输送。采用深度回声状态网络 预测模型对空调负荷进行实时预测,其拟合曲线很好地符合了这种规律性,说明该模型具有很好的泛化能力。将该预测模型与控制技术结合起来,对冷水机组的运行参数甚至启停状态进行实时调节,就可以达到空调负荷与机组供冷的相对平衡,降低冷水机组的能耗。结论)采用关联度初始化输入权值。采用灰色关联度法对影响负荷输出的各输入参数进行分析,解决了深度回声状态网络的输入权值随机优化的问题。)对中间状态进行 聚类,根据具有代表性的中间状态计算输出权值,减少回归时间,提高了预测速度。)采用坐标轮换法搜索最佳的网络层数和储备池大小。深度回声状态网络的学习性能依赖于网络层数和储备池大小
25、的寻优过程,如果采用遍历法对所有可能的取值进行寻优,时间消耗将会非常巨大,不利于实时预测;如果采用比较复杂的优化算法寻优,训练时长也比较长。因此,采用快速准确的坐标轮换法搜索这 个参数,提高了模型的预测性能。通过 标准数据集和卷烟厂空调负荷预测实验,证明 模型具有更高的预测精度及更强的泛化能力,和 均小于其他算法的对应值。同时,坐标轮换法搜索时间较短,而且中间层聚类减少了求逆时间,该算法可以缩短预测时间,便于实时调节冷水机组流量以匹配供需负荷。这样冷冻水流量甚至机组启停状态可以随着负荷变化而调整,提高冷水机组的节能效果。当然在预测模型实际应用时,由于管路延迟效应,还需要提前预测空调负荷。这样冷
26、水机组的冷量才能按时达到空调末端,满足负荷需求。至于提前时间量,需要根据实际工况确定,这将是下一步的工作。参考文献:,:,:张振中,郭傅傲,刘大明,等 基于最大互信息系数和小波分解的多模型集成短期负荷预测 计算机应用与软件,():张曦,康平,付雪峰,等 改进多目标萤火虫优化的软子空间聚类算法及在短期负荷预测中的应用 计算机应用与软件,():,杨胜维,吴利瑞,刘东 基于随机森林的航站楼负荷预测及特征分析 建筑热能通风空调,():闫秀英,李忆言,杜伊帆,等 基于 的空调系统负荷预测 分布式能源,():,:甘中学,喻想想,许裕栗,等 基于周期性 模型的空调冷热负荷预测 控制工程,():钱青,唐桂忠,张广明,等 基于 的建筑分项能耗短期预测 计算机工程,():,():王华秋,李春洋,李永德 树种 的冷水机组预测优化模型研究 重庆理工大学学报(自然科学),():,:,:,:,:,:,:,:王永海,等:改进的深度回声网络在空调负荷预测中的应用 ,():,:,(,;,;,):,:;(责任编辑 周媛媛)