分销赏收藏举报申诉 / 16

立即下载 VIP下载

当前位置：首页 > 学术论文 > 毕业论文/毕业设计 > 基于主动学习机制GAN的M...过程二噁英排放风险预警模型_汤健.pdf

基于主动学习机制GAN的M...过程二噁英排放风险预警模型_汤健.pdf

上传人：自信****多点

文档编号：274616

上传时间：2023-06-26

格式：PDF

页数：16

大小：3.02MB

《基于主动学习机制GAN的M...过程二噁英排放风险预警模型_汤健.pdf》由会员分享，可在线阅读，更多相关《基于主动学习机制GAN的M...过程二噁英排放风险预警模型_汤健.pdf（16页珍藏版）》请在咨信网上搜索。

1、第卷第期年月北京工业大学学报基于主动学习机制的过程二噁英排放风险预警模型汤健，崔璨麟，夏恒，王丹丹，乔俊飞，（北京工业大学信息学部，北京；智慧环保北京实验室，北京）摘要：针对构建城市固废焚烧（，）过程剧毒污染物二噁英（，）排放风险预警模型的样本极为稀少的问题，提出一种基于主动学习机制生成对抗网络（，）的排放风险预警建模方法首先，以风险等级作为条件信息使得生成候选虚拟样本；然后，利用基于最大均值差异和多视角可视化分布信息的主动学习机制进行虚拟样本的初筛和评估，以获得期望虚拟样本；最后，基于混合样本构建排放风险预警模型通过基准数据集和过程数据集验证了所提方法的有

2、效性基于主动学习机制的排放风险预警建模方法可以有效解决样本稀少的问题，提高模型精度关键词：城市固废焚烧（，）；二噁英（，）排放风险预警；生成对抗网络（，）；虚拟样本生成（，）；最大均值差异；主动学习中图分类号：；文献标志码：文章编号：（）：收稿日期：；修回日期：基金项目：国家自然科学基金资助项目（）；北京市自然科学基金资助项目（）作者简介：汤健（），男，教授，博士生导师，主要从事小样本数据建模、固废处理智能控制方面的研究，：，（，；，）：（）（），（），北京工业大学学报年：（）；（）；（）；（）；城市固废的产生量随城市人口的不断增加而逐年提高城市固废焚烧（

3、，）是当今世界大部分国家采用的具有无害化、减量化和资源化等优势的处理手段由于过程所产生的副产品二噁英（，）为剧毒污染物，不但损害内分泌系统和破坏染色体进而导致细胞癌变，而且在生物体内具有累积效应，是造成焚烧建厂存在“邻避现象”的主要原因因此，控制其排放是急需解决的环保问题，对排放的风险等级进行预警，对实现过程的优化控制和减少污染排放具有实际意义目前，工业界主要对过程末端烟囱排放烟气中的进行检测常用方法包括：）离线直接检测法首先在线收集一定量的烟气，然后在实验室进行一周左右的化验分析缺点是检测费用昂贵和时间滞后，目前企业大多按照需求进行不定期的检测）在线间接检测法首先对与

4、有密切关系的指示物关联物进行检测，然后通过映射模型计算排放浓度缺点是检测设备复杂且价格昂贵，导致其很难直接应用于工业现场）软测量法以易测过程变量和污染物浓度为输入构建数据驱动模型，实现排放的在线检测显然，离线直接检测法和在线间接检测法均很难满足过程以减少排放为目的的实时优化控制的需求此外，排放浓度检测的难度大、周期长、费用昂贵，导致构建数据驱动模型的样本真值极其稀少因此，过程中排放浓度检测问题属于典型的小样本建模问题，具有数量少、样本间不平衡等特性通常较少数量的建模样本难以准确反映工业过程的真实特性，因此，构建鲁棒可靠的污染物浓度排放回归预测模型较为困难，相对而言，构建污

5、染排放风险预警模型较为容易此外，工业现场领域专家也常采用低、中、高等不确定性语言描述污染排放风险，并依据自身经验获得判别结果以调整相关控制参数但是，建模样本的不平衡，即某类样本的数量远小于其他类，这也是所构建风险判别模型具有片面性和偏差性的主要原因目前，已存在多种面向小样本数据的建模方法，例如：支持向量机（，）通过最大间隔超平面划分数据集以减少对样本数量和分布的需求，但存在对缺失值敏感、惩罚参数和核函数选择困难等问题；基于概率推理图模型的贝叶斯网络（，），能够结合建模数据和专家经验进行不确定性推理，但网络结构和参数的确定缺乏系统化的设计方法；灰色模型（，）基于灰色系统理论建模，能够有效减少

6、数据间的随机性，并使数据呈现更加明显的特征规律，虽然在一维指数变化数据预测方面的性能较好，但却很难处理高维输入和分布未知的数据针对上述小样本建模方法存在的问题，虚拟样本生成（，）方法被提出，即在原始样本的基础上根据先验知识、样本分布等信息生成一定数量的虚拟样本以填补信息空缺进一步，等通过数学证明了在领域先验知识下生成的虚拟样本与原始的真实样本具有相同建模效果众多研究也表明，将虚拟样本加入到小样本集中可提高模型的精度和泛化能力根据生成原理，笔者将分为类：）基于分布采样；）基于信息扩散；）基于特征提取；）基于生成对抗网络（，）基于分布采样的是通过对原始样本的分布进行采样以获得新样本，如

7、文献提出基于高斯分布采样生成虚拟样本后将其添加到小样本集中构建分类器，实验结果表明其效果优于原始小样本集该类方法的优点是计算简单和易于实现，缺点是对原始样本分布的依赖性强，难以用于分布复杂的高维数据基于信息扩散的包括整体趋势扩散技术和基于树的趋势扩散技术，主要通过扩展样本的属性域，利用模糊理论生成虚拟样本，但扩散系数和扩散函数的确定较难基于特征提取的是从原始样本中提取特征，即对高维数据进行降维后在低维特征空间生成虚拟样本，主要方法有分布随机邻域嵌入（，）和虽然该类方法可有效处理高维数据，但通过降维生成的低维虚拟样本可能丢失高维样本的分布关系目前，基于的多应用于虚拟图像样本的生成

8、，最初由等基于博弈对抗思想提出，其通过生成器和判别器的博弈对抗使得虚拟样第期汤健，等：基于主动学习机制的过程二噁英排放风险预警模型本越来越接近真实样本，从而解决样本数量少的问题文献提出基于生成器和判别器的等效模型，以少量绝缘子图像样本和随机噪声为输入生成虚拟绝缘子图像样本，结果表明，增加虚拟样本后的分类效果得到有效提升文献提出解决管道泄漏数据集类不平衡问题的增强，结果表明，增加虚拟样本可提高状态检测模型的精度研究表明，利用博弈对抗逼近真实分布，生成的虚拟分类样本更加接近真实样本在的网络超参数优化方面，文献在多个生成器之间采用参数共享方式进行优化训练，通过引入正则项减少梯

9、度消失的影响文献将进化神经网络与相结合应用于风力发电预测，通过一组不同的损失函数在进化过程中逐渐逼近网络最优参数上述这些研究难以用于建模样本稀少的场景由上可知，基于的研究在工业领域中的应用，尤其面向过程数据的应用鲜有报道此外，对于如何选择更有效的虚拟样本是一个开放性的难题图基于炉排炉的工艺流程主动学习是指通过一定的算法查询最有用的未标记样本后由领域专家进行标记，然后基于混合样本训练分类模型以提高泛化性能文献利用不确定性抽样选取接近决策边界的样本进行标注，实验结果表明，主动学习只需要使用更少的标注样本即可达到更好的泛化性能文献指出虽然半监督模型采用计算机代替人工标注降低了

10、成本，但标注结果却依赖于基准分类器的分类准确率，难以保证标注结果的准确性，相较而言，主动学习采用人工标注有效地降低了标注错误的可能性由上可知，主动学习能够通过提升训练样本的质量提高分类模型的性能目前，如何主动标记虚拟样本的研究鲜有报道综上，本文提出基于主动学习机制的过程中排放风险预警模型构建方法首先，在原始的基础上引入风险等级作为条件信息，使得生成器能够生成指定风险等级的虚拟样本；然后，先使用最大均值差异（，）对虚拟样本进行初筛，对初筛后的虚拟样本再基于主成分分析（，）和进行可视化，进而由领域专家进行主动判别；最后，基于虚拟样本和真实样本组成的混合样本构建排放风险预警模型

11、结合基准数据集和过程的实际数据验证了所提方法的有效性过程排放描述国内某电厂的炉排炉焚烧工艺流程如图所示北京工业大学学报年由图可知，城市固废由专用车辆收集，称完质量后运输至卸料大厅，倾倒入密封的固废池中，并通过抓斗送至焚烧炉料斗内，由给料器推至炉排；城市固废在焚烧炉内依次经历干燥、点燃、燃烧和燃烬个阶段，燃烬后的残渣落入水冷渣斗后由捞渣机送至灰渣坑中，收集后送至填埋场处理；焚烧过程产生的热量经余热锅炉后生成高压蒸汽，推动汽轮发电机发电；添加活性炭和消石灰后的锅炉出口烟气进入反应器，产生的飞灰进入飞灰罐，烟气进入袋式除尘器以去除烟气颗粒物、中和反应物和活性炭吸附物

12、处理之后分为个部分：）尾部飞灰进入飞灰罐；）部分烟灰混合物在混合器中加水后重新进入反应器；）尾部烟气通过引风机经烟囱排入大气，其中包含、和等物质固废不完全燃烧和新规合成反应导致过程产生的焚烧灰、飞灰和烟气中均包含因此，焚烧过程中烟气需要达到，并保持以确保有毒有机物的有效分解在烟气处理阶段向反应器内注入石灰和活性炭，吸附和部分重金属，然后经袋式除尘器过滤，通过引风机排入烟囱，以减少排放烟气中的浓度此外，该阶段产生的积灰存在的记忆效应也会导致排放浓度增加现场分布式控制系统（，）采集和存储上述各阶段的过程变量以及常规污染物（、和等）浓度然而，由于高成本和长周期等原因使得

13、排放烟气中的检测样本较为稀少由上可知，构建排放风险预警模型的样本存在数量少、分布不均和维数高等特点排放风险预警建模策略本文提出基于主动学习机制的过程中排放风险预警模型构建策略，包括基于的、虚拟样本筛选与评估和基于混合样本的风险预警模型构建个模块，如图所示图基于主动学习机制的排放风险预警模型构建策略图中：，表示由过程获取的真实样本，和分别表示其输入集和输出集；表示随机噪声；，为生成器生成的候选虚拟样本，和分别表示其输入集和输出集；，为经过初筛的虚拟样本，和分别表示其输入集和输出集；和分别表示由可视化和可视化提供的分布信息；，为经过领域专家主动判别得到

14、的合格虚拟样本，和分别表示其输入集和输出集；?表示所构建风险预警模型的风险类别预测输出建模算法.基于的模块由于原始生成的虚拟样本类型不可控，本模块在原始的基础上引入排放风险等级作为条件信息以控制生成虚拟样本的类型所提基于的流程如图所示本文中，将每批训练样本数记为，学习率记为，最大训练次数记为生成器采用层神经网络，隐含层使用激活函数，输出层使用线性激活函数，即第期汤健，等：基于主动学习机制的过程二噁英排放风险预警模型图基于的流程（，）（）（）式中：和分别为生成器输入层和隐含层之间的权值和偏置；（）表示激活函数；为生成器隐含层输出；和分别为生成器隐

15、含层和输出层之间的权值和偏置；为训练过程中生成器的输出判别器的隐含层使用激活函数，输出层使用激活函数，即，（）（）（）（）（）式中：为，和，组成的混合样本；和分别为判别器输入层和隐含层间的权值和偏置；为判别器隐含层输出；和分别为判别器隐含层和输出层间的权值和偏置；（）表示激活函数；为训练过程中判别器的输出相应地，的目标函数为（）（）（）（）（）式中：（）表示的分布；为判别器对，的输出；（）表示的分布；为判别器对，的输出通常，判别器需要计算样本来自（）或（）的概率，生成器根据判别器的结果学习真实样本的分布（）以减少（），进而使得生成器和判别器在最小最大的博弈对抗中共同训练本文中，

16、将当前生成器生成的虚拟样本质量与前一次检测的虚拟样本质量进行比较，当两者的差距小于预设阈值时认为生成器达到稳定，判别函数为（，），（）式中表示第个待检测生成器生成的候选虚拟样本质量，本文采用值评判由式（）可知，若（，）的值为，表示生成器达到稳定；反之，生成器未达到稳定，需要继续训练.虚拟样本筛选与评估模块.基于的虚拟样本初筛子模块首先，取若干个稳定生成器生成若干组候选虚拟样本接着，计算每组虚拟样本质量采用度量虚拟样本与真实样本的总体均值差异，进而衡量两者之间的分布差异为便于理解，将生成器生成的候选虚拟样本输入和真实样本输入的形式表示为，（），（）式中和分别表示一组候选虚

17、拟样本和真实样本的数量通过高维映射函数获得上述样本在再生核希尔伯特空间（，）中期望差值的上确界，即（，）（）（）（）（）（）式中：为；（）表示将样本映射到高维；（）和（）表示样本映射到中的期望值根据式（）计算组虚拟样本，与真实样本，间的值，初筛函数定义为（，）（，），（，），（，）（）式中（）表示取组虚拟样本与，的值最小的那组虚拟样本，将其作为质量最佳的初筛虚拟样本，.基于的虚拟样本可视化模块.基于的虚拟样本可视化子模块通过一组正交向量将原始数据投影到新北京工业大学学报年的空间，在消除了原始数据冗余的同时保留了主要信息为便于理解，此处将初筛虚拟样本的输入及其

18、中心化后的形式表示为，（），（）式中和为样本数量和维数首先，计算的协方差矩阵（）接着，将其进行特征分解，矩阵为（）|（），（）式中：为依特征根从大到小顺序排列的对角阵；为特征根对应的特征向量矩阵然后，依据最大特征向量，得到降到维的虚拟样本（）式中为最大特征值对应的特征向量最后，计算的概率密度，将其可视化.基于的虚拟样本可视化子模块的原理是根据样本点之间的相似性将高维样本嵌入到低维空间通常，使得中距离近的样本点在中离得更近，距离远的样本点离得更远，进而能够有效地解决拥挤问题，提高可视化的效果为便于理解，此处将初筛虚拟样本的输入和采用降至维后的样本表示为，（），（）

19、首先，在和中分别使用高斯分布和分布将距离转换成概率以表示个样本点之间的相似性，目标函数为（）（）式中：与分别为和的的矩阵；是中个样本点与之间的概率，计算公式为（）（）（）（）（）（）（）式中和是以样本点和为中心的高斯函数的方差式（）中的是中个样本点与之间的概率，计算公式为（）（）（）相应地，目标函数的梯度为（）（）（）（）记的学习率和动量分别为和（），计算第次迭代的值，公式为（）（）（）最后，达到迭代次数后，即可得到约简为维的虚拟样本类似地，计算的概率密度后，将其可视化.基于领域专家的主动判别子模块将对虚拟样本进行和可视化所获得的

20、分布信息与期望分布的差异记为和，其过程可表示为（，）（）（，）（）式中（）和（）表示分布差异判别函数此处，通过领域专家的主动打分予以判别，并相应地将其得分记为和两者加权为最终得分，公式为（）式中和分别为和对应的权重本文提出的领域专家主动判别函数为（），（）式中为根据领域专家经验设定的阈值式（）表明：若（）的值为，表示该初筛虚拟样本为合格虚拟样本；反之，其为不合格.基于混合样本的风险预警模型构建模块将判别得到的合格虚拟样本，和原始真实样本，进行组合，得到混合样本，公式为第期汤健，等：基于主动学习机制的过程二噁英排放风险预警模型，（）本文采用随机森林（，）作为风险预警模

21、型的分类器实验验证.基准数据集实验结果及分析.实验数据描述为了验证所提方法的合理性和有效性，采用（）平台上的个基准数据集和进行测试，其统计信息如表所示.实验结果.基于的结果针对基准数据集，生成器和判别器均采用层表基准数据集的统计结果数据集样本数特征数类别数神经网络，每层均为全连接层，其中：生成器的隐含层采用激活函数，输出层采用线性激活函数；判别器的隐含层采用激活函数，输出层采用激活函数；隐含层神经元个数取训练样本输入特征数量的倍，取训练样本数的具体参数设置如表所示.虚拟样本筛选与评估结果图表示和数据集生成的候选虚拟样本质量和训练次数间的关系表基准数据集

22、参数的设置数据集生成器网络结构判别器网络结构训练次数，.，.图基准数据集生成的候选虚拟样本质量和训练次数间的关系由图可知：对于数据集，训练次数从开始，虚拟样本质量基本达到稳定；对于数据集，训练次数达到后虚拟样本质量基本达到稳定对于数据集，从次到次训练中每次选择个生成器，共个生成器，每个生成器生成组虚拟样本，每组个候选虚拟样本对于数据集，从次到次训练中每次选择个生成器，共个生成器，每个生成器生成组虚拟样本，每组个候选虚拟样本然后，从个生成器的组虚拟样本中筛选出与真实样本的值最小的作为初筛虚拟样本，结果如表所示由表可知：数据集第次训练

23、得到的生成器生成的第组虚拟样本与真实样本的值最小；数据集第次训练得到的生成器生成的第组虚拟样本与真实样本的值最小因此，这组作为初筛虚拟样本图表示和数据集的初筛虚拟样本的和可视化结果图（）（）中的实心圆和星号代表真实样本和初筛虚拟样本，红、绿和蓝色分别代表类别、和北京工业大学学报年表基准数据集基于的虚拟样本初筛实验结果数据集训练次数组数.将图的可视化结果交与位领域专家，专家根据分布拟合情况对上述可视化结果进行打分（百分制），并将权重系数均取为.，结果如表所示和数据集初筛后的虚拟样本最终得分分别为.和.，均高于设定阈值，即组虚拟样本都属于

24、合格虚拟样本.基于混合样本的分类模型构建结果表为基于混合样本的分类模型构建时采用的相关参数由于算法具有随机性，实验重复进行次的分类准确率如图所示由图可知，和数据集的平均准确率为.和.，表明基于混合样本的分类模型具有较高的精度.实验结果对比针对和数据集，分别进行如表所示的类实验和数据集次的对比实验结果和统计结果分别如图和表所示由图和表可知：）数据集基于虚拟样本训练的分类模型性能低于基于真实样本的，但是基于混合样本训练的分类模型的性能均优于真实样本，可见添加虚拟样本之后分类模型的精度和稳定性都得到了提高；）数据集在添加了虚拟样本后，对于分类模型的性能提升并不明显，

25、但却有效地提高了分类模型的稳定性，可见需考虑数据集的特性为展示不同数量的混合样本对实验结果的影响，本文进行了实验，具体为：原实验中测试集保持不变，对混合样本训练集按照以为间隔共组进行抽样实验，实验结果如图所示由图可知，混合样本的数量越多，所建立的分第期汤健，等：基于主动学习机制的过程二噁英排放风险预警模型图基准数据集基于和的初筛虚拟样本可视化结果表基准数据集基于可视化的专家打分结果数据集专家编号可视化得分可视化得分加权得分平均得分.表基准数据集混合样本分类模型的相关参数数据集真实样本数量虚拟样本数量树的数量样本划分混合样本用于训练，用于测

26、试混合样本用于训练，用于测试北京工业大学学报年图基准数据集运行次分类模型的结果表基准数据集对比实验的相关参数数据集实验编号真实样本数量虚拟样本数量树数量样本划分真实样本训练，测试虚拟样本训练，使用实验的测试集测试混合样本训练，测试真实样本训练，测试虚拟样本训练，使用实验的测试集测试混合样本训练，测试图基准数据集对比实验的准确率表基准数据集对比实验的统计结果对比实验编号准确率均值准确率标准差准确率均值准确率标准差.第期汤健，等：基于主动学习机制的过程二噁英排放风险预警模型图基准数据集混合样本数量对比实验的结果类模型准确率越高，

27、但针对不同数据集具有差异性此外，对比表可知，建模样本数量相同时，基于混合样本的建模性能强于单独的原始样本和虚拟样本如何确定适合的混合样本数量有待于进一步研究.数据实验结果及分析.实验数据描述本文所采用的数据来自北京某基于炉排炉的电厂，涵盖了年所记录条线的个有效排放浓度检测样本原始输入特征经过处理后从维降至维，此处将排放浓度分为个风险等级，如表所示高风险、中高风险、中风险、中低风险和低风险相应的样本数分别为、和，随机选择作为训练集构建模型，剩下的用于测试模型性能表排放风险等级划分标准分级标准风险等级.（）高风险.（）.中高风险.（）.中风险.（）.中低风险（

28、）.低风险.实验结果.基于的结果此处，生成器的输入层神经元个数为，与真实样本输入维数、输出维数一致，隐含层神经元个数为真实样本维数的倍，采用激活函数，输出层神经元个数与生成虚拟样本的维数一致，采用线性激活函数判别器的输入层神经元个数取，与虚拟样本和真实样本维数一致，隐含层神经元个数为真实样本维数的倍，采用激活函数，输出层神经元个数为，采用激活函数具体参数设置如表所示表数据集参数设置数据集生成器网络结构判别器网络结构训练次数，.虚拟样本筛选与评估结果图所示为基于数据生成的候选虚拟样本质量和训练次数的关系图数据生成候选虚拟样本质量和训练次数关系由图可知，当

29、训练次数达到时，生成的虚拟样本质量达到稳定进一步，从次到次训练中每次选择个生成器，共个生成器每个生成器生成组虚拟样本集，每组虚北京工业大学学报年拟样本的个风险等级各个，共个虚拟样本从个生成器的组虚拟样本集中筛选出与真实样本的值最小的作为初筛后的虚拟样本集实验结果如表所示由表可知，第次训练得到的生成器生成的第组虚拟样本与真实样本的值最小，因此，选择该组虚拟样本为保证可视化的效果，从个虚拟样本中随机选择与原始真实样本相同数量的不同风险等级初筛虚拟样本共个来进行可视化，实验结果如图所示表数据集基于的虚拟样本初筛实验结果训练次

30、数组数.图数据集基于和的初筛虚拟样本可视化结果图（）中的实心圆和星号分别代表真实样本和初筛虚拟样本；红色、绿色、深蓝色、淡蓝色和黑色分别代表低、中低、中、中高、高风险将图的可视化结果交与位领域专家，专家根据分布拟合情况对可视化结果进行打分（百分制），并将权重系数均取为.，结果如表所示由表可知，位专家的最终平均得分为.，高于设定阈值分，即该组初筛虚拟样本属于合格虚拟样本表数据集的领域专家打分结果专家编号可视化得分可视化得分综合得分平均得分.第期汤健，等：基于主动学习机制的过程二噁英排放风险预警模型.基于混合样本的风险预警模型构建结果使用上述合格虚拟样本和真实样

31、本组成的混合样本构建风险预警模型，相关参数如表所示次实验的准确率如图所示表数据混合样本风险预警模型构建的相关参数真实样本数量虚拟样本数量树数量样本划分真实样本用于训练，用于测试混合样本用于训练，用于测试由图可知，混合样本训练的风险预警模型的泛化性能强于真实样本训练的模型.实验结果对比此外，共进行组对比实验，相关参数如表所示表中，风险等级按照高、中高、中、中低、低风险的顺序排列虚拟样本从筛选虚拟样本中随图数据集运行次风险预警模型的结果机抽取，其中：不平衡虚拟样本和不平衡混合样本指各风险等级样本比例与真实样本的比例相同，平衡虚拟样本和平衡混合样本指各风险等级的样

32、本数相同考虑算法的随机性，种实验均重复执行次图为实验、和所构建的风险预警模型的准确率表得出了统计结果的对比表数据集对比实验的相关参数实验编号样本数各风险等级样本数样本划分真实样本训练，测试不平衡虚拟样本训练，使用实验的测试集测试真实样本和虚拟样本组成的不平衡混合样本训练，测试平衡虚拟样本训练，使用实验的测试集测试真实样本和虚拟样本组成的平衡混合样本训练，测试图数据集对比实验的结果表数据集对比实验的统计结果实验编号准确率均值准确率标准差.由图和表可知：）真实样本、不平衡虚拟样本和平衡虚拟样本的平均准确率分别为.、.和.，因此，本文方法所生

33、成的虚拟样本在泛化性能上接近真实样本；）基北京工业大学学报年于混合样本的平均准确率为.和.，相较于未添加虚拟样本的准确率分别提升了和，表明添加虚拟样本明显有助于提高模型性能；）平衡混合样本的平均准确率相较于不平衡混合样本提高了，表明平衡数据建模效果好于不平衡数据；）混合样本准确率的标准差低于真实样本，表明添加虚拟样本后提高了模型的稳定性.参数对比分析此处依据固定参数（包括生成虚拟样本组数和）对可变参数（和）进行分析，后者对泛化性能的影响如表所示由表可知：）代表每次训练的样本数量，其变化会改变每代的训练次数，进而影响生成虚拟样本的质量，最终对风

34、险预警模型的准确率产生影响当偏小时，每次训练样本偏少，导致很难学习到真实样本的分布；当偏大时，每轮训练次数偏少会影响训练效果，导致风险预警模型准确率和稳定性降低因此，取值应该基于建模数据的特性）的变化影响的训练效果，进而影响风险预警模型准确率通常，随着的降低，模型准确率会提高，但相应地需要训练的次数也会增多，进而导致时间成本增加因此，该值需要依据实际情况进行均衡表不同可变参数对模型性能影响的统计结果数据集每代训练次数准确率均值准确率标准差.第期汤健，等：基于主动学习机制的过程二噁英排放风险预警模型此外，训练次数会影响的训练效果，进而影响生成虚拟样本的质量随着训

35、练次数的增加，的训练效果变佳，生成的虚拟样本更接近真实样本上述分析表明，可变参数的设置方式对排放风险预警模型的性能具有一定影响，应根据实际情况进行选择，建议为：）当真实样本属于高维样本时，应该选择较小的和较大的训练次数以充分学习真实样本所有特征，从而获得更好的虚拟样本质量；）根据真实样本的实际数量选择合适的以保证每次训练的样本数和每代训练的次数相对均衡实际上，模型性能不是由算法中某个可变参数控制，而是受上述参数的综合影响可见，如何全局地优化选择可变参数也是有待解决的问题结论）提出基于和主动学习的风险预警框架，并用于建立排放浓度风险预警模型）基于的方法可通过条件信息生成指定类

36、型的候选虚拟样本，有效地扩展样本数量，填补真实样本的信息空白）虚拟样本评估和筛选方法使用对候选虚拟样本进行初筛，将初筛后的虚拟样本可视化结果交给领域专家进行判别，使得合格虚拟样本的质量更加接近真实样本基于基准数据和工业数据验证了所提策略和方法的有效性）未来研究方向包括：如何处理高维、离散的过程数据；如何增加生成器和判别器博弈对抗过程中的稳定性；如何改进生成器和判别器网络算法以获得更优虚拟样本参考文献：，：，：，（）：乔俊飞，郭子豪，汤健面向城市固废焚烧过程的二噁英排放浓度检测方法综述自动化学报，（）：，：，（）：（），：汤健，王丹丹，郭子豪，等基于虚拟样本优化选择的城市固废焚烧过程

37、二噁英排放浓度预测北京工业大学学报，（）：，（）：（）汤健，夏恒，乔俊飞，等深度集成森林回归建模方法及应用北京工业大学学报，（）：，（）：（），（），：，（）：，（）：，（）：，：，：朱宝虚拟样本生成技术及建模应用研究北京：北京化工大学，：，（）张永清，卢荣钊，乔少杰，等一种基于样本空间的类别不平衡数据采样方法自动化学报，（）：北京工业大学学报年，（）：（），（），：，（）：，：，：，（）：汤健，乔俊飞，柴天佑，等基于虚拟样本生成技术的多组分机械信号建模自动化学报，（）：，（）：（），（）：，（）：，（）：，：，：，：，（）：高强，姜忠昊基于等效模型的小样本库扩增研究电测与仪表，（）：，（）：（），（）：王星，杜伟，陈吉，等基于深度残差生成式对抗网络的样本生成方法控制与决策，（）：，（）：（）李响，严毅，刘明辉，等基于多条件对抗和梯度优化的生成对抗网络电子科技大学学报，（）：，（）：（），：，（）：，（）：，：，（）：，：？，（）：，（）：（责任编辑梁洁）

下载提示：咨信网仅提供存储空间/不修改/不编辑

【自信AI创作助手】【自信AI导航】
1、请仔细预览页面，基本判断完整性，对于直接下载带来的问题请及时与客服沟通；下载的文档，不会出现我们的网址水印。
2、该文档所得收入（下载+内容+预览）归上传者、原创作者；如果您是本文档原作者，请点此认领！既往收益都归您。

同意并开始全文预览

举报此文档有问题？有机会获“体验VIP”奖励！

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

10 金币 0人已下载

申诉本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请申请举报、认领或删除 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 基于主动学习机制 GAN 过程二噁英排放风险预警模型汤健

咨信网温馨提示：
1、咨信平台为文档C2C交易模式，即用户上传的文档直接被用户下载，收益归上传人（含作者）所有；本站仅是提供信息存储空间和展示预览，仅对用户上传内容的表现方式做保护处理，对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿，我们不确定上传用户享有完全著作权，根据《信息网络传播权保护条例》，如果侵犯了您的版权、权益或隐私，请联系我们，核实后会尽快下架及时删除，并可随时和客服了解处理情况，尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确)，网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据，平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺，下载前须认真查看，确认无误后再购买，务必慎重购买；若有违法违纪将进行移交司法处理，若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传，付费前请自行鉴别，如您付费，意味着您已接受本站规则且自行承担风险，本站不进行额外附加服务，虚拟产品一经售出概不退款（未进行购买下载可退充值款），文档一经付费（服务费）、不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印，是因预览和防盗链等技术需要对页面进行转换压缩成图而已，我们并不对上传的文档进行任何编辑或修改，文档下载后都不会有水印标识（原文档上传前个别存留的除外），下载后原文更清晰；试题试卷类文档，如果标题没有明确说明有答案则都视为没有答案，请知晓；PPT和DOC文档可被视为“模板”，允许上传人保留章节、目录结构的情况下删减部份的内容；PDF文档不管是原文档转换或图片扫描而得，本站不作要求视为允许，下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权，请谨慎使用；网站提供的党政主题相关内容(国旗、国徽、党徽－－等)目的在于配合国家政策宣传，仅限个人学习分享使用，禁止用于任何广告和商用目的。
6、文档遇到问题，请及时私信或留言给本站上传会员【自信****多点】，需本站解决可联系【微信客服】、【 QQ客服】，若有其他问题请点击或扫码反馈【服务填表】；文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“【版权申诉】”（推荐），意见反馈和侵权处理邮箱：1219186828@qq.com；也可以拔打客服电话：4008-655-100；投诉/维权电话：4009-655-100。