基于函数型主成分分析的过程批次响应序贯建模.pdf
《基于函数型主成分分析的过程批次响应序贯建模.pdf》由会员分享,可在线阅读,更多相关《基于函数型主成分分析的过程批次响应序贯建模.pdf(8页珍藏版)》请在咨信网上搜索。
1、第 50 卷第 4 期化 工 自 动 化 及 仪 表作者简介院刘洋洋渊1995-冤袁硕士研究生袁从事基于试验设计方法的生化过程建模优化研究袁lyy_遥引用本文院刘洋洋袁刘飞.基于函数型主成分分析的过程批次响应序贯建模咱J暂.化工自动化及仪表袁2023袁50渊4冤院439-446.实际工业生产中袁大量生化类间歇过程的机理不清楚或工艺过于复杂袁使得机理建模难度大且优化求解困难袁因而开发数据驱动模型成为可行的替代方案咱1暂遥 结合试验设计渊Design of Ex鄄periments袁DoE冤的响应曲面法渊Response SurfaceMethodology袁RSM冤 是一种兼具建模与优化的数据驱
2、动方法咱2暂袁其在生化分析和药物研究方面被广泛应用咱3暂遥 RSM只能够建立生产中某一时刻响应与操作条件之间的数据驱动模型袁通常是终端时刻遥 但构建整个批次响应关于操作条件的模型则更为重要袁 并且随着自动化实验平台的普及袁短期内并行试验能够快速获取批次数据袁这进一步促进了学者们对批次响应建模的研究遥文献咱4暂对RSM进行推广袁提出了动态响应曲面法 渊Dynamic Response Surface Methodology袁DRSM冤袁通过在响应面模型的系数中引入与时间相关的移位勒让德多项式渊Shifted Legendre Poly鄄nomials袁SLP冤袁 将RSM中仅描述某一时刻的模型系
3、数转化为可以表示整个批次的时变系数曰WANG Z和DONG Y等针对估计高阶SLP微小偏差造成的模型局部振荡问题分别提出相应的改进策略咱5袁6暂袁并拓展了DRSM的应用范围咱7暂遥 文献咱8暂使用改进DRSM建立吡啶酮环化反应模型曰文献 咱9暂 提出基于半参数模型的批次响应建模流程袁应用于甲酯化学选择性水解反应分析遥 此外袁还可以考虑高斯过程咱10暂尧机器学习咱11袁12暂等方法来分析批次响应建模问题遥以上方法把批次响应看作生产过程的离散数据序列遥 笔者将把批次响应视作一个整体袁表示为连续的响应函数曲线袁即函数型数据咱13暂遥 函数型主成分分析渊Functional Principal Com
4、ponentAnalysis袁FPCA冤 是研究函数型数据的主要方法遥FIDALEO M采用面心立方复合设计构造试验袁利用FPCA建立搅拌球磨机批次响应与操作条件之间的函数模型袁 确定了操作条件的设计空间咱14暂遥其中袁FPCA作用于批次响应得到均值曲线尧主成分函数和主成分得分遥 FIDALEO M使用RSM构建主成分得分关于操作条件的二阶多项式预测模型遥 但当批次响应的非线性较强且试验区域较为复杂时袁就需要采用精度更高尧灵活性更强的建模方法曰另一方面袁如果根据一次试验设计所得模型未达到预期精度袁还需考虑如何进一步提高DOI:10.20030/ki.1000鄄3932.202304007基于函
5、数型主成分分析的过程批次响应序贯建模刘洋洋刘飞渊江南大学 轻工过程先进控制教育部重点实验室冤摘要针对间歇生化过程操作条件的批次响应建模问题袁结合试验设计方法袁提出一种基于函数型主成分分析的序贯建模策略遥 首先袁使用B样条基函数平滑法将离散的批次响应序列转化为连续的响应函数曲线曰然后袁运用函数型主成分分析得到响应函数的均值曲线尧主成分函数和主成分得分曰最后袁构建主成分得分与操作条件之间的Kriging模型袁用于预测试验区域内任意操作条件所对应的主成分得分袁从而建立批次响应关于操作条件的模型遥 为了提高模型预测精度袁依据改进的收敛条件袁采用序贯设计迭代更新模型遥 通过生化反应网络试验仿真袁验证了该
6、建模策略的有效性袁且仿真结果表明该建模策略具有较好的数据可视化和模型解释能力遥关键词函数型主成分分析序贯设计批次响应试验设计Kriging模型生化类间歇过程中图分类号TP274.2文献标识码A文章编号1000鄄3932渊2023冤04鄄0439鄄084392023 年化 工 自 动 化 及 仪 表模型精度遥因此袁笔者采用精度更高的Kriging模型预测主成分得分袁并结合极大均方误差准则的序贯设计咱15暂袁在当前模型预测精度较低区域进行新的试验袁以提高所建模型精度遥 使用改进的曲线拟合度量指标与均方误差共同组成序贯设计收敛条件遥通过FPCA序贯建立生化反应网络产物浓度模型的试验仿真袁验证了所提方
7、法的有效性遥1基于Kriging模型的FPCA建模1.1函数型主成分分析FPCA的第1步是将离散的批次响应转化为连续的响应函数遥设离散的观测批次响应为院ym=h渊tm冤+着m袁m=0袁1袁噎袁nM渊1冤其中袁tm沂咱t0袁tb暂 是响应观测点袁t0和tb分别是批次的起始时刻和终端时刻曰ym是tm处的观测响应曰h渊tm冤表示潜在的响应函数h渊t冤在tm处的取值曰着m是tm处的观测误差遥考虑到生化批次响应的非周期性袁使用有限个B样条基函数的线性组合来平滑袁则响应函数h渊t冤可表示为院h渊t冤=nM+a-2d=0移cd准d袁a渊t冤渊2冤其中袁cd是线性组合的系数袁通过粗糙惩罚平滑法估计得到咱16暂
8、曰准d袁a渊t冤是第d个a阶B样条基函数遥根据Karhunen鄄Lo侉ve展开式咱17暂袁并截取前nQ个主成分函数袁可得h渊t冤的分解形式院h渊t冤=滋渊t冤+q=1移孜q灼q渊t冤渊3冤其中袁均值曲线滋渊t冤=nLl=1移hl渊t冤/nL袁nL是总试验次数曰灼q渊t冤是第q个主成分函数渊FPC冤袁与之相对的主成分得分渊FPC score冤孜q为院孜q=tbt0乙渊h渊t冤-滋渊t冤冤灼q渊t冤dt渊4冤记协方差函数为院C渊t袁t忆冤=nLl=1移hl渊t冤-滋渊t冤hl渊t忆冤-滋渊t忆冤nL-1渊5冤t忆沂咱t0袁tb暂可以证明主成分函数灼q渊t冤满足特征方程咱18暂院tbt0乙C渊t袁t
9、忆冤灼q渊t忆冤dt忆=浊q灼q渊t冤渊6冤其中袁浊q为C渊t袁t忆冤的特征值曰灼q渊t冤为浊q的特征函数遥为使估计的响应函数更好地拟合批次响应袁笔者采用方差解释率 渊Fraction of Variance Ex鄄plained 袁FVE冤来选取合适的nQ值院FVE=q=1移浊q肄q=1移浊q逸95%渊7冤至此袁可得响应函数的预测模型为院y渊t冤=滋渊t冤+q=1移孜q灼q渊t冤渊8冤1.2预测主成分得分主成分函数给出批次响应随时间的变化趋势袁而主成分得分则表示不同批次响应之间的差异袁度量不同操作条件对批次响应的影响遥 因此袁将主成分得分孜q视作操作条件u的标量响应袁即孜q=f渊u冤袁函数f
10、表示Kriging模型遥 操作条件u由nI个操作变量ui组成袁 故主成分得分与操作变量的关系为院孜q=f渊u1袁u2袁噎袁unI冤渊9冤在DoE中袁引入因子wi定义操作变量ui院ui=ui0+驻ui伊wi袁-1臆wi臆1渊10冤其中袁参考操作变量ui0=渊ui袁max+ui袁min冤/2袁偏移量驻ui=渊ui袁max-ui袁min冤/2袁ui袁max和ui袁min分别是操作变量ui的最大值和最小值遥式渊9冤改写为院孜q=f渊w1袁w2袁噎袁wnI冤渊11冤主成分得分估计值孜q的预测均方误差表示为渍渊w冤=MSE咱孜渊w冤暂咱19暂袁其中w=咱w1袁w2袁噎袁wnI暂T为试验点遥2FPCA序贯建
11、模算法本研究不额外增加测试集来检验模型精度袁而是采用改进的拟合度量指标袁结合极大均方误差准则的收敛特性袁提出建模收敛条件遥设批次响应ym的预测值为ym袁平均值y=nMm=0移ymnQnQnQ440第 50 卷第 4 期化 工 自 动 化 及 仪 表渊nM+1冤袁得拟合度量的统计量Rsquared为院Rsquared=1-nMm=0移渊ym-ym冤2渊12冤采用式渊12冤计算离散响应的拟合程度袁但是预测所得响应函数可能出现局部振荡遥 只在观测点计算拟合程度袁会导致高估袁因而考虑采用改进的拟合度量指标遥 将平滑所得响应函数y渊t冤看作为观测响应函数遥 再由式渊8冤计算得到预测响应函数y渊t冤袁则响
12、应函数的残差平方和与离差平方和之商SSET为院SSET=tbt0乙y渊t冤-y渊t冤2dttbt0乙y渊t冤-y-渊t冤2dt+缀渊13冤为了确保式渊13冤恒有效袁添加极小数缀=2-52院IRsquared=1SSET 姨+1渊14冤其中袁IRsquared是改进后的拟合度量指标袁其值越接近于1袁模型预测响应越贴合观测响应遥 当IRsquared逸0.95时袁 模型预测响应就可以较好地拟合观测响应遥下面给出FPCA序贯建模批次响应的算法流程袁如图1所示遥nMm=0移渊ym-ym冤2图1FPCA序贯建模算法流程FPCA序贯建模批次响应算法的具体实现步骤如下院a.构造初始试验点集遥 依据生产和操作
13、规范确定试验区域并判断其是否规则袁如果试验区域4412023 年化 工 自 动 化 及 仪 表是规则的超立方体袁采用面心立方复合设计构造初始试验点集曰否则袁由基于二阶线性模型的D最优设计构造初始试验点集咱20暂袁初始试验点个数应不少于np渊np为线性模型的项数冤遥 考虑到后续预测主成分得分需建立Kriging模型袁 额外增加5个试验点用于随机部分的估计遥 故初始试验次数为np+5遥b.获得试验数据集Sk渊设k=0冤遥 运行试验点集中的试验袁 等间距记录观测到的批次响应袁获得试验数据集Sk袁 其包含试验点集和与之对应的批次响应遥c.基于试验数据集Sk建立模型Mk遥 首先袁通过粗糙惩罚平滑法将离散
14、的批次响应转化为连续的响应函数曰然后袁对响应函数进行FPCA袁得到均值曲线尧 主成分函数和主成分得分袁 由方差解释率FVE逸95%选取主成分函数个数曰最后袁构建主成分得分与试验点的Kriging模型袁 用于预测未试点的主成分得分袁从而建立响应函数预测模型Mk遥d.根据极大均方误差准则获得序贯试验数据遥 通过分布在试验区域内的网格点选取候选点遥 极大均方误差所对应的候选点为序贯试验点袁运行试验并观测批次响应袁得到序贯试验数据集Sk忆遥 将Sk忆加入试验数据集Sk袁得到新数据集Sk+1遥 在这一步中袁生成候选点的网格分布间隔为0.04遥 nQ个主成分得分一次序贯设计至多添加nQ个数据袁这是由于每个
15、主成分得分的极大均方误差可能对应不同的候选点袁也可能对应相同的候选点遥e.序贯设计收敛条件判断遥 计算步骤d中序贯试验点的均方误差渍k和拟合度量指标IRsquared遥 如果k=0袁执行步骤c曰否则袁若IRsquared逸0.95且渍k-1逸渍k袁则满足序贯设计收敛条件袁 基于试验数据集Sk+1建立模型Mk+1袁算法流程结束曰不然袁执行步骤c遥3生化反应网络建模示例对一个含10种物质的模拟反应网络进行FPCA序贯建模遥该反应网络具有8个独立反应袁反应1尧4为可逆反应袁 动力学方程和参数见文献咱6暂袁物质间的关系如图2所示袁其中袁数字代表反应袁圆圈代表物质袁蓝色表示反应物袁灰色表示中间体袁橙色表
16、示副产物袁绿色表示目标产物遥图2模拟反应网络示意图通过DoE研究反应温度渊50耀90 益冤尧反应物A2初始浓度渊0.8耀1.2 mol/L冤及反应物A3初始浓度渊0耀2 mol/L冤对反应网络中各物质批次浓度的影响遥 设这3个操作变量相对应的因子依次为w1尧w2和w3遥采用面心立方复合设计构造初始试验袁共15个试验点袁包括8个角点尧6个面中心点和1个体中心点遥 试验的运行由求解反应动力学方程仿真实现遥在12 h反应批次内袁每小时采样一次物质浓度遥 添加方差为N渊0袁0.005冤的正态分布噪声来表示测量误差袁该误差大约为较小浓度物质D2和D3的量级遥首先袁以批次浓度较为复杂的中间体I1为例袁比较
17、两个不同阶数B样条基函数的粗糙惩罚平滑效果遥这里的阶数渊Order冤是指定义一个多项式所需的常数个数遥 四阶B样条基函数以较低的阶数尧较好的平滑效果被广泛应用袁 而六阶B样条基函数则用于处理较为复杂的情况遥图3是中间体I1两个不同批次浓度的粗糙惩罚平滑结果袁左右两侧分别使用的是四阶和六阶B样条基函数袁均取得442第 50 卷第 4 期化 工 自 动 化 及 仪 表图3中间体I1批次浓度的粗糙惩罚平滑较好的平滑效果遥 计算平滑浓度拟合观测浓度的均方根误差 渊Root Mean Square Error袁RMSE冤袁可知四阶B样条基函数略优遥接着袁以目标产物F为代表进行FPCA序贯建模遥 前述已明
18、确操作变量及其范围尧试验区域尧初始试验点集和产物F的批次浓度遥 将离散的各批次浓度由四阶B样条基函数通过粗糙惩罚平滑法转化为连续的浓度曲线遥 对浓度曲线进行函数型主成分分析袁若要方差解释率FVE逸95%袁需提取两个主成分函数袁记为FPC1渊t冤和FPC2渊t冤袁解释率依次为89%和10%遥初始试验产物F批次浓度的均值曲线如图4a所示袁图4b是所提取的主成分函数图袁其中FPC1渊t冤恒为正且随着反应的进行先增加后逐渐趋平稳袁FPC2渊t冤随着反应的进行先增加后持续下降袁 且在反应进行至一半左右时由正转负遥图4初始试验产物F浓度均值曲线和主成分函数图5给出了主成分函数对浓度均值函数的影响袁来直观展
19、示FPC1渊t冤和FPC2渊t冤的特征遥 其中袁野+冶线是滋渊t冤+浊q1/2伊FPCq渊t冤袁野-冶线是滋渊t冤-浊q1/2伊FPCq渊t冤遥 由于特征值nq越大袁FPCq渊t冤对方差的贡献率越大袁因此将特征值的平方根作用于主成分函数遥在FPC1渊t冤维度上袁产物F浓度的变化主要表现为竖直方向上的移动袁且随着反应进行移动幅度增大遥FPC2渊t冤在反应进行到一半左右时由正转负袁与横坐标轴有一个交点袁产物F浓度的变化在6 h左右也出现变号遥 意味着FPC2渊t冤主要显示反应过程前半部分与后半部分的对比袁该对比大致表现为浓度变化速率遥4432023 年化 工 自 动 化 及 仪 表初始试验点及与之
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 函数 成分 分析 过程 批次 响应 建模
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。