Multi-stage Quality Prediction of Batch Process Based on KECA and MBA-NARX
-
摘要:
间歇过程产品质量与过程特性或过程反应原理密切相关,为解决其过程数据呈现的多阶段性、时序性和动态性的问题,提出一种基于带外源输入的非线性自回归(NARX)神经网络进行多阶段质量预测. 首先,对间歇过程数据进行K均值(K-means)聚类阶段划分和核熵成分分析(KECA)数据降维,保证输入数据阶段特征的同时提升后续预测过程的效率;然后,在各阶段内构造NARX预测模型,利用改进蝙蝠算法(MBA)优化网络的隐含层节点数,实现间歇过程在线质量预测;最后,利用青霉素仿真实验数据验证所提方法的有效性. 研究结果表明:NARX神经网络开环模式具有较好的预测效果,核熵成分分析的数据降维方式更有利于后续的质量预测研究;MBA对于网络隐含层节点数的优化效率高、稳定性好,阶段划分可以一定程度上提高间歇过程的预测性能,提出的多阶段质量预测模型预测性能较高,均方根误差和平均绝对百分比误差分别达到0.02和1.20%.
Abstract:The product quality of batch process is closely related to the process characteristics or the process reaction principle. In order to solve the problems of multistage, time sequence and dynamics of batch process data, a multistage quality prediction method based on nonlinear autoregressive with exogeneous inputs (NARX) neural network is proposed. First, the batch process data are divided into stages by the K-means, and the data dimension is reduced using the kernel entropy component analysis (KECA). These works can improve the prediction efficiency of the subsequent process while ensuring the stage characteristics of the input data. Then, the NARX prediction model is constructed in each stage, and the number of hidden layer nodes of the network is optimized by using the improved bat algorithm (MBA) to realize the online quality prediction of batch processes. The penicillin simulation data is used to verify the effectiveness of the proposed method. The results show that the open-loop structure of the NARX neural network has a good prediction effect, and the data dimensionality reduction method of the KECA is more conducive to subsequent quality prediction research. MBA optimizes the number of hidden layer nodes in the network with higher efficiency and better stability. The stage division can improve the prediction performance of the batch process to a certain extent. The proposed multi-stage quality prediction model has higher prediction performance, its root means square error and the mean absolute percentage error reached 0.02 and 1.48%.
-
自动定理证明是人工智能的核心部分之一,致力于生成高效的计算机程序,从而使计算机能够完全或几乎完全自动地进行推理. 即,将形式化为一阶逻辑公式的前提和结论作为计算机程序的输入,并试图利用程序自动从前提中推导出结论. 这样的程序通常被称为自动定理证明器(automated theorem prover,ATP).
随着形式化技术的发展,ATP的应用范围从理论上的数学定理逐渐拓展到知识编译[1]、软(硬)件模型检验[2-5]、管理规划[6-7]、集成电路设计[8-10]及软件测试[11]等实际问题上. 因此,旨在推理小规模数学问题的ATP越来越多面对从一些大型知识库(CYC[12]、SUMO[13]以及Mizar[14]等)和实际应用中转换而成的大规模的问题. 这些大规模问题通常被称为大理论(large theory),通常包含成千上万个前提,但是仅有非常少的一部分前提才对问题结论的证明有用. 大规模的冗余前提集会使得ATP在证明问题时搜索空间呈指数型增长,甚至可能立即超出计算机的运行能力,这大大地限制ATP自动推理能力. 假设可以直接使用在证明中出现的前提,ATP则能够轻松快速地证明问题的结论. 因此,从问题中去除不必要的前提,可以减少搜索空间,并降低搜索难度. 在ATP开始证明之前选择出对问题结论证明有用的前提的过程被称为前提选择(premise selection). 前提选择是ATP预处理中非常关键的一环,对解决大理论的自动推理至关重要.
早期的前提选择方法[15-16]通过不断对当前选择的前提和结论否定的模型进行语义分析来指导前提的选择. 然而,基于语义的前提选择方法非常耗时,且严重依赖模型检查器的能力. 随后,一些基于符号相关性的前提选择方法[17-19]不断被提出. 此类方法主要通过计算和比较出现在公式(前提和结论)符号中,分析公式间的相关性. 当前,一些机器学习[20-22]和深度学习[23-27]技术也开始应用在前提选择中. 基于学习的前提选择方法强烈地依赖于大规模成功证明的领域经验,需要从形式化证明构造不同领域(如集合论、代数以及管理等)问题的语料库. 然而,在形式化时不同领域问题使用的符号是随机制定的,使得对应的语料库无法在学习训练中跨领域通用. 因此,当ATP面临一个新领域中的大规模问题时,由于缺乏新领域中的形式化证明,将导致当此类学习方法在前提选择任务中失效.
因此,从效率和可行性出发,当前ATP主要使用基于符号相关性的方法作为主要前提选择方法. 然而,当前方法终止前提选择过程的条件是,无法再选择任何的前提作为相关前提. 在此情况下,现有方法缺少在选择过程中对所选择前提的充分性进行判断,因此,可能在已经充分选择了相关前提的情况下,仍不会停止选择过程. 这直接导致当前选择过程将大量与结论证明无关的前提标记为相关的. 此外,当前的方法在选择前提时仍需人工设置相关度边界,这导致相关度边界值不具有普遍性和广泛适用性.
针对以上问题,本文提出了一种新的基于符号权重的一阶逻辑前提选择方法SymbolWeight. 新方法通过考虑问题中符号出现的频率,为每个符号赋予不同的权重. 在新的权重定义下,若符号是通用符号(高频符号),其权重就越小;若符号是稀有符号(低频符号),其权重就越大. 新定义符号的权重能够削弱通用符号造成的负面影响,以及体现稀有符号的重要性,从而保证基于新权重的相关度计算更加稳定. 同时,为减少手工参数的数量,提高前提选择的精确度,新方法提出一种自适应相关度边界,用于判断前提是否与结论相关. 此外,为了在充分选择相关前提的情况下及时停止前提选择过程,新方法交互结合了前提选择过程和结论自动推理过程. 实验结果表明,和自动定理证明器中广泛使用的通用前提选择方法相比,新方法能够帮助自动定理证明器E在MPTP2078基准测试集上提高10%以上的证明率.
1. 预备工作
在一阶逻辑[28]中,给定一个变元符号集
V 、一个函数符号集F 、一个谓词集P . 一阶逻辑项是一个变量项v(v∈V) 或者形如f(tu1,tu2,⋯,tug) 的函数项. 其中:f(•)∈F ,是g (g⩾0 )元函数符;tu1 ,tu2 ,…,tug 是项. 一阶逻辑原子(atom)形如pred(tr1,tr2,⋯,tro) ,其中:pred(•)∈P ,是o (o⩾0 )元谓词符;tr1 ,tr2 ,…,tro 是项. 一阶逻辑公式是由一阶逻辑联结词C={~,∧,∨,→,↔} 、量词Q={∀,∃} 和原子联结而成. 其中:~ 表示否定;∧ 表示且;∨ 表示或;→ 表示蕴含;↔ 表示等价;∀ 表示全称量词;∃ 表示存在量词.在自动定理证明中,问题的前提和结论均被形式化为一阶逻辑公式. 因此,符号是前提和结论最直观的特征. 若要为大理论问题的结论选择最相关的前提,最自然的方法是使用基于符号的前提选择方法.
2. 前提选择方法
基于符号相关性的前提选择方法意味着需要根据出现在前提中符号计算前提与当前结论证明的相关性,并据对应的相关度对前提进行选择.
2.1 基本思想
令c和P分别为一个大理论问题中的结论和前提集,基于符号相关性的前提选择方法的基本框架为:
1) 若符号s出现在c中,则s与c是1度相关的;
2) 若前提
p∈P 中的符号(或符号集)与c是k度相关的,则p是k+1 度相关的;3) 若p与c是k度相关的,则p中的所有符号与c是k度相关的.
在此过程中,首先需要定义两个相关集,即相关前提集
Rp 和相关符号集Rs .Rp 包含结论及与结论证明相关的前提.Rs 包含Rp 中所有公式的所有符号,即Rs=⋃func∈RpF(func), (1) 式中:
func 为结论c或与结论证明相关的任意前提p;F(func) 为func 中所有符号组成的集合.开始时,
Rp 仅包含结论c,Rs 仅包含c中所有的符号. 即初始时,Rp={c} ,Rs=F(c) . 前提选择方法基于每个前提p的符号集F(p) 和当前Rs , 计算p与c的相关度,不断地选择新的p加入Rp 中,同时更新Rs ,直到无法再将任何前提加入Rp 中. 在完成前提选择后,由相关前提集Rp 中的所有前提和结论组成的缩减问题将作为自动定理证明器新的输入,用于自动地证明问题的结论. 现有基于符号相关性的前提选择方法的通用流程如算法1所示.算法1 现有的基于符号相关性的前提选择方法
输入:结论c、前提P、相关前提集
Rp 、相关符号集
Rs 、无关前提集Ip 、选择前提集SP、相关度阈值h、循环标记
Flag 输出:
Rp Rp=c ,Rs=F(c) ,Ip=P ,Sp=∅ ,Flag=True while
Flag dofor
p∈Ip do根据当前的
Rs ,计算p 的相关度if
p 的相关度⩾h thenSp:=Sp∪{p} end if
end for
if
Sp=∅ thenFlag=False else
Rp:=Rp∪Sp ,Rs:=(⋃p∈SpF(p))∪Rs ,Ip:=Ip|Sp Sp=∅ end if
end while
完整的前提选择方法必须包含两个部分:前提选择和结论证明. 给定一个大理论,前提选择方法首先需要对大理论中的前提进行选择,随后利用自动定理证明器在选定的前提集上对问题的结论进行自动推理. 现有基于符号相关性的前提选择方法均将这两个部分分离开来,即,必须在结束前提选择过程之后,再利用自动定理证明器证明缩减后的问题. 尽管通过调整和添加实验参数对选择前提的数量进行限制,现有方法最后选择的前提仍有大量是与结论证明无关的.
2.2 基于符号权重的前提选择方法
由算法1可知,如何计算前提和相关符号集相关度是基于符号相关性的前提选择方法的重点. 简单地,可通过前提中的符号是否出现在相关符号集中,从而确定前提的相关性. 如果前提至少包含相关符号集中的一个符号,则可认为该前提是相关的. 在此情况下,若前提包含相关符号集中的一个符号,则该前提中的所有符号都会变为相关符号(加入相关符号集中). 这种做法的弊端在于,几次迭代后,问题中几乎所有的前提都将被选择加入相关前提集中. 其中,最主要的原因是大理论问题中某些符号(通常被称为通用符号)频繁地出现在不同的前提中. 若通用符号被标记为相关符号,则所有包含此类符号的前提都将被认为是与结论证明相关的. 因此,前提的选择方法的重心应该放在解决通用符号的问题上.
与通过符号对应的是稀有符号,即在问题中出现的频率较低,基于此类符号的选择方法能够避免选择过多的前提. 因此,符号的权重定义应该遵循两个原则:削弱通用符号造成的负面影响,以及体现稀有符号的重要性. 给定一个前提集
P ,任意符号s∈⋃p∈PF(p) 的权重w(s) 定义为w(s)=1−occ(s)|P|+1, (2) 式中:
occ(s) 为包含符号s的所有前提数量;|P| 为P中的前提总数.显而易见,对任意符号
s ,0<w(s)<1 .w(s) 满足符号权重定义的两个原则. 若符号s是通用符号,则s的权重就越小;若符号s是稀有符号,则s的权重就越大. 式(2)定义的符号权重均在区间(0,1) ,这能够保证基于该符号权重的相关度更加稳定.给定相关符号集
Rs ,前提p 在Rs 下与结论证明的相关度为r(p)=∑si∈Rs∩F(p)w(si)∑sj∈F(p)w(sj), (3) 式中:
si 为Rs 与F(p) 的交集中的任意符号;sj 为F(p) 中的任意符号.前提p与结论证明的相关度
r(p) 是在区间[0,1] 内的实数. 如果p中的符号均不在相关符号集Rs 中,则p与结论证明的相关度为0. 这说明p与当前的相关前提集Rp 毫无符号上的关联. 如果p中的符号均在Rs 中,则p与结论证明的相关度为1. 这说明p与当前的相关前提集Rp 在符号上非常相关. 值得注意的是,随着相关前提集Rp 和相关符号集Rs 的变化,前提p的相关度也会发生变化.由式(3)可知,每个前提都存在一个基于当前相关符号集的相关度. 给定任意两个前提,通过比较其与结论证明的相关度大小,可以形式化两个前提间“更相关”的关系. 根据相关度的高低能够将对应的前提进行排序,但不能直接形式化“最相关前提”这一概念. 最相关前提的相关度大于最不相关前提的相关度, 因此,最直观的做法是设定一个相关度边界,用于区分最相关前提和最不相关前提.
定义1 给定一个相关度边界h(
0⩽h⩽1 ),前提p被标记为最相关前提, 当且仅当r(p)⩽h .由定义1可知,如果将h设置为0,所有的前提均为最相关前提. 如果将h设置为1,仅有非常少(甚至为0)的前提被标记为最相关的. 显然,相关度边界值过大或过小都会直接影响选择的结果,甚至问题结论的证明. 通过人工设置的相关度边界不具有普遍性和广泛适用性.
为解决以上问题,本文提出了一种自适应相关度边界. 该边界仅由当前选择过程中前提的相关度而决定,从而不再需要提前进行人工设置.
假定问题中包含n个前提
p1 ,p2 ,…,pn ,n∈N,n⩾1 ,其对应的相关度分别为r(p1) ,r(p2) ,…,r(pn) . 在n个相关度中,部分相关度的值相同. 因此,合并相同的相关度值,能够从r(p1) ,r(p2) ,…,r(pn) 中获取M个不同的数值,M∈N,1⩽M⩽n . 这里将M个数值从高到低进行排序,序号为m的数值即为第m级自适应相关度边界hm ,m∈N,1⩽m⩽M .显然,自适应相关度边界因问题而异,且会随着选择过程的变化而变化. 在选择过程中,所有相关度小于
hm 的前提均不会被选择.前提选择方法的主旨在于选择尽可能少但充分与问题结论证明相关的前提. 一种可能的方法是选择一级自适应相关度边界
h1 作为选择前提的条件. 实验发现,在大部分情况下,h1=1 . 由式(3)可知,若一个前提的相关度为1,则该前提的所有符号均在相关符号集中. 若在相关前提集中加入相关度为1的前提,并不会使对应的相关符号集Rs 发生任何变化(加入新的符号). 因此,仅选择相关度为1的前提作为最相关前提,会导致选择的前提不够充分. 因此,本文进一步细化地定义了自适应相关度边界hadaptive .定义2 给定一个前提集和前提对应的相关度,
1) 若第1级自适应相关度边界
h1=1 ,则自适应相关度边界为第2级自适应相关度边界,即hadaptive=h2 ;2) 此外,自适应相关度边界为第1级自适应相关度边界,即
hadaptive=h1 .由定义2可知,利用自适应相关度边界
hadaptive ,新提出的基于符号权重的前提选择方法不再依赖任何人工设置的相关度边界.给定一个前提集
P ,现在可以根据前提p∈P 的相关度和自适应相关度边界,从P 中选择最相关前提. 然而,当前仍无法直观地判断所选择的前提对问题的结论证明是否足够充分. 因此,本文将前提选择过程和ATP的证明过程进行交互地结合. 在新的框架下,每一次选择的结果均将作为ATP的输入,开始尝试证明问题的结论. 若结论能够被自动地证明,则说明当前选择的前提是充分的,且整个过程可以停止.新提出的基于符号权重的前提选择算法流程如算法2所示. 最初的相关前提集仅包含问题的结论,对应的相关符号集仅包含结论中的符号,且无关前提集为问题的整个前提集. 在每次选择结束后,当前相关前提集中的前提和结论组成了新的缩减问题,ATP开始尝试在给定的CPU (central processing unit)运行时间内对该缩减问题进行证明. 若ATP能够证明该问题的结论,则不需要再继续选择前提,整个选择和证明过程立即停止. 否则,开始基于当前的相关符号集计算前提的相关度,并依据相关度边界, 将符合条件的前提标记为选择前提. 在旋转过程中,若没有满足条件的前提,则整个过程立即停止;否则, 利用当前新选择的前提更新相关前提集和相对应的关符号集,并从无关前提集中移除新选择的前提. 因此,整个过程将在K次循环后停止,
k∈N,k⩾1 .算法2 基于符号权重的前提选择算法
输入: 结论c、前提P、相关前提集
Rp 、相关符 号集Rs 、无关前提集IP、选择前提集SP、 相关度集R、自动定理证明器ATP 、迭代 次数K、 CPU运行时间T输出:
Rp Rp=c ,Rs=F(c) ,Ip=P ,Sp=∅,R=∅ for
k∈[1,2,…,K] do利用
ATP 尝试在时间T内证明由Rp 中的前提(和结论)组成的缩减问题
if 问题被
ATP 证明 then停止
else
for
p∈Ip do根据当前的
Rs ,计算p 的相关度r(p) R:=R∪{r(p)} end for
根据R决定自适应相关度
hadaptive for
p∈Ip doif
r(p)⩾hadaptive thenSp:=Sp∪{p} end if
end for
if
Sp=∅ then停止
else
Rp:=Rp∪Sp ,Rs:=(⋃p∈SpF(p))∪Rs ,Ip:=Ip|Sp Sp=∅ ,R=∅ end if
end if
end for
3. 实验和分析
本节使用MPTP2078问题库作为实验的基准测试集. MPTP2078问题库一共包含2078个问题,均来自Mizar问题库与Bolzano-Weierstrass定理相关的问题. 问题库中, 所有问题的前提和结论均被形式化为一阶逻辑公式,且公式按照其在Mizar数学库中出现的顺序线性排序. 即出现在每一个结论之前的公式(前提和其他结论)均可作为证明该结论的前提. 问题的前提数量在区间
[10,4563] 内,且前提的平均数量为1876个. 有关问题库前提数量和符号的具体分析见表1.表 1 MPTP2078问题库描述Table 1. Description of MPTP2078 benchmark个 项目 公式 结论 最小前提 最大前提 平均前提 符号 数量 4564 2078 10 4563 1876 784 在本文的实验中,使用的操作系统为CentOS Linux 7.4.1708;CPU为octa-core Intel(R) Xeon(R) E5-2667 3.20 GHz;内存128 G. 使用自动定理证明器E作为实验默认ATP. 除证明结论的数量外,还使用选择精准度
Spre (selected precision)和选择度Sel (selectivity)[29]作为评估各种选择方法性能的指标, 如式(4)、(5)所示.Spre 的值越高越好,而Sel 的值越低越好.Spre=1|Proved|∑prob∈ProvedNUiP(prob)NSel(prob), (4) Sel=1|Proved|∑prob∈ProvedNSel(prob)NAxP(prob), (5) 式中:
Proved 为被证明的问题集;prob∈Proved ,是Proved 中的一个被证明的问题;NUiP(prob) 为出现在prob 证明中的有用前提的数量;NSel(prob) 为选择的前提的数量;NAxP(prob) 为prob 包含的原始前提的数量.表2列出了实验所涉及的基于符号的前提选择方法. 为了保证实验的公平性,本文将每个问题在自动定理证明器E上运行的CPU时间设定为60 s. 若一个问题的选择过程迭代K次,则每次迭代后生成的缩减问题仅在自动定理证明器E上运行
60/K s. 显然地,需要权衡每次自动定理证明器运行的CPU时间和选择的迭代次数.提出的SymbolWeight能够根据前提的相当度自动地决定合适的相关度边界. 因此,SymbolWeight的性能仅与选择的迭代次数K有关. 表3评估了其在不同迭代次数K下对自动定理证明器E的性能影响. 由于每个问题运行CPU的时间最多为60 s,继续增加迭代次数会使得每次迭代中证明问题的CPU时间过小. 因此,SymbolWeight在实验中的最大迭代次数设置为30次. 随着K的不断增加,证明问题的数量在不断增加. 当
K=30 时,自动定理证明器E能够证明1077个问题. 值得注意的是,增加迭代次数并不会限制SymbolWeight的选择能力. 实验发现,SymbolWeight能够大大地减少选择前提的数量. 即使当K增加到30时,SymbolWeight平均选择前提数仅约为174个. 这表明,提出的自适应相关度边界在不损害自动定理证明器E证明能力的前提下,能够有效解决相关度边界的阈值设定问题. 随着K的增加,自动定理证明器CPU时间在逐渐减少(K=30 时,CPU时间仅为2 s). 然而,证明问题的数量在不断增加. 这说明如果能够正确地选择出证明大理论问题结论所需要的全部前提,自动定理证明器E能够轻易地搜索到结论的证明. 因此,有效的前提选择方法能够大大地帮助证明器提高证明问题的能力.表 3 自动定理证明器E在SymbolWeight下的证明性能Table 3. Performance of automated theorem prover E with SymbolWeightK 证明数
量/个平均选择前提数量/个 选择精
确度选择度 2 288 13.0 0.358 0.054 4 599 22.6 0.336 0.060 6 818 33.3 0.322 0.054 8 862 44.5 0.309 0.053 10 920 55.9 0.302 0.055 12 932 68.4 0.295 0.057 14 967 81.1 0.288 0.059 16 980 94.0 0.285 0.060 18 1003 106.3 0.280 0.061 20 1014 117.3 0.278 0.061 22 1028 128.7 0.275 0.064 24 1045 140.7 0.271 0.068 26 1057 151.5 0.268 0.070 28 1071 162.4 0.265 0.074 30 1077 174.2 0.264 0.076 表4比较了自动定理证明器E在不同基于符号的前提选择方法下的证明性能. E-SInE和Vampire-SInE分别表示在证明器E和Vampire中的SInE[19]方法. 自动定理证明器E在使用SymbolWeight作为前提选择方法时能够证明MPTP2078问题库中超过半数的问题. 与E-SInE和Vampire-SInE相比,SymbolWeight能够帮助自动定理证明器E在MPTP2078基准测试集上分别提高19.49%和10.49%的证明率.
表 4 自动定理证明器E在不同的基于符号的前提选择方法下的证明性能Table 4. Performance of automated theorem prover E with different symbol-based premise selection methods前提选择方法 证明数量/个 证明率/% no-selection 663 30.90 E-SInE 672 32.34 Vampire-SInE 859 41.34 SymbolWeight 1077 51.83 4. 结 论
1) 提出了新的符号权重和相关度计算方法,并基于此设计并实现了用于解决大理论问题的前提选择的方法;
2) 提出了自适应相关度边界,解决了在基于符号的前提选择方法中需要人工地设置相关度边界的问题;
3) 新提出的前提选择方法能够大大地提高自动定理证明器E在MPTP2078问题库上的证明能力.
-
表 1 过程变量说明
Table 1. Description of process variables
变量号 变量名称 变量号 变量名称 1 通风率/(L•h−1) 9 排气二氧化碳浓度/
(Mmol•L−1)2 搅拌速率/
(r•min−1)10 pH 值 3 底物流加速率/
(L•h−1)11 温度/K 4 补料温度/K 12 产生热/K 5 基质浓度/(g•L−1) 13 酸流加速率/(L•h−1) 6 溶解氧浓度/% 14 碱流加速率/(L•h−1) 7 菌体浓度/(g•L−1) 15 冷水流加速率/(L•h−1) 8 反应器体积/L 16 热水流加速率/(L•h−1) 表 2 NARX两种结构下的RMSE和MAPE区间范围
Table 2. The range of RMSE and MAPE in the two NARX structures
模式 RMSE MAPE/% Close-loop [1,5] [200,1500] Open-loop [0,0.60] [0,200] 表 3 数据降维方法对比
Table 3. Comparison of data dimensionality reduction methods
表 4 各算法初始参数
Table 4. Initial parameters of each algorithm
算法 参数 对应值或区间 PSO 种群大小 20 最大迭代数/次 20 速度区间 [1,16] 加速度因子1、2 2、2 GA 种群大小 20 最大迭代数/次 20 交叉概率 0.4 变异概率 0.01 MBA 种群大小 20 最大迭代数/次 20 响度 0.25 频率区间 [0,2] 位置更新区间 [1,16] 表 5 3种参数优化模型对比
Table 5. Comparison of three parameter optimization models
预测指标 PSO-NARX GA-NARX MBA-NARX 迭代
时间/s标准差/×10−4 验证集
误差迭代
时间/s标准差/×10−4 验证集
误差迭代
时间/s标准差/×10−4 验证集
误差产物浓度 200.56 16.70 0.024 1006.87 10.42 0.012 144.78 5.60 0.008 菌体浓度 181.42 10.66 0.687 894.91 7.58 0.298 134.39 3.40 0.144 基质浓度 240.38 21.52 0.376 1307.42 19.04 0.033 149.89 10.50 0.055 均值 207.45 16.30 0.360 1069.73 12.35 0.110 143.02 6.54 0.070 表 6 阶段预测结果
Table 6. Comparison of stages prediction effects
阶段/h RMSE MAPE/% 总体RMSE 总体MAPE/% 预测
用时/s0~38 0.04 2.83 0.02 1.20 51.72 39~169 0.01 0.78 170~280 0.01 0.84 281~400 0.02 1.47 0~400 0.04 2.60 0.04 2.60 22.06 -
[1] 王普,曹彩霞,高学金. 基于扩展得分矩阵的多阶段间歇过程质量预测[J]. 高校化学工程学报,2019,33(3): 664-671. doi: 10.3969/j.issn.1003-9015.2019.03.021WANG Pu, CAO Chaixia, GAO Xuejin. Quality prediction of multistage batch processes based on extended score matrices[J]. Journal of Chemical Engineering of Chinese Universities, 2019, 33(3): 664-671. doi: 10.3969/j.issn.1003-9015.2019.03.021 [2] ALSHAWARGHI H, ELKAMEL A, MOSHIRI B, et al. Predictive models and detection methods applicable in water detection framework for industrial electric arc furnaces[J]. Computers & Chemical Engineering, 2019, 128(6): 285-300. [3] 李和平. 基于核函数的间歇过程软分段建模方法研究[D]. 北京: 北京化工大学, 2015. [4] 王新普,周想凌,邢杰,等. 一种基于改进灰色BP神经网络组合的光伏出力预测方法[J]. 电力系统保护与控制,2016,44(18): 81-87. doi: 10.7667/PSPC151675WANG Xinpu, ZHOU Xiangling, XING Jie, et al. A prediction method of PV output power based on the combination of improved grey back propagation neural network[J]. Power System Protection and Control, 2016, 44(18): 81-87. doi: 10.7667/PSPC151675 [5] HUANG Y S, HU J J, LIU H, LIU S J. Research on price forecasting method of China's carbon trading market based on PSO-RBF algorithm[J]. Systems Science & Control Engineering, 2019, 7(2): 40-47. [6] 李应求,安勃,李恒通. 基于NARX及混沌支持向量机的短期风速预测[J]. 电力系统保护与控制,2019,47(23): 65-73.LI Yingqiu, AN Bo, LI Hengtong. Short-term wind speed prediction based on NARX and chaos-support vector machine[J]. Power System Protection and Control, 2019, 47(23): 65-73. [7] 庞学苗. 基于人工神经网络的轮轨力预测[D]. 南京: 南京理工大学, 2012. [8] 吴启蒙,魏明,庞雷. 基于NARX神经网络的电子电路电磁脉冲响应建模[J]. 高压电器,2013,49(11): 62-68.WU Qimeng, WEI Ming, PANG Lei. Modelling electromagnetic pulse response of electronic circuits based on NARX neural network[J]. High Voltage Apparatus, 2013, 49(11): 62-68. [9] MAHDI S, MOHAMMAD B. Real-time estimation of break sizes during LOCA in nuclear power plants using NARX neural network[J]. Nuclear Engineering and Technology, 2019, 51(1): 702-708. [10] CARLOS A, JUAN P, MARTI N, et al. Recurrent neural network model with Bayesian training and mutual information for response prediction of large buildings[J]. Engineering Structures, 2019, 178(1): 603-615. [11] 焦博隆,钟志贤,刘翊馨,等. 基于蝙蝠算法优化的变分模态分解的转子裂纹检测方法[J]. 振动与冲击,2020,39(6): 98-103.JIAO Bolong, ZHONG Zhixian, LIU Yuxin, et al. Rotor crack detection method based on variational mode decomposition based on optimization parameters of bat algorithm[J]. Journal of Vibration and Shock, 2020, 39(6): 98-103. [12] 王仲,顾煜炯,韩旭东,等. 基于历史数据聚类的火电机组工况划分[J]. 仪器仪表学报,2019,40(2): 90-95.WANG Zhong, GU Yujiong, HAN Xudong, et al. Operating condition classification of thermal power unit based on historical data clustering[J]. Chinese Journal of Scientific Instrument, 2019, 40(2): 90-95. [13] 张朝龙,何怡刚,袁莉芬,等. 基于核熵成分分析的模拟电路早期故障诊断方法[J]. 仪器仪表学报,2015,36(3): 675-684.ZHANG Chaolong, HE Yigang, YUAN Lifeng, et al. Approach for analog circuit incipient fault diagnosis based on KECA[J]. Chinese Journal of Scientific Instrument, 2015, 36(3): 675-684. [14] 惠永永,赵小强. 基于WICA-WGNPE的高斯-非高斯联合指标间歇过程监控[J]. 仪器仪表学报,2018,39(1): 190-199.HUI Yongyong, ZHAO Xiaoqiang. Batch process monitoring with Gaussian and non-Gaussian joint indicator based on WICA-WGNPE[J]. Chinese Journal of Scientific Instrument, 2018, 39(1): 190-199. [15] WANG H, JIN H, WANG J, et al. Optimization approach for multi-scale segmentation of remotely sensed imagery under k-means clustering guidance[J]. Acta Geodaetica et Cartographica Sinica, 2015, 44(5): 526-532. -