• ISSN 0258-2724
  • CN 51-1277/U
  • EI Compendex
  • Scopus 收录
  • 全国中文核心期刊
  • 中国科技论文统计源期刊
  • 中国科学引文数据库来源期刊

基于KECA和MBA-NARX的多阶段间歇过程质量预测

张敏 袁毅 李贤均

刘清华, 李瑞杰, 朱绪胜, 陈代鑫. 基于符号权重的一阶逻辑前提选择方法[J]. 西南交通大学学报, 2023, 58(3): 704-710. doi: 10.3969/j.issn.0258-2724.20220478
引用本文: 张敏, 袁毅, 李贤均. 基于KECA和MBA-NARX的多阶段间歇过程质量预测[J]. 西南交通大学学报, 2023, 58(3): 685-695. doi: 10.3969/j.issn.0258-2724.20200382
LIU Qinghua, LI Ruijie, ZHU Xusheng, CHEN Daixin. First-Order Logical Premise Selection Method Based on Symbol Weight[J]. Journal of Southwest Jiaotong University, 2023, 58(3): 704-710. doi: 10.3969/j.issn.0258-2724.20220478
Citation: ZHANG Min, YUAN Yi, LI Xianjun. Multi-stage Quality Prediction of Batch Process Based on KECA and MBA-NARX[J]. Journal of Southwest Jiaotong University, 2023, 58(3): 685-695. doi: 10.3969/j.issn.0258-2724.20200382

基于KECA和MBA-NARX的多阶段间歇过程质量预测

doi: 10.3969/j.issn.0258-2724.20200382
基金项目: 国家重点研发计划(2020YFB1712200);中国博士后科学基金(2020M673279);四川省科技计划(2020J1TD0012);教育部人文社会科学研究青年基金(18YJC630255)
详细信息
    作者简介:

    张敏(1986—),女,讲师,博士,研究方向为智能故障诊断和质量控制,E-mail:zhmzhangmin16@126.com

  • 中图分类号: TH 878;TG115.28

Multi-stage Quality Prediction of Batch Process Based on KECA and MBA-NARX

  • 摘要:

    间歇过程产品质量与过程特性或过程反应原理密切相关,为解决其过程数据呈现的多阶段性、时序性和动态性的问题,提出一种基于带外源输入的非线性自回归(NARX)神经网络进行多阶段质量预测. 首先,对间歇过程数据进行K均值(K-means)聚类阶段划分和核熵成分分析(KECA)数据降维,保证输入数据阶段特征的同时提升后续预测过程的效率;然后,在各阶段内构造NARX预测模型,利用改进蝙蝠算法(MBA)优化网络的隐含层节点数,实现间歇过程在线质量预测;最后,利用青霉素仿真实验数据验证所提方法的有效性. 研究结果表明:NARX神经网络开环模式具有较好的预测效果,核熵成分分析的数据降维方式更有利于后续的质量预测研究;MBA对于网络隐含层节点数的优化效率高、稳定性好,阶段划分可以一定程度上提高间歇过程的预测性能,提出的多阶段质量预测模型预测性能较高,均方根误差和平均绝对百分比误差分别达到0.02和1.20%.

     

  • 自动定理证明是人工智能的核心部分之一,致力于生成高效的计算机程序,从而使计算机能够完全或几乎完全自动地进行推理. 即,将形式化为一阶逻辑公式的前提和结论作为计算机程序的输入,并试图利用程序自动从前提中推导出结论. 这样的程序通常被称为自动定理证明器(automated theorem prover,ATP).

    随着形式化技术的发展,ATP的应用范围从理论上的数学定理逐渐拓展到知识编译[1]、软(硬)件模型检验[2-5]、管理规划[6-7]、集成电路设计[8-10]及软件测试[11]等实际问题上. 因此,旨在推理小规模数学问题的ATP越来越多面对从一些大型知识库(CYC[12]、SUMO[13]以及Mizar[14]等)和实际应用中转换而成的大规模的问题. 这些大规模问题通常被称为大理论(large theory),通常包含成千上万个前提,但是仅有非常少的一部分前提才对问题结论的证明有用. 大规模的冗余前提集会使得ATP在证明问题时搜索空间呈指数型增长,甚至可能立即超出计算机的运行能力,这大大地限制ATP自动推理能力. 假设可以直接使用在证明中出现的前提,ATP则能够轻松快速地证明问题的结论. 因此,从问题中去除不必要的前提,可以减少搜索空间,并降低搜索难度. 在ATP开始证明之前选择出对问题结论证明有用的前提的过程被称为前提选择(premise selection). 前提选择是ATP预处理中非常关键的一环,对解决大理论的自动推理至关重要.

    早期的前提选择方法[15-16]通过不断对当前选择的前提和结论否定的模型进行语义分析来指导前提的选择. 然而,基于语义的前提选择方法非常耗时,且严重依赖模型检查器的能力. 随后,一些基于符号相关性的前提选择方法[17-19]不断被提出. 此类方法主要通过计算和比较出现在公式(前提和结论)符号中,分析公式间的相关性. 当前,一些机器学习[20-22]和深度学习[23-27]技术也开始应用在前提选择中. 基于学习的前提选择方法强烈地依赖于大规模成功证明的领域经验,需要从形式化证明构造不同领域(如集合论、代数以及管理等)问题的语料库. 然而,在形式化时不同领域问题使用的符号是随机制定的,使得对应的语料库无法在学习训练中跨领域通用. 因此,当ATP面临一个新领域中的大规模问题时,由于缺乏新领域中的形式化证明,将导致当此类学习方法在前提选择任务中失效.

    因此,从效率和可行性出发,当前ATP主要使用基于符号相关性的方法作为主要前提选择方法. 然而,当前方法终止前提选择过程的条件是,无法再选择任何的前提作为相关前提. 在此情况下,现有方法缺少在选择过程中对所选择前提的充分性进行判断,因此,可能在已经充分选择了相关前提的情况下,仍不会停止选择过程. 这直接导致当前选择过程将大量与结论证明无关的前提标记为相关的. 此外,当前的方法在选择前提时仍需人工设置相关度边界,这导致相关度边界值不具有普遍性和广泛适用性.

    针对以上问题,本文提出了一种新的基于符号权重的一阶逻辑前提选择方法SymbolWeight. 新方法通过考虑问题中符号出现的频率,为每个符号赋予不同的权重. 在新的权重定义下,若符号是通用符号(高频符号),其权重就越小;若符号是稀有符号(低频符号),其权重就越大. 新定义符号的权重能够削弱通用符号造成的负面影响,以及体现稀有符号的重要性,从而保证基于新权重的相关度计算更加稳定. 同时,为减少手工参数的数量,提高前提选择的精确度,新方法提出一种自适应相关度边界,用于判断前提是否与结论相关. 此外,为了在充分选择相关前提的情况下及时停止前提选择过程,新方法交互结合了前提选择过程和结论自动推理过程. 实验结果表明,和自动定理证明器中广泛使用的通用前提选择方法相比,新方法能够帮助自动定理证明器E在MPTP2078基准测试集上提高10%以上的证明率.

    在一阶逻辑[28]中,给定一个变元符号集V、一个函数符号集F、一个谓词集P. 一阶逻辑项是一个变量项vvV或者形如f(tu1,tu2,,tug)的函数项. 其中:f()F,是gg0)元函数符;tu1,tu2,…,tug是项. 一阶逻辑原子(atom)形如pred(tr1,tr2,,tro),其中:pred()P,是oo0)元谓词符;tr1tr2,…,tro是项. 一阶逻辑公式是由一阶逻辑联结词C={,,,,}、量词Q={,}和原子联结而成. 其中:表示否定;表示且;表示或;表示蕴含;表示等价;表示全称量词;表示存在量词.

    在自动定理证明中,问题的前提和结论均被形式化为一阶逻辑公式. 因此,符号是前提和结论最直观的特征. 若要为大理论问题的结论选择最相关的前提,最自然的方法是使用基于符号的前提选择方法.

    基于符号相关性的前提选择方法意味着需要根据出现在前提中符号计算前提与当前结论证明的相关性,并据对应的相关度对前提进行选择.

    cP分别为一个大理论问题中的结论和前提集,基于符号相关性的前提选择方法的基本框架为:

    1) 若符号s出现在c中,则sc是1度相关的;

    2) 若前提pP中的符号(或符号集)与ck度相关的,则pk+1度相关的;

    3) 若pck度相关的,则p中的所有符号与ck度相关的.

    在此过程中,首先需要定义两个相关集,即相关前提集Rp和相关符号集Rs. Rp包含结论及与结论证明相关的前提. Rs包含Rp中所有公式的所有符号,即

    Rs=funcRpF(func),
    (1)

    式中:func为结论c或与结论证明相关的任意前提pF(func)func中所有符号组成的集合.

    开始时,Rp仅包含结论cRs仅包含c中所有的符号. 即初始时,Rp={c}Rs=F(c). 前提选择方法基于每个前提p的符号集F(p)和当前Rs, 计算pc的相关度,不断地选择新的p加入Rp中,同时更新Rs,直到无法再将任何前提加入Rp中. 在完成前提选择后,由相关前提集Rp中的所有前提和结论组成的缩减问题将作为自动定理证明器新的输入,用于自动地证明问题的结论. 现有基于符号相关性的前提选择方法的通用流程如算法1所示.

    算法1 现有的基于符号相关性的前提选择方法

    输入:结论c、前提P、相关前提集Rp、相关符

       号集Rs、无关前提集Ip、选择前提集SP

       相关度阈值h、循环标记Flag

    输出: Rp

        Rp=cRs=F(c)Ip=PSp=

        Flag=True

        while Flag do

        for pIp do

         根据当前的Rs,计算p的相关度

         if p的相关度h then

          Sp:=Sp{p}

        end if

       end for

       if Sp= then

        Flag=False

       else

        Rp:=RpSpRs:=(pSpF(p))Rs

          Ip:=Ip|Sp

        Sp=

       end if

      end while

    完整的前提选择方法必须包含两个部分:前提选择和结论证明. 给定一个大理论,前提选择方法首先需要对大理论中的前提进行选择,随后利用自动定理证明器在选定的前提集上对问题的结论进行自动推理. 现有基于符号相关性的前提选择方法均将这两个部分分离开来,即,必须在结束前提选择过程之后,再利用自动定理证明器证明缩减后的问题. 尽管通过调整和添加实验参数对选择前提的数量进行限制,现有方法最后选择的前提仍有大量是与结论证明无关的.

    由算法1可知,如何计算前提和相关符号集相关度是基于符号相关性的前提选择方法的重点. 简单地,可通过前提中的符号是否出现在相关符号集中,从而确定前提的相关性. 如果前提至少包含相关符号集中的一个符号,则可认为该前提是相关的. 在此情况下,若前提包含相关符号集中的一个符号,则该前提中的所有符号都会变为相关符号(加入相关符号集中). 这种做法的弊端在于,几次迭代后,问题中几乎所有的前提都将被选择加入相关前提集中. 其中,最主要的原因是大理论问题中某些符号(通常被称为通用符号)频繁地出现在不同的前提中. 若通用符号被标记为相关符号,则所有包含此类符号的前提都将被认为是与结论证明相关的. 因此,前提的选择方法的重心应该放在解决通用符号的问题上.

    与通过符号对应的是稀有符号,即在问题中出现的频率较低,基于此类符号的选择方法能够避免选择过多的前提. 因此,符号的权重定义应该遵循两个原则:削弱通用符号造成的负面影响,以及体现稀有符号的重要性. 给定一个前提集P,任意符号spPF(p)的权重w(s)定义为

    w(s)=1occ(s)|P|+1
    (2)

    式中:occ(s)为包含符号s的所有前提数量;|P|P中的前提总数.

    显而易见,对任意符号s0<w(s)<1. w(s)满足符号权重定义的两个原则. 若符号s是通用符号,则s的权重就越小;若符号s是稀有符号,则s的权重就越大. 式(2)定义的符号权重均在区间(0,1),这能够保证基于该符号权重的相关度更加稳定.

    给定相关符号集Rs,前提pRs下与结论证明的相关度为

    r(p)=siRsF(p)w(si)sjF(p)w(sj),
    (3)

    式中:siRsF(p)的交集中的任意符号;sjF(p)中的任意符号.

    前提p与结论证明的相关度r(p)是在区间[0,1]内的实数. 如果p中的符号均不在相关符号集Rs中,则p与结论证明的相关度为0. 这说明p与当前的相关前提集Rp毫无符号上的关联. 如果p中的符号均在Rs中,则p与结论证明的相关度为1. 这说明p与当前的相关前提集Rp在符号上非常相关. 值得注意的是,随着相关前提集Rp和相关符号集Rs的变化,前提p的相关度也会发生变化.

    由式(3)可知,每个前提都存在一个基于当前相关符号集的相关度. 给定任意两个前提,通过比较其与结论证明的相关度大小,可以形式化两个前提间“更相关”的关系. 根据相关度的高低能够将对应的前提进行排序,但不能直接形式化“最相关前提”这一概念. 最相关前提的相关度大于最不相关前提的相关度, 因此,最直观的做法是设定一个相关度边界,用于区分最相关前提和最不相关前提.

    定义1 给定一个相关度边界h0h1),前提p被标记为最相关前提, 当且仅当r(p)h.

    由定义1可知,如果将h设置为0,所有的前提均为最相关前提. 如果将h设置为1,仅有非常少(甚至为0)的前提被标记为最相关的. 显然,相关度边界值过大或过小都会直接影响选择的结果,甚至问题结论的证明. 通过人工设置的相关度边界不具有普遍性和广泛适用性.

    为解决以上问题,本文提出了一种自适应相关度边界. 该边界仅由当前选择过程中前提的相关度而决定,从而不再需要提前进行人工设置.

    假定问题中包含n个前提p1,p2,…,pnnN,n1,其对应的相关度分别为r(p1),r(p2),…,r(pn). 在n个相关度中,部分相关度的值相同. 因此,合并相同的相关度值,能够从r(p1),r(p2),…,r(pn)中获取M个不同的数值, MN,1Mn. 这里将M个数值从高到低进行排序,序号为m的数值即为第m级自适应相关度边界hmmN,1mM.

    显然,自适应相关度边界因问题而异,且会随着选择过程的变化而变化. 在选择过程中,所有相关度小于hm的前提均不会被选择.

    前提选择方法的主旨在于选择尽可能少但充分与问题结论证明相关的前提. 一种可能的方法是选择一级自适应相关度边界h1作为选择前提的条件. 实验发现,在大部分情况下,h1=1. 由式(3)可知,若一个前提的相关度为1,则该前提的所有符号均在相关符号集中. 若在相关前提集中加入相关度为1的前提,并不会使对应的相关符号集Rs发生任何变化(加入新的符号). 因此,仅选择相关度为1的前提作为最相关前提,会导致选择的前提不够充分. 因此,本文进一步细化地定义了自适应相关度边界hadaptive.

    定义2 给定一个前提集和前提对应的相关度,

    1) 若第1级自适应相关度边界h1=1,则自适应相关度边界为第2级自适应相关度边界,即hadaptive=h2

    2) 此外,自适应相关度边界为第1级自适应相关度边界,即hadaptive=h1.

    由定义2可知,利用自适应相关度边界hadaptive,新提出的基于符号权重的前提选择方法不再依赖任何人工设置的相关度边界.

    给定一个前提集P,现在可以根据前提pP的相关度和自适应相关度边界,从P中选择最相关前提. 然而,当前仍无法直观地判断所选择的前提对问题的结论证明是否足够充分. 因此,本文将前提选择过程和ATP的证明过程进行交互地结合. 在新的框架下,每一次选择的结果均将作为ATP的输入,开始尝试证明问题的结论. 若结论能够被自动地证明,则说明当前选择的前提是充分的,且整个过程可以停止.

    新提出的基于符号权重的前提选择算法流程如算法2所示. 最初的相关前提集仅包含问题的结论,对应的相关符号集仅包含结论中的符号,且无关前提集为问题的整个前提集. 在每次选择结束后,当前相关前提集中的前提和结论组成了新的缩减问题,ATP开始尝试在给定的CPU (central processing unit)运行时间内对该缩减问题进行证明. 若ATP能够证明该问题的结论,则不需要再继续选择前提,整个选择和证明过程立即停止. 否则,开始基于当前的相关符号集计算前提的相关度,并依据相关度边界, 将符合条件的前提标记为选择前提. 在旋转过程中,若没有满足条件的前提,则整个过程立即停止;否则, 利用当前新选择的前提更新相关前提集和相对应的关符号集,并从无关前提集中移除新选择的前提. 因此,整个过程将在K次循环后停止,kN,k1.

    算法2 基于符号权重的前提选择算法

    输入: 结论c、前提P、相关前提集Rp、相关符     号集Rs、无关前提集IP、选择前提集SP、     相关度集R、自动定理证明器ATP、迭代     次数K、 CPU运行时间T

    输出:Rp

      Rp=cRs=F(c)Ip=PSp=R=

       for k[1,2,,K] do

       利用ATP尝试在时间T内证明由Rp

         的前提(和结论)组成的缩减问题

        if 问题被ATP证明 then

        停止

        else

        for pIp do

         根据当前的Rs,计算p的相关度

          r(p)

         R:=R{r(p)}

        end for

        根据R决定自适应相关度hadaptive

        for pIp do

         if r(p)hadaptive then

          Sp:=Sp{p}

        end if

       end for

       if Sp= then

        停止

       else

        Rp:=RpSpRs:=(pSpF(p))Rs

          Ip:=Ip|Sp

        Sp=R=

        end if

       end if

        end for

    本节使用MPTP2078问题库作为实验的基准测试集. MPTP2078问题库一共包含2078个问题,均来自Mizar问题库与Bolzano-Weierstrass定理相关的问题. 问题库中, 所有问题的前提和结论均被形式化为一阶逻辑公式,且公式按照其在Mizar数学库中出现的顺序线性排序. 即出现在每一个结论之前的公式(前提和其他结论)均可作为证明该结论的前提. 问题的前提数量在区间[10,4563] 内,且前提的平均数量为1876个. 有关问题库前提数量和符号的具体分析见表1.

    表  1  MPTP2078问题库描述
    Table  1.  Description of MPTP2078 benchmark
    项目公式结论最小前提最大前提平均前提符号
    数量456420781045631876784
    下载: 导出CSV 
    | 显示表格

    在本文的实验中,使用的操作系统为CentOS Linux 7.4.1708;CPU为octa-core Intel(R) Xeon(R) E5-2667 3.20 GHz;内存128 G. 使用自动定理证明器E作为实验默认ATP. 除证明结论的数量外,还使用选择精准度Spre(selected precision)和选择度Sel(selectivity)[29]作为评估各种选择方法性能的指标, 如式(4)、(5)所示. Spre的值越高越好,而Sel的值越低越好.

    Spre=1|Proved|probProvedNUiP(prob)NSel(prob)
    (4)
    Sel=1|Proved|probProvedNSel(prob)NAxP(prob)
    (5)

    式中:Proved为被证明的问题集;probProved,是Proved中的一个被证明的问题; NUiP(prob)为出现在prob证明中的有用前提的数量;NSel(prob)为选择的前提的数量;NAxP(prob)prob包含的原始前提的数量.

    表2列出了实验所涉及的基于符号的前提选择方法. 为了保证实验的公平性,本文将每个问题在自动定理证明器E上运行的CPU时间设定为60 s. 若一个问题的选择过程迭代K次,则每次迭代后生成的缩减问题仅在自动定理证明器E上运行60/K s. 显然地,需要权衡每次自动定理证明器运行的CPU时间和选择的迭代次数.

    表  2  参与实验的基于符号的前提选择方法的说明
    Table  2.  Description of symbol-based premise selection methods in experiments
    前提选择方法说明
    no-selection不使用任何前提选择
    SInE[19]基于触发关系的前提选择
    LightWeight[18]基于符号轻量相关性的前提选择
    SymbolWeight新提出的基于符号权重的前提选择
    下载: 导出CSV 
    | 显示表格

    提出的SymbolWeight能够根据前提的相当度自动地决定合适的相关度边界. 因此,SymbolWeight的性能仅与选择的迭代次数K有关. 表3评估了其在不同迭代次数K下对自动定理证明器E的性能影响. 由于每个问题运行CPU的时间最多为60 s,继续增加迭代次数会使得每次迭代中证明问题的CPU时间过小. 因此,SymbolWeight在实验中的最大迭代次数设置为30次. 随着K的不断增加,证明问题的数量在不断增加. 当K=30时,自动定理证明器E能够证明1077个问题. 值得注意的是,增加迭代次数并不会限制SymbolWeight的选择能力. 实验发现,SymbolWeight能够大大地减少选择前提的数量. 即使当K增加到30时,SymbolWeight平均选择前提数仅约为174个. 这表明,提出的自适应相关度边界在不损害自动定理证明器E证明能力的前提下,能够有效解决相关度边界的阈值设定问题. 随着K的增加,自动定理证明器CPU时间在逐渐减少(K=30 时,CPU时间仅为2 s). 然而,证明问题的数量在不断增加. 这说明如果能够正确地选择出证明大理论问题结论所需要的全部前提,自动定理证明器E能够轻易地搜索到结论的证明. 因此,有效的前提选择方法能够大大地帮助证明器提高证明问题的能力.

    表  3  自动定理证明器E在SymbolWeight下的证明性能
    Table  3.  Performance of automated theorem prover E with SymbolWeight
    K证明数
    量/个
    平均选择前提数量/个选择精
    确度
    选择度
    2 288 13.0 0.358 0.054
    4 599 22.6 0.336 0.060
    6 818 33.3 0.322 0.054
    8 862 44.5 0.309 0.053
    10 920 55.9 0.302 0.055
    12 932 68.4 0.295 0.057
    14 967 81.1 0.288 0.059
    16 980 94.0 0.285 0.060
    18 1003 106.3 0.280 0.061
    20 1014 117.3 0.278 0.061
    22 1028 128.7 0.275 0.064
    24 1045 140.7 0.271 0.068
    26 1057 151.5 0.268 0.070
    28 1071 162.4 0.265 0.074
    30 1077 174.2 0.264 0.076
    下载: 导出CSV 
    | 显示表格

    表4比较了自动定理证明器E在不同基于符号的前提选择方法下的证明性能. E-SInE和Vampire-SInE分别表示在证明器E和Vampire中的SInE[19]方法. 自动定理证明器E在使用SymbolWeight作为前提选择方法时能够证明MPTP2078问题库中超过半数的问题. 与E-SInE和Vampire-SInE相比,SymbolWeight能够帮助自动定理证明器E在MPTP2078基准测试集上分别提高19.49%和10.49%的证明率.

    表  4  自动定理证明器E在不同的基于符号的前提选择方法下的证明性能
    Table  4.  Performance of automated theorem prover E with different symbol-based premise selection methods
    前提选择方法证明数量/个证明率/%
    no-selection66330.90
    E-SInE67232.34
    Vampire-SInE85941.34
    SymbolWeight107751.83
    下载: 导出CSV 
    | 显示表格

    1) 提出了新的符号权重和相关度计算方法,并基于此设计并实现了用于解决大理论问题的前提选择的方法;

    2) 提出了自适应相关度边界,解决了在基于符号的前提选择方法中需要人工地设置相关度边界的问题;

    3) 新提出的前提选择方法能够大大地提高自动定理证明器E在MPTP2078问题库上的证明能力.

  • 图 1  间歇数据阶段划分

    Figure 1.  Stage division of batch process

    图 2  NARX神经网络结构

    Figure 2.  Schematic of NARX neural network

    图 3  NARX两种结构

    Figure 3.  Two structures of NARX

    图 4  MBA优化NARX隐含层节点数流程

    Figure 4.  Flow chart of MBA optimized the number in NARX hidden layer

    图 5  基于KECA和MBA-NARX的间歇过程多阶段预测

    Figure 5.  Multi-stage prediction of batch process based on KECA and MBA-NARX

    图 6  青霉素发酵时段划分结果

    Figure 6.  Penicillin fermentation stage division results

    图 7  RMSEMAPE随隐含层节点数变化趋势

    Figure 7.  The trend of RMSE and MAPE with the number of hidden layer nodes under the close/open-loop

    图 8  NARX两种模式下的实际预测

    Figure 8.  Actual prediction in the two NARX structures

    图 9  不同降维方法后的预测结果

    Figure 9.  Prediction results of different dimensionality reduction methods

    图 10  多阶段预测与整体预测对比

    Figure 10.  Comparison between multi-stage prediction and overall prediction

    表  1  过程变量说明

    Table  1.   Description of process variables

    变量号变量名称变量号变量名称
    1通风率/(L•h−19排气二氧化碳浓度/
    (Mmol•L−1
    2搅拌速率/
    (r•min−1
    10pH 值
    3底物流加速率/
    (L•h−1
    11温度/K
    4补料温度/K12产生热/K
    5基质浓度/(g•L−113酸流加速率/(L•h−1
    6溶解氧浓度/%14碱流加速率/(L•h−1
    7菌体浓度/(g•L−115冷水流加速率/(L•h−1
    8反应器体积/L16热水流加速率/(L•h−1
    下载: 导出CSV

    表  2  NARX两种结构下的RMSEMAPE区间范围

    Table  2.   The range of RMSE and MAPE in the two NARX structures

    模式RMSEMAPE/%
    Close-loop[1,5][200,1500]
    Open-loop[0,0.60][0,200]
    下载: 导出CSV

    表  3  数据降维方法对比

    Table  3.   Comparison of data dimensionality reduction methods

    降维算法降至维度RMSEMAPE/%降维用时/s
    170.1859.92
    PCA60.1544.670.74
    KPCA60.066.58182.24
    KECA60.042.604.07
    注:加粗代表在此表内对比的算法中表现最优,性能最好,表56同理.
    下载: 导出CSV

    表  4  各算法初始参数

    Table  4.   Initial parameters of each algorithm

    算法参数对应值或区间
    PSO种群大小20
    最大迭代数/次20
    速度区间[1,16]
    加速度因子1、22、2
    GA种群大小20
    最大迭代数/次20
    交叉概率0.4
    变异概率0.01
    MBA种群大小20
    最大迭代数/次20
    响度0.25
    频率区间[0,2]
    位置更新区间[1,16]
    下载: 导出CSV

    表  5  3种参数优化模型对比

    Table  5.   Comparison of three parameter optimization models

    预测指标PSO-NARXGA-NARXMBA-NARX
    迭代
    时间/s
    标准差/×10−4验证集
    误差
    迭代
    时间/s
    标准差/×10−4验证集
    误差
    迭代
    时间/s
    标准差/×10−4验证集
    误差
    产物浓度200.5616.700.0241006.8710.420.012144.78 5.60 0.008
    菌体浓度181.4210.660.687 894.91 7.580.298134.39 3.40 0.144
    基质浓度240.3821.520.3761307.4219.040.033149.8910.50 0.055
    均值207.4516.300.360 1069.7312.350.110 143.02 6.540.070
    下载: 导出CSV

    表  6  阶段预测结果

    Table  6.   Comparison of stages prediction effects

    阶段/hRMSEMAPE/%总体RMSE总体MAPE/%预测
    用时/s
    0~38 0.04 2.83 0.02 1.20 51.72
    39~169 0.01 0.78
    170~280 0.01 0.84
    281~400 0.02 1.47
    0~400 0.04 2.60 0.04 2.60 22.06
    下载: 导出CSV
  • [1] 王普,曹彩霞,高学金. 基于扩展得分矩阵的多阶段间歇过程质量预测[J]. 高校化学工程学报,2019,33(3): 664-671. doi: 10.3969/j.issn.1003-9015.2019.03.021

    WANG Pu, CAO Chaixia, GAO Xuejin. Quality prediction of multistage batch processes based on extended score matrices[J]. Journal of Chemical Engineering of Chinese Universities, 2019, 33(3): 664-671. doi: 10.3969/j.issn.1003-9015.2019.03.021
    [2] ALSHAWARGHI H, ELKAMEL A, MOSHIRI B, et al. Predictive models and detection methods applicable in water detection framework for industrial electric arc furnaces[J]. Computers & Chemical Engineering, 2019, 128(6): 285-300.
    [3] 李和平. 基于核函数的间歇过程软分段建模方法研究[D]. 北京: 北京化工大学, 2015.
    [4] 王新普,周想凌,邢杰,等. 一种基于改进灰色BP神经网络组合的光伏出力预测方法[J]. 电力系统保护与控制,2016,44(18): 81-87. doi: 10.7667/PSPC151675

    WANG Xinpu, ZHOU Xiangling, XING Jie, et al. A prediction method of PV output power based on the combination of improved grey back propagation neural network[J]. Power System Protection and Control, 2016, 44(18): 81-87. doi: 10.7667/PSPC151675
    [5] HUANG Y S, HU J J, LIU H, LIU S J. Research on price forecasting method of China's carbon trading market based on PSO-RBF algorithm[J]. Systems Science & Control Engineering, 2019, 7(2): 40-47.
    [6] 李应求,安勃,李恒通. 基于NARX及混沌支持向量机的短期风速预测[J]. 电力系统保护与控制,2019,47(23): 65-73.

    LI Yingqiu, AN Bo, LI Hengtong. Short-term wind speed prediction based on NARX and chaos-support vector machine[J]. Power System Protection and Control, 2019, 47(23): 65-73.
    [7] 庞学苗. 基于人工神经网络的轮轨力预测[D]. 南京: 南京理工大学, 2012.
    [8] 吴启蒙,魏明,庞雷. 基于NARX神经网络的电子电路电磁脉冲响应建模[J]. 高压电器,2013,49(11): 62-68.

    WU Qimeng, WEI Ming, PANG Lei. Modelling electromagnetic pulse response of electronic circuits based on NARX neural network[J]. High Voltage Apparatus, 2013, 49(11): 62-68.
    [9] MAHDI S, MOHAMMAD B. Real-time estimation of break sizes during LOCA in nuclear power plants using NARX neural network[J]. Nuclear Engineering and Technology, 2019, 51(1): 702-708.
    [10] CARLOS A, JUAN P, MARTI N, et al. Recurrent neural network model with Bayesian training and mutual information for response prediction of large buildings[J]. Engineering Structures, 2019, 178(1): 603-615.
    [11] 焦博隆,钟志贤,刘翊馨,等. 基于蝙蝠算法优化的变分模态分解的转子裂纹检测方法[J]. 振动与冲击,2020,39(6): 98-103.

    JIAO Bolong, ZHONG Zhixian, LIU Yuxin, et al. Rotor crack detection method based on variational mode decomposition based on optimization parameters of bat algorithm[J]. Journal of Vibration and Shock, 2020, 39(6): 98-103.
    [12] 王仲,顾煜炯,韩旭东,等. 基于历史数据聚类的火电机组工况划分[J]. 仪器仪表学报,2019,40(2): 90-95.

    WANG Zhong, GU Yujiong, HAN Xudong, et al. Operating condition classification of thermal power unit based on historical data clustering[J]. Chinese Journal of Scientific Instrument, 2019, 40(2): 90-95.
    [13] 张朝龙,何怡刚,袁莉芬,等. 基于核熵成分分析的模拟电路早期故障诊断方法[J]. 仪器仪表学报,2015,36(3): 675-684.

    ZHANG Chaolong, HE Yigang, YUAN Lifeng, et al. Approach for analog circuit incipient fault diagnosis based on KECA[J]. Chinese Journal of Scientific Instrument, 2015, 36(3): 675-684.
    [14] 惠永永,赵小强. 基于WICA-WGNPE的高斯-非高斯联合指标间歇过程监控[J]. 仪器仪表学报,2018,39(1): 190-199.

    HUI Yongyong, ZHAO Xiaoqiang. Batch process monitoring with Gaussian and non-Gaussian joint indicator based on WICA-WGNPE[J]. Chinese Journal of Scientific Instrument, 2018, 39(1): 190-199.
    [15] WANG H, JIN H, WANG J, et al. Optimization approach for multi-scale segmentation of remotely sensed imagery under k-means clustering guidance[J]. Acta Geodaetica et Cartographica Sinica, 2015, 44(5): 526-532.
  • 加载中
图(10) / 表(6)
计量
  • 文章访问数:  679
  • HTML全文浏览量:  350
  • PDF下载量:  95
  • 被引次数: 0
出版历程
  • 收稿日期:  2020-06-24
  • 修回日期:  2020-11-11
  • 网络出版日期:  2021-10-19
  • 刊出日期:  2021-01-06

目录

/

返回文章
返回