Loading [MathJax]/extensions/TeX/boldsymbol.js
  • ISSN 0258-2724
  • CN 51-1277/U
  • EI Compendex
  • Scopus 收录
  • 全国中文核心期刊
  • 中国科技论文统计源期刊
  • 中国科学引文数据库来源期刊

基于时频Grad-CAM的调制识别网络可解释分析

梁先明 倪帆 陈文洁 张家树

罗霞, 胡剑鹏, 甘易玄. 基于鲁棒接续时间的铁路空车调运优化[J]. 西南交通大学学报, 2022, 57(1): 55-64, 82. doi: 10.3969/j.issn.0258-2724.20200799
引用本文: 梁先明, 倪帆, 陈文洁, 张家树. 基于时频Grad-CAM的调制识别网络可解释分析[J]. 西南交通大学学报, 2024, 59(5): 1215-1224. doi: 10.3969/j.issn.0258-2724.20210791
LUO Xia, HU Jianpeng, GAN Yixuan. Optimization on Railway Empty Wagon Allocation Based on Robust Connecting Time[J]. Journal of Southwest Jiaotong University, 2022, 57(1): 55-64, 82. doi: 10.3969/j.issn.0258-2724.20200799
Citation: LIANG Xianming, NI Fan, CHEN Wenjie, ZHANG Jiashu. Interpretability of Modulation Recognition Network Based on Time-Frequency Gradient-Weighted Class Activation Mapping[J]. Journal of Southwest Jiaotong University, 2024, 59(5): 1215-1224. doi: 10.3969/j.issn.0258-2724.20210791

基于时频Grad-CAM的调制识别网络可解释分析

doi: 10.3969/j.issn.0258-2724.20210791
基金项目: 国家自然科学基金项目(62071396);四川省自然科学基金项目(2022NSFSC0531)
详细信息
    作者简介:

    梁先明(1976—),男,高级工程师,研究方向为通信信号处理与分析、智能信号分析,E-mail:liangxm8873@126.com

    通讯作者:

    张家树(1965—),男,教授,博士,研究方向为神经网络与机器智能、信号与信息智能处理、信息安全技术,E-mail:jszhang@swjtu.edu.cn

  • 中图分类号: TP301.6

Interpretability of Modulation Recognition Network Based on Time-Frequency Gradient-Weighted Class Activation Mapping

  • 摘要:

    针对时频深度学习调制识别方法存在可解释性差的问题,提出一种基于时频梯度加权类激活映射(Grad-CAM)的调制识别网络可解释框架. 该框架通过时频Grad-CAM可视化深度模型中隐含层的关键特征,从视觉上解释网络隐含层提取的时频深度特征对于正确与错误识别中的作用,揭示低信噪比环境下网络性能下降的内在机理,并通过量化和排序网络中每层不同卷积核的贡献值来判断网络的冗余程度. 仿真实验结果验证了基于时频Grad-CAM的调制识别网络可解释性框架的有效性;可解释分析结果表明,在低信噪比环境下,网络特征提取区域有大量噪声存在,且本文所测试的调制识别网络冗余程度较为严重.

     

  • 空车调运是实现铁路资源优化配置的重要内容,空车调运的优劣直接影响铁路车辆的利用效率、市场需求的满足程度以及运输组织的现代化水平.

    近年来空车调运优化问题的研究多从供需及环境的随机性出发建立动态随机规划模型. 文献[1]基于广义旅速建立时空服务网络,提出了空车调配多阶段动态优化方法;在此基础上,文献[2]着重考虑了实际运输生产中的能力约束,建立了考虑车种替代动态规划模型;文献[3]则将空车调配分为基于固定需求的优化调整和基于客户实时需求的策略再优化两个阶段,解决了空车需求的动态变化问题;文献[4]基于供需的不确定性,为约束条件和目标函数设置了一定的置信水平,建立了多车种调配优化模型;文献[5]考虑了路网中转能力和通行能力不确定性的影响,建立多目标随机期望约束模型;文献[6]则针对列车走行时间的不确定性,提出了鲁棒优化模型,并利用对称和对偶变化降低了模型求解难度,提高了求解效率.

    在上述研究的基础上,考虑到实际铁路生产中空车的产生以及空车的需求是一个时空问题,除了物理层面的连接外,还应当结合空车与列车接续时间关系进行列车之间的空车配流. 同时,网络中列车的旅行时间以及车站的技术作业时间具有不确定性,时间的波动会直接对供需网络的接续关系造成影响. 因此,本文基于鲁棒优化理论对多车种、可替代条件下的空车调运问题进行了研究.

    供应站与需求站的车站技术作业时间以及站间旅行时间不确定性时,如何确定需求站的空车来源、类型与空车数量是鲁棒接续时间要求下空车调运的核心问题. 模型中包含下述参数.

    定义集合及索引:Ii分别为空车供应站集合和索引,iIJj分别为空车需求站集合及索引,jJEe分别为供应站内产生空车的到达列车集合及索引,eEFf分别为供应站发出的可挂运空车的列车集合及索引,fFGg分别为需求站内需使用到达空车装车的发出列车集合及索引,gGη为实际的空车类型,χ为考虑车种替代后按用途归类的空车类型,空车类型集合H包括平车(N)、棚车(P)和敞车(C),H={N,P,C},且 η,χH.

    定义供应站相关变量:citi分别为供应站i的等待车小时费用及车站技术作业时间;Sie,ηSif分别为供应站i内第e列到达列车产生η型空车的数目及第f列发出列车的最大空车挂运数目;AieLif分别为供应站ie列到达列车的到达时刻及第f列发出列车的最晚编组时刻.

    定义需求站相关变量:pjcjtj分别为需求站j的空车装车后产生收益、空车等待车小时费用及车站技术作业时间;Sjg,χ为空车需求站jg列发出列车需要的χ型空车数量;Ljg为空车需求站jg列发出列车的最晚编组时刻.

    定义0-1变量: xi,e,f表示供应站i的第e列到达列车与供应站i的第f列发出列车间是否存在接续关系,xi,e,f = 1为是,xi,e,f = 0为否;yif,jg = 0表示供应站i的第f列发出列车与需求站j的第g列发出列车间是否存在接续关系,yif,jg = 1为是,yif,jg = 0为否.

    定义决策变量:di,e,f,η为供应站i的第e列到达列车为供应站i发出的第f列列车供应的η型空车的数量;dif,jg,χ为供应站if列发出列车为需求站j发出的第g列列车供应的χ型空车的数量;dif,jg,η为供应站if列发出列车为需求站jg列发出列车供应的η型空车的数量.

    另外定义了空车供应站i和空车需求站j间的空车输送费用cij及站间旅行时间tij.

    名义模型是将供应站与需求站车站技术作业时间以及站间旅行时间看作确定值时的空车调运模型.

    1) 目标函数

    以空车调运效益最大化为目标函数,如式(1)所示,其中:等号右端第1项表示空车到达需求站后由需求站装车发出所产生收益;第2项表示空车调运时产生的路径消耗费用[7];第3项表示空车在需求站的等待费用;第4项表示空车在供应站的等待费用.

    C1=max{χijfgyif,jgdif,jg,χpjχijfgyif,jgdif,jg,χcijχijfgyif,jgdif,jg,χcj[Ljg(Lif+tij+tj)]ηiefxi,e,fdi,e,f,ηci(LiftiAie)}. (1)

    2) 约束条件

    式(2)表示供应站i的第e列到达列车给该站各发出列车f提供的η型空车总数不得超过第e列到达列车产生η型空车总数.

    fxi,e,fdi,e,f,ηSie,η. (2)

    式(3)表示供应站i的各次到达列车e为该站第f列发出列车供应的空车总数不得超过第f列发出列车的最大空车挂运数目.

    ηexi,e,fdi,e,f,ηSif. (3)

    式(4)表示dif,jg,ηη型箱的数量等于其实际替换的各车型dif,jg,χ的数量总和. 设Rηη型箱可替代的车型集合,参考文献[8],平车代替敞车有90%概率,棚车代替平车和敞车有75%的可能,敞车代替棚车有30%的可能,故有RN = {N,C},RP = {N,P,C},RC = {P,C}.

    dif,jg,η=χRηdif,jg,χ. (4)

    式(5)表示供应站i发出的第f列列车中挂运的各型空车均用于满足需求站的空车需求[9-10].

    exi,e,fdi,e,f,η=gyif,jgdif,jg,η. (5)

    式(6)表示各供应站发出的列车为需求站j发出的第g列列车提供的χ型空车数量等于该列车对χ型空车的需求量.

    ifyif,jgdif,jg,χ = Sjg,χ. (6)

    式(7)表示列车间空车输送数量非负.

    {di,e,f,η0,dif,jg,η0. (7)

    式(8)表示如果供应站i的第e列到达列车在供应站i完成相关技术作业后,到达调车场的时刻不晚于i站第f列发出列车的最晚编组时刻,则该组供应站到达列车与发出列车之间满足最小接续时间要求,即xi,e,f = 1,否则,xi,e,f = 0. 供应站到达列车产生的空车来自重车卸车时,ti = (ti,dj + ti,zx) + (ti,jt + ti,zx) + (ti,xc + ti,zx);到达列车本身挂有空车时,ti = (ti,dj + ti,zx) + (ti,jt + ti,zx);其中:ti,djti,zxti,jtti,xc分别为i站的到达技术作业时间标准、转线作业时间标准、解体作业时间标准(含推峰时间)及卸车作业时间标准.

    xi,e,f={1,Aie+tiLif,0,Aie+ti>Lif. (8)

    式(9)表示若供应站i发出的第f列列车在需求站j完成相关技术作业后,到达调车场的时刻不晚于j站发出第g列列车的最晚编组时刻,即yie,jg = 1,否则,yie,jg = 0. 列车在需求站j的技术作业时间tj = (tj,dj + tj,zx) + (tj,jt + tj,zx) + (tj,zc + tj,zx),其中:tj,djtj,zxtj,jttj,zc分别为j站到达技术作业时间标准、转线作业时间标准、解体作业时间标准及装车作业的时间标准.

    yif,jg={1,Lif+tij+tjLjg,0,Lif+tij+tj>Ljg. (9)

    式(10)表示只有当供应站if列发出列车存在满足接续时间要求的空车来源时,即xi,e,f = 1时,才考虑该发出列车与需求站发出列车的接续关系.

    yif,jgexi,e,f. (10)

    为便于说明,本文定义了属于关系、连接关系和车流关系,如图1所示,图中:三角框为供应站,正方形框为需求站,圆圈为列车,后同.

    图  1  空车调运网络
    Figure  1.  Empty wagon allocation network

    定义1 属于关系指供应站到达列车e、发出列车f与供应站i之间的关系以及需求站发出列车g与需求站j之间的关系.

    定义2 连接关系为供应站发出的列车f与该列车到达的需求站j之间的关系,供应站发出的任一可挂运空车的列车有且只与一个需求站建立连接关系.

    定义3 车流关系是指当某一列车中的车辆可以成为另一列车中的车流来源时,两列列车之间存在的关系. 车流关系可以定义为两部分:

    1) 供应站到达列车e与该站发出列车f之间的车流关系定义为第1阶段车流关系;

    2) 供应站发出的列车f与需求站发出的列车e之间的车流关系定义为第2阶段车流关系.

    车流关系由约束条件式(8)~(10)确定.

    实际运输中由于设备因素、环境因素和人为因素的影响,列车站间旅行时间以及车站技术作业时间是不确定的,若以固定的旅行时间和技术作业时间作为空车接续时间的判断依据,当接续条件Lif − (Aie+ti)0Ljg − (Lif+tij+tj)0,但取值较小时,技术作业时间和旅行时间的波动可能使得既有的接续关系失效,导致求得方案不可行. 因此,基于Dimitris等[11]提出的鲁棒优化理论建立了空车调运鲁棒优化模型.

    为描述站间旅行时间和车站技术作业时间的不确定性,令˜tij[tij,tij+ˆti]˜ti[ti,ti+ˆti]˜tj[tj,tj+ˆtj]ˆtijˆtiˆtj分别为tijtitj的时间最大波动量.

    引入 αij=(˜tijtij)/ˆtijβi=(˜titi)/ˆtiγj=(˜tjtj)/ˆtj分别表示tijtitj波动程度的系数,αij,βi,γj[0,1]. 令参数集合为UVWαijUβiVγjW,可得

    {˜tij=tij+αijˆtij,˜ti=ti+βiˆti,˜tj=tj+γjˆtj. (11)

    ˜tij˜ti˜tj均波动,则模型过于保守,为避免此情形,在模型中引入Γ1Γ2Γ3来调整模型的鲁棒性,以此作为波动下限值,参数的不确定集为ijαijΓ1iβiΓ2jγjΓ3. Γ1Γ2Γ3保证了各项时间均存在一定的不确定性,且取值越大,时间的不确定程度越大,调整Γ1Γ2Γ3的取值可以避免模型过度鲁棒. 构建的鲁棒优化模型如下.

    1) 目标函数

    鲁棒优化模型的目标函数如式(12),约束关系如式(13)所示,结合波动程度与波动下限约束,式(12)中的C2如(14)所示,矩阵表达如式(15)所示.

    max{C1+C2}, (12)
    s.t.{αij + δij=1,βi+δi=1,γj+δj=1,ij(θijαij)=Γ1,i(θiβi)=Γ2,j(θjγj)=Γ3, (13)
    C2=min{χijfgyif,jgdif,jg,χci(αijˆtij+γjˆtj)+ηijfxi,e,fdi,e,f,ηβiˆti}, (14)
    \left[\begin{array}{ccccccccc}{{\boldsymbol{E}}}_{nm}& 0& 0& {{\boldsymbol{E}}}_{nm}& 0& 0& 0& 0& 0\\ 0& {{\boldsymbol{E}}}_{n}& 0& 0& {{\boldsymbol{E}}}_{n}& 0& 0& 0& 0\\ 0& 0& {{\boldsymbol{E}}}_{m}& 0& 0& {{\boldsymbol{E}}}_{m}& 0& 0& 0\\ -{{\boldsymbol{Z}}}_{nm}& 0& 0& 0& 0& 0& {{\boldsymbol{Z}}}_{nm}& 0& 0\\ 0& -{{\boldsymbol{Z}}}_{n}& 0& 0& 0& 0& 0& {{\boldsymbol{Z}}}_{n}& 0\\ 0& 0& -{{\boldsymbol{Z}}}_{m}& 0& 0& 0& 0& 0& {{\boldsymbol{Z}}}_{m}\end{array}\right]\left[\begin{array}{c}{{\boldsymbol{U}}}_{nm}\\ {{\boldsymbol{V}}}_{n}\\ {{\boldsymbol{W}}}_{m}\\ {{\boldsymbol{\delta}} }_{nm}\\ {{\boldsymbol{\delta}} }_{n}\\ {{\boldsymbol{\delta}} }_{m}\\ {{\boldsymbol{\theta}} }_{nm}\\ {{\boldsymbol{\theta}} }_{n}\\ {{\boldsymbol{\theta}} }_{m}\end{array}\right]=\left[\begin{array}{l}{{\boldsymbol{Z}}}_{nm}^{\text{T}}\\ {{\boldsymbol{Z}}}_{n}^{\text{T}}\\ {{\boldsymbol{Z}}}_{m}^{\text{T}}\\ -{\varGamma }_{1}\\ -{\varGamma }_{2}\\ -{\varGamma }_{3}\end{array}\right], (15)

    式(13)、(15)中: {\delta _{ij}} {\delta _i} {\delta _j} {\theta _{ij}} {\theta _i} {\theta _j} 为松弛系数; n 为供应站数目; m 为需求站数目; {{\boldsymbol{E}}_n} n \times n 的单位矩阵; {{\boldsymbol{Z}}_n} 为元素全为1的 1 \times n 矩阵;{{\boldsymbol{\delta}} _n} = {({\delta _1},{\delta _2}, \cdots ,{\delta _n})^{\rm T}}{{\boldsymbol{\theta}} _n} = {({\theta _1},{\theta _2}, \cdots ,{\theta _n})^{\rm T}}{{\boldsymbol{U}}_{nm}} = (\alpha _{11},\alpha_{12}, \cdots , \alpha _{nm})^{\rm T}{{\boldsymbol{V}}_n} = {(\beta_1,\beta _2, \cdots ,{\beta _n})^{\rm T}}{{\boldsymbol{W}}_m} = {(\gamma_1,{\gamma _2}, \cdots ,{\gamma _m})^{\rm T}}.

    证明一个矩阵为完全幺模矩阵的充分条件为:① 矩阵中元素仅包含0、1、−1;② 矩阵每列最多两个非0元素;③ 矩阵的行可分划成两个子集,使得同列中两个非零元素符号相同时,对应的两行在不同的行子集中,当符号不同时,对应的两行在同一行子集中. 易得:约束矩阵式(15)满足条件 ①、②,并且当矩阵行划分为(1,4)和(2,3,5,6)两个行子集时满足条件 ③,故该约束矩阵为完全幺模矩阵. 结合完全幺模矩阵的性质,当 {\varGamma _1} {\varGamma _2} {\varGamma _3} 均取整数时,式(13)、(14)的最优解 {\alpha ^{\text{*}}} {\beta ^{\text{*}}} {\lambda ^{\text{*}}} 也为整数,因{\alpha _{ij}},\;{\beta _i},\;{\gamma _j}\geqslant 0,且{\alpha _{ij}},\;{\beta _i}, {\gamma _j} \leqslant 1,故其最优值取0或1.

    2) 约束条件

    原约束条件中式(2)~(7)、(10)不变,式(8)、(9)分别变更为式(16)、(17).

    {x_{i,e,f}} = \left\{ \begin{gathered} 1,{\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {A_{ie}} + {t_i} + {\beta _i}\hat{t} {{_i}} \leqslant {L_{if}}, \hfill \\ 0,{\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {A_{ie}} + {t_i} + {\beta _i}\hat{t} {{_i}} > {L_{if}}, \hfill \\ \end{gathered} \right. (16)
    {y_{if,jg}} = \left\{ \begin{gathered} 1,{\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {L_{if}} + {t_{ij}} + {a_{ij}}\hat{t} {{_{ij}}} + {t_j} + {\gamma _j}\hat{t} {{_j}} \leqslant {L_{jg}}, \hfill \\ 0,{\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {L_{if}} + {t_{ij}} + {a_{ij}}\hat{t} {{_{ij}}} + {t_j} + {\gamma _j}\hat{t} {{_j}} > {L_{jg}}{\kern 1pt} . \hfill \\ \end{gathered} \right. (17)

    名义模型为非线性整数规划模型,求解困难,因此,求解前结合约束关系式(8) ~ (10)对模型进行简化.

    以算例中的供应站3为例,为便于表示,此处仅保留三列供应站发出列车,变化前后网络结构如图2所示. 与原网络相比,新网络中仅保留了 {x_{i,e,f}} = 1 {y_{ie,jg}} = 1 时所对应的决策变量 {d_{i,e,f,\eta }} {d_{if,jg,\eta }} ,进而去除模型中的约束条件式(8)~(10),转化为线性规划模型,可调用CPLEX进行求解.

    图  2  简化前后网络图
    Figure  2.  Network diagrams of pre- and post-simplification

    鲁棒优化模型中引入了变量 {\alpha _{ij}} {\beta _i} {\gamma _j} ,这些变量会导致供需网络中既有车流关系的变化,但对于每组 {\alpha _{ij}} {\beta _i} {\gamma _j} 存在唯一的网络结构,求解时可以看作名义模型.

    遍历满足约束的每组 {\alpha _{ij}} {\beta _i} {\gamma _j} 是最准确的求解方法,但当 {\varGamma _1} {\varGamma _2} {\varGamma _3} 取值较高时模型的求解复杂度会剧增,导致求解困难. 研究发现,只有当网络结构中的车流关系减少时,最优调运方案才可能改变,故设计下述步骤求解. 求解时 {\varGamma _1} {\varGamma _2} {\varGamma _3} \hat{t} {{_{ij}}} \hat{t} {{_i}} \hat{t} {{_j}} 为已知值.

    步骤1 结合式(8)~(10),得出固定出行时间下供需网络中存在的车流关系,令供应站i的第1阶段车流关系集合为{{\varOmega} _{{\kern 1pt} {\kern 1pt} 1,i}},供应站i的第2阶段车流关系集合为{{\varOmega} _{{\kern 1pt} {\kern 1pt} {\text{2}},i}},形式如下:

    {{\varOmega} _{{\kern 1pt} {\kern 1pt} 1,i}} = [(1,1),(1,2), \cdots ,(e,f)] , (18)
    \begin{split} {{\varOmega} _{{\kern 1pt} {\kern 1pt} {\text{2,}}i}} = [(1,1,1),(1,1,2), \cdots ,(f,j,g)], \end{split} (19)

    式中:Ω1,i中(e,f )表示i站第e列到达列车可以为i站第f列发出列车供应空车;Ω2,i中(f,j,g)表示i站发出的第f列列车可以为j站发出的第g列列车供应空车.

    步骤2 令集合 U V W 中的各项元素均为1,即所有的 {t_{ij}} {t_i} {t_j} 都存在波动,结合式(10)、(16)、(17),得出绝对鲁棒下的网络中存在的车流关系{{\varPi} _{{\kern 1pt} {\kern 1pt} 1,i}}{{\varPi} _{{\kern 1pt} {\kern 1pt} {\text{2}},i}},形式同{{\varOmega} _{{\kern 1pt} {\kern 1pt} 1,i}}{{\varOmega} _{{\kern 1pt} {\kern 1pt} {\text{2}},i}}.

    步骤3 比较{{\varPi} _{{\kern 1pt} {\kern 1pt} 1,i}}{{\varPi} _{{\kern 1pt} {\kern 1pt} {\text{2}},i}}{{\varOmega} _{{\kern 1pt} {\kern 1pt} 1,i}}{{\varOmega} _{{\kern 1pt} {\kern 1pt} {\text{2}},i}}中的车流关系数量,确定此时减少的车流关系. 若{{\varPi} _{{\kern 1pt} {\kern 1pt} 1,i}} \subsetneqq {{\varOmega} _{{\text{1,}}i}},说明第1阶段车流关系发生了变化,若{{\varPi} _{{\kern 1pt} {\kern 1pt} {\text{2}},i}} \subsetneqq {{\varOmega} _{{\kern 1pt} {\kern 1pt} {\text{2}},i}},说明第2阶段车流关系发生变化. 假设此时减少的车流关系为{{\varOmega} _{{\kern 1pt} {\kern 1pt} 1,1}}的(1,1),{{\varOmega} _{{\text{1,2}}}}的(1,2),{{\varOmega} _{{\kern 1pt} {\kern 1pt} {\text{2}},2}}的(1,1,1),{{\varOmega} _{{\kern 1pt} {\kern 1pt} {\text{2}},{\text{3}}}}的(2,2,1).

    步骤4 找出减少的车流关系中包含的供应站集合I1、需求站集合J1以及连接关系集合O,以步骤3中假设为例,减少的车流关系中包含的供应站为I1 = {1,2,3},包含的需求站为J1 = {1,2},包含的连接关系为{O} = \{ (2,1), (3,2)\}.

    步骤5 令集合 U V W 中的各项元素均为0. 同时,根据供应站 {n_1} 、需求站 {n_2} 、连接关系 {n_3} 及波动下限 {{\varGamma _1}、{\varGamma _2}、{\varGamma _3}} ,按下述方法确定 {\beta _i} {\gamma _j} {\alpha _{ij}} 的取值:

    1) 若 {\varGamma _1} \geqslant \left| {{n_1}} \right| \left| {{n_1}} \right| 表示 {n_1} 中元素个数,其余同),则令 {I_1} 内各供应站的系数 {\beta _i} 为1,以 {I_1}{\rm{ = }}\left\{ {{\rm{1,2,3}}} \right\} 为例即 {\beta _1} = 1 {\beta _2} = 1 {\beta _3} = 1 ;若 {\varGamma _1} < \left| {{I_1}} \right| 则得到从 {I_1} 中取 {\varGamma _1} 个元素的全排列集合 {N_1} ,令每组排列的系数为1;

    2) 针对 {\varGamma _2} 的调整方法同T1,当 {\varGamma _{\text{2}}} < \left| {{J_{\text{1}}}} \right| 时,得到从 {J_{\text{1}}} 中取 {\varGamma _{\text{2}}} 个元素的全排列集合 {N_{\text{2}}}

    3) 若 {\varGamma _{\text{3}}} \geqslant \left| {{O}} \right| ,则令 {O} 中各元素的系数 {\alpha _{ij}} = 1 ,以步骤3中假设为例, {\alpha _{21}} = 1 {\alpha _{32}} = 1 ;否则,得到从 {O} 中取 {\varGamma _3} 个元素的全排列组合 {N_3} ,令每组排列的系数为1.

    步骤6 输入由 {N_1} {N_2} {N_3} 中元素组成的 {\alpha _{ij}} {\beta _i} {\gamma _j} 排列,调用CPLEX求解各网络结构下的最佳效益值,取其中的最小值作为鲁棒解.

    该算法在给定波动量 \hat{t} {{_{ij}}} \hat{t} {{_i}} \hat{t} {{_j}} 的情况下,找出最劣网络结构较理想网络结构中减少的车流关系,以此为入手点找出波动下限 {\varGamma _1} {\varGamma _2} {\varGamma _3} 下最可能引起网络结构变化的 {\alpha _{ij}} {\beta _i} {\gamma _j} 排列,避免了无效遍历,减少了求解时间.

    以5个需求站和4个供应站构成的网络进行分析. 供应站列车的到达时刻 {A_{ie}} 、产生的各型空车数量{S_{ ie,\eta }}表1. 供应站发出列车 f 的最晚编组时刻 {L_{if}} 、发往需求站 j 和最大空车挂运数量{S_{ if}}表2. 需求站发出列车 g 的最晚编组时刻 {L_{jg}} 及空车需求量{S_{ jg,\chi }}表3. 站间空车输送费用 {c_{ij}} 、名义旅行时间 {t_{ij}} 表4. 各车站等待车小时费用 {c_i} {c_j} ,固定作业时间 {t_i} {t_j} ,空车装车后的发送效益 {p_j} 表5. 规划阶段起始时刻为0,1天为1440 min,表中负号对应前一天的时间. 前一阶段残存空车也按照其实际列车到达情况加入供应站到达列车数据.

    表  1  供应站列车到达时刻及空车产生数量
    Table  1.  Time of train arrival and number of empty wagons produced in supply stations
    供应站产生空车的到达列车编号
    1234
    17,5,7,5412,3,5,5−439,5,5,5−100,5,3,5
    2−35,3,5,7450,3,10,2−465,7,5,3−50,5,8,3
    3−367,5,6,5−497,5,5,5200,3,4,5
    4−436,5,5,2−356,5,2,580,6,4,5
    注:以逗号为分隔的各项依次为列车到达时间/min、平车数目/辆、棚车数目/辆、敞车数目/辆.
    下载: 导出CSV 
    | 显示表格
    表  2  供应站列车最晚编组时刻及最大空车挂运数量
    Table  2.  Train marshalling time limit and maximum number of empty wagons in supply stations
    供应站可挂运空车的发出列车编号
    12345
    1 222,1,10 627,3,15 −224,5,15 300,2,10 150,4,15
    2 203,1,10 693,3,15 −217,5,15 0,2,15 500,4,10
    3 −138,2,10 −268,4,10 400,1,10 800,3,10 500,5,10
    4 −326,2,15 −246,4,15 200,1,10 400,3,10 340,5,10
    注:以逗号为分隔的各项依次为最晚编组时间/min、发往需求站编号、最大空箱挂运数目/辆.
    下载: 导出CSV 
    | 显示表格
    表  3  需求站列车最晚编组时刻及所需空车数量
    Table  3.  Train marshalling time limit and number of empty trains required in demand stations
    列车
    序号
    需求站编号
    12345
    1660,2,6,2280,5,2,101160,5,8,2260,2,6,1400,2,8,2
    2780,5,5,2560,6,8,51400,6,5,2920,8,5,5800,10,2,2
    注:以逗号为分隔的各项依次为最晚编组时间/min、平车数目/辆、棚车数目/辆、敞车数目/辆.
    下载: 导出CSV 
    | 显示表格
    表  4  站间空车输送费用及名义旅行时间
    Table  4.  Empty wagon transportation cost and nominal travel time between stations


    需求站编号
    12345
    1200,3.3157,2.3285,4.6322,4.8420,5.9
    2174,3.479,1.2202,3.3288,4.1406,5.5
    3298,4.0172,3.4186,2.8193,4.1204,3.4
    4363,5.5338,6.2248,4.9210,3.5209,3.1
    注:以逗号为分隔的各项依次为空车输送费用/(元•箱)−1、名义旅行时间/h.
    下载: 导出CSV 
    | 显示表格

    通过MATLAB 2018a调用数学优化软件CPLEX编程求解,得到该供需网络下的最优空车匹配方案,供应站各发出列车挂运的空车来源见表6. 各需求站发出列车的空车来源见表7. 该网络下存在474个第1阶段车流关系,204个第2阶段车流关系,空车输送效益值为53708元.

    表  5  车站参数数据
    Table  5.  Station parameter data
    站点编号需求站供应站
    pj/(元•箱−1)tj/mincj /(元•h−1)ti/minci /(元•h−1)
    167323132052
    248520552254
    359824662186
    465927121052
    58052573
    下载: 导出CSV 
    | 显示表格
    表  6  供应站发出列车的空车来源
    Table  6.  Empty wagon source of trains leaving from supply stations
    供应站编号列车发出序号
    12345
    1 (1,4);(1,6);0 (2,3):0;(2,2) (3,5);(3,5);(3,5) 0;0;0 (4,2);(4,3);(4,1)
    2 (1,3);(1,5);(1,2) (2,3);(2,10);(2,2) 0;(3,1);0 (3,7);(3,4);(3,3) 0;0;0
    3 0;(1,1);[(1,5),(2,4)] (2,4);(2,5);(2,1) 0;0;0 (1,5);(1,3);0 0;0;0
    4 (1,5);(1,5);(1,2) (2,4);(2,2);(2,5) 0;0;(3,2) 0;0;0 [(2,1),(3,6)];(3,2);(3,1)
    注:以分号分割的各项依次对应的车型为平车、棚车、敞车; [ ]内为相同车型的空车来源集;( )内各项依次表示到达列车序号、提供空车数量/辆. 以“(1,4);(1,6);0”为例,供应站1发出的第1列列车中,挂运空车的来源为:第1列到达列车提供4辆平车;第1列到达列车提供6辆棚车;该列车中不包含敞车.
    下载: 导出CSV 
    | 显示表格
    表  7  需求站发出列车空车来源
    Table  7.  Empty wagon source of trains leaving from demand station
    需求站编号列车发出序号
    12
    1 (2,1,2);(1,1,6);(2,1,2) [(1,1,4),(2,1,1)];(2,1,5);(4,3,2)
    2 [(2,4,1),(4,1,4)];(4,1,2);[(2,4,3),(3,1,5),(4,1,2)] (2,4,6);[(2,4,4),(3,1,1),(4,1,3)];[(3,1,4),(4,1,1)]
    3 [(1,2,2),(2,2,3)];(2,2,8);(1,2,2) [(1,2,1),(3,4,5)];[(2,2,2),(3,4,3)];(2,2,2)
    4 (4,2,2);[(3,2,5),(4,2,1)];(3,2,1) [(1,5,2),(3,2,4),(4,2,2)];[(1,5,4),(4,2,1)];(4,2,5)
    5 (1,3,2);[(1,3,7),(2,3,1)];(1,3,2) [(1,3,3),(4,5,7)];(4,5,2);[(1,3,1),(4,5,1)]
    注:以分号分割的各项依次对应的车型为平车、棚车、敞车; [ ]内为相同车型的空车来源集合;( )内各项依次表示供应站编号、供应站发出列车序号、空车数量/辆. 以“[(1,1,4),(2,1,1)];(2,1,5);(4,3,2)”为例,需求站1发出的第2列列车中,其装车空箱的来源为:供应站1发出的第1列车提供4辆平车,供应站2发出的第1列车提供1辆平车;供应站2发出的第1列车提供5辆棚车;供应站4发出的第3列车提供2辆敞车.
    下载: 导出CSV 
    | 显示表格

    空车替代情况:需求站2发出的列车2中由列车(4,1,1)供应的1辆敞车为平车用作敞车. 需求站4发出的列车2中由列车(1,5,4)供应的棚车中,有1辆为敞车用作棚车. 需求站5发出的列车1中由列车(1,3,7)供应的棚车中,2辆为敞车用作棚车.

    波动量和波动下限造成的网络结构变化可能导致无可行解,为保证可行解的存在对网络进行下述变化.

    1) 为各供应站增加一辆虚拟到达列车,该列车与供应站所有发出列车 f 均存在接续关系,且挂有充足的各类型空车;

    2) 任一供应站与所有需求站间均增加一列虚拟发出列车,该列车与需求站所有发出列车 g 均存在接续关系且发出列车的空车挂运能力充足;

    3) 当供应站发出列车空车来源为供应站虚拟到达列车时,供应站库存费用取较大常数,当需求站发出列车车流来源为供应站虚拟发出列车时,需求站发车效益为0.

    4) 求得最优解后,除去供应站虚拟到达列车和虚拟发出列车对应车流关系,结合式(1)求解实际效益,作为当前方案下的效益值.

    3.3.1   单因素波动影响分析

    模型中的不确定因素包括站间旅行时间、供应站及需求站作业时间3项. 各因素的不确定程度由波动量 \hat{t} {{_{ij}}} \hat{t} {{_i}} \hat{t} {{_j}} 和波动下限 {\varGamma _1} {\varGamma _2} {\varGamma _3} 共同决定,令 {q_1}{t_{ij}} = \hat{t} {{_{ij}}} {q_2}{t_i} = \hat{t} {{_i}} {q_3}{t_j} = \hat{t} {{_j}} . 不同波动下限下效益值随 \hat{t} {{_{ij}}} \hat{t} {{_i}} \hat{t} {{_j}} 的变化即可看作效益值随波动率 {q_1} {q_{\text{2}}} {q_{\text{3}}} 的变化. 单因素波动导致效益值和网络结构的变化如图3所示.

    图  3  单因素波动率影响分析
    Figure  3.  Fluctuation influence analysis from single factor

    图3可知:

    1) 单因素的不确定性导致效益值出现较大变化时,必然伴随车流关系的变化. 只有当减少的车流关系属于当前最优调运方案时效益值才会有较大变化.

    2) 相同波动率下效益值差距较大时,波动下限越大效益值越小. 此时,相同波动率下的最优调运方案不同,波动下限越大,网络中存在车流关系越少,网络结构越劣,效益越小.

    3) 相同波动率下效益值很接近时,波动下限越大效益值越大. 此时最优调运方案一致,波动下限越大,受到影响的作业或旅行时间越多,车辆的等待时间越小,效益值越大.

    4) 从单因素的绝对鲁棒性来看,波动率相同时,效益值越小则受波动率影响越大,故各因素对效益的影响程度为 {t_j} > {t_{ij}} > {t_i} .

    3.3.2   多因素波动率影响分析

    给定 {\varGamma _1}{\text{ = 15}} {\varGamma _2}{\text{ = 2}} {\varGamma _3} = 3 {q_1} {q_2} {q_3} 之间互动关系如图4. {q_2} 的大小决定第1阶段连接关系的数量,也决定了优化结果的上限. 随着 {q_2} 的增大,效益值整体波动幅度逐渐减小, {q_2} 不变时效益值随 {q_1} {q_3} 的增大而减小.

    图  4  多因素波动率影响分析
    Figure  4.  Fluctuation influence analysis from multiple factors
    3.3.3   波动下限影响分析

    q_1 = 5{\text{%}} q _2 = 4{\text{%}} q_3 = 5{\text{%}} 时,不同 {\varGamma _1}、 {\varGamma _2}、{\varGamma _3} 下方案效益值如图5所示.

    1) 站间旅行时间波动下限影响分析

    {\varGamma _2} {\varGamma _3} 取值相同, {\varGamma _1} \in [0,2] 时, {\varGamma _1} 对效益有显著影响,并且 {\varGamma _1} 越大效益越小. {\varGamma _1} \in [3,20] 时, {\varGamma _1} 对效益无显著影响, {\varGamma _1} 越大效益值越大.

    2) 供应站作业时间波动下限影响分析

    {\varGamma _1} {\varGamma _3} 取值相同, {\varGamma _2} 的取值对效益无较大影响,并且 {\varGamma _2} 越大效益值越大.

    3) 需求站作业时间波动下限影响分析

    {\varGamma _1} {\varGamma _2} 取值相同, {\varGamma _3} \in [0,1]时的效益明显大于{\varGamma _3} \in [2,5]时的效益,且效益与 {\varGamma _3} 的呈负相关. 但当 {\varGamma _3} \in [2,5] 时,虽然效益仍与 {\varGamma _3} 呈负相关,但无显著差异.

    综上,供应站作业时间波动下限对效益值的影响最小. 旅行时间波动下限和需求站作业时间波动下限取值较小时,它们对效益值有较大影响,并且二者间存在相互影响.

    图  5  波动下限影响分析
    Figure  5.  Influence analysis of lower limit of fluctuation

    1) 提出供应站到达列车、发出列车以及需求站发出列车间的空车接续时间关系判断方法,并据此分别建立了确定环境与不确定环境下的空车调运优化模型.

    2) 考虑构建模型的特征,将确定环境下的模型转化为了线性模型,并结合车流关系的变化是效益值变化的主要原因这一特点,设计了鲁棒优化模型的求解算法,求得了考虑车种替代的空车配流方案.

    3) 需求站技术作业时间波动率对效益值影响最大. 供应站技术作业时间波动下限对效益值影响最小. 方案效益值随方案鲁棒性的提高而下降.

  • 图 1  可解释调制识别网络设计

    Figure 1.  Design of interpretable modulation recognition network

    图 2  12种调制信号的二维时频特征图

    Figure 2.  2D time-frequency characteristic diagrams of 12 modulation signals

    图 3  SE-ResNet50结构

    Figure 3.  SE-ResNet50 structure

    图 4  二维时频特征提取的调制识别整体准确率

    Figure 4.  Overall accuracy of modulation recognition based on 2D time-frequency feature extraction

    图 5  0 dB下SE-ResNet识别结果的混淆矩阵

    Figure 5.  Confusion matrix of recognition results with SE-ResNet at 0 dB

    图 6  −10 dB下SE-ResNet识别结果的混淆矩阵

    Figure 6.  Confusion matrix of recognition results with SE-Res Net at −10 dB

    图 7  类激活图在不同时频特征上的映射结果

    Figure 7.  Mapping results of class activation graphs on different time-frequency features

    图 8  4条BPSK信号时频图在SE-ResNet下的梯度类激活映射

    Figure 8.  Gradient-weighted class activation mapping of time-frequency graphs from four BPSK modulated signals with SE-ResNet

    图 9  每类信号时频特征对于不同预测类别的梯度类激活映射

    Figure 9.  Gradient class activation mapping of time-frequency characteristics from each class of signals for different prediction classes

    图 10  8PSK调制信号的时频特征在不同信噪比下的SE-ResNet50隐藏层最后一层的类激活图

    Figure 10.  Class activation graphs of time-frequency characteristics of 8PSK modulated signals on the last hidden layers with SE-ResNet50 under different SNR ratios

    图 11  SE-ResNet、ResNet50和VGGNet对于同种调制信号时频特征的类激活图

    Figure 11.  Class activation graphs of SE-ResNet, ResNet50 and VGGNet for the same modulated signal

    图 12  4种深度网络最后一层的卷积核贡献值排序

    Figure 12.  Ranking of kernel contribution values on the last convolution layer of four deep networks

    图 13  VGG16最后一层卷积层每个卷积核对应的贡献值

    Figure 13.  Contribution values of each kernel on the last convolution layer of VGG16

  • [1] WEI W, MENDEL J M. Maximum-likelihood classification for digital amplitude-phase modulations[J]. IEEE Transactions on Communications, 2000, 48(2): 189-193. doi: 10.1109/26.823550
    [2] POLYDOROS A, KIM K. On the detection and classification of quadrature digital modulations in broad-band noise[J]. IEEE Transactions on Communications, 1990, 38(8): 1199-1211. doi: 10.1109/26.58753
    [3] HUAN C Y, POLYDOROS A. Likelihood methods for MPSK modulation classification[J]. IEEE Transactions on Communications, 1995, 43(2/3/4): 1493-1504. doi: 10.1109/26.380199
    [4] NANDI A K, AZZOUZ E E. Algorithms for automatic modulation recognition of communication signals[J]. IEEE Transactions on Communications, 1998, 46(4): 431-436. doi: 10.1109/26.664294
    [5] ZAERIN M, SEYFE B. Multiuser modulation classification based on cumulants in additive white Gaussian noise channel[J]. IET Signal Processing, 2012, 6(9): 815-823. doi: 10.1049/iet-spr.2011.0357
    [6] 李红光,郭英,眭萍,等. 基于时频特征的卷积神经网络跳频调制识别[J]. 浙江大学学报(工学版),2020,54(10): 1945-1954.

    LI Hongguang, GUO Ying, SUI Ping, et al. Frequency hopping modulation recognition of convolutional neural network based on time-frequency characteristics[J]. Journal of Zhejiang University (Engineering Science), 2020, 54(10): 1945-1954.
    [7] ZHANG H J, LE RUYET D, TERRÉ M. Spectral correlation of multicarrier modulated signals and its application for signal detection[J]. EURASIP Journal on Advances in Signal Processing, 2010, 2010: 794246.1-794246.14.
    [8] SCHREYOGG C, KITTEL K, KRESSEL U, et al. Robust classification of modulation types using spectral features applied to HMM[C]//1997 IEEE Military Communications Conference (MILCOM 97). Monterey: IEEE, 1997: 1377-1381.
    [9] MOBASSERI B G. Constellation shape as a robust signature for digital modulation recognition[C]//IEEE Military Communications Conference (MILCOM 99). Atlantic City: IEEE, 1999: 442-446.
    [10] 李楠. 双谱特征和深度学习在信号调制识别中的应用[J]. 弹箭与制导学报,2019,39(5): 81-84,88.

    LI Nan. Application of bi-spectral feature and depth learning in signal modulation recognition[J]. Journal of Projectiles, Rockets, Missiles and Guidance, 2019, 39(5): 81-84,88.
    [11] O’SHEA T, HOYDIS J. An introduction to deep learning for the physical layer[J]. IEEE Transactions on Cognitive Communications and Networking, 2017, 3(4): 563-575. doi: 10.1109/TCCN.2017.2758370
    [12] HU S S, PEI Y Y, LIANG P P, et al. Robust modulation classification under uncertain noise condition using recurrent neural network[C]//2018 IEEE Global Communications Conference (GLOBECOM). Abu Dhabi: IEEE, 2018: 8647582.1-8647582.7.
    [13] 吴亚聪. 基于深度注意胶囊的智能信号识别方法研究[D]. 西安: 西安电子科技大学,2019.
    [14] ZHOU B L, KHOSLA A, LAPEDRIZA A, et al. Learning deep features for discriminative localization[C]//2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). Las Vegas: IEEE, 2016: 2921-2929.
    [15] SELVARAJU R R, COGSWELL M, DAS A, et al. Grad-CAM: visual explanations from deep networks via gradient-based localization[C]//2017 IEEE International Conference on Computer Vision (ICCV). Venice: IEEE, 2017: 618-626.
    [16] CHEN J Y, MIAO S H, ZHENG H B, et al. Feature explainable deep classification for signal modulation recognition[C]//The 46th Annual Conference of the IEEE Industrial Electronics Society (IECON 2020). Singapore: IEEE, 2020: 3543-3548.
  • 加载中
图(13)
计量
  • 文章访问数:  467
  • HTML全文浏览量:  162
  • PDF下载量:  58
  • 被引次数: 0
出版历程
  • 收稿日期:  2021-09-10
  • 修回日期:  2022-05-16
  • 网络出版日期:  2024-06-14
  • 刊出日期:  2022-06-09

目录

/

返回文章
返回