Loading [MathJax]/jax/element/mml/optable/SuppMathOperators.js
  • ISSN 0258-2724
  • CN 51-1277/U
  • EI Compendex
  • Scopus 收录
  • 全国中文核心期刊
  • 中国科技论文统计源期刊
  • 中国科学引文数据库来源期刊

强震下大跨度连续梁桥损伤分析

贾宏宇 吴炜昌 游刚 杨磊 彭奇慧 郑史雄

岳川, 王立德, 闫海鹏. 小样本条件下列车通信网络攻击样本生成方法[J]. 西南交通大学学报, 2023, 58(6): 1277-1285. doi: 10.3969/j.issn.0258-2724.20210557
引用本文: 贾宏宇, 吴炜昌, 游刚, 杨磊, 彭奇慧, 郑史雄. 强震下大跨度连续梁桥损伤分析[J]. 西南交通大学学报, 2023, 58(6): 1423-1431. doi: 10.3969/j.issn.0258-2724.20220072
YUE Chuan, WANG Lide, YAN Haipeng. Attack-Sample Generation Method for Train Communication Network Under Few-Shot Condition[J]. Journal of Southwest Jiaotong University, 2023, 58(6): 1277-1285. doi: 10.3969/j.issn.0258-2724.20210557
Citation: JIA Hongyu, WU Weichang, YOU Gang, YANG Lei, PENG Qihui, ZHENG Shixiong. Damage Analysis of Long-Span Continuous Beam Bridges Under Strong Earthquakes[J]. Journal of Southwest Jiaotong University, 2023, 58(6): 1423-1431. doi: 10.3969/j.issn.0258-2724.20220072

强震下大跨度连续梁桥损伤分析

doi: 10.3969/j.issn.0258-2724.20220072
基金项目: 国家自然科学基金(52178169)
详细信息
    通讯作者:

    贾宏宇(1981—),男,副教授,博士生导师,研究方向为桥梁抗震,E-mail:Hongyu1016@swjtu.edu.cn

  • 中图分类号: U442.5

Damage Analysis of Long-Span Continuous Beam Bridges Under Strong Earthquakes

  • 摘要:

    连续梁桥结构常因地震发生损伤甚至倒塌而失去交通作用,研究强震下大跨度连续梁桥的损伤破坏机制对提高桥梁抗倒塌性能具有重要意义. 基于有限元软件ANSYS/LS-DYNA,考虑桥墩材料非线性、损伤过程大变形非线性以及梁端非线性碰撞,建立大跨度连续梁桥在强震作用下的损伤三维数值模型,进行非线性分析,直观模拟大跨度连续梁桥在强震作用下的损伤破坏过程,从连续梁桥的应变与位移响应、桥墩损伤和梁-台间碰撞作用等方面分析了大跨度连续梁桥的地震损伤情况. 研究结果表明:单向地震动输入与双向地震动输入作用下破坏模式基本一致,破坏模式由桥梁结构本身决定,地震动输入方式影响较小;大跨度连续梁桥的地震损伤是逐渐发展的过程,桥墩混凝土损伤因子不断累积达到0.99,固定墩底部发生受弯塑性破坏,桥梁发生损伤破坏.

     

  • 随着列车通信网络(TCN)对通信速率及智能化需求的不断增加,基于以太网的列车通信网络(ETCN)因其带宽高、兼容性强及开放性好等优点,正逐步成为现今智能列车的首选网络架构[1]. 但ETCN的应用给列车带来通信便利之时,也引入了诸多网络安全隐患[2]. 作为基础性公共设施,列车的网络安全至关重要,应当采取有效的措施来提高其安全防护能力.

    入侵检测在网络安全领域扮演着重要的角色,可以发现网络入侵行为并发出告警[3]. 近年来,深度学习已成为入侵检测方法的主流选择,其优势发挥通常是以充足的数据样本为基础,但在入侵检测领域,小样本问题(模型训练时攻击样本数量过少)仍然阻挠深度学习方法发挥其应有的检测能力. 网络攻击多为偶发事件,攻击报文数量往往有限,对于列车通信网络,攻击者更加追求“悄无声息”地入侵,攻击样本往往数量更小,小样本问题更加凸显,使模型没有充足的信息可以学习. 同时,由于正常报文数量巨大,也会进一步导致类不平衡问题,即训练数据中各类别分布不均衡,导致深度学习模型倾向于学习正常样本的特征,而轻视关键的攻击样本.

    数据增广是解决小样本问题的主流方法,即利用特定方法扩充小样本数据的数量[4]. 传统的数据增广方法主要为过采样方法,例如:文献[5]使用合成少数过采样法(SMOTE)来扩充小样本数据,提升了入侵检测的准确率;文献[6]提出一种基于聚类簇结构特性的综合采样法,能够生成样本分布结构特性保持的均衡数据样本. 上述方法在面对入侵检测的小样本问题时取得了较好的效果,并且具有可解释性强、机制简单的优势,但也正因为其机制较为简单,生成样本的质量不够突出,容易导致有效信息的丢失及模型过拟合. 生成对抗网络(GAN)[7]是一种生成模型,因其强大的数据生成能力已被广泛应用于多个领域的数据增广任务中. 对于入侵检测的小样本问题,一种更为新颖的解决思路是使用GAN来生成高质量的网络攻击样本:文献[8]提出了一种基于GAN的攻击样本生成方法,将生成的样本应用在基于CNN的入侵检测模型中,能够有效地提升模型的准度;文献[9]对传统GAN进行了改进,提出了一种基于不平衡生成对抗网络(IGAN)的攻击样本生成方法并应用于点对点模式(ad-hoc)网络的入侵检测任务中,有效提升了入侵检测的检测准度. 上述方法虽取得了优异的表现,但皆有不同的适用场景. 如何将GAN有效地应用于ETCN场景仍是一项具有挑战性的任务,需要结合ETCN中攻击数据的实际特点对方法进行适应性的改进设计.

    针对ETCN入侵检测的小样本问题,在传统GAN框架基础上,本文提出一种改进的生成对抗网络(GMCW-GAN),用于生成高质量的ETCN网络攻击样本. 实验结果表明,本文提出的方法能够生成有效的ETCN网络攻击样本,可以在小样本条件下提高基于深度学习的ETCN入侵检测的检测准度,进而增强ETCN的安全防御能力.

    首先,分析将传统GAN应用于网络攻击样本生成任务时存在的主要缺点,在此基础上,介绍GMCW-GAN的主要改进内容;其次,设计GMCW-GAN中生成器与判别器的内部网络结构.

    GAN是Goodfellow等[7]于2014年提出的一种基于可微生成器的生成式建模方法. GAN由2部分组成:生成器G与判别器D,通过对抗训练的方式使生成器产生的样本服从真实数据分布. 该训练过程是一个0和博弈问题,即生成器与判别器各自的收益等于对方的损失,当训练接近纳什均衡时,模型达到最优. 其目标函数如式(1),GAN的整体优化目标可形式化表示为minGmaxDV(D,G).

    V(D,G)=Expr(x)logD(x;ϕ)+E˜xpg(˜x)log(1D(G(z;θ);ϕ)), (1)

    式中:θϕ分别为生成器与判别器的参数;z为输入生成器的随机变量;Expr(x)为从真实数据x的分布pr(x)中获取的期望,xS维连续向量;E˜xpg(˜x)为从生成数据˜x的分布pg(˜x)中获取的期望,˜x = G(z;θ).

    传统GAN存在3项缺点:1) 生成器的输入通常为符合高斯分布或均匀分布的随机变量,然而,在实际应用中,这2类分布的表达能力较为单一,会从模型的初始采样环节对生成样本的初始数据形态产生约束,最终影响生成样本的多样性;2) 生成过程中,生成样本的类别不受控,表现为将GAN应用在多类别的生成任务中时,无法按需指定其生成特定类别的样本;3) 生成器的优化目标等价于最小化pg(˜x)pr(x)之间的JS (Jensen-Shannon)散度[7],当分布之间没有重叠部分时,将导致生成器梯度消失,从而无法通过训练进一步优化生成器.

    对于ETCN入侵检测的攻击样本生成任务,缺点1会导致生成样本的多样性不足,从而限制其在入侵检测模型训练环节中的促进作用;缺点2会导致生成样本的类别难以控制,从而增加样本生成模型的训练难度与成本;缺点3会导致生成样本的真实性不足,不能够充分模拟真实的网络入侵数据.

    面向ETCN入侵检测的攻击样本生成需求,本文设计了一种样本生成方法GMCW-GAN,其整体结构见图1. 该方法在传统GAN的基础上从采样策略、约束条件、损失密度3个方面进行改进,以克服上述缺点.

    图  1  GMCW-GAN的整体结构
    Figure  1.  Overall structure of GMCW-GAN
    1.1.1   采样策略改进

    传统GAN从高斯分布或均匀分布中采样生成随机变量作为其潜在空间的先验分布,这种采样方式在一定程度上约束了生成样本的多样性. 为解决这一问题,GMCW-GAN采用具备多模态特性的高斯混合模型(GMM)[10]来替代传统的一元高斯分布,从而更好地契合真实训练样本的内生多模态特性,增加生成样本的多样性.

    GMM由N个高斯分量加权求和组成,每个分量为1个一元高斯分布,可将GMM形式化表述为

    p(x|λ)=Ni=1ωig(x|μi,Ci)=Ni=1ωi(2π)S/2|Ci|1/2×exp{(xμi)TC1i(xμi)2}, (2)

    式中:g(x|μi,Ci)为单个随机潜变量依从的S元高斯分布的概率密度函数;μi为均值向量,μiRSCi为协方差矩阵;λ={ωi,μi,Ci}为GMM的参数,ωi为第i个高斯分量的权值,且Ni=1ωi=1.

    对于ETCN攻击样本生成任务,在没有先验知识时,可认为GMCW-GAN潜空间中的高斯分量具有均等权值,则可令ωi = 1/1NN,因此,潜空间需要计算的参数可约简为λ={μi,Ci}. 由于直接从GMM中采样得到随机变量的过程不可导,无法参与反向梯度传播来更新参数λ,因此,GMCW-GAN通过重参数化技巧解决该问题,即首先从正态分布N(0,1)中采样得到ε,并按式(3)计算得到随机变量z.

    z=μi+σiε, (3)

    式中:σi为方差,σiRS×S.

    该过程在保持潜在变量随机性的同时,将随机性与参与训练的参数分离,确保GMM的参数λ可以通过反向传播来动态更新.

    1.1.2   约束条件改进

    传统GAN的生成过程自由度过高,其生成的样本不可控. 为解决该问题,GMCW-GAN引入样本条件约束技巧,通过给定相应的样本类别标签约束增强生成过程的可控性.

    在GMCW-GAN中,令真实目标样本的类别标签y为样本条件约束,通过给生成器和判别器的输入分别增加约束x|yz|y来实现. 增加了样本条件约束后的优化目标改写为

    minGmaxDV(D,G) = Expr(x)logD(x|y;ϕ)+E˜xpg(˜x)log(1D(G(z|y;θ);ϕ)). (4)

    改进后,可以通过改变输入样本的类别标签y来控制模型生成所需的网络攻击样本.

    1.1.3   损失函数改进

    传统GAN通过JS散度来衡量pg(˜x)pr(x)之间的距离,当两分布之间不存在重叠时会导致梯度消失等问题. 为克服该缺陷,GMCW-GAN引入沃瑟斯坦距离[11]来替代基于JS散度的损失函数,使得改进后的损失函数拥有更加合理的优化目标.

    沃瑟斯坦距离可度量高维空间中的数据推动距离. 面对高维的网络攻击样本,将数据从pr(x)推向pg(˜x)的过程存在多种移动路径,每种路径下,将数据全部推至目的分布的总代价B(γ),如式(5)所示.

    B(γ)=xr˜xgγ(xr,˜xg)|xr˜xg|, (5)

    式中:γ为一条特定的移动路径,γ(xr,˜xg)为具体的推动数据量,xr˜xg分别为推动前、后的样本映射,|xr˜xg|为移动距离.

    所有移动路径总代价中的最小值即pr(x)pg(˜x)的沃瑟斯坦距离W(pr,pg),即

    W(pr,pg)=minPB(γ), (6)

    式中:P为两分布间所有可能的移动路径.

    将式(5)代入式(6),可以等价地将W(pr,pg)表示为

    W(pr,pg) = infγΠ(pr,pg)E(xr,˜xg)γ[||xr˜xg||], (7)

    式中:Π(pr,pg)pr(x)pg(˜x)构成的联合分布集合,inf表示取下确界.

    求解式(7)的过程等同于求解一个线性规划问题,面对现实中复杂的网络攻击数据分布,直接对其求解是难以实现的,因此,通过求解其对偶问题[12],等价地得到新的函数表达式为

    W1(pr,pg)=sup||D||L (8)

    式中:\sup 表示取上确界,L \leqslant 1表示函数应服从1-Lipschitz约束.

    GMCW-GAN引入梯度惩罚(gradient penalty)来保证函数服从1-Lipschitz约束,即在判别器的优化目标中加入梯度惩罚项 G_{\rm{P}}(\hat {\boldsymbol{x}}) ,其表达式为

    G_{\rm{P}}(\hat {\boldsymbol{x}}) = - \lambda {E_{\hat {\boldsymbol{x}}\sim{P_{{\rm{GP}}}}(\hat {\boldsymbol{x}})}}\max \{0,||{\nabla _{\hat {\boldsymbol{x}}}}D(\hat {\boldsymbol{x}})|| - 1\}, (9)

    式中:{P_{{\rm{GP}}}}(\hat {\boldsymbol{x}})为由{p_{\rm{g}}}(\tilde {\boldsymbol{x}})的采样点与{p_{\rm{r}}}({\boldsymbol{x}})的采样点连线组成的分布,\hat {\boldsymbol{x}} 为分布中的变量.

    联立式(4)、(8)、(9),即可得到GMCW-GAN最终的目标函数为

    \begin{split} & V(D,G) = {\max\limits _D}\{ {E_{{\boldsymbol{x}}\sim{p_{\rm{r}}}({\boldsymbol{x}})}}D({\boldsymbol{x}}|y;\phi ) - \\ &\quad{E_{\tilde {\boldsymbol{x}}\sim{p_{\rm{g}}}(\tilde {\boldsymbol{x}})}}(D(G({\boldsymbol{z}}|y;\theta );\phi ) - \\ &\quad \lambda {E_{\hat {\boldsymbol{x}}\sim{P_{{\rm{GP}}}}(\hat {\boldsymbol{x}})}}\max \{0,||{\nabla _{\hat {\boldsymbol{x}}}}D(\hat {\boldsymbol{x}})|| - 1\} \} . \end{split} (10)

    本节基于具有强表示能力的卷积神经网络来设计生成器与判别器的内部网络结构.

    1.2.1   生成器

    生成器主要作用是将输入的随机变量转变为攻击样本,GMCW-GAN中生成器的网络结构包括全连接层(FC1)、重塑层(R2)、2层转置卷积层(TC3、TC4)与卷积层(C5),如图2所示.

    图  2  生成器网络结构
    Figure  2.  Network structure of generator

    从高斯混合模型中采样得到的随机分布{\boldsymbol{z}}与样本标签约束y的联合嵌入表示生成器的输入;通过FC1将输入进一步表示为多神经元隐层的输出;通过R2将FC1的输出重塑为三维结构;通过TC3与TC4执行转置卷积;通过C5,以same padding(保持卷积前后张量的高与宽不变)的方式执行卷积,得到与真实攻击样本同形状的生成攻击样本.

    为避免引入稀疏梯度,FC1、TC3与TC4中的非线性激活函数采用LeakyRelu[13],同时因为C5的输出为生成的攻击样本,为保证与输入至判别器的真实样本具备同样的特征尺度(0~1),采用Sigmoid函数作为其非线性激活函数.

    1.2.2   判别器

    判别器主要用于判断其输入样本是否真实,其本质上是一个二分类器,GMCW-GAN中判别器的网络结构包括2层卷积层(C1、C2)、展平层(F3)与2层全连接层(FC4、FC5),如图3所示.

    图  3  判别器网络结构
    Figure  3.  Network structure of discriminator

    判别器的输入用真实攻击样本或生成器生成的攻击样本与样本标签约束的联合嵌入表示;通过C1与C2提取样本特征;利用F3将C2的输出展平为向量;进一步用FC4与FC5提取特征,同时缩减向量长度,最终得到单个元素的输出. C1、C2与FC4中的非线性激活函数采用LeakyRelu,应用沃瑟斯坦距离作为优化目标,因此,FC5的输出无须进行非线性激活.

    为验证GMCW-GAN的性能,首先,介绍ETCN半实物实验平台,给出攻击数据的获取方式;其次,给出相应评价指标,并介绍实验测试环境与相关超参数配置;最后,通过多角度的实验,验证GMCW-GAN的攻击样本生成能力.

    本文对照某型ETCN列车的实车网络拓扑,搭建ETCN半实物实验平台,根据相关资料在平台中模拟配置了车辆正常通信进程,在此基础上将安装了攻击模拟软件的攻击节点接入至交换机,从而开展模拟攻击实验. 实验环境如图4所示.

    图  4  ETCN半实物实验平台
    Figure  4.  Hardware-in-the-loop experimental platform of ETCN

    本文提出的GMCW-GAN生成样本类型主要取决于输入的真实样本类型. 为了验证其生成能力,本节采取的思路为:总结ETCN可能面临的典型攻击,开展模拟攻击实验,从而获取相应的数据,用于验证GMCW-GAN的生成能力.

    作者的前期研究中总结了ETCN可能面临的3大类主要攻击有探测类攻击、拒绝服务类攻击、中间人类攻击[14],因此,本文向实验平台注入3大类攻击中的8种典型攻击来构造训练数据集,包括属于探测类攻击的IP扫描、端口扫描与漏洞扫描,属于拒绝服务类攻击的UDP(user datagram protocol)泛洪,TCP(transmission control protocol)泛洪,属于中间人类攻击的ARP(address resolution protocol)欺骗、篡改与重放.

    为便于比较GMCW-GAN生成的样本与真实样本的质量,通过2个步骤构建2个ETCN攻击数据集.

    步骤1 通过攻击模拟实验构造1个样本充足的基准ETCN攻击数据集,称为TADS (train attack dataset),其数据分布见表1.

    表  1  TADS的样本分布
    Table  1.  Sample distribution of TADS
    攻击类别样本数量/个比例/%
    IP 扫描 10648 44.89
    端口扫描 9562
    漏洞扫描 11257
    篡改 9301
    重放 8872
    ARP 欺骗 9525
    正常报文 72643 55.11
    下载: 导出CSV 
    | 显示表格

    步骤2 维持TADS中正常报文数量不变,在其各类攻击样本中随机抽取500个样本,构造小样本的ETCN攻击数据集,称为TADS-F,其数据分布见表2.

    表  2  TADS-F的样本分布
    Table  2.  Sample distribution of TADS-F
    攻击类别样本数量/个比例/%
    IP 扫描5003.97
    端口扫描500
    漏洞扫描500
    篡改500
    重放500
    ARP欺骗500
    正常报文72643 96.03
    下载: 导出CSV 
    | 显示表格

    TADS中,正常报文与攻击报文均有上万个样本,数量充足,同时其数量比约为5.5∶4.5,分布平衡. TADS-F中,正常报文数量充足,但攻击报文数量稀少,其数量比约为9.6∶0.4,分布不平衡.

    生成样本的目的是给入侵检测模型的训练提供更多有效信息,因此,本节通过入侵检测性能来评价GMCW-GAN的攻击样本生成能力. 小样本条件下主要关注正类样本(攻击)是否能被正确检测. 查准率P是指所有检测为攻击的样本中真正为攻击的比例,反映了对攻击样本的检测精准度;查全率R是指所有攻击样本中被正确检测为攻击的比例,反映了对攻击样本的检测完整度;F1分数是PR的调和平均,如式(11)所示,可综合反映对攻击样本的检测能力.

    F_1 = \frac{{2 P R}}{{P + R}}\times 100{\text{%}} \,. (11)

    虚警率(FPR)是指被错误检测为攻击的正常样本占所有正常样本的比例,虚警率越低,模型对正样本的预测纯度越高,性能越好,如式(12).

    F_{{\rm{PR}}} = \frac{{F_{\rm{P}}}}{{F_{\rm{P}} + T_{\rm{N}}}} \times 100{\text{%}} \, , (12)

    式中:FP为被误检的正常样本数量,TN为被正确检测的正常样本数量.

    攻击样本生成实验与入侵检测实验在以下配置环境中实施:1) 硬件,AMD Ryzen 5 1600X CPU@3.60 GHz,32 GB RAM,NVIDIA GeForce GTX 1060 6 GB GPU;2) 软件,Windows 10 操作系统,Keras 2.5.0,CUDA 10.2.95.

    GMCW-GAN采用RMSProp作为优化器,学习率设置为0.001,小批量大小为32个,随机变量设置为128维向量,梯度惩罚项为10,{{\boldsymbol{\mu}} _i}{{\boldsymbol{\sigma}} _i}赋以随机初值(由于共有8类攻击样本,因此i样本标签为1~8的整数.

    深度神经网络(DNN)是一种具有代表性的深度学习方法,在入侵检测领域取得了良好的应用效果[15],其网络结构如图5所示. 该模型的主要原理为:将入侵检测任务转化为深度学习中的分类任务,将模型视为实现函数关系拟合的分类器,通过从隐含层到输出层的逐层拟合,建立输入 (样本的特征表示)与输出 (预测的类别)之间的映射关系,通过该映射关系即可实现对输入样本的类别预测,从而实现入侵检测. 所构建的模型具有3层隐含层,其神经元数分别为512、256、128个,激活函数为ReLU,损失函数为交叉熵损失,优化器采用SGD,学习率为0.002,小批量大小为64,遍历次数epoch为30次,检测的总类别数C=9(包含正常类).

    图  5  入侵检测模型的结构
    Figure  5.  Network structure of intrusion detection model

    开展实验之前,首先对原始数据进行预处理:提取TADS中网络报文的主要报头信息作为样本特征,包括以太网头、IP头、UDP头、TCP头、ICMP头、ARP头以及TRDP头的各关键字段;用−1填充样本中的缺失值;使用独热码(one-hot)将类别型特征转换为数值型;使用最大最小归一化对全部特征值进行标准化处理. 基于预处理后的TADS,通过2.1节中的方式构造TADS-F.

    为多角度验证GMCW-GAN的性能,共开展了下述4类实验.

    2.4.1   样本生成实验

    训练GMCW-GAN模型,按需生成少数类攻击样本从而构造大样本平衡攻击数据集.

    步骤1 从高斯混合模型中生成128维的随机向量{\boldsymbol{z}},从TADS-F中获取真实攻击样本{\boldsymbol{x}},将{{{\boldsymbol{z}}}}{\boldsymbol{x}}分别与样本标签y进行联合嵌入,得到带条件约束的输入向量{\boldsymbol{z}}|y与真实样本{\boldsymbol{x}}|y.

    步骤2 将{\boldsymbol{z}}|y输入生成器,得到一批生成的攻击样本G({\boldsymbol{z}}|y).

    步骤3 固定生成器参数,将{\boldsymbol{x}}|yG({\boldsymbol{z}}|y)输入判别器,训练判别器.

    步骤4 固定判别器参数,将{\boldsymbol{z}}|y输入生成器,训练生成器,得到新的G({\boldsymbol{z}}|y).

    步骤5 循环步骤3与步骤4,对整体模型进行对抗训练,直至收敛,从而完成训练.

    步骤6 按照y从1~8的顺序,将{\boldsymbol{z}}|y输入训练好的生成器,对每类攻击各生成9500个样本,得到大样本数据集(TADS-L),其分布见表3.

    表  3  TADS-L的样本分布
    Table  3.  Sample distribution of TADS-L
    攻击类别样本数量/个比例/%
    IP 扫描1000045.23
    端口扫描10000
    漏洞扫描10000
    篡改10000
    重放10000
    ARP 欺骗10000
    正常报文7264354.77
    下载: 导出CSV 
    | 显示表格

    数据集中的网络报文为高维样本,无法直观地观察,使用t分布随机邻域嵌入(t-SNE)[16],将真实样本与生成样本映射为三维空间中的点以观察其分布,如图6所示.

    图  6  真实样本与生成样本的三维空间表示
    Figure  6.  3D representation of real and generated samples

    图6中红色散点与蓝色散点分别代表真实攻击样本与生成样本的三维表示,可以看到:GMCW-GAN生成样本与真实样本高度相似,这初步证明了GMCW-GAN的生成能力. 当然,该结果是由初步的视觉观察得到的,由于t-SNE实现的是对空间特征的维度映射,并不完全反映数据在高维空间的真实情况,因此,仍需通过下述实验进一步验证生成样本的质量.

    2.4.2   验证生成样本对入侵检测性能影响的实验

    通过比较用TADS、TADS-F与TADS-L分别训练的DNN入侵检测模型在相同测试集上的性能差异,来验证GMCW-GAN生成的攻击样本对入侵检测性能的影响. 从TADS中对各类别均匀分层抽样获取测试集,每类1000个,共计7000个测试数据. 用TADS、TADS-F与TADS-L分别训练DNN入侵检测模型,3个模型在测试集上测试得到的F1分数见图7,虚警率分别为12.7%、11.2%、12.4%.

    图  7  TADS、TADS-F、TADS-L数据集分别训练的DNN入侵检测模型的F1分数
    Figure  7.  F1 score of DNN intrusion detection models trained by TADS, TADS-F, and TADS-L

    对于TADS-DNN在测试集上的测试结果,在其样本分布均衡且数据量充足的情况下,不同类别攻击的F1分数是由其自身特性决定的,不在本文的讨论范围内. 可将这一结果作为基准参考,从而排除攻击本身的检测难度对比较结果的影响.

    TADS-DNN与TADS-F-DNN对比发现:后者各类攻击的F1分数相较于前者有明显下降,这是由攻击样本数量减少而导致的模型拟合能力下降引起的;与之相反的是,TADS-F-DNN对正常样本的检测能力略有提升,分析其原因可知,正常样本数量没有减少,模型可提取信息仍然充足,同时,由于攻击样本数量减少导致了类不平衡,模型会将其自身学习至擅于识别样本量大的类别,因此导致了对正常样本检测能力的小幅上升;TADS-F-DNN的虚警率略低于TADS-DNN,这同样说明训练时攻击样本的减少几乎不会影响正常样本的检测,反而因为引发的类不平衡现象,略微提高了对正常样本的识别能力.

    根据图7可知:TADS-L-DNN对攻击样本的检测能力相较于TADS-F-DNN有明显提升,对8类攻击样本的F1分数均有促进作用,使其平均提升了4.23%,这证明GMCW-GAN生成的攻击样本对入侵检测的检测准度有明显的促进作用;TADS-L-DNN的F1分数与虚警率均非常接近于TADS-DNN,由于TADS-L与TADS的数据分布相同,其唯一区别在于样本真实性不同,这证明了生成的攻击样本与真实样本非常相似;尽管两者的检测结果差距很小,但最好的检测效果仍由TADS-DNN取得,这表明生成样本本质上仍是对真实样本的模拟,只能尽可能地向其逼近.

    综上可知,GMCW-GAN可以生成非常接近真实攻击样本的高质量样本,可用于扩充小样本的攻击数据,从而提高入侵检测的检测能力.

    2.4.3   与其他生成方法的性能比较实验

    为进一步验证GMCW-GAN的生成能力,开展与其他经典方法及前沿方法的对比实验,其中,经典方法包括随机过采样(ROS)、SMOTE与传统GAN;前沿方法包括文献[8]与文献[9]所提出的方法. 利用上述多种方法从TADS-F中生成新的网络攻击样本,分别构造多个大样本数据集,其数据分布与TADS-L相同. 以TADS-L与这多个数据集训练的DNN入侵检测模型的测试结果见图8表4.

    图  8  不同生成方法对入侵检测F1分数的影响对比
    Figure  8.  Comparison of data generation methods affecting F1 score in intrusion detection

    图8可知:机制最为简单的ROS所生成的攻击样本对入侵检测的促进最少;SMOTE优于ROS,这是由于其应用了K近邻方法,使其比随机采样更具备信息提取能力;在IP扫描、端口扫描、漏洞扫描、ARP欺骗、UDP泛洪与TCP泛洪上,传统GAN表现出比ROS与SMOTE更好的生成能力,这证明了传统GAN具备更强的样本生成能力;但其篡改与重放样本的生成效果劣于SMOTE,导致这一结果的可能原因是传统GAN训练中出现了模式崩塌,使得模型对篡改与重放的拟合能力较低;相比之下,GMCW-GAN对篡改与重放样本的生成效果最好,但与其他方法的差距并不突出,导致这一结果的可能原因是篡改与重放样本同正常样本在特征上非常相似,因此,入侵检测模型对这2类生成样本并不敏感,表现为F1分数的变化较小.

    表  4  不同生成方法对入侵检测模型虚警率的影响对比
    Table  4.  Comparison of data generation methods affecting FPR of intrusion detection models %
    方法ROSSMOTEGAN文献[8]文献[9]本文方法
    虚警率12.512.112.212.412.212.4
    下载: 导出CSV 
    | 显示表格

    参与对比的2个前沿方法表现出了比经典方法更好的效果. GMCW-GAN取得了全局最优的表现,其生成的攻击样本所训练的模型在所有攻击类别上均取得了最佳F1分数,相较于其他方法,GMCW-GAN拥有最佳的攻击样本生成能力,将传统GAN的几种改进方法、生成器与判别器的优化设计综合在一起后,取得了明显的优化效果.

    表4可知,不同生成模型生成的样本对入侵检测模型的虚警率影响很小,这一结果再一次验证了2.4.3节中的结论,即生成的攻击样本主要用于促进入侵检测模型对攻击样本的检测能力,在正常样本数量较大的前提下,生成的攻击样本对正常样本的检测几乎没有影响.

    2.4.4   类内实验

    上述实验从整体视角评估并验证了本文方法的有效性,本节则开展类内实验,具体对比所提出的不同改进对生成样本的影响,从而验证各项改进的有效性.

    本文共对传统GAN进行了3项改进,其中第2项改进为约束条件改进,其效果体现在增强实验人员在样本生成实验中的控制力,即能够通过该改进来控制模型按需生成特定类型的攻击样本,因此,该改进对样本的质量无影响,不参与量化的评估. 为评估其他2项改进,即采样策略与损失函数的改进,首先,在GMCW-GAN中去除这2项改进,其次,去除一项、保留另一项,从而共建立3个模型,利用这3个模型,按照2.4.3节的方式开展对比实验,在入侵检测实验中,F1分数结果如图9所示. 由于不同生成模型对虚警率的影响已在上文实验中进行了验证,因此不再进行对比.

    图  9  2项类内改进方法对入侵检测的影响对比
    Figure  9.  Comparison of two in-class improvements affecting intrusion detection

    通过图9可知:采样策略改进与损失函数改进对各项攻击的F1分数均有促进作用,验证了对生成样本的多样性与真实性的提升效果;对于除篡改与重放外的其他攻击样本,损失函数改进对F1分数的促进比采样策略改进更明显,样本真实性的提升能够比多样性的提升在入侵检测中带来更明显的促进作用;对于篡改与重放,2项改进对F1分数的提升较为接近,这2类攻击与正常样本的相似度很高,因此,样本真实性在其检测过程中带来的收益相对受限,表现为多样性与真实性的促进效果接近. 整体而言,包含了2项改进的完整模型对各类攻击样本均具有最佳的F1分数,2项改进能够共同促进入侵检测的检测准度提升,进一步验证了2项改进的有效性.

    针对基于深度学习的ETCN入侵检测领域面临的网络攻击小样本问题,对传统生成对抗网络进行改进,提出了一种攻击样本生成方法GMCW-GAN. 该方法使用高斯混合模型、样本条件约束与沃瑟斯坦距离改进了GAN的采样策略、约束条件及损失函数,基于卷积神经网络构建了生成器与判别器. 在ETCN半实物实验平台中进行了模拟攻击实验以获取攻击样本,利用GMCW-GAN生成了新的攻击样本,通过多角度的实验证明了GMCW-GAN可以生成有效的网络攻击样本,可用其扩充模型训练数据,进而缓解ETCN入侵检测的小样本问题.

  • 图 1  桥梁尺寸示意(单位:cm)

    Figure 1.  Bridge dimensions (unit: cm)

    图 2  桥墩有限元模型(单位:cm)

    Figure 2.  Finite element model of bridge pier (unit: cm)

    图 3  材料模型

    Figure 3.  Material models

    图 4  地震加速度时程

    Figure 4.  Seismic acceleration time history

    图 5  墩顶与主梁纵向相对位移

    Figure 5.  Longitudinal relative displacement of pier top and main beam

    图 6  0~17.0 s损伤破坏过程

    Figure 6.  Damage process of 0~17.0 s

    图 7  主梁应变响应

    Figure 7.  Strain response of main beam

    图 8  主梁和桥墩位移响应

    Figure 8.  Displacement responses of main beam and bridge pier

    图 9  桥墩破坏区域平均损伤因子

    Figure 9.  Average damage factor of bridge pier damage area

    图 10  桥墩部分损伤云图

    Figure 10.  Partial damage cloud maps of bridge pier

    图 11  梁端碰撞力

    Figure 11.  Beam end collision force

    图 12  梁端碰撞应力云图

    Figure 12.  Beam end collision stress cloud map

    图 13  桥墩底应力

    Figure 13.  Bridge pier bottom stress

    表  1  混凝土模型部分参数

    Table  1.   Partial parameters of concrete model

    参数等级密度/
    (kg·m−3
    抗压强度/
    GPa
    骨料
    直径/m
    侵蚀破坏
    参数
    取值C502400500.021.1
    下载: 导出CSV

    表  2  钢筋模型部分参数

    Table  2.   Partial parameters of steel bar model

    参数泊松比密度/
    ( kg·m−3
    屈服应力/
    GPa
    弹性模量/
    GPa
    失效应变
    取值0.378004002000000.12
    下载: 导出CSV

    表  3  桥梁动力特性

    Table  3.   Bridge dynamic characteristics

    阶数频率/Hz振型特点
    11.55主梁第 1 阶纵向振动
    22.82主梁第 1 阶横向振动
    33.02主梁第 2 阶横向振动
    43.53主梁跨中横向振动
    53.61主梁第 1 阶竖向振动
    64.80主梁第 2 阶纵向振动
    75.84主梁第 1 阶反对称横向振动
    87.70主缆第 1 阶对称横向振动
    97.74主梁第 1 阶反对称竖向振动
    108.38主梁第 1 阶对称竖向振动
    下载: 导出CSV
  • [1] 游四方,郑史雄,贾宏宇,等. 地震作用下简支梁桥纵向碰撞模拟[J]. 铁道标准设计,2020,64(12): 59-66.

    YOU Sifang, ZHENG Shixiong, JIA Hongyu, et al. Longitudinal colliding simulation of simply supported beam bridges under ground motions[J]. Railway Standard Design, 2020, 64(12): 59-66.
    [2] 刘磊,赵东升,朱瑜,等. 1993—2017年我国大陆地震灾害损失的时空特征[J]. 自然灾害学报,2021,30(3): 14-23.

    LIU Lei, ZHAO Dongsheng, ZHU Yu, et al. Spatiotemporal characteristics of earthquake hazard losses in mainland China during 1993−2017[J]. Journal of Natural Disasters, 2021, 30(3): 14-23.
    [3] HAO H, TANG E K C. Numerical simulation of a cable-stayed bridge response to blast loads, partⅡ: damage prediction and FRP strengthening[J]. Engineering Structures., 2010, 32(10): 3193-3205. doi: 10.1016/j.engstruct.2010.06.006
    [4] 谢文,孙利民. 采用耗能辅助墩的超大跨斜拉桥顺桥向地震损伤控制[J]. 中南大学学报(自然科学版),2013,44(11): 4672-4681.

    XIE Wei, SUN Limin. Seismic damage control of long span cable-stayed bridges by supporting piers with energy dissipating in longitudinal direction[J]. Journal of Central South University (Science and Technology), 2013, 44(11): 4672-4681.
    [5] 仇清良,仇步云. 强震作用下大跨度连续梁桥的倒塌破坏研究[J]. 工程抗震与加固改造,2014,36(1): 57-60,134.

    QIU Qingliang, QIU Buyun. Study on the collapse and failure of long-span continuous beam bridge under strong earthquake[J]. Earthquake Resistant Engineering and Retrofitting, 2014, 36(1): 57-60,134.
    [6] 黎雅乐,宗周红,黄学漾,等. 强震下钢筋混凝土连续梁桥非线性动力响应分析[J]. 东南大学学报(自然科学版),2016,46(6): 1271-1277.

    LI Yale, ZONG Zhouhong, HUANG Xueyang, et al. Nonlinear dynamic response analysis of reinforced concrete continuous girder bridge under strong earthquake excitations[J]. Journal of Southeast University (Natural Science Edition), 2016, 46(6): 1271-1277.
    [7] 左烨,孙广俊,李鸿晶. 混凝土梁桥地震倒塌失效机制[J]. 南京工业大学学报(自然科学版),2018,40(3): 73-80,104.

    ZUO Ye, SUN Guangjun, LI Hongjing. Failure mechanism of concrete girder bridges collapse during earthquakes[J]. Journal of Nanjing University of Technology (Natural Science Edition), 2018, 40(3): 73-80,104.
    [8] 王学伟. 公铁两用斜拉桥强地震作用下的连续倒塌过程数值模拟[J]. 西南公路,2018,147(3): 143-148.
    [9] 黎雅乐,宗周红,黄学漾,等. 基于倒塌分析的连续梁桥地震损伤评估方法[J]. 振动. 测试与诊断,2019,39(4): 867-874,911.

    LI Yale, ZONG Zhouhong, HUANG Xueyang, et al. Collapse analysis-based seismic damage evaluation of continuous girder bridge[J]. Journal of Vibration, Measurement & Diagnosis, 2019, 39(4): 867-874,911.
    [10] 陈敬一,杜修力,韩强,等. 摇摆双层桥梁地震反应及抗倒塌能力分析[J]. 工程力学,2020,37(10): 56-69.

    CHEN Jingyi, DU Xiuli, HAN Qiang, et al. Analysis of seismic response and overturning resistance of rocking double-deck bridge system[J]. Engineering Mechanics, 2020, 37(10): 56-69.
    [11] 周艳,张雷明,刘西拉. 美国Cypress高架桥地震倒塌的仿真分析[J]. 岩石力学与工程学报,2005,24(17): 3035-3044.

    ZHOU Yan, ZHANG Leiming, LIU Xila. Collapse simulation and analysis of Cypress viaduct during Loma Prieta earthquake[J]. Chinese Journal of Rock Mechanics and Engineering, 2005, 24(17): 3035-3044.
    [12] 徐俊祥,刘西拉. 地裂时桥梁倒塌过程研究[J]. 中国铁道科学,2008,29(1): 17-21.

    XU Junxiang, LIU Xila. Study on bridge collapse resulting from fault rupture[J]. China Railway Science, 2008, 29(1): 17-21.
    [13] JOHNSON N, RANF R T, SAIIDI M S, et al. Seismic testing of a two-span reinforced concrete bridge[J]. Journal of Bridge Engineering, 2008, 13(2): 173-182. doi: 10.1061/(ASCE)1084-0702(2008)13:2(173)
    [14] MURRAY Y D, LEWIS B A. Numerical simulation of damage in concrete[R]. Colorado Springs: APTEK, Inc., 1995.
    [15] SIMO J C, JU J W. Strain-and stress-based continuum damage models—I. formulation[J]. International Journal of Solids and Structures, 1987, 23(7): 821-840. doi: 10.1016/0020-7683(87)90083-7
    [16] MURRAY Y D. Users manual for LS-DYNA concrete material model 159, FHWA-HRT-05-062[R]. Colorado Springs: APTEK, Inc., 2007.
    [17] BRUGGI M. Generating strut-and-tie patterns for reinforced concrete structures using topology optimization[J]. Computers & Structures, 2009, 87(23/24): 1483-1495.
    [18] Livermore Software Technology Corporation. LS-DYNA theory manual[M]. Livermore: Livermore Software Technology Corporation, 2019.
    [19] 张沧海. 大跨度桥梁多向多点激励地震反应分析[D]. 哈尔滨: 中国地震局工程力学研究所, 2011.
    [20] MUTHUKUMAR S, DESROCHES R. A Hertz contact model with non-linear damping for pounding simulation[J]. Earthquake Engineering & Structural Dynamics, 2006, 35(7): 811-828.
  • 期刊类型引用(0)

    其他类型引用(1)

  • 加载中
图(13) / 表(3)
计量
  • 文章访问数:  381
  • HTML全文浏览量:  96
  • PDF下载量:  61
  • 被引次数: 1
出版历程
  • 收稿日期:  2022-01-24
  • 修回日期:  2022-03-27
  • 网络出版日期:  2023-09-13
  • 刊出日期:  2022-04-21

目录

/

返回文章
返回