Density-Reducing Monte Carlo Method for 7 Degrees of Freedom Humanoid Robot Arm Workspace Solution
-
摘要:
针对蒙特卡洛法和改进蒙特卡洛法在求解机械臂工作空间时存在精度不够准确和加密点云浪费的问题,提出一种降密蒙特卡洛法. 首先,基于蒙特卡洛法中随机点分布不均的特性,对机械臂初始工作空间进行均匀加密,使空间的内部与边界区域分明;然后,采用扩展关节角度和循环加密随机点的方式,只对边界区域进行加密,达到降低工作空间随机点云密度的目的;同时,还研究了该方法中初始点云数量、各轴向分割体素数量、精度阈值、扩展关节角度和循环次数等参数对工作空间精度的影响;最后,通过仿真分析对降密蒙特卡洛法的有效性进行验证. 结果表明:相比于蒙特卡洛法,降密蒙特卡洛法在工作空间平均误差率为0.02242%时,总随机点云数量降幅为93.89%;相比于改进蒙特卡洛法,在循环次数为2次和4次时,降密蒙特卡洛法工作空间的平均误差率分别降低0.13853%和0.11329%,总随机点云数量降幅分别为44.83%和64.52%.
Abstract:A density-reducing Monte Carlo method was proposed to address the problems of inaccurate precision and waste of encrypted point cloud in the Monte Carlo method and the improved Monte Carlo method for solving robot arm workspace. Firstly, based on the characteristic of uneven distribution of random points in the Monte Carlo method, the initial workspace of the robot arm was uniformly densified to make the inner and boundary regions of the space clear. Then, only the boundary region was encrypted by adopting the extended joint angle and the cyclic encryption of random points, so as to reduce the density of the random point cloud in the workspace. Meanwhile, the influence of initial point cloud quantity, axial segmentation voxel quantity, precision threshold, extended joint angle, and cycle number on the precision of the workspace was studied. Finally, the effectiveness of the density-reducing Monte Carlo method was verified by simulation analysis. The results show that compared with the Monte Carlo method, the total number of random point clouds of the density-reducing Monte Carlo method decreases by 93.89% when the average error rate of the workspace is 0.022 42%. In addition, compared with the improved Monte Carlo method, the density-reducing Monte Carlo method reduces the average error rate of the workspace by 0.138 53% and 0.113 29% when the number of cycles is 2 and 4, and the total number of random point clouds decreases by 44.83% and 64.52%.
-
随着列车通信网络(TCN)对通信速率及智能化需求的不断增加,基于以太网的列车通信网络(ETCN)因其带宽高、兼容性强及开放性好等优点,正逐步成为现今智能列车的首选网络架构[1]. 但ETCN的应用给列车带来通信便利之时,也引入了诸多网络安全隐患[2]. 作为基础性公共设施,列车的网络安全至关重要,应当采取有效的措施来提高其安全防护能力.
入侵检测在网络安全领域扮演着重要的角色,可以发现网络入侵行为并发出告警[3]. 近年来,深度学习已成为入侵检测方法的主流选择,其优势发挥通常是以充足的数据样本为基础,但在入侵检测领域,小样本问题(模型训练时攻击样本数量过少)仍然阻挠深度学习方法发挥其应有的检测能力. 网络攻击多为偶发事件,攻击报文数量往往有限,对于列车通信网络,攻击者更加追求“悄无声息”地入侵,攻击样本往往数量更小,小样本问题更加凸显,使模型没有充足的信息可以学习. 同时,由于正常报文数量巨大,也会进一步导致类不平衡问题,即训练数据中各类别分布不均衡,导致深度学习模型倾向于学习正常样本的特征,而轻视关键的攻击样本.
数据增广是解决小样本问题的主流方法,即利用特定方法扩充小样本数据的数量[4]. 传统的数据增广方法主要为过采样方法,例如:文献[5]使用合成少数过采样法(SMOTE)来扩充小样本数据,提升了入侵检测的准确率;文献[6]提出一种基于聚类簇结构特性的综合采样法,能够生成样本分布结构特性保持的均衡数据样本. 上述方法在面对入侵检测的小样本问题时取得了较好的效果,并且具有可解释性强、机制简单的优势,但也正因为其机制较为简单,生成样本的质量不够突出,容易导致有效信息的丢失及模型过拟合. 生成对抗网络(GAN)[7]是一种生成模型,因其强大的数据生成能力已被广泛应用于多个领域的数据增广任务中. 对于入侵检测的小样本问题,一种更为新颖的解决思路是使用GAN来生成高质量的网络攻击样本:文献[8]提出了一种基于GAN的攻击样本生成方法,将生成的样本应用在基于CNN的入侵检测模型中,能够有效地提升模型的准度;文献[9]对传统GAN进行了改进,提出了一种基于不平衡生成对抗网络(IGAN)的攻击样本生成方法并应用于点对点模式(ad-hoc)网络的入侵检测任务中,有效提升了入侵检测的检测准度. 上述方法虽取得了优异的表现,但皆有不同的适用场景. 如何将GAN有效地应用于ETCN场景仍是一项具有挑战性的任务,需要结合ETCN中攻击数据的实际特点对方法进行适应性的改进设计.
针对ETCN入侵检测的小样本问题,在传统GAN框架基础上,本文提出一种改进的生成对抗网络(GMCW-GAN),用于生成高质量的ETCN网络攻击样本. 实验结果表明,本文提出的方法能够生成有效的ETCN网络攻击样本,可以在小样本条件下提高基于深度学习的ETCN入侵检测的检测准度,进而增强ETCN的安全防御能力.
1. GMCW-GAN样本生成方法
首先,分析将传统GAN应用于网络攻击样本生成任务时存在的主要缺点,在此基础上,介绍GMCW-GAN的主要改进内容;其次,设计GMCW-GAN中生成器与判别器的内部网络结构.
1.1 对传统GAN的优化改进
GAN是Goodfellow等[7]于2014年提出的一种基于可微生成器的生成式建模方法. GAN由2部分组成:生成器G与判别器D,通过对抗训练的方式使生成器产生的样本服从真实数据分布. 该训练过程是一个0和博弈问题,即生成器与判别器各自的收益等于对方的损失,当训练接近纳什均衡时,模型达到最优. 其目标函数如式(1),GAN的整体优化目标可形式化表示为minGmaxDV(D,G).
V(D,G)=Ex∼pr(x)logD(x;ϕ)+E˜x∼pg(˜x)log(1−D(G(z;θ);ϕ)), (1) 式中:θ与ϕ分别为生成器与判别器的参数;z为输入生成器的随机变量;Ex∼pr(x)为从真实数据x的分布pr(x)中获取的期望,x为S维连续向量;E˜x∼pg(˜x)为从生成数据˜x的分布pg(˜x)中获取的期望,˜x = G(z;θ).
传统GAN存在3项缺点:1) 生成器的输入通常为符合高斯分布或均匀分布的随机变量,然而,在实际应用中,这2类分布的表达能力较为单一,会从模型的初始采样环节对生成样本的初始数据形态产生约束,最终影响生成样本的多样性;2) 生成过程中,生成样本的类别不受控,表现为将GAN应用在多类别的生成任务中时,无法按需指定其生成特定类别的样本;3) 生成器的优化目标等价于最小化pg(˜x)与pr(x)之间的JS (Jensen-Shannon)散度[7],当分布之间没有重叠部分时,将导致生成器梯度消失,从而无法通过训练进一步优化生成器.
对于ETCN入侵检测的攻击样本生成任务,缺点1会导致生成样本的多样性不足,从而限制其在入侵检测模型训练环节中的促进作用;缺点2会导致生成样本的类别难以控制,从而增加样本生成模型的训练难度与成本;缺点3会导致生成样本的真实性不足,不能够充分模拟真实的网络入侵数据.
面向ETCN入侵检测的攻击样本生成需求,本文设计了一种样本生成方法GMCW-GAN,其整体结构见图1. 该方法在传统GAN的基础上从采样策略、约束条件、损失密度3个方面进行改进,以克服上述缺点.
1.1.1 采样策略改进
传统GAN从高斯分布或均匀分布中采样生成随机变量作为其潜在空间的先验分布,这种采样方式在一定程度上约束了生成样本的多样性. 为解决这一问题,GMCW-GAN采用具备多模态特性的高斯混合模型(GMM)[10]来替代传统的一元高斯分布,从而更好地契合真实训练样本的内生多模态特性,增加生成样本的多样性.
GMM由N个高斯分量加权求和组成,每个分量为1个一元高斯分布,可将GMM形式化表述为
p(x|λ)=N∑i=1ωig(x|μi,Ci)=N∑i=1ωi(2π)S/2|Ci|1/2×exp{−(x−μi)TC−1i(x−μi)2}, (2) 式中:g(x|μi,Ci)为单个随机潜变量依从的S元高斯分布的概率密度函数;μi为均值向量,μi∈RS;Ci为协方差矩阵;λ={ωi,μi,Ci}为GMM的参数,ωi为第i个高斯分量的权值,且∑Ni=1ωi=1.
对于ETCN攻击样本生成任务,在没有先验知识时,可认为GMCW-GAN潜空间中的高斯分量具有均等权值,则可令ωi = 1/1NN,因此,潜空间需要计算的参数可约简为λ={μi,Ci}. 由于直接从GMM中采样得到随机变量的过程不可导,无法参与反向梯度传播来更新参数λ,因此,GMCW-GAN通过重参数化技巧解决该问题,即首先从正态分布N(0,1)中采样得到ε,并按式(3)计算得到随机变量z.
z=μi+σiε, (3) 式中:σi为方差,σi∈RS×S.
该过程在保持潜在变量随机性的同时,将随机性与参与训练的参数分离,确保GMM的参数λ可以通过反向传播来动态更新.
1.1.2 约束条件改进
传统GAN的生成过程自由度过高,其生成的样本不可控. 为解决该问题,GMCW-GAN引入样本条件约束技巧,通过给定相应的样本类别标签约束增强生成过程的可控性.
在GMCW-GAN中,令真实目标样本的类别标签y为样本条件约束,通过给生成器和判别器的输入分别增加约束x|y与z|y来实现. 增加了样本条件约束后的优化目标改写为
minGmaxDV(D,G) = Ex∼pr(x)logD(x|y;ϕ)+E˜x∼pg(˜x)log(1−D(G(z|y;θ);ϕ)). (4) 改进后,可以通过改变输入样本的类别标签y来控制模型生成所需的网络攻击样本.
1.1.3 损失函数改进
传统GAN通过JS散度来衡量pg(˜x)与pr(x)之间的距离,当两分布之间不存在重叠时会导致梯度消失等问题. 为克服该缺陷,GMCW-GAN引入沃瑟斯坦距离[11]来替代基于JS散度的损失函数,使得改进后的损失函数拥有更加合理的优化目标.
沃瑟斯坦距离可度量高维空间中的数据推动距离. 面对高维的网络攻击样本,将数据从pr(x)推向pg(˜x)的过程存在多种移动路径,每种路径下,将数据全部推至目的分布的总代价B(γ),如式(5)所示.
B(γ)=∑xr˜xgγ(xr,˜xg)|xr−˜xg|, (5) 式中:γ为一条特定的移动路径,γ(xr,˜xg)为具体的推动数据量,xr、˜xg分别为推动前、后的样本映射,|xr−˜xg|为移动距离.
所有移动路径总代价中的最小值即pr(x)与pg(˜x)的沃瑟斯坦距离W(pr,pg),即
W(pr,pg)=minPB(γ), (6) 式中:P为两分布间所有可能的移动路径.
将式(5)代入式(6),可以等价地将W(pr,pg)表示为
W(pr,pg) = infγ∈Π(pr,pg)E(xr,˜xg)∼γ[||xr−˜xg||], (7) 式中:Π(pr,pg)为pr(x)与pg(˜x)构成的联合分布集合,inf表示取下确界.
求解式(7)的过程等同于求解一个线性规划问题,面对现实中复杂的网络攻击数据分布,直接对其求解是难以实现的,因此,通过求解其对偶问题[12],等价地得到新的函数表达式为
W1(pr,pg)=sup||D||L⩽ (8) 式中:\sup 表示取上确界,L \leqslant 1表示函数应服从1-Lipschitz约束.
GMCW-GAN引入梯度惩罚(gradient penalty)来保证函数服从1-Lipschitz约束,即在判别器的优化目标中加入梯度惩罚项 G_{\rm{P}}(\hat {\boldsymbol{x}}) ,其表达式为
G_{\rm{P}}(\hat {\boldsymbol{x}}) = - \lambda {E_{\hat {\boldsymbol{x}}\sim{P_{{\rm{GP}}}}(\hat {\boldsymbol{x}})}}\max \{0,||{\nabla _{\hat {\boldsymbol{x}}}}D(\hat {\boldsymbol{x}})|| - 1\}, (9) 式中:{P_{{\rm{GP}}}}(\hat {\boldsymbol{x}})为由{p_{\rm{g}}}(\tilde {\boldsymbol{x}})的采样点与{p_{\rm{r}}}({\boldsymbol{x}})的采样点连线组成的分布,\hat {\boldsymbol{x}} 为分布中的变量.
联立式(4)、(8)、(9),即可得到GMCW-GAN最终的目标函数为
\begin{split} & V(D,G) = {\max\limits _D}\{ {E_{{\boldsymbol{x}}\sim{p_{\rm{r}}}({\boldsymbol{x}})}}D({\boldsymbol{x}}|y;\phi ) - \\ &\quad{E_{\tilde {\boldsymbol{x}}\sim{p_{\rm{g}}}(\tilde {\boldsymbol{x}})}}(D(G({\boldsymbol{z}}|y;\theta );\phi ) - \\ &\quad \lambda {E_{\hat {\boldsymbol{x}}\sim{P_{{\rm{GP}}}}(\hat {\boldsymbol{x}})}}\max \{0,||{\nabla _{\hat {\boldsymbol{x}}}}D(\hat {\boldsymbol{x}})|| - 1\} \} . \end{split} (10) 1.2 生成器与判别器的网络结构设计
本节基于具有强表示能力的卷积神经网络来设计生成器与判别器的内部网络结构.
1.2.1 生成器
生成器主要作用是将输入的随机变量转变为攻击样本,GMCW-GAN中生成器的网络结构包括全连接层(FC1)、重塑层(R2)、2层转置卷积层(TC3、TC4)与卷积层(C5),如图2所示.
从高斯混合模型中采样得到的随机分布{\boldsymbol{z}}与样本标签约束y的联合嵌入表示生成器的输入;通过FC1将输入进一步表示为多神经元隐层的输出;通过R2将FC1的输出重塑为三维结构;通过TC3与TC4执行转置卷积;通过C5,以same padding(保持卷积前后张量的高与宽不变)的方式执行卷积,得到与真实攻击样本同形状的生成攻击样本.
为避免引入稀疏梯度,FC1、TC3与TC4中的非线性激活函数采用LeakyRelu[13],同时因为C5的输出为生成的攻击样本,为保证与输入至判别器的真实样本具备同样的特征尺度(0~1),采用Sigmoid函数作为其非线性激活函数.
1.2.2 判别器
判别器主要用于判断其输入样本是否真实,其本质上是一个二分类器,GMCW-GAN中判别器的网络结构包括2层卷积层(C1、C2)、展平层(F3)与2层全连接层(FC4、FC5),如图3所示.
判别器的输入用真实攻击样本或生成器生成的攻击样本与样本标签约束的联合嵌入表示;通过C1与C2提取样本特征;利用F3将C2的输出展平为向量;进一步用FC4与FC5提取特征,同时缩减向量长度,最终得到单个元素的输出. C1、C2与FC4中的非线性激活函数采用LeakyRelu,应用沃瑟斯坦距离作为优化目标,因此,FC5的输出无须进行非线性激活.
2. 实验与讨论
为验证GMCW-GAN的性能,首先,介绍ETCN半实物实验平台,给出攻击数据的获取方式;其次,给出相应评价指标,并介绍实验测试环境与相关超参数配置;最后,通过多角度的实验,验证GMCW-GAN的攻击样本生成能力.
2.1 数据获取
本文对照某型ETCN列车的实车网络拓扑,搭建ETCN半实物实验平台,根据相关资料在平台中模拟配置了车辆正常通信进程,在此基础上将安装了攻击模拟软件的攻击节点接入至交换机,从而开展模拟攻击实验. 实验环境如图4所示.
本文提出的GMCW-GAN生成样本类型主要取决于输入的真实样本类型. 为了验证其生成能力,本节采取的思路为:总结ETCN可能面临的典型攻击,开展模拟攻击实验,从而获取相应的数据,用于验证GMCW-GAN的生成能力.
作者的前期研究中总结了ETCN可能面临的3大类主要攻击有探测类攻击、拒绝服务类攻击、中间人类攻击[14],因此,本文向实验平台注入3大类攻击中的8种典型攻击来构造训练数据集,包括属于探测类攻击的IP扫描、端口扫描与漏洞扫描,属于拒绝服务类攻击的UDP(user datagram protocol)泛洪,TCP(transmission control protocol)泛洪,属于中间人类攻击的ARP(address resolution protocol)欺骗、篡改与重放.
为便于比较GMCW-GAN生成的样本与真实样本的质量,通过2个步骤构建2个ETCN攻击数据集.
步骤1 通过攻击模拟实验构造1个样本充足的基准ETCN攻击数据集,称为TADS (train attack dataset),其数据分布见表1.
表 1 TADS的样本分布Table 1. Sample distribution of TADS攻击类别 样本数量/个 比例/% IP 扫描 10648 44.89 端口扫描 9562 漏洞扫描 11257 篡改 9301 重放 8872 ARP 欺骗 9525 正常报文 72643 55.11 步骤2 维持TADS中正常报文数量不变,在其各类攻击样本中随机抽取500个样本,构造小样本的ETCN攻击数据集,称为TADS-F,其数据分布见表2.
表 2 TADS-F的样本分布Table 2. Sample distribution of TADS-F攻击类别 样本数量/个 比例/% IP 扫描 500 3.97 端口扫描 500 漏洞扫描 500 篡改 500 重放 500 ARP欺骗 500 正常报文 72643 96.03 TADS中,正常报文与攻击报文均有上万个样本,数量充足,同时其数量比约为5.5∶4.5,分布平衡. TADS-F中,正常报文数量充足,但攻击报文数量稀少,其数量比约为9.6∶0.4,分布不平衡.
2.2 评价指标
生成样本的目的是给入侵检测模型的训练提供更多有效信息,因此,本节通过入侵检测性能来评价GMCW-GAN的攻击样本生成能力. 小样本条件下主要关注正类样本(攻击)是否能被正确检测. 查准率P是指所有检测为攻击的样本中真正为攻击的比例,反映了对攻击样本的检测精准度;查全率R是指所有攻击样本中被正确检测为攻击的比例,反映了对攻击样本的检测完整度;F1分数是P与R的调和平均,如式(11)所示,可综合反映对攻击样本的检测能力.
F_1 = \frac{{2 P R}}{{P + R}}\times 100{\text{%}} \,. (11) 虚警率(FPR)是指被错误检测为攻击的正常样本占所有正常样本的比例,虚警率越低,模型对正样本的预测纯度越高,性能越好,如式(12).
F_{{\rm{PR}}} = \frac{{F_{\rm{P}}}}{{F_{\rm{P}} + T_{\rm{N}}}} \times 100{\text{%}} \, , (12) 式中:FP为被误检的正常样本数量,TN为被正确检测的正常样本数量.
2.3 实验设置
攻击样本生成实验与入侵检测实验在以下配置环境中实施:1) 硬件,AMD Ryzen 5 1600X CPU@3.60 GHz,32 GB RAM,NVIDIA GeForce GTX 1060 6 GB GPU;2) 软件,Windows 10 操作系统,Keras 2.5.0,CUDA 10.2.95.
GMCW-GAN采用RMSProp作为优化器,学习率设置为0.001,小批量大小为32个,随机变量设置为128维向量,梯度惩罚项为10,{{\boldsymbol{\mu}} _i}与{{\boldsymbol{\sigma}} _i}赋以随机初值(由于共有8类攻击样本,因此i样本标签为1~8的整数.
深度神经网络(DNN)是一种具有代表性的深度学习方法,在入侵检测领域取得了良好的应用效果[15],其网络结构如图5所示. 该模型的主要原理为:将入侵检测任务转化为深度学习中的分类任务,将模型视为实现函数关系拟合的分类器,通过从隐含层到输出层的逐层拟合,建立输入 (样本的特征表示)与输出 (预测的类别)之间的映射关系,通过该映射关系即可实现对输入样本的类别预测,从而实现入侵检测. 所构建的模型具有3层隐含层,其神经元数分别为512、256、128个,激活函数为ReLU,损失函数为交叉熵损失,优化器采用SGD,学习率为0.002,小批量大小为64,遍历次数epoch为30次,检测的总类别数C=9(包含正常类).
2.4 实验过程与结果
开展实验之前,首先对原始数据进行预处理:提取TADS中网络报文的主要报头信息作为样本特征,包括以太网头、IP头、UDP头、TCP头、ICMP头、ARP头以及TRDP头的各关键字段;用−1填充样本中的缺失值;使用独热码(one-hot)将类别型特征转换为数值型;使用最大最小归一化对全部特征值进行标准化处理. 基于预处理后的TADS,通过2.1节中的方式构造TADS-F.
为多角度验证GMCW-GAN的性能,共开展了下述4类实验.
2.4.1 样本生成实验
训练GMCW-GAN模型,按需生成少数类攻击样本从而构造大样本平衡攻击数据集.
步骤1 从高斯混合模型中生成128维的随机向量{\boldsymbol{z}},从TADS-F中获取真实攻击样本{\boldsymbol{x}},将{{{\boldsymbol{z}}}}与{\boldsymbol{x}}分别与样本标签y进行联合嵌入,得到带条件约束的输入向量{\boldsymbol{z}}|y与真实样本{\boldsymbol{x}}|y.
步骤2 将{\boldsymbol{z}}|y输入生成器,得到一批生成的攻击样本G({\boldsymbol{z}}|y).
步骤3 固定生成器参数,将{\boldsymbol{x}}|y与G({\boldsymbol{z}}|y)输入判别器,训练判别器.
步骤4 固定判别器参数,将{\boldsymbol{z}}|y输入生成器,训练生成器,得到新的G({\boldsymbol{z}}|y).
步骤5 循环步骤3与步骤4,对整体模型进行对抗训练,直至收敛,从而完成训练.
步骤6 按照y从1~8的顺序,将{\boldsymbol{z}}|y输入训练好的生成器,对每类攻击各生成9500个样本,得到大样本数据集(TADS-L),其分布见表3.
表 3 TADS-L的样本分布Table 3. Sample distribution of TADS-L攻击类别 样本数量/个 比例/% IP 扫描 10000 45.23 端口扫描 10000 漏洞扫描 10000 篡改 10000 重放 10000 ARP 欺骗 10000 正常报文 72643 54.77 数据集中的网络报文为高维样本,无法直观地观察,使用t分布随机邻域嵌入(t-SNE)[16],将真实样本与生成样本映射为三维空间中的点以观察其分布,如图6所示.
图6中红色散点与蓝色散点分别代表真实攻击样本与生成样本的三维表示,可以看到:GMCW-GAN生成样本与真实样本高度相似,这初步证明了GMCW-GAN的生成能力. 当然,该结果是由初步的视觉观察得到的,由于t-SNE实现的是对空间特征的维度映射,并不完全反映数据在高维空间的真实情况,因此,仍需通过下述实验进一步验证生成样本的质量.
2.4.2 验证生成样本对入侵检测性能影响的实验
通过比较用TADS、TADS-F与TADS-L分别训练的DNN入侵检测模型在相同测试集上的性能差异,来验证GMCW-GAN生成的攻击样本对入侵检测性能的影响. 从TADS中对各类别均匀分层抽样获取测试集,每类1000个,共计7000个测试数据. 用TADS、TADS-F与TADS-L分别训练DNN入侵检测模型,3个模型在测试集上测试得到的F1分数见图7,虚警率分别为12.7%、11.2%、12.4%.
对于TADS-DNN在测试集上的测试结果,在其样本分布均衡且数据量充足的情况下,不同类别攻击的F1分数是由其自身特性决定的,不在本文的讨论范围内. 可将这一结果作为基准参考,从而排除攻击本身的检测难度对比较结果的影响.
TADS-DNN与TADS-F-DNN对比发现:后者各类攻击的F1分数相较于前者有明显下降,这是由攻击样本数量减少而导致的模型拟合能力下降引起的;与之相反的是,TADS-F-DNN对正常样本的检测能力略有提升,分析其原因可知,正常样本数量没有减少,模型可提取信息仍然充足,同时,由于攻击样本数量减少导致了类不平衡,模型会将其自身学习至擅于识别样本量大的类别,因此导致了对正常样本检测能力的小幅上升;TADS-F-DNN的虚警率略低于TADS-DNN,这同样说明训练时攻击样本的减少几乎不会影响正常样本的检测,反而因为引发的类不平衡现象,略微提高了对正常样本的识别能力.
根据图7可知:TADS-L-DNN对攻击样本的检测能力相较于TADS-F-DNN有明显提升,对8类攻击样本的F1分数均有促进作用,使其平均提升了4.23%,这证明GMCW-GAN生成的攻击样本对入侵检测的检测准度有明显的促进作用;TADS-L-DNN的F1分数与虚警率均非常接近于TADS-DNN,由于TADS-L与TADS的数据分布相同,其唯一区别在于样本真实性不同,这证明了生成的攻击样本与真实样本非常相似;尽管两者的检测结果差距很小,但最好的检测效果仍由TADS-DNN取得,这表明生成样本本质上仍是对真实样本的模拟,只能尽可能地向其逼近.
综上可知,GMCW-GAN可以生成非常接近真实攻击样本的高质量样本,可用于扩充小样本的攻击数据,从而提高入侵检测的检测能力.
2.4.3 与其他生成方法的性能比较实验
为进一步验证GMCW-GAN的生成能力,开展与其他经典方法及前沿方法的对比实验,其中,经典方法包括随机过采样(ROS)、SMOTE与传统GAN;前沿方法包括文献[8]与文献[9]所提出的方法. 利用上述多种方法从TADS-F中生成新的网络攻击样本,分别构造多个大样本数据集,其数据分布与TADS-L相同. 以TADS-L与这多个数据集训练的DNN入侵检测模型的测试结果见图8与表4.
从图8可知:机制最为简单的ROS所生成的攻击样本对入侵检测的促进最少;SMOTE优于ROS,这是由于其应用了K近邻方法,使其比随机采样更具备信息提取能力;在IP扫描、端口扫描、漏洞扫描、ARP欺骗、UDP泛洪与TCP泛洪上,传统GAN表现出比ROS与SMOTE更好的生成能力,这证明了传统GAN具备更强的样本生成能力;但其篡改与重放样本的生成效果劣于SMOTE,导致这一结果的可能原因是传统GAN训练中出现了模式崩塌,使得模型对篡改与重放的拟合能力较低;相比之下,GMCW-GAN对篡改与重放样本的生成效果最好,但与其他方法的差距并不突出,导致这一结果的可能原因是篡改与重放样本同正常样本在特征上非常相似,因此,入侵检测模型对这2类生成样本并不敏感,表现为F1分数的变化较小.
参与对比的2个前沿方法表现出了比经典方法更好的效果. GMCW-GAN取得了全局最优的表现,其生成的攻击样本所训练的模型在所有攻击类别上均取得了最佳F1分数,相较于其他方法,GMCW-GAN拥有最佳的攻击样本生成能力,将传统GAN的几种改进方法、生成器与判别器的优化设计综合在一起后,取得了明显的优化效果.
从表4可知,不同生成模型生成的样本对入侵检测模型的虚警率影响很小,这一结果再一次验证了2.4.3节中的结论,即生成的攻击样本主要用于促进入侵检测模型对攻击样本的检测能力,在正常样本数量较大的前提下,生成的攻击样本对正常样本的检测几乎没有影响.
2.4.4 类内实验
上述实验从整体视角评估并验证了本文方法的有效性,本节则开展类内实验,具体对比所提出的不同改进对生成样本的影响,从而验证各项改进的有效性.
本文共对传统GAN进行了3项改进,其中第2项改进为约束条件改进,其效果体现在增强实验人员在样本生成实验中的控制力,即能够通过该改进来控制模型按需生成特定类型的攻击样本,因此,该改进对样本的质量无影响,不参与量化的评估. 为评估其他2项改进,即采样策略与损失函数的改进,首先,在GMCW-GAN中去除这2项改进,其次,去除一项、保留另一项,从而共建立3个模型,利用这3个模型,按照2.4.3节的方式开展对比实验,在入侵检测实验中,F1分数结果如图9所示. 由于不同生成模型对虚警率的影响已在上文实验中进行了验证,因此不再进行对比.
通过图9可知:采样策略改进与损失函数改进对各项攻击的F1分数均有促进作用,验证了对生成样本的多样性与真实性的提升效果;对于除篡改与重放外的其他攻击样本,损失函数改进对F1分数的促进比采样策略改进更明显,样本真实性的提升能够比多样性的提升在入侵检测中带来更明显的促进作用;对于篡改与重放,2项改进对F1分数的提升较为接近,这2类攻击与正常样本的相似度很高,因此,样本真实性在其检测过程中带来的收益相对受限,表现为多样性与真实性的促进效果接近. 整体而言,包含了2项改进的完整模型对各类攻击样本均具有最佳的F1分数,2项改进能够共同促进入侵检测的检测准度提升,进一步验证了2项改进的有效性.
3. 结 论
针对基于深度学习的ETCN入侵检测领域面临的网络攻击小样本问题,对传统生成对抗网络进行改进,提出了一种攻击样本生成方法GMCW-GAN. 该方法使用高斯混合模型、样本条件约束与沃瑟斯坦距离改进了GAN的采样策略、约束条件及损失函数,基于卷积神经网络构建了生成器与判别器. 在ETCN半实物实验平台中进行了模拟攻击实验以获取攻击样本,利用GMCW-GAN生成了新的攻击样本,通过多角度的实验证明了GMCW-GAN可以生成有效的网络攻击样本,可用其扩充模型训练数据,进而缓解ETCN入侵检测的小样本问题.
-
表 1 仿人机械臂关节限位
Table 1. Joint limit of humanoid robot arm
关节角度 最大值/(°) 最小值/(°) θ1 180 −90 θ2 10 −180 θ3 120 −90 θ4 130 −60 θ5 180 −180 θ6 80 −80 θ7 90 −90 表 2 仿人机械臂D-H参数
Table 2. D-H parameters for humanoid robot arm
i θi /(º) di /m ai /m αi / (º) 1 90 dbs 0 −90 2 0 0 0 90 3 0 dse 0 −90 4 0 0 0 90 5 0 dew 0 −90 6 −90 0 0 90 7 0 0 awt 0 表 3 机械臂实际工作空间范围
Table 3. Actual workspace range of robot arm
m 轴向 最大值 最小值 x 0.63975 −0.63979 y 0.63982 −0.63978 z 0.76096 −0.31102 表 4 初始点云数量对工作空间精度的影响
Table 4. Influence of initial point cloud quantity on workspace precision
Pinit/个 xmin/m xmax/m ymin/m ymax/m zmin/m zmax/m εa/% 5000 −0.63738 0.63639 −0.63458 0.63739 −0.29514 0.76061 1.20751 10000 −0.63909 0.63447 −0.63770 0.63850 −0.30532 0.76083 0.55259 50000 −0.63939 0.63772 −0.63644 0.63939 −0.30078 0.76069 0.71627 100000 −0.63960 0.63689 −0.63531 0.63619 −0.29769 0.76089 1.00622 表 5 体素数量对工作空间精度的影响
Table 5. Influence of voxel quantity on workspace precision
各轴向体素数量/个 xmin/m xmax/m ymin/m ymax/m zmin/m zmax/m εa/% 6 −0.63730 0.63468 −0.63729 0.63618 −0.29272 0.76062 1.34452 10 −0.63939 0.63772 −0.63644 0.63939 −0.30078 0.76069 0.71627 14 −0.63781 0.63859 −0.63663 0.63872 −0.30624 0.76076 0.45310 18 −0.63839 0.63899 −0.63931 0.63895 −0.30600 0.76087 0.36249 表 6 精度阈值对工作空间精度的影响
Table 6. Influence of precision threshold on workspace precision
Nε xmin/m xmax/m ymin/m ymax/m zmin/m zmax/m εa/% 300 −0.63789 0.63678 −0.63716 0.63912 −0.30574 0.76089 0.49774 600 −0.63839 0.63899 −0.63931 0.63895 −0.30600 0.76087 0.36249 900 −0.63864 0.63646 −0.63758 0.63900 −0.30816 0.76086 0.35013 表 7 最大循环次数对工作空间精度的影响
Table 7. Influence of maximum cycle number on workspace precision
Cm/次 xmin/m xmax/m ymin/m ymax/m zmin/m zmax/m εa/% 5 −0.63839 0.63899 −0.63931 0.63895 −0.30600 0.76087 0.36249 8 −0.63940 0.63868 −0.63974 0.63907 −0.30554 0.76078 0.35615 16 −0.63945 0.63785 −0.63838 0.63973 −0.30664 0.76093 0.33245 表 8 降密蒙特卡洛法中工作空间范围及其误差率
Table 8. Workspace range and error rate by density-reducing Monte Carlo method
项目 xmin/m xmax/m ymin/m ymax/m zmin/m zmax/m 极值 −0.63961 0.63937 −0.63900 0.63956 −0.31113 0.76091 误差率 0.00018 0.00038 −0.00078 0.00026 −0.00011 0.00005 表 9 降密蒙特卡洛法与改进蒙特卡洛法对比
Table 9. Comparison between density-reducing Monte Carlo method and improved Monte Carlo method
方法 循环
次数/次总点云数/
(×105 个)εa/% 耗时/h 改进蒙特卡洛法 2 5.8 0.68532 4.591 4 9.3 0.55971 13.841 降密蒙特卡洛法 2 3.2 0.54679 0.997 4 3.3 0.44642 1.051 -
[1] 赵雅婷,赵韩,梁昌勇,等. 养老服务机器人现状及其发展建议[J]. 机械工程学报,2019,55(23): 13-24. doi: 10.3901/JME.2019.23.013ZHAO Yating, ZHAO Han, LIANG Changyong, et al. Current situation and development suggestions of old-age service robot[J]. Journal of Mechanical Engineering, 2019, 55(23): 13-24. doi: 10.3901/JME.2019.23.013 [2] 杨林川,朱庆. 建成环境对老年人出行行为影响的空间异质性[J]. 西南交通大学学报,2023,58(3): 696-703.YANG Linchuan, ZHU Qing. Spatially heterogeneous effects of the built environment on the travel behavior of older adults[J]. Journal of Southwest Jiaotong University, 2023, 58(3): 696-703. [3] 刘欣,仇原鹰,盛英,等. 平面冗余并联机器人的综合性能优化设计[J]. 西南交通大学学报,2008,43(5): 626-632. doi: 10.3969/j.issn.0258-2724.2008.05.014LIU Xin, QIU Yuanying, SHENG Ying, et al. Optimization of comprehensive performance of planar redundant parallel manipulator[J]. Journal of Southwest Jiaotong University, 2008, 43(5): 626-632. doi: 10.3969/j.issn.0258-2724.2008.05.014 [4] YIN G Q, HE F Y, LI Z F, et al. Workspace description and simulation of a backhoe device for hydraulic excavators[J]. Automation in Construction, 2020, 119: 103325.1-103325.8. [5] 东辉,杜志江. 基于工作空间密度函数的平面冗余机器人的逆运动学求解算法[J]. 机械工程学报,2015,51(17): 8-14. doi: 10.3901/JME.2015.17.008DONG Hui, DU Zhijiang. Inverse kinematics of planar redundant manipulators based on workspace density function[J]. Journal of Mechanical Engineering, 2015, 51(17): 8-14. doi: 10.3901/JME.2015.17.008 [6] XU Z T, ZHAO Y H, XIAN L W, et al. Workspace solution and space trajectory planning of 5-DOF manipulator[J]. Journal of Physics: Conference Series, 2022, 2239(1): 012015.1-012015.5. [7] 赵智远,徐振邦,何俊培,等. 基于工作空间分析的9自由度超冗余串联机械臂构型优化[J]. 机械工程学报,2019,55(21): 51-63.ZHAO Zhiyuan, XU Zhenbang, HE Junpei, et al. Configuration optimization of nine degree of freedom super-redundant serial manipulator based on workspace analysis[J]. Journal of Mechanical Engineering, 2019, 55(21): 51-63. [8] CAO Y, LU K, LI X J, et al. Accurate numerical methods for computing 2D and 3D robot workspace[J]. International Journal of Advanced Robotic Systems, 2011, 8(6): 76.1-76.13. [9] 吴虎,李鑫宁,杨先海. 基于网格划分理论连杆机器人工作空间的研究[J]. 济南大学学报(自然科学版),2022,36(4): 476-483.WU Hu, LI Xinning, YANG Xianhai. Research on workspace for multi-linkages robots based on grid partition theory[J]. Journal of University of Jinan (Science and Technology), 2022, 36(4): 476-483. [10] 李钊,樊桂菊,梁昭,等. 基于D-H法的果园作业平台工作空间分析与试验[J]. 农业工程学报,2020,36(16): 25-34. doi: 10.11975/j.issn.1002-6819.2020.16.004LI Zhao, FAN Guiju, LIANG Zhao, et al. Workspace analysis and experiments of orchard platform based on D-H method[J]. Transactions of the Chinese Society of Agricultural Engineering, 2020, 36(16): 25-34. doi: 10.11975/j.issn.1002-6819.2020.16.004 [11] 王春,韩秋实. 六自由度串联机械臂运动学及其工作空间研究[J]. 组合机床与自动化加工技术,2020(6): 32-36. doi: 10.13462/j.cnki.mmtamt.2020.06.008WANG Chun, HAN Qiushi. Kinematics of six-degree-of-freedom series manipulator and its working space[J]. Modular Machine Tool & Automatic Manufacturing Technique, 2020(6): 32-36. doi: 10.13462/j.cnki.mmtamt.2020.06.008 [12] 田海波,马宏伟,魏娟. 串联机器人机械臂工作空间与结构参数研究[J]. 农业机械学报,2013,44(4): 196-201. doi: 10.6041/j.issn.1000-1298.2013.04.034TIAN Haibo, MA Hongwei, WEI Juan. Workspace and structural parameters analysis for manipulator of serial robot[J]. Transactions of the Chinese Society for Agricultural Machinery, 2013, 44(4): 196-201. doi: 10.6041/j.issn.1000-1298.2013.04.034 [13] PEIDRÓ A, REINOSO Ó, GIL A, et al. An improved Monte Carlo method based on Gaussian growth to calculate the workspace of robots[J]. Engineering Applications of Artificial Intelligence, 2017, 64: 197-207. doi: 10.1016/j.engappai.2017.06.009 [14] HE B, ZHU X R, ZHANG D. Boundary encryption-based Monte Carlo learning method for workspace modeling[J]. Journal of Computing and Information Science in Engineering, 2020, 20(3): 034502.1-034502.6. [15] 刘志忠,柳洪义,罗忠,等. 机器人工作空间求解的蒙特卡洛法改进[J]. 农业机械学报,2013,44(1): 230-235. doi: 10.6041/j.issn.1000-1298.2013.01.043LIU Zhizhong, LIU Hongyi, LUO Zhong, et al. Improvement on Monte Carlo method for robot workspace determination[J]. Transactions of the Chinese Society for Agricultural Machinery, 2013, 44(1): 230-235. doi: 10.6041/j.issn.1000-1298.2013.01.043 [16] 徐振邦,赵智远,贺帅,等. 机器人工作空间求解的蒙特卡洛法改进和体积求取[J]. 光学 精密工程,2018,26(11): 2703-2713. doi: 10.3788/OPE.20182611.2703XU Zhenbang, ZHAO Zhiyuan, HE Shuai, et al. Improvement of Monte Carlo method for robot workspace solution and volume calculation[J]. Optics and Precision Engineering, 2018, 26(11): 2703-2713. doi: 10.3788/OPE.20182611.2703 [17] ZHAO Z Y, HE S, ZHAO Y P, et al. Workspace analysis for a 9-DOF hyper-redundant manipulator based on an improved Monte Carlo method and voxel algorithm[C]//2018 IEEE International Conference on Mechatronics and Automation (ICMA). Changchun: IEEE, 2018: 637-642. [18] DOU R T, YU S B, LI W Y, et al. Inverse kinematics for a 7-DOF humanoid robotic arm with joint limit and end pose coupling[J]. Mechanism and Machine Theory, 2022, 169: 104637.1-104637.23. [19] LI W Y, CHEN P, BAI D C, et al. Modularization of 2- and 3-DOF coupled tendon-driven joints[J]. IEEE Transactions on Robotics, 2021, 37(3): 905-917. doi: 10.1109/TRO.2020.3038687 [20] 肖正涛,高健,吴东庆,等. 面向三维点云识别的体素网格降采样[J]. 组合机床与自动化加工技术,2021(11): 43-47. doi: 10.13462/j.cnki.mmtamt.2021.11.011XIAO Zhengtao, GAO Jian, WU Dongqing, et al. Voxel grid downsampling for 3D point cloud recognition[J]. Modular Machine Tool & Automatic Manufacturing Technique, 2021(11): 43-47. doi: 10.13462/j.cnki.mmtamt.2021.11.011 -