Review of Roadway Facility Design for Self-Driving Cars
-
摘要:
随着智能网联车辆相关技术的不断突破和快速发展,高度自动化的无人驾驶汽车日益成熟并将逐渐进入大众生活. 区别于人工驾驶车辆,无人驾驶汽车具备环境感知、自主决策、控制执行等功能,能够完成典型工况或所有工况的自动驾驶. 而对道路设施进行改进和调整,有助于加快无人驾驶时代的到来,为此,需要明确无人驾驶汽车对道路设施设计的需求和影响. 首先,在平纵线形、横断面设计、交通标志标线、停车设施和数字化道路设施等方面分析了道路设施如何适应无人驾驶汽车的行驶特性;其次,梳理了智慧路侧设施以及无人驾驶专用车道的现状和发展趋势;再次,归纳了国内外面向无人驾驶汽车的道路基础设施的研究方法,包括虚拟仿真测试和实车道路测试,以及国内外为开展实车测试所实施的实验道路建设;最后,总结了现有研究的聚焦点和局限性,展望了该领域所面临的挑战和未来发展趋势. 现有道路基础设施的规划设计没有预见无人驾驶汽车的到来,在无人驾驶全面普及之前,人工驾驶和无人驾驶混行会长时间存在,因此,道路设施设计应根据无人驾驶的发展阶段和未来趋势进行相应的变革,本文为适应无人驾驶汽车的道路设施设计提供了理论基础.
Abstract:With the continuous breakthrough and development of intelligent connected vehicle technologies, highly automated self-driving cars have gradually matured and entered public life. Different from manual driving cars, self-driving cars integrate the functions of environmental perception, independent decision-making, as well as control and execution. As a result, it can complete the self-driving for typical or all roadway conditions. The improvement and adjustment in roadway facilities will help to speed up the arrival of the self-driving era. Therefore, it is necessary to clarify the demand and impact of self-driving cars on the design of roadway facilities. Firstly, how the roadway facilities adapt to the driving behavior of self-driving cars was analyzed from five aspects such as horizontal and vertical alignment, cross-section design, traffic signs and markings, parking facilities, and digital roadway facilities. Secondly, the status and development trends of smart roadside facilities and self-driving exclusive lanes were summed up. Then, the research methods of roadway facilities for self-driving cars in China and abroad were summarized, including virtual simulation tests and field driving tests, and the experimental roadways constructed for field driving tests around the world were reviewed. Finally, the focus of and the limitations of existing research were summarized, and the challenges and future development trends of this research field were prospected. The planning and design of existing roadway facilities do not foresee the arrival of self-driving cars; before the widespread popularization of self-driving, manual driving and self-driving cars will coexist for a long time. Therefore, roadway facilities should be designed according to the development stage and future trends of self-driving. This work provides a theoretical basis for roadway facility design adapted to self-driving cars.
-
Key words:
- self-driving cars /
- self-driving /
- roadway facility /
- roadway design /
- self-driving exclusive lanes
-
随着列车通信网络(TCN)对通信速率及智能化需求的不断增加,基于以太网的列车通信网络(ETCN)因其带宽高、兼容性强及开放性好等优点,正逐步成为现今智能列车的首选网络架构[1]. 但ETCN的应用给列车带来通信便利之时,也引入了诸多网络安全隐患[2]. 作为基础性公共设施,列车的网络安全至关重要,应当采取有效的措施来提高其安全防护能力.
入侵检测在网络安全领域扮演着重要的角色,可以发现网络入侵行为并发出告警[3]. 近年来,深度学习已成为入侵检测方法的主流选择,其优势发挥通常是以充足的数据样本为基础,但在入侵检测领域,小样本问题(模型训练时攻击样本数量过少)仍然阻挠深度学习方法发挥其应有的检测能力. 网络攻击多为偶发事件,攻击报文数量往往有限,对于列车通信网络,攻击者更加追求“悄无声息”地入侵,攻击样本往往数量更小,小样本问题更加凸显,使模型没有充足的信息可以学习. 同时,由于正常报文数量巨大,也会进一步导致类不平衡问题,即训练数据中各类别分布不均衡,导致深度学习模型倾向于学习正常样本的特征,而轻视关键的攻击样本.
数据增广是解决小样本问题的主流方法,即利用特定方法扩充小样本数据的数量[4]. 传统的数据增广方法主要为过采样方法,例如:文献[5]使用合成少数过采样法(SMOTE)来扩充小样本数据,提升了入侵检测的准确率;文献[6]提出一种基于聚类簇结构特性的综合采样法,能够生成样本分布结构特性保持的均衡数据样本. 上述方法在面对入侵检测的小样本问题时取得了较好的效果,并且具有可解释性强、机制简单的优势,但也正因为其机制较为简单,生成样本的质量不够突出,容易导致有效信息的丢失及模型过拟合. 生成对抗网络(GAN)[7]是一种生成模型,因其强大的数据生成能力已被广泛应用于多个领域的数据增广任务中. 对于入侵检测的小样本问题,一种更为新颖的解决思路是使用GAN来生成高质量的网络攻击样本:文献[8]提出了一种基于GAN的攻击样本生成方法,将生成的样本应用在基于CNN的入侵检测模型中,能够有效地提升模型的准度;文献[9]对传统GAN进行了改进,提出了一种基于不平衡生成对抗网络(IGAN)的攻击样本生成方法并应用于点对点模式(ad-hoc)网络的入侵检测任务中,有效提升了入侵检测的检测准度. 上述方法虽取得了优异的表现,但皆有不同的适用场景. 如何将GAN有效地应用于ETCN场景仍是一项具有挑战性的任务,需要结合ETCN中攻击数据的实际特点对方法进行适应性的改进设计.
针对ETCN入侵检测的小样本问题,在传统GAN框架基础上,本文提出一种改进的生成对抗网络(GMCW-GAN),用于生成高质量的ETCN网络攻击样本. 实验结果表明,本文提出的方法能够生成有效的ETCN网络攻击样本,可以在小样本条件下提高基于深度学习的ETCN入侵检测的检测准度,进而增强ETCN的安全防御能力.
1. GMCW-GAN样本生成方法
首先,分析将传统GAN应用于网络攻击样本生成任务时存在的主要缺点,在此基础上,介绍GMCW-GAN的主要改进内容;其次,设计GMCW-GAN中生成器与判别器的内部网络结构.
1.1 对传统GAN的优化改进
GAN是Goodfellow等[7]于2014年提出的一种基于可微生成器的生成式建模方法. GAN由2部分组成:生成器G与判别器D,通过对抗训练的方式使生成器产生的样本服从真实数据分布. 该训练过程是一个0和博弈问题,即生成器与判别器各自的收益等于对方的损失,当训练接近纳什均衡时,模型达到最优. 其目标函数如式(1),GAN的整体优化目标可形式化表示为minGmaxDV(D,G).
V(D,G)=Ex∼pr(x)logD(x;ϕ)+E˜x∼pg(˜x)log(1−D(G(z;θ);ϕ)), (1) 式中:θ与ϕ分别为生成器与判别器的参数;z为输入生成器的随机变量;Ex∼pr(x)为从真实数据x的分布pr(x)中获取的期望,x为S维连续向量;E˜x∼pg(˜x)为从生成数据˜x的分布pg(˜x)中获取的期望,˜x = G(z;θ).
传统GAN存在3项缺点:1) 生成器的输入通常为符合高斯分布或均匀分布的随机变量,然而,在实际应用中,这2类分布的表达能力较为单一,会从模型的初始采样环节对生成样本的初始数据形态产生约束,最终影响生成样本的多样性;2) 生成过程中,生成样本的类别不受控,表现为将GAN应用在多类别的生成任务中时,无法按需指定其生成特定类别的样本;3) 生成器的优化目标等价于最小化pg(˜x)与pr(x)之间的JS (Jensen-Shannon)散度[7],当分布之间没有重叠部分时,将导致生成器梯度消失,从而无法通过训练进一步优化生成器.
对于ETCN入侵检测的攻击样本生成任务,缺点1会导致生成样本的多样性不足,从而限制其在入侵检测模型训练环节中的促进作用;缺点2会导致生成样本的类别难以控制,从而增加样本生成模型的训练难度与成本;缺点3会导致生成样本的真实性不足,不能够充分模拟真实的网络入侵数据.
面向ETCN入侵检测的攻击样本生成需求,本文设计了一种样本生成方法GMCW-GAN,其整体结构见图1. 该方法在传统GAN的基础上从采样策略、约束条件、损失密度3个方面进行改进,以克服上述缺点.
1.1.1 采样策略改进
传统GAN从高斯分布或均匀分布中采样生成随机变量作为其潜在空间的先验分布,这种采样方式在一定程度上约束了生成样本的多样性. 为解决这一问题,GMCW-GAN采用具备多模态特性的高斯混合模型(GMM)[10]来替代传统的一元高斯分布,从而更好地契合真实训练样本的内生多模态特性,增加生成样本的多样性.
GMM由N个高斯分量加权求和组成,每个分量为1个一元高斯分布,可将GMM形式化表述为
p(x|λ)=N∑i=1ωig(x|μi,Ci)=N∑i=1ωi(2π)S/2|Ci|1/2×exp{−(x−μi)TC−1i(x−μi)2}, (2) 式中:g(x|μi,Ci)为单个随机潜变量依从的S元高斯分布的概率密度函数;μi为均值向量,μi∈RS;Ci为协方差矩阵;λ={ωi,μi,Ci}为GMM的参数,ωi为第i个高斯分量的权值,且∑Ni=1ωi=1.
对于ETCN攻击样本生成任务,在没有先验知识时,可认为GMCW-GAN潜空间中的高斯分量具有均等权值,则可令ωi = 1/1NN,因此,潜空间需要计算的参数可约简为λ={μi,Ci}. 由于直接从GMM中采样得到随机变量的过程不可导,无法参与反向梯度传播来更新参数λ,因此,GMCW-GAN通过重参数化技巧解决该问题,即首先从正态分布N(0,1)中采样得到ε,并按式(3)计算得到随机变量z.
z=μi+σiε, (3) 式中:σi为方差,σi∈RS×S.
该过程在保持潜在变量随机性的同时,将随机性与参与训练的参数分离,确保GMM的参数λ可以通过反向传播来动态更新.
1.1.2 约束条件改进
传统GAN的生成过程自由度过高,其生成的样本不可控. 为解决该问题,GMCW-GAN引入样本条件约束技巧,通过给定相应的样本类别标签约束增强生成过程的可控性.
在GMCW-GAN中,令真实目标样本的类别标签y为样本条件约束,通过给生成器和判别器的输入分别增加约束x|y与z|y来实现. 增加了样本条件约束后的优化目标改写为
minGmaxDV(D,G) = Ex∼pr(x)logD(x|y;ϕ)+E˜x∼pg(˜x)log(1−D(G(z|y;θ);ϕ)). (4) 改进后,可以通过改变输入样本的类别标签y来控制模型生成所需的网络攻击样本.
1.1.3 损失函数改进
传统GAN通过JS散度来衡量pg(˜x)与pr(x)之间的距离,当两分布之间不存在重叠时会导致梯度消失等问题. 为克服该缺陷,GMCW-GAN引入沃瑟斯坦距离[11]来替代基于JS散度的损失函数,使得改进后的损失函数拥有更加合理的优化目标.
沃瑟斯坦距离可度量高维空间中的数据推动距离. 面对高维的网络攻击样本,将数据从pr(x)推向pg(˜x)的过程存在多种移动路径,每种路径下,将数据全部推至目的分布的总代价B(γ),如式(5)所示.
B(γ)=∑xr˜xgγ(xr,˜xg)|xr−˜xg|, (5) 式中:γ为一条特定的移动路径,γ(xr,˜xg)为具体的推动数据量,xr、˜xg分别为推动前、后的样本映射,|xr−˜xg|为移动距离.
所有移动路径总代价中的最小值即pr(x)与pg(˜x)的沃瑟斯坦距离W(pr,pg),即
W(pr,pg)=minPB(γ), (6) 式中:P为两分布间所有可能的移动路径.
将式(5)代入式(6),可以等价地将W(pr,pg)表示为
W(pr,pg) = infγ∈Π(pr,pg)E(xr,˜xg)∼γ[||xr−˜xg||], (7) 式中:Π(pr,pg)为pr(x)与pg(˜x)构成的联合分布集合,inf表示取下确界.
求解式(7)的过程等同于求解一个线性规划问题,面对现实中复杂的网络攻击数据分布,直接对其求解是难以实现的,因此,通过求解其对偶问题[12],等价地得到新的函数表达式为
W1(pr,pg)=sup||D||L⩽ (8) 式中:\sup 表示取上确界,L \leqslant 1表示函数应服从1-Lipschitz约束.
GMCW-GAN引入梯度惩罚(gradient penalty)来保证函数服从1-Lipschitz约束,即在判别器的优化目标中加入梯度惩罚项 G_{\rm{P}}(\hat {\boldsymbol{x}}) ,其表达式为
G_{\rm{P}}(\hat {\boldsymbol{x}}) = - \lambda {E_{\hat {\boldsymbol{x}}\sim{P_{{\rm{GP}}}}(\hat {\boldsymbol{x}})}}\max \{0,||{\nabla _{\hat {\boldsymbol{x}}}}D(\hat {\boldsymbol{x}})|| - 1\}, (9) 式中:{P_{{\rm{GP}}}}(\hat {\boldsymbol{x}})为由{p_{\rm{g}}}(\tilde {\boldsymbol{x}})的采样点与{p_{\rm{r}}}({\boldsymbol{x}})的采样点连线组成的分布,\hat {\boldsymbol{x}} 为分布中的变量.
联立式(4)、(8)、(9),即可得到GMCW-GAN最终的目标函数为
\begin{split} & V(D,G) = {\max\limits _D}\{ {E_{{\boldsymbol{x}}\sim{p_{\rm{r}}}({\boldsymbol{x}})}}D({\boldsymbol{x}}|y;\phi ) - \\ &\quad{E_{\tilde {\boldsymbol{x}}\sim{p_{\rm{g}}}(\tilde {\boldsymbol{x}})}}(D(G({\boldsymbol{z}}|y;\theta );\phi ) - \\ &\quad \lambda {E_{\hat {\boldsymbol{x}}\sim{P_{{\rm{GP}}}}(\hat {\boldsymbol{x}})}}\max \{0,||{\nabla _{\hat {\boldsymbol{x}}}}D(\hat {\boldsymbol{x}})|| - 1\} \} . \end{split} (10) 1.2 生成器与判别器的网络结构设计
本节基于具有强表示能力的卷积神经网络来设计生成器与判别器的内部网络结构.
1.2.1 生成器
生成器主要作用是将输入的随机变量转变为攻击样本,GMCW-GAN中生成器的网络结构包括全连接层(FC1)、重塑层(R2)、2层转置卷积层(TC3、TC4)与卷积层(C5),如图2所示.
从高斯混合模型中采样得到的随机分布{\boldsymbol{z}}与样本标签约束y的联合嵌入表示生成器的输入;通过FC1将输入进一步表示为多神经元隐层的输出;通过R2将FC1的输出重塑为三维结构;通过TC3与TC4执行转置卷积;通过C5,以same padding(保持卷积前后张量的高与宽不变)的方式执行卷积,得到与真实攻击样本同形状的生成攻击样本.
为避免引入稀疏梯度,FC1、TC3与TC4中的非线性激活函数采用LeakyRelu[13],同时因为C5的输出为生成的攻击样本,为保证与输入至判别器的真实样本具备同样的特征尺度(0~1),采用Sigmoid函数作为其非线性激活函数.
1.2.2 判别器
判别器主要用于判断其输入样本是否真实,其本质上是一个二分类器,GMCW-GAN中判别器的网络结构包括2层卷积层(C1、C2)、展平层(F3)与2层全连接层(FC4、FC5),如图3所示.
判别器的输入用真实攻击样本或生成器生成的攻击样本与样本标签约束的联合嵌入表示;通过C1与C2提取样本特征;利用F3将C2的输出展平为向量;进一步用FC4与FC5提取特征,同时缩减向量长度,最终得到单个元素的输出. C1、C2与FC4中的非线性激活函数采用LeakyRelu,应用沃瑟斯坦距离作为优化目标,因此,FC5的输出无须进行非线性激活.
2. 实验与讨论
为验证GMCW-GAN的性能,首先,介绍ETCN半实物实验平台,给出攻击数据的获取方式;其次,给出相应评价指标,并介绍实验测试环境与相关超参数配置;最后,通过多角度的实验,验证GMCW-GAN的攻击样本生成能力.
2.1 数据获取
本文对照某型ETCN列车的实车网络拓扑,搭建ETCN半实物实验平台,根据相关资料在平台中模拟配置了车辆正常通信进程,在此基础上将安装了攻击模拟软件的攻击节点接入至交换机,从而开展模拟攻击实验. 实验环境如图4所示.
本文提出的GMCW-GAN生成样本类型主要取决于输入的真实样本类型. 为了验证其生成能力,本节采取的思路为:总结ETCN可能面临的典型攻击,开展模拟攻击实验,从而获取相应的数据,用于验证GMCW-GAN的生成能力.
作者的前期研究中总结了ETCN可能面临的3大类主要攻击有探测类攻击、拒绝服务类攻击、中间人类攻击[14],因此,本文向实验平台注入3大类攻击中的8种典型攻击来构造训练数据集,包括属于探测类攻击的IP扫描、端口扫描与漏洞扫描,属于拒绝服务类攻击的UDP(user datagram protocol)泛洪,TCP(transmission control protocol)泛洪,属于中间人类攻击的ARP(address resolution protocol)欺骗、篡改与重放.
为便于比较GMCW-GAN生成的样本与真实样本的质量,通过2个步骤构建2个ETCN攻击数据集.
步骤1 通过攻击模拟实验构造1个样本充足的基准ETCN攻击数据集,称为TADS (train attack dataset),其数据分布见表1.
表 1 TADS的样本分布Table 1. Sample distribution of TADS攻击类别 样本数量/个 比例/% IP 扫描 10648 44.89 端口扫描 9562 漏洞扫描 11257 篡改 9301 重放 8872 ARP 欺骗 9525 正常报文 72643 55.11 步骤2 维持TADS中正常报文数量不变,在其各类攻击样本中随机抽取500个样本,构造小样本的ETCN攻击数据集,称为TADS-F,其数据分布见表2.
表 2 TADS-F的样本分布Table 2. Sample distribution of TADS-F攻击类别 样本数量/个 比例/% IP 扫描 500 3.97 端口扫描 500 漏洞扫描 500 篡改 500 重放 500 ARP欺骗 500 正常报文 72643 96.03 TADS中,正常报文与攻击报文均有上万个样本,数量充足,同时其数量比约为5.5∶4.5,分布平衡. TADS-F中,正常报文数量充足,但攻击报文数量稀少,其数量比约为9.6∶0.4,分布不平衡.
2.2 评价指标
生成样本的目的是给入侵检测模型的训练提供更多有效信息,因此,本节通过入侵检测性能来评价GMCW-GAN的攻击样本生成能力. 小样本条件下主要关注正类样本(攻击)是否能被正确检测. 查准率P是指所有检测为攻击的样本中真正为攻击的比例,反映了对攻击样本的检测精准度;查全率R是指所有攻击样本中被正确检测为攻击的比例,反映了对攻击样本的检测完整度;F1分数是P与R的调和平均,如式(11)所示,可综合反映对攻击样本的检测能力.
F_1 = \frac{{2 P R}}{{P + R}}\times 100{\text{%}} \,. (11) 虚警率(FPR)是指被错误检测为攻击的正常样本占所有正常样本的比例,虚警率越低,模型对正样本的预测纯度越高,性能越好,如式(12).
F_{{\rm{PR}}} = \frac{{F_{\rm{P}}}}{{F_{\rm{P}} + T_{\rm{N}}}} \times 100{\text{%}} \, , (12) 式中:FP为被误检的正常样本数量,TN为被正确检测的正常样本数量.
2.3 实验设置
攻击样本生成实验与入侵检测实验在以下配置环境中实施:1) 硬件,AMD Ryzen 5 1600X CPU@3.60 GHz,32 GB RAM,NVIDIA GeForce GTX 1060 6 GB GPU;2) 软件,Windows 10 操作系统,Keras 2.5.0,CUDA 10.2.95.
GMCW-GAN采用RMSProp作为优化器,学习率设置为0.001,小批量大小为32个,随机变量设置为128维向量,梯度惩罚项为10,{{\boldsymbol{\mu}} _i}与{{\boldsymbol{\sigma}} _i}赋以随机初值(由于共有8类攻击样本,因此i样本标签为1~8的整数.
深度神经网络(DNN)是一种具有代表性的深度学习方法,在入侵检测领域取得了良好的应用效果[15],其网络结构如图5所示. 该模型的主要原理为:将入侵检测任务转化为深度学习中的分类任务,将模型视为实现函数关系拟合的分类器,通过从隐含层到输出层的逐层拟合,建立输入 (样本的特征表示)与输出 (预测的类别)之间的映射关系,通过该映射关系即可实现对输入样本的类别预测,从而实现入侵检测. 所构建的模型具有3层隐含层,其神经元数分别为512、256、128个,激活函数为ReLU,损失函数为交叉熵损失,优化器采用SGD,学习率为0.002,小批量大小为64,遍历次数epoch为30次,检测的总类别数C=9(包含正常类).
2.4 实验过程与结果
开展实验之前,首先对原始数据进行预处理:提取TADS中网络报文的主要报头信息作为样本特征,包括以太网头、IP头、UDP头、TCP头、ICMP头、ARP头以及TRDP头的各关键字段;用−1填充样本中的缺失值;使用独热码(one-hot)将类别型特征转换为数值型;使用最大最小归一化对全部特征值进行标准化处理. 基于预处理后的TADS,通过2.1节中的方式构造TADS-F.
为多角度验证GMCW-GAN的性能,共开展了下述4类实验.
2.4.1 样本生成实验
训练GMCW-GAN模型,按需生成少数类攻击样本从而构造大样本平衡攻击数据集.
步骤1 从高斯混合模型中生成128维的随机向量{\boldsymbol{z}},从TADS-F中获取真实攻击样本{\boldsymbol{x}},将{{{\boldsymbol{z}}}}与{\boldsymbol{x}}分别与样本标签y进行联合嵌入,得到带条件约束的输入向量{\boldsymbol{z}}|y与真实样本{\boldsymbol{x}}|y.
步骤2 将{\boldsymbol{z}}|y输入生成器,得到一批生成的攻击样本G({\boldsymbol{z}}|y).
步骤3 固定生成器参数,将{\boldsymbol{x}}|y与G({\boldsymbol{z}}|y)输入判别器,训练判别器.
步骤4 固定判别器参数,将{\boldsymbol{z}}|y输入生成器,训练生成器,得到新的G({\boldsymbol{z}}|y).
步骤5 循环步骤3与步骤4,对整体模型进行对抗训练,直至收敛,从而完成训练.
步骤6 按照y从1~8的顺序,将{\boldsymbol{z}}|y输入训练好的生成器,对每类攻击各生成9500个样本,得到大样本数据集(TADS-L),其分布见表3.
表 3 TADS-L的样本分布Table 3. Sample distribution of TADS-L攻击类别 样本数量/个 比例/% IP 扫描 10000 45.23 端口扫描 10000 漏洞扫描 10000 篡改 10000 重放 10000 ARP 欺骗 10000 正常报文 72643 54.77 数据集中的网络报文为高维样本,无法直观地观察,使用t分布随机邻域嵌入(t-SNE)[16],将真实样本与生成样本映射为三维空间中的点以观察其分布,如图6所示.
图6中红色散点与蓝色散点分别代表真实攻击样本与生成样本的三维表示,可以看到:GMCW-GAN生成样本与真实样本高度相似,这初步证明了GMCW-GAN的生成能力. 当然,该结果是由初步的视觉观察得到的,由于t-SNE实现的是对空间特征的维度映射,并不完全反映数据在高维空间的真实情况,因此,仍需通过下述实验进一步验证生成样本的质量.
2.4.2 验证生成样本对入侵检测性能影响的实验
通过比较用TADS、TADS-F与TADS-L分别训练的DNN入侵检测模型在相同测试集上的性能差异,来验证GMCW-GAN生成的攻击样本对入侵检测性能的影响. 从TADS中对各类别均匀分层抽样获取测试集,每类1000个,共计7000个测试数据. 用TADS、TADS-F与TADS-L分别训练DNN入侵检测模型,3个模型在测试集上测试得到的F1分数见图7,虚警率分别为12.7%、11.2%、12.4%.
对于TADS-DNN在测试集上的测试结果,在其样本分布均衡且数据量充足的情况下,不同类别攻击的F1分数是由其自身特性决定的,不在本文的讨论范围内. 可将这一结果作为基准参考,从而排除攻击本身的检测难度对比较结果的影响.
TADS-DNN与TADS-F-DNN对比发现:后者各类攻击的F1分数相较于前者有明显下降,这是由攻击样本数量减少而导致的模型拟合能力下降引起的;与之相反的是,TADS-F-DNN对正常样本的检测能力略有提升,分析其原因可知,正常样本数量没有减少,模型可提取信息仍然充足,同时,由于攻击样本数量减少导致了类不平衡,模型会将其自身学习至擅于识别样本量大的类别,因此导致了对正常样本检测能力的小幅上升;TADS-F-DNN的虚警率略低于TADS-DNN,这同样说明训练时攻击样本的减少几乎不会影响正常样本的检测,反而因为引发的类不平衡现象,略微提高了对正常样本的识别能力.
根据图7可知:TADS-L-DNN对攻击样本的检测能力相较于TADS-F-DNN有明显提升,对8类攻击样本的F1分数均有促进作用,使其平均提升了4.23%,这证明GMCW-GAN生成的攻击样本对入侵检测的检测准度有明显的促进作用;TADS-L-DNN的F1分数与虚警率均非常接近于TADS-DNN,由于TADS-L与TADS的数据分布相同,其唯一区别在于样本真实性不同,这证明了生成的攻击样本与真实样本非常相似;尽管两者的检测结果差距很小,但最好的检测效果仍由TADS-DNN取得,这表明生成样本本质上仍是对真实样本的模拟,只能尽可能地向其逼近.
综上可知,GMCW-GAN可以生成非常接近真实攻击样本的高质量样本,可用于扩充小样本的攻击数据,从而提高入侵检测的检测能力.
2.4.3 与其他生成方法的性能比较实验
为进一步验证GMCW-GAN的生成能力,开展与其他经典方法及前沿方法的对比实验,其中,经典方法包括随机过采样(ROS)、SMOTE与传统GAN;前沿方法包括文献[8]与文献[9]所提出的方法. 利用上述多种方法从TADS-F中生成新的网络攻击样本,分别构造多个大样本数据集,其数据分布与TADS-L相同. 以TADS-L与这多个数据集训练的DNN入侵检测模型的测试结果见图8与表4.
从图8可知:机制最为简单的ROS所生成的攻击样本对入侵检测的促进最少;SMOTE优于ROS,这是由于其应用了K近邻方法,使其比随机采样更具备信息提取能力;在IP扫描、端口扫描、漏洞扫描、ARP欺骗、UDP泛洪与TCP泛洪上,传统GAN表现出比ROS与SMOTE更好的生成能力,这证明了传统GAN具备更强的样本生成能力;但其篡改与重放样本的生成效果劣于SMOTE,导致这一结果的可能原因是传统GAN训练中出现了模式崩塌,使得模型对篡改与重放的拟合能力较低;相比之下,GMCW-GAN对篡改与重放样本的生成效果最好,但与其他方法的差距并不突出,导致这一结果的可能原因是篡改与重放样本同正常样本在特征上非常相似,因此,入侵检测模型对这2类生成样本并不敏感,表现为F1分数的变化较小.
参与对比的2个前沿方法表现出了比经典方法更好的效果. GMCW-GAN取得了全局最优的表现,其生成的攻击样本所训练的模型在所有攻击类别上均取得了最佳F1分数,相较于其他方法,GMCW-GAN拥有最佳的攻击样本生成能力,将传统GAN的几种改进方法、生成器与判别器的优化设计综合在一起后,取得了明显的优化效果.
从表4可知,不同生成模型生成的样本对入侵检测模型的虚警率影响很小,这一结果再一次验证了2.4.3节中的结论,即生成的攻击样本主要用于促进入侵检测模型对攻击样本的检测能力,在正常样本数量较大的前提下,生成的攻击样本对正常样本的检测几乎没有影响.
2.4.4 类内实验
上述实验从整体视角评估并验证了本文方法的有效性,本节则开展类内实验,具体对比所提出的不同改进对生成样本的影响,从而验证各项改进的有效性.
本文共对传统GAN进行了3项改进,其中第2项改进为约束条件改进,其效果体现在增强实验人员在样本生成实验中的控制力,即能够通过该改进来控制模型按需生成特定类型的攻击样本,因此,该改进对样本的质量无影响,不参与量化的评估. 为评估其他2项改进,即采样策略与损失函数的改进,首先,在GMCW-GAN中去除这2项改进,其次,去除一项、保留另一项,从而共建立3个模型,利用这3个模型,按照2.4.3节的方式开展对比实验,在入侵检测实验中,F1分数结果如图9所示. 由于不同生成模型对虚警率的影响已在上文实验中进行了验证,因此不再进行对比.
通过图9可知:采样策略改进与损失函数改进对各项攻击的F1分数均有促进作用,验证了对生成样本的多样性与真实性的提升效果;对于除篡改与重放外的其他攻击样本,损失函数改进对F1分数的促进比采样策略改进更明显,样本真实性的提升能够比多样性的提升在入侵检测中带来更明显的促进作用;对于篡改与重放,2项改进对F1分数的提升较为接近,这2类攻击与正常样本的相似度很高,因此,样本真实性在其检测过程中带来的收益相对受限,表现为多样性与真实性的促进效果接近. 整体而言,包含了2项改进的完整模型对各类攻击样本均具有最佳的F1分数,2项改进能够共同促进入侵检测的检测准度提升,进一步验证了2项改进的有效性.
3. 结 论
针对基于深度学习的ETCN入侵检测领域面临的网络攻击小样本问题,对传统生成对抗网络进行改进,提出了一种攻击样本生成方法GMCW-GAN. 该方法使用高斯混合模型、样本条件约束与沃瑟斯坦距离改进了GAN的采样策略、约束条件及损失函数,基于卷积神经网络构建了生成器与判别器. 在ETCN半实物实验平台中进行了模拟攻击实验以获取攻击样本,利用GMCW-GAN生成了新的攻击样本,通过多角度的实验证明了GMCW-GAN可以生成有效的网络攻击样本,可用其扩充模型训练数据,进而缓解ETCN入侵检测的小样本问题.
-
表 1 无人驾驶超高速公路等级划分
Table 1. Classification of self-driving superhighways
公路等级 超三级高速 超二级高速 超一级高速 设计速度/
(km•h−1)180、160、
140160、140、
120140、120、
100表 2 专用车道的隔离方式
Table 2. Isolation methods of exclusive lane
隔离方式 实现隔离的设施 适用条件 优点 缺点 标线隔离 路面施画漆条 任意条件下驶入驶出专用道 灵活性高,车辆可
在任何位置驶出驶入
专用车道驶出专用车道容易与人工驾驶车辆发生冲突;人工驾驶车辆可任意进出专用车道 缓冲带 导流线 + 道钉 连续弯道或事故多发路段 有缓冲区域,提供
安全空间占地较大,车辆还是可以随意驶入驶出自动驾驶专用车道 硬质隔离 混凝土防撞栏、波梁护栏、矩形护栏、组合式防撞栏 连续弯道、长下坡、事故多发路段 隔离程度高,防撞
性能强,安全性较高不易拆装,缺乏一定便捷性,发生交通事故或其他紧急事故时,特殊车辆进出困难 软质隔离 橡胶棒、塑料隔离墩、弹性交通柱 高架道路分流端、道路沿线较小交叉路口两侧、危险地点 易拆装,安装使用
灵活材质偏软,不能起到缓冲隔离的安全性作用;容易损坏 行车道颜色 彩色路面 任意条件下驶入驶出专用道 灵活性高;醒目,
专用路权效果显著驶出专用车道容易与正常行驶车流发生冲突;人工驾驶车辆可任意进出专用车道 -
[1] KHOURY J, AMINE K, ABI SAAD R. An initial investigation of the effects of a fully automated vehicle fleet on geometric design[J]. Journal of Advanced Transportation, 2019, 1208: 1-10. [2] OTHMAN K. Impact of autonomous vehicles on the physical infrastructure: changes and challenges[J]. Designs, 2021, 5(3): 1-30. [3] SEN S, ROESLER J R. Human-centered geometric design of roads using an autonomous vehicle problem[C]//Middle Atlantic ASEE Section Spring 2021 Conference. New York: ASEE, 2021: 1-19. [4] MACHIANI S G, JAHANGIRI A, MELENDEZ B, et al. Safety Impact evaluation of a narrow-automated vehicle-exclusive reversible lane on an existing smart freeway[R]. Washington D. C.: San Diego State University, 2021. [5] GOPALAKRISHNA D, CARLSON P J, SWEATMAN P, et al. Impacts of automated vehicles on highway infrastructure[R]. Washington D. C.: Federal Highway Administration, 2021. [6] CHEN F, BALIEU R, KRINGOS N. Potential influences on long-term service performance of road infrastructure by automated vehicles[J]. Transportation Research Record: Journal of the Transportation Research Board, 2016, 2550(1): 72-79. doi: 10.3141/2550-10 [7] LI B B, SONG D Z, LI H F, et al. Lane marking quality assessment for autonomous driving[C]//2018 IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS). Spain: IEEE, 2019: 1-9. [8] 杨晓寒,暴连胜,顾思思. 高速公路车路协同自动驾驶条件及技术研究[J]. 公路交通科技(应用技术版),2019,15(2): 262-266. [9] 何永明. 超高速公路安全保障与经济评价研究[D]. 哈尔滨: 东北林业大学, 2017. [10] 印顺超. 车联网环境下完全自动驾驶高速公路几何设计标准研究[D]. 西安: 长安大学, 2021. [11] 李智,孔翎旭,王刚,等. 采用平均应力坡度评价沥青路面的抗滑衰变特性[J]. 公路工程,2018,43(5): 33-36,41. doi: 10.3969/j.issn.1674-0610.2018.05.007LI Zhi, KONG Lingxu, WANG Gang, et al. Evaluation of anti-sliding attenuation of asphalt pavement by average value of slope[J]. Highway Engineering, 2018, 43(5): 33-36,41. doi: 10.3969/j.issn.1674-0610.2018.05.007 [12] SHI W J, ALAWIEH M B, LI X, et al. Algorithm and hardware implementation for visual perception system in autonomous vehicle: a survey[J]. Integration, 2017, 59: 148-156. [13] 黄晓明,蒋永茂,郑彬双,等. 基于路表摩擦特性的无人驾驶车辆安全制动原理与方法[J]. 科学通报,2020,65(30): 3328-3340. doi: 10.1360/TB-2020-0029HUANG Xiaoming, JIANG Yongmao, ZHENG Binshuang, et al. Principle and method of safe braking of unmanned vehicles based on the friction characteristics of road surface[J]. Chinese Science Bulletin, 2020, 65(30): 3328-3340. doi: 10.1360/TB-2020-0029 [14] FERREIRA M, DAMAS L, CONCEICÃO H, et al. Self-automated parking lots for autonomous vehicles based on vehicular ad hoc networking[C]//2014 IEEE Intelligent Vehicles Symposium Proceedings. Dearborn: IEEE, 2014: 472-479. [15] NOURINEJAD M, BAHRAMI S, ROORDA M J. Designing parking facilities for autonomous vehicles[J]. Transportation Research Part B: Methodological, 2018, 109: 110-127. doi: 10.1016/j.trb.2017.12.017 [16] ZHANG W W, GUHATHAKURTA S. Parking spaces in the age of shared autonomous vehicles: how much parking will we need and where?[J]. Transportation Research Record: Journal of the Transportation Research Board, 2017, 2651(1): 80-91. doi: 10.3141/2651-09 [17] GRIGORESCU S, TRASNEA B, COCIAS T, et al. A survey of deep learning techniques for autonomous driving[J]. Journal of Field Robotics, 2020, 37(3): 362-386. doi: 10.1002/rob.21918 [18] YANG B S, DONG Z, LIU Y, et al. Computing multiple aggregation levels and contextual features for road facilities recognition using mobile laser scanning data[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2017, 126: 180-194. doi: 10.1016/j.isprsjprs.2017.02.014 [19] 王秋红,李艳芬,周炎. 面向车路协同路侧设备运维管理平台研究[J]. 电子技术应用,2020,46(12): 36-38. doi: 10.16157/j.issn.0258-7998.201120WANG Qiuhong, LI Yanfen, ZHOU Yan. Research on the operation and maintenance management platform of vehicle-to-road coordination road-side equipment[J]. Application of Electronic Technique, 2020, 46(12): 36-38. doi: 10.16157/j.issn.0258-7998.201120 [20] 中国道路交通安全协会. 车联网路侧设施设置指南: T/CTS 1—2020[S]. 北京: 中国标准出版社, 2020 . [21] 周兰孙,郑豆豆. 基于高速公路ETC门架收费设施的车路协同系统探讨[J]. 中国交通信息化,2020(11): 99-101. doi: 10.13439/j.cnki.itsc.2020.11.008 [22] 朱涵. 车联网路侧单元部署算法研究[D]. 大连: 大连理工大学, 2016. [23] 吴湧. 车联网路侧单元部署问题的研究[D]. 桂林: 广西师范大学, 2018. [24] 李志龙. 车联网中路侧单元部署策略研究[D]. 上海: 上海交通大学, 2019. [25] 王健. 面向车路协同的路侧节点部署与异构网络切换方法[D]. 西安: 长安大学, 2015. [26] FOGUE M, SANGUESA J A, MARTINEZ F J, et al. Improving roadside unit deployment in vehicular networks by exploiting genetic algorithms[J]. Applied Sciences, 2018, 8(1): 86-107. doi: 10.3390/app8010086 [27] MASSOBRIO R, TOUTOUH J, NESMACHNOW S. Multi-objective evolutionary algorithms for smart placement of roadside units in vehicular networks[M]. Florida: Chapman & Hall (CRC Press), 2017. [28] GUERNA A, BITAM S. GICA: an evolutionary strategy for roadside units deployment in vehicular networks[C]//2019 International Conference on Networking and Advanced Systems (ICNAS). Annaba: IEEE, 2019: 1-6. [29] SAEED T U. Road infrastructure readiness for autonomous vehicles[D]. West Lafayette: Purdue University , 2019. [30] RAD S R, FARAH H, TAALE H, et al. Design and operation of dedicated lanes for connected and automated vehicles on motorways: a conceptual framework and research agenda[J]. Transportation Research Part C: Emerging Technologies, 2020, 117: 102664.1-102664.18. [31] OAKES ASH L, TRICKER J, DAWN A, et al. Roads for the future dedicated driverless spaces-city[R]. London: City Science, 2018. [32] LIU Z C, SONG Z Q. Strategic planning of dedicated autonomous vehicle lanes and autonomous vehicle/toll lanes in transportation networks[J]. Transportation Research Part C: Emerging Technologies, 2019, 106: 381-403. doi: 10.1016/j.trc.2019.07.022 [33] CHEN Z B, HE F, ZHANG L H, et al. Optimal deployment of autonomous vehicle lanes with endogenous market penetration[J]. Transportation Research Part C: Emerging Technologies, 2016, 72: 143-156. doi: 10.1016/j.trc.2016.09.013 [34] LIU Y Y, TIGHT M, SUN Q X, et al. A systematic review: road infrastructure requirement for connected and autonomous vehicles (CAVs)[J]. Journal of Physics: Conference Series, 2019, 1187(4): 042073.1-042073.14. [35] UZAIR M. Who is liable when a driverless car crashes?[J]. World Electric Vehicle Journal, 2021, 12(2): 62-88. doi: 10.3390/wevj12020062 [36] LIU H, KAN X D, SHLADOVER S E, et al. Modeling impacts of cooperative adaptive cruise control on mixed traffic flow in multi-lane freeway facilities[J]. Transportation Research Part C: Emerging Technologies, 2018, 95: 261-279. doi: 10.1016/j.trc.2018.07.027 [37] National Automated Highway System Consortium. Downselect system configurations and workshop[R]. Washington D. C.: National Automated Highway System Consortium, 1997. [38] 王贺鹏,李志斌,王立. 自动驾驶仿真的虚拟交通信号系统分析及实现[J]. 汽车实用技术,2020(7): 34-37. doi: 10.16638/j.cnki.1671-7988.2020.07.011WANG Hepeng, LI Zhibin, WANG Li. Analysis and implementation of virtual traffic signal system for autopilot simulation[J]. Automobile Technology, 2020(7): 34-37. doi: 10.16638/j.cnki.1671-7988.2020.07.011 [39] 王白凡,刘小洁,杜鹏. 基于VISSIM的自动驾驶车队的行程时间可靠度研究[J]. 交通世界,2020(28): 6-9. doi: 10.3969/j.issn.1006-8872(s).2020.10.003 [40] 宋振伟. 基于FPGA 的车辆自动驾驶系统的研究与仿真设计[D]. 哈尔滨: 哈尔滨工业大学, 2014. [41] 林泓熠,魏政君,钟宇婷,等. 基于Autoware的无人驾驶小车平台设计与实验仿真[J]. 机电工程技术,2021,50(6): 130-133,172.LIN Hongyi, WEI Zhengjun, ZHONG Yuting, et al. Platform design and experimental simulation of autonomous vehicle based on Autoware[J]. Mechanical & Electrical Engineering Technology, 2021, 50(6): 130-133,172. [42] 王楠,刘卫国,张君媛,等. 汽车ACC系统纵向控制六模式切换策略仿真研究[J]. 交通信息与安全,2014,32(4): 143-148. doi: 10.3963/j.issn.1674-4861.2014.04.026WANG Nan, LIU Weiguo, ZHANG Junyuan, et al. Simulation test of a new six-mode switching controller for enhanced adapt cruise control[J]. Journal of Transport Information and Safety, 2014, 32(4): 143-148. doi: 10.3963/j.issn.1674-4861.2014.04.026 -