Evaluation Difference of Dynamic and Static Track Irregularity and Characteristics of Dynamic Chord Measurement Method
-
摘要:
中点弦测法能够有效控制影响行车安全性和舒适性的指定波段轨道不平顺,主要用于测量轨道静态不平顺,但其较低的测量效率制约着轨道“状态修”的发展. 针对上述问题,将轨道动态不平顺按中点弦测输出,分析动静态弦测值差异与弦长和不平顺波长的关联关系,提出能够评价轨道动态平顺性的动态弦测法,研究动态不平顺与静态不平顺间的映射关系. 研究结果表明:42 m和70 m动态高通滤波幅值分别与10 m弦和20 m弦测值变化规律相当;当不平顺波长大于70 m时,120 m动态高通滤波幅值与40 m弦测值变化规律基本对应;截止波长为42、70、120 m的轨道动态不平顺,分别与弦长为20、30 ~ 40、30 ~ 60 m的动态弦测波形相关性最优,对应的动态弦测法最大合理弦长分别为20、30、40 m,通过路基和简支梁区段实测数据验证了动态弦测法的适应性;在路基沉降区段,弦长为60 m时,静态弦测值明显朝负方向偏离动态弦测值的处所为沉降点,相邻两侧朝正方向偏离动态弦测值的处所为沉降区段起终点.
Abstract:The midpoint chord method can effectively control the track irregularity of the designated band that affects the driving safety and comfort. It is mainly used to measure the track static irregularity. However, its low measurement efficiency restricts the development of track ‘state-maintenance’. To solve the above problems, the track dynamic irregularity is output according to the midpoint chord. The correlation between the dynamic and static chord measured values with the chord length and the irregularity wavelength is analyzed. The dynamic track irregularity is outputed according to the midpoint chord measurement. A dynamic chord measurement method is proposed, that can evaluate the dynamic smoothness of the track, and studies the mapping relationship between dynamic irregularity and static irregularity. The results show that, the dynamic high-pass filter amplitudes of 42 m and 70 m are equivalent to the measured values of 10 m chord and 20 m chord respectively. When the irregularity wavelength is greater than 70 m, the 120 m dynamic high-pass filter amplitude basically corresponds to the variation law of 40 m chord measured value. The track dynamic irregularities with cut-off wavelengths of 42, 70 m and 120 m have the best correlation with the dynamic chord measurement waveforms with chord lengths of 20, 30–40 m and 30–60 m respectively. The maximum reasonable chord lengths of the dynamic chord measurement method are 20, 30 m and 40 m respectively. The adaptability of the dynamic chord measurement method has been verified by the measured data of subgrade and simply supported beam sections. In the subgrade settlement section, when the chord length is 60 m, the place where the static chord measurement value deviates significantly from the dynamic chord measurement value in the negative direction is the settlement point, and the places where the adjacent two sides deviate from the dynamic chord measurement value in the positive direction are the beginning and end of the settlement section.
-
在近几十年里,深度神经网络凭借其在多个任务领域的卓越表现,已然成为无人机智能应用不可或缺的核心技术. 无人机在农业、采矿、公共安全、能源巡视等领域的广泛应用,都高度依赖于深度神经网络对各类复杂任务作出的精准判断. 这些任务涵盖了目标识别、语义分割、图像解析示例、目标检测、深度估计、轨迹预测等[1]诸多方面. 随着新应用需求的不断涌现,针对每种特定任务构建专用的深度学习模型已成为业内通行的解决方案. 因此,为满足多样化的任务需求,深度学习模型的种类和数量正在急剧增长.
尽管目前存在一些能力强大的大模型,但由于无人机计算能力的局限性,实际应用仍然需要针对特定类型的任务定制模型. 这需要大量的训练数据和计算资源,对单个无人机用户来说是一项艰巨的挑战. 因此,联邦学习作为一种解决本地数据稀缺、计算能力有限,同时保护用户数据隐私[2]的方法被提出. 在联邦学习中,用户无需像传统的模型训练那样共享其本地数据,而是仅通过共享模型参数来构建全局模型,从而提高单个无人机任务执行的效能. 无人机联邦学习的研究主要关注无人机的能量损耗[3]问题. 研究者们从节能[4-5]和可持续性[6]等方面入手,对无人机高效应用联邦学习进行了深入探究,为在无人机上应用联邦学习奠定了坚实的基础.
传统的联邦学习方法通常只应用于具有相同模型结构并执行相同任务的无人机之间. 然而,在实际应用中,无人机往往需要执行多个任务. 在智慧农业领域,无人机不仅需要对农作物进行准确识别,还需要对农作物的位置和距离进行判断,以便进行精准施肥. 在无人机安防领域,无人机需要能识别重点目标并对人物身体部位进行区分. 在这种情况下,无人机群中存在大量执行多种任务并各自拥有本地数据的无人机,为持续提高无人机任务执行效能,需要不断对模型进行训练. 这种分布式场景与联邦学习思想相契合,然而,传统的联邦学习方法无法直接应用于多任务场景. 因此,构建适用于多任务场景的联邦学习框架是必要的. 传统的联邦学习方法在面对多任务场景时面临挑战,主要是由于任务数据稀缺性和任务模型限制所导致的,具体而言:
1) 任务数据稀缺:由于特定任务的专业性较高且无人机用户数量有限,收集和生成足够的训练数据变得颇具挑战性. 因此,对于本地数据资源有限的无人机用户所执行的特定任务,传统的联邦学习方法在构建高性能任务模型时仍会面临困难.
2) 任务模型限制:传统的联邦学习方法要求无人机用户执行相同的任务并拥有相同的模型结构. 换言之,当无人机用户希望参与联邦学习系统时,必须与执行相同任务并拥有相同模型结构的一组无人机用户合作. 虽然知识蒸馏[7]为无人机用户提供了使用不同结构模型进行操作的可能性,但在执行不同任务的无人机群中的应用仍然存在重大挑战. 这种对联邦学习系统内任务同质性的要求对无人机群施加了很大的约束,从而减弱了联邦学习适应无人机群的能力.
为应对上述挑战,学者开始深入研究多任务问题. 文献[8]认为,多任务学习与单任务学习具有相同的输入,但不同任务的输出却有所区别;该文献试图捕捉任务之间的相关性,提取共性知识,从而提高多任务输出的效能. 基于此,文献[9-12]假设任务之间的相关性是先验已知的. 然而,文献[13-16]则认为任务之间的相互关系是未知的,需要通过数据来探索. 本文主要关注前一种观点,因为根据任务的具体属性,在单个系统中设置彼此相关的任务是可行的. 多任务学习方法可以在不同任务之间转移公用知识,这种特性使得其特别适合于联邦学习,尽管存在这种潜力,但现有的多任务联邦学习方法在适应分布式场景和异构模型之间的多任务学习方面存在一定的局限性.
为了在无人机群中实现多任务异构模型之间的联邦学习,本文提出一种基于编-解码器结构的多任务联邦学习方法(multi-task federated learning method based on encoders and decoders structure,M-Fed). 该方法旨在超越传统联邦学习所固有的任务模型限制,实现执行不同任务无人机之间的协作和相互学习,以缓解任务数据稀缺的问题. 无人机用户无需考虑任务限制,只需要按照服务器要求统一模型组件即可参与联邦学习.
已有研究主要探讨了在具有相同模型和执行相同任务的无人机之间进行本地训练和联邦学习. 然而,本文提出的M-Fed在传统联邦学习基础上面临着2个新的挑战:1) 开发一个框架实现多任务无人机集群的联邦学习;2) 在异构模型之间高效地共享知识. 为应对这些挑战,设计一个适用于多任务无人机集群的联邦学习框架,以最大限度地提取异构模型之间的公用知识,同时确保在不影响本地任务的情况下进行知识转移.
1. 问题描述与方法设计
为深入研究无人机群在多任务环境下联邦学习的有效性,本文提出的M-Fed方法与其他方法的差异如图1 所示. 图中,不同颜色象征着各异的任务,数字①~⑥表示不同的无人机实体. 本地训练与传统的联邦学习方法均受限于相同任务间的协作,而M-Fed方法打破了这一桎梏,无人机能够超越任务的界限,自由参与到联邦学习的进程中. M-Fed不仅拓宽了无人机的应用范围,还提升了联邦学习的灵活性与效率.
1.1 无人机群多任务联邦学习问题描述
传统联邦学习的基本目标是通过整合来自多个无人机的本地模型,形成一个统一的全局模型. 可以将其描述为
{argminwn1NN∑n=1f(Sn;wn),G0=A(F(w1),F(w2),⋯,F(wN)), (1) 式中:$N$为无人机数量,$ {S_n} $为无人机$n$的本地数据和标签集,${w_n}$为无人机$n$的模型参数集合,f(·)为损失函数,$ F({w_n}) $为无人机的本地模型函数,A(·)为聚合函数,$G_0$为全局模型函数.
在传统联邦学习框架中,每架无人机都利用其本地数据进行独立训练. 通过无人机群与服务器间的多次迭代交互,再借助聚合函数,各无人机的本地模型得以巧妙地融合成一个全局模型. 这一过程旨在最小化无人机群的总体损失,并在不直接共享数据的前提下实现知识共享. 然而,传统联邦学习的一个显著限制是要求所有无人机采用相同的模型结构,这在处理多任务场景时显得尤为不切实际.
针对无人机群多任务联邦学习的场景,存在$ K $个不同的任务$ ( {K \leqslant N} ) $,每架无人机负责执行一个特定的任务,但不同无人机也可能分配到相同的任务. 每架无人机都持有一个本地数据集${S_n}$,该数据集包含本地数据及其对应的数据标签对. 针对每个任务,无人机都拥有一个与之对应的本地模型,其模型结构为${M_k}$,$k=1,2,\cdots, K$. 若无人机执行相同的任务,则其模型结构也是相同的,这意味着模型参数之间存在一一对应的关系. 反之,执行不同任务的无人机其模型结构各异,参数之间无法形成直接的映射关系. 此外,无人机的损失函数也不再是统一的,而是根据具体任务$k$来确定的,记作${f_k}({S_n};{w_n})$. 对于执行任务$k$的无人机,其模型函数为${F_k}(w)$,w为模型参数集合. 在传统联邦学习中,模型聚合是一个核心步骤. 当所有无人机执行相同任务时,由于模型结构相同,模型聚合相对简单,可以采用平均聚合或加权平均聚合等方法. 然而,在多任务场景下,这种直接的模型聚合方法变得不再适用. 原因在于不同任务下的无人机模型结构存在差异,导致无法直接进行聚合. 因此,在多任务联邦学习的背景下,需要重新思考模型聚合的策略. 为处理不同结构模型之间的聚合问题,必须考虑任务之间的关系,并探索新的聚合方法. 这样的方法需要能够适应不同模型结构之间的差异,同时有效地整合各个无人机的模型更新,以促进全局模型的学习和优化.
M-Fed方法的核心思想是利用不同模型之间的公用知识,即不同任务之间的相似性,来提升无人机模型的性能. 通过这一策略,M-Fed方法能够更有效地整合各种任务信息,从而优化无人机模型的表现.
1.2 无人机群多任务联邦学习框架搭建
如图2所示,M-Fed方法框架主要由无人机群和服务器两大核心部分构成. 在无人机参与多任务联邦学习的过程中,需对其原有模型进行结构性调整,即改造为包含编码器和解码器的复合模型. 编码器部分由服务器统一确定,以确保在模型融合过程中的一致性;解码器则根据具体任务需求进行个性化定制,满足多样化的任务处理要求. 无人机主要负责本地训练任务,利用各自的私有数据进行模型训练,完成后将模型参数上传至服务器. 服务接收到参数后,对执行相同任务的模型进行聚合操作,生成任务全局模型. 随后,服务器从每个任务全局模型中提取编码器组件,并将其整合成一个编码器全局模型. 服务器完成模型聚合和编码器提取后,将任务全局模型分发给对应任务的无人机,并将编码器全局模型广播给所有无人机. 无人机接收到从服务器发送的2个模型后,将本地模型同步为任务全局模型,将编码器全局模型加入到本地损失函数中,通过迭代优化使得本地编码器模型与编码器全局模型参数逐渐逼近,实现全局模型知识向无人机本地模型的有效共享.
在无人机进行本地训练时,其本地模型会经历预定次数的迭代过程. 在此过程中,编码器全局模型保持固定不变. 然而,这种固定性可能会在一定程度上影响无人机的收敛效率. 为解决这一问题,引入自适应参数机制动态管理编码器全局模型与无人机模型之间的交互作用. 当无人机模型的参数发生显著变化时,自适应参数会降低编码器全局模型的影响权重;而当无人机模型的参数趋于稳定时,则会增加其影响权重. 通过这种动态调整策略,能够更有效平衡编码器全局模型与无人机模型之间的关系,从而提升整体的学习效率.
1.3 无人机群多任务联邦学习算法设计
M-Fed的目标是通过在多个任务模型之间传递知识来提升其整体性能. 这种方法不仅关注共享知识的提取与整合,还着重考虑知识传递可能对各个任务模型带来的潜在负面影响. M-Fed要求所有无人机模型均采用编码器-解码器架构. 在编码器部分,模型负责提取输入数据的特征信息,并将其转换为固定长度的向量表示. 为确保知识在不同任务间的有效传递,所有无人机模型的编码器结构保持一致. 然而,在解码器环节,模型需要将编码器输出转换成特定任务的所需输出. 因此,解码器的设计需要根据具体任务进行定制. 这意味着,处理不同任务的无人机模型,其解码器部分可能会有所差异. 在这架构下,无人机执行任务的范围并不会受限于单一任务类型.
首先,对于执行相同任务的无人机组,可以利用传统的联邦学习技术进行模型训练,形成任务全局模型. 形式上,参与者可以通过联邦平均最小化其损失函数的平均值,该算法表示为
{argminwn∈Rd1NN∑n=1fk(Sn;wn),Gk=A(Fk(w1),Fk(w2),⋯,Fk(wN)), (2) 式中:${G_k}$为任务$ k $的全局模型,d为维度.
通过在传统联邦学习框架内对执行同一任务$ k $的所有无人机进行模型训练与聚合,最终能够获取$ K $个针对不同任务的全局模型.
在多任务无人机群场景中,为实现跨任务的知识共享,采取了以下策略:不同任务的无人机群会上传其任务全局模型中结构相同的模型编码器部分,利用聚合算法构建出一个编码器全局模型. 然后,在传统联邦学习框架的基础上,按式(3)进行优化,以实现任务间的有效知识转移.
min∑k‖wE,k−g‖2, (3) 式中:${w_{\mathrm{E},k}}$为任务$k$的全局模型中编码器部分的参数,$g$为编码器全局模型的参数.
通过这种方法,能够使不同任务模型的编码器部分在参数空间上相互接近,进而实现跨任务的知识传递.
在多任务联邦学习系统中,各无人机均可通过其本地数据集${S_n}$访问相应的数据和标签. 无人机的模型架构包含编码器和解码器两部分. 其中,所有无人机的编码器结构保持一致,而解码器结构则根据各自承担的任务类型进行个性化设计. 每架无人机利用其本地数据集训练出独特的本地模型函数${F_k}({w_n})$. 对于执行相同任务的无人机群,系统会依据式(2)并采用聚合算法,构建针对该任务的全局模型. 这一过程表示为
minfk(w)=1|Sn||Sn|∑i=112(yi−Fk(xi))2, (4) 式中:${x_i}$、${y_i}$分别为$ {S_n} $中的数据、标签对,$ \left| {{S_n}} \right| $为数据集$S_n $的总量.
这一过程可以解释为:利用执行任务$k$的无人机$i$的模型参数${w_n}$来预测与数据集${S_n}$相关的损失. 为了使得任务$k$的损失函数最小化,参数$w$的更新规则为
w=w−α∇f(w), (5) 式中:$ \alpha $为学习率,用于控制参数更新的步长;$ \nabla f(w) $是损失函数$ f $关于参数$ w $的梯度,包含了损失函数对每个模型参数的偏导数.
无人机执行特定轮次的本地训练后,借助传统聚合方法,使执行相同任务的无人机能够共同构建任务全局模型函数${F_k}(w)$,最终形成$ K $个任务全局模型函数.
在处理多种相关性任务时,尽管每个任务的目标各异,但模型的浅层参数通常展现出一定的通用性[17]. 鉴于此,本文通过整合这些浅层参数,使相关无人机在执行不同任务时能够实现知识的有效共享. 首先,构建一个全局的任务模型函数集合;接着,从这个集合中提取出所有任务全局模型函数中的编码器部分,并运用聚合函数进行整合,最终形成了编码器全局模型. 这一过程如式(6)所示.
g=A(FE,1(wE),FE,2(wE),⋯,FE,K(wE)), (6) 式中:${w_{\mathrm{E}}}$为模型编码器部分的参数集,${F_{{\mathrm{E}},k}}$(·)为任务$k$的模型函数的编码器部分.
为将编码器全局模型中的融合知识有效传递给每架无人机,在无人机训练过程中引入正则化项,鼓励无人机的本地编码器模型向编码器全局模型对齐,从而实现知识共享. 这一思想在式(3)中得到具体体现,修改后的损失函数为
fk(w)=fk(w)+λ‖wE−g‖2, (7) 式中:$\lambda $为超参数.
${w_{\mathrm{E}}}$的结构与$g$的结构是等效的,并且可用于规范计算. $\lambda $作为本地模型与编码器全局模型之间的调节器,其作用至关重要,随着$\lambda $趋近于0,算法将变为具有相同任务的无人机之间的传统联邦学习. 而随着$\lambda $值的增加,关注点又重新回到全局目标上. 为增强训练过程,可以灵活地调整$\lambda $值,以更好地平衡本地模型与编码器全局模型之间的关系,从而达到更好的学习效果. 在训练初期,由于本地模型的参数需经历较大波动,如果此时编码器全局模型与本地模型过于紧密地对齐,可能会导致训练效率降低. 因此,此时应该选择较小的$\lambda $值. 然而,随着训练的进行,本地模型开始趋于收敛,参数的变化将逐渐变得平稳,此时,通过适当增加$\lambda $值,可以增加全局模型对任务模型的影响,促进本地编码器与编码器全局模型更紧密地对齐.
M-Fed算法包括2个阶段:1) 本地训练阶段. 通过损失函数的多轮迭代,无人机将服务器发送的编码器全局模型$g$与本地编码器在参数层面逐步拉近,进而实现不同任务间公共知识的有效共享. 2) 服务器参数聚合阶段. 在接收到所有无人机上传的参数后,服务器首先根据任务对模型进行聚合,获取任务全局模型参数集合;接着,构建编码器全局模型$ g $,这一过程是通过提取所有任务全局模型的编码器部分并进行聚合来实现的;最后,服务器将任务全局模型和编码器全局模型发送至对应的无人机. M-Fed算法流程如下:
1) 输入:$\mathcal{K} $,任务集合;T,聚合轮数;$\mathcal {N} $,无人机集合;m,本地训练轮数;$\mathcal{N}_k $,执行任务k的无人机集合,k$\in \mathcal{K} $;$\lambda $,超参数;$\alpha $,学习率;g,编码器全局模型;$w_k^{(0)} $,初始参数集合,$k\in \mathcal {K}$
2) for $t = 0,1, \cdots ,T - 1$ do
服务器根据任务$ k $将第t次聚合的参数$w_k^{(t)} $下发给对应任务的无人机
3) $ w_k^{(t)} \to {\mathcal {N}_k} ,\;k \in \mathcal {K} $
服务器将全局骨干模型$g$下发给所有无人机
4) $ g \to \mathcal{N} $
5) for 无人机$n \in \mathcal{N}$同时do
利用本地数据训练本地模型$m$轮
6) $w_n^{(t + 1)} = w_n^{(t)} - \left( {\alpha \Delta f\left( {w_n^{(t)}} \right) + \lambda {{\left\| {w_{{{\mathrm{E}},n}}^{(t)} - g} \right\|}_2}} \right)$(${w_{{\mathrm{E}},n}}$是无人机$n$参数的编码器部分)
7) 发送$\varDelta _{k,n}^{(t)} = w_n^{(t + 1)} - w_n^{(t)}$给服务器
end for
8) 通过聚合函数$A$将执行任务$k$参数进行聚合,形成任务全局模型集合
$ {w_k^{(t + 1)}} \leftarrow A\left( {w_k^{(t)},\left\{ {\Delta _{k,n}^{(t)}} \right\}} \right),\; n \in {{\mathcal{N}_k}} ,\;k \in \mathcal{K} $,
聚合函数A将所有无人机的编码器部分参数进行聚合,形成编码器全局模型
9) $g \leftarrow A\left( {\left\{ {w_{{\mathrm{E}},k}^{(t + 1)}} \right\}} \right),\;k \in \mathcal {K} $是$w_k^{(t+1)} $的编码器部分
end for
10) 输出 $ {w_k^{(T - 1)}} ,\; k \in \mathcal {K} $
与传统联邦学习中的优化目标相似,构建任务全局模型旨在为无人机提供直接从其中学习任务知识的机会. 同时,无人机还能够从编码器全局模型中学习共用知识,这不仅能从执行相同任务的其他无人机中汲取经验,更能从执行不同任务的无人机中汲取多样化的信息,从而进一步提升模型效率. 任务全局模型的构建旨在为无人机提供直接从任务全局模型中学习任务知识的机会. 此外,通过从编码器全局模型中学习共用知识,无人机可以进一步提高模型效率.
2. 实验结果及分析
2.1 数据准备与实验设置
本研究选用PASCAL-Context数据集分割版本作为实验对象. 该数据集是密集预测任务领域中备受推崇的基准之一,尤其适用于多任务无人机群方法的验证[18]. 该数据集包含10581张训练图像和1449张验证图像. 为体现多任务特性,选取4个任务进行实验分析:语义分割、人体部位分割、显著性估计以及语义边界检测.
模型设置:模型的编码器部分由服务器确定,选用ResNet-18编码器. 采用DeepLabV3 + 和Atrous Spatial Pyramid Pooling(ASPP)模块作为本文的模型解码器. 执行不同任务的模型之间的差异仅在于模型出口处,根据任务分类的数量,设定对应数量的出口.
无人机本地执行完5个轮次后,会进行一次聚合. 变量阈值$ \lambda $是通过模型聚合轮数来评估的,并呈现指数增长趋势,逐渐增强其影响. 4个任务的编码器模型配置保持相同,ResNet-18其他组件(如解码器、损失函数和优化器)则根据具体任务而有所不同. 解码器、损失函数和其他相关方面遵循所分配任务的要求. 每架无人机进行100个轮次的训练,整个模型使用PyTorch在4个RTX 2080Ti GPU上进行训练.
2.2 实验评估指标
语义边界检测评估任务的指标是optimal dataset scale/F-measure(odsF)[19]. 为使用odsF指标,本文为所有图像设置相同的阈值,即选择F1-measure为固定阈值并将其应用于所有图像,表示为
IodsF=2PrRePr+Re, (8) 式中:$ {P_{\mathrm{r}}} $为精准率,$ {R_{\mathrm{e}}} $为召回率.
语义分割、人体部位分割和显著性估计使用mean intersection over union (mIoU)来评估任务. mIoU定义为
ImIoU=1c∑P∩GP∪G, (9) 式中:$P$为预测值,$G$为真实值,$c$为类别总数.
2.3 实验结果及分析
为验证所提出方法的有效性,在实验中将M-Fed算法与传统方法进行比较. 传统方法包括局部训练算法和经典联邦学习方法. 在局部训练算法中,本文为每个客户端都执行了本地训练,并从中选取表现最优的结果作为代表值进行展现. 选择4个任务,每个任务有5架无人机参与训练,总共有20架无人机. 数据在20架无人机之间分散,没有重叠. 所采用的硬件设备旨在模拟20架无人机共同参与联邦学习的场景. 为确保实验的有效性与可行性,选用基础模型结构,并将数据集均匀分割为20份,以适应无人机所搭载的计算平台的参数限制. 这样的设计能够充分模拟实际无人机联邦学习的环境,从而为研究提供有力的实验支撑.
实验结果如表1所示. 表中:增量反映了相较于局部训练方法,其他方法在各任务上实现的提升量平均数;加粗数字为最优值.
表 1 PASCAL-Context数据集实验结果Table 1. Experimental results on PASCAL-Context dataset方法 编码器 语义分割 人体部位分割 显著性估计 语义边界检测 增量/% 局部训练 ResNet-18 38.36 49.03 55.74 60.90 0 经典联邦学习 ResNet-18 49.71 52.66 59.09 61.20 10.87 M-Fed ResNet-18 50.60 52.46 59.31 62.90 13.25 由表1可知:
1) 提出的M-Fed方法在3个任务中均获得了最高分数,总体上相较于经典联邦学习方法有所提升. 具体而言,在语义分割任务中实现了1.79%的部分改善;显著性估计任务中提高了0.37%;而在语义边缘任务中则提升了2.78%. 然而,在人体部位分割任务中,该方法出现了0.38%的降低.
2) 局部训练结果显示了每架无人机在单独使用本地数据进行训练时,在该任务中所能获得的最佳性能. 显然,M-Fed可显著提升性能,远超过单独的局部训练效果. 例如,在语义分割任务中,通过M-Fed在训练期间间接共享参数,mIoU值提高29.59%. 同样地,M-Fed促进了不同任务之间的模型间参数信息的传递.
3) M-Fed方法通过从其他任务中充分转移知识,语义分割任务、显著性估计任务和语义边缘任务得到了适度的优化;而人体部位分割任务则表明,吸收转移信息更为困难,但并未过多牺牲原始系统的能力.
在PASCAL-Context数据集的实验中,M-Fed方法在不同任务上展现出了多样化的表现. 这可能是由于本文实验仅选用了ResNet-18作为编码器,其参数数量的限制可能一定程度上影响了M-Fed方法的性能. 随着编码器模型参数量的增加,M-Fed方法的实验结果可能会有所不同. 因此,本文从多角度出发,深入验证M-Fed方法的有效性. 如表2所示,对PASCAL-Context数据集进行量化评估,直观地展示实验结果.
表 2 PASCAL-Context数据集的量化结果Table 2. Quantitative results on PASCAL-Context dataset具体而言,M-Fed方法在各任务中均表现卓越,并在多个方面超越基准方法. 在语义分割任务中,M-Fed展现出与经典联邦学习方法相当的效果,相较于局部训练方法,能够更准确地辨别出不同动物个体. 人体部位分割任务中,尽管M-Fed的数值得分稍逊于经典联邦学习算法,但从量化结果中可见,M-Fed在边缘处理上更为精准. 在显著性估计任务中,M-Fed聚焦于关键物体,显著减少了环境干扰. 而在语义边缘检测任务中,M-Fed的精细处理尤为突出,特别是在人物腿部轮廓和远处地形边界的划分上,展现出更精细的划分能力.
M-Fed方法巧妙地实现了任务间的知识共享,使得无人机能够不仅从相关任务中汲取可泛化的知识,还能专注于各自的特定任务,从而显著提升整体任务表现. 这一特性让M-Fed在多个任务中均展现出强大的性能优势.
3. 结 论
本文提出一种基于编-解码器结构的无人机群多任务联邦学习方法,允许无人机在多任务条件下参与联邦学习. 与传统的联邦学习方法相比,M-Fed方法在处理无人机任务和模型一致性方面有所创新. 实证结果验证了所提出M-Fed方法的有效性. 并得到主要结论如下:
1) 提出的M-Fed方法通过编码器-解码器结构实现无人机多任务联邦学习,允许无人机在不同任务下参与联邦学习,同时保持任务和模型结构的一致性,并通过实验得到验证.
2) 为减少M-Fed在联邦学习初期的负面影响,引入可变阈值策略,有效控制M-Fed的参与度,从而提高训练效果.
3) M-Fed方法展示了良好的可嵌入性和与常规方法的兼容性,其灵活性和通用性使其成为解决无人机多任务联邦学习问题的有力工具.
尽管M-Fed方法可以有效提升模型性能,但面临以下限制:
1) M-Fed方法在处理低相关性任务时可能出现的性能下降.
2) M-Fed要求参与任务的无人机采用相同的编码器架构.
后续研究将致力于解决这些限制,使得无人机群适应更广泛的任务场景.
-
表 1 动态弦测误差
Table 1. Dynamic chord measurement error
% 截止波长/m 弦长/m 10 20 30 40 50 60 42 5.4 20.0 39.3 58.2 73.2 83.6 70 2.4 7.7 16.6 27.5 39.3 51.0 120 2.2 2.7 6.0 10.4 15.7 21.8 表 2 动态弦测值与静态弦测值峰值差
Table 2. Peak value difference between dynamic chord measurement and static chord measurement mm
弦长/m 截止波长/m 动、静态弦测值峰值差 A B C-1 C-2 C-3 10 42 0.2 0.3 0.1 0.4 0.1 70 0.2 0.2 0.1 0.3 0.1 120 0.1 0.2 0.1 0.2 0.1 20 42 0.8 0.8 0.4 1.3 0.6 70 0.6 0.7 0.4 0.9 0.5 120 0.4 0.6 0.3 0.6 0.3 30 42 1.7 1.5 0.5 2.7 1.3 70 1.2 1.4 0.4 1.9 0.9 120 0.8 1.2 0.3 1.2 0.6 40 42 2.8 2.7 1.4 4.5 0.9 70 2.1 2.6 1.4 3.3 0.7 120 1.4 2.2 1.2 2.2 0.5 50 42 4.0 4.1 2.0 6.4 3.0 70 3.1 4 1.9 4.8 2.6 120 2.0 3.4 1.7 3.2 1.8 60 42 5.2 5.6 2.9 7.7 4.0 70 4.3 5.6 2.7 6.1 3.6 120 2.9 4.8 2.4 4.0 2.5 -
[1] 罗林, 张格明, 吴旺青, 等. 轮轨系统轨道平顺状态的控制[M]. 北京: 中国铁道出版社, 2006: 62-65 [2] 刘学文,杨怀志,杨飞,等. 基于动静态检测数据的轨道精测精调评价技术[J]. 铁道建筑,2019,59(9): 111-115. doi: 10.3969/j.issn.1003-1995.2019.09.27LIU Xuewen, YANG Huaizhi, YANG Fei, et al. Evaluation technology of track precision measurement and fine adjustment based on dynamic and static detection data[J]. Railway Engineering, 2019, 59(9): 111-115. doi: 10.3969/j.issn.1003-1995.2019.09.27 [3] 杨飞,刘丙强,谭社会,等. 高速铁路轨道静态几何不平顺弦测评价标准体系研究[J]. 铁道建筑,2021,61(6): 107-111,120. doi: 10.3969/j.issn.1003-1995.2021.06.24YANG Fei, LIU Bingqiang, TAN Shehui, et al. Research on evaluation standard system of chord measurement for track static geometric irregularity of high speed railway[J]. Railway Engineering, 2021, 61(6): 107-111,120. doi: 10.3969/j.issn.1003-1995.2021.06.24 [4] 田新宇,高亮,杨飞,等. 基于动态短弦的无砟轨道板周期性不平顺管理标准[J]. 中国铁道科学,2020,41(6): 30-38. doi: 10.3969/j.issn.1001-4632.2020.06.04TIAN Xinyu, GAO Liang, YANG Fei, et al. Management standard for cyclic irregularity of ballastless track slab based on dynamic short chord[J]. China Railway Science, 2020, 41(6): 30-38. doi: 10.3969/j.issn.1001-4632.2020.06.04 [5] 张国锋,高晓蓉,王黎,等. 数字逆滤波技术在轨道不平顺检测中的应用[J]. 信号处理,2004,20(6): 667-670. doi: 10.3969/j.issn.1003-0530.2004.06.030ZHANG Guofeng, GAO Xiaorong, WANG Li, et al. The applying of digital- inverse filtering technology in track irregularity inspection[J]. Signal Processing, 2004, 20(6): 667-670. doi: 10.3969/j.issn.1003-0530.2004.06.030 [6] 程樱,许玉德,周宇,等. 三点偏弦法复原轨面不平顺波形的理论及研究[J]. 华东交通大学学报,2011,28(1): 42-46. doi: 10.3969/j.issn.1005-0523.2011.01.009CHENG Ying, XU Yude, ZHOU Yu, et al. Theory and research of asymmetrical chord offset method of restoring a waveform of track irregularity[J]. Journal of East China Jiaotong University, 2011, 28(1): 42-46. doi: 10.3969/j.issn.1005-0523.2011.01.009 [7] 王源,徐金辉,陈嵘,等. 基于中点弦测法的轨道不平顺精确值数学模型研究[J]. 铁道建筑,2015,55(5): 139-143. doi: 10.3969/j.issn.1003-1995.2015.05.35WANG Yuan, XU Jinhui, CHEN Rong, et al. Research on mathematical model of accurate value of track irregularity based on midpoint chord measurement method[J]. Railway Engineering, 2015, 55(5): 139-143. doi: 10.3969/j.issn.1003-1995.2015.05.35 [8] 魏晖,朱洪涛,殷华,等. 高铁轨道平顺性的150 m/300 m校验及其快速测量[J]. 铁道工程学报,2015,32(1): 44-48,54. doi: 10.3969/j.issn.1006-2106.2015.01.009WEI Hui, ZHU Hongtao, YIN Hua, et al. 150 m/300 m check for the irregularities of HSR and its rapid survey[J]. Journal of Railway Engineering Society, 2015, 32(1): 44-48,54. doi: 10.3969/j.issn.1006-2106.2015.01.009 [9] 杨飞,赵文博,高芒芒,等. 运营期高速铁路轨道长波不平顺静态测量方法及控制标准[J]. 中国铁道科学,2020,41(3): 41-49. doi: 10.3969/j.issn.1001-4632.2020.03.05YANG Fei, ZHAO Wenbo, GAO Mangmang, et al. Static measurement method and control standard for long-wave irregularity of high-speed railway track during operation period[J]. China Railway Science, 2020, 41(3): 41-49. doi: 10.3969/j.issn.1001-4632.2020.03.05 [10] 赵文博,杨飞,李国龙,等. 高速铁路轨道平顺性静态长弦测量矢距差法数学模型推导及特性分析[J]. 铁道建筑,2020,60(2): 105-109.ZHAO Wenbo, YANG Fei, LI Guolong, et al. Mathematical model derivation and characteristics analysis of vector distance difference method for static long chord measurement of high speed railway[J]. Railway Engineering, 2020, 60(2): 105-109. [11] 魏世斌,李颖,赵延峰,等. GJ-6型轨道检测系统的设计与研制[J]. 铁道建筑,2012,52(2): 97-100. doi: 10.3969/j.issn.1003-1995.2012.02.030 [12] 魏晖,朱洪涛,吴维军,等. 高速铁路长波不平顺的相对测量整道[J]. 铁道建筑,2014,54(8): 95-98. doi: 10.3969/j.issn.1003-1995.2014.08.29 [13] 魏晖,朱洪涛,赵国堂,等. 基于中点弦测模型的无砟轨道精调量迭代求解[J]. 西南交通大学学报,2015,50(1): 131-136. doi: 10.3969/j.issn.0258-2724.2015.01.019WEI Hui, ZHU Hongtao, ZHAO Guotang, et al. Iterative algorithm of HSR ballastless track realignment calculation based on MCO model[J]. Journal of Southwest Jiaotong University, 2015, 50(1): 131-136. doi: 10.3969/j.issn.0258-2724.2015.01.019 [14] 中华人民共和国铁道部. 高速铁路无砟轨道线路维修规则(试行): TG/GW 115—2012 [S]. 北京: 中国铁道出版社, 2012. [15] 杨飞,吴细水,孙宪夫,等. 钢轨轧制不平顺激扰下的动车组动力响应特性[J]. 西南交通大学学报,2022,57(2): 267-276,294.YANG Fei, WU Xishui, SUN Xianfu, et al. Dynamic response characteristics of EMU under excitation of rail straightening irregularity[J]. Journal of Southwest Jiaotong University, 2022, 57(2): 267-276,294. [16] NAGANUMA Y, KOBAYASHI M, OKUMURA T. Inertial measurement processing techniques for track condition monitoring on Shinkansen commercial trains[J]. Journal of Mechanical Systems for Transportation and Logistics, 2010, 3(1): 315-325. doi: 10.1299/jmtl.3.315 [17] 魏世斌,刘伶萍,刘维桢,等. 提速线路轨道长波不平顺检测技术[J]. 中国铁道科学,2010,31(2): 141-144.WEI Shibin, LIU Lingping, LIU Weizhen, et al. Technology for the measurement of long-wavelength track irregularity of speed-up railway[J]. China Railway Science, 2010, 31(2): 141-144. [18] HAIGERMOSER A, LUBER B, RAUH J, et al. Road and track irregularities: measurement, assessment and simulation[J]. Vehicle System Dynamics, 2015, 53(7): 878-957. doi: 10.1080/00423114.2015.1037312 [19] 中国国家铁路集团有限公司. 铁路基础设施动态检测——轨道几何检测系统: Q/CR 751—2020[S]. 北京: 中国铁道出版社, 2020 期刊类型引用(14)
1. 李国龙,孙宪夫,高彦嵩,杨飞,高芒芒,柯在田. 基于实车试验的大跨度桥梁轨道静态长波高低不平顺验收标准验证. 铁道学报. 2024(01): 120-128 . 百度学术
2. 曾晨,国巍,刘汉云,余志武,蒋丽忠,国振,谈遂. 非对称弦测法中基于梯度下降的轨道不平顺复原方法(英文). Journal of Central South University. 2024(01): 288-301 . 百度学术
3. 王有能,李再帏,张家维,谭社会,时瑾. 千米级大跨度桥上线路动态与静态轨道不平顺的关系. 铁道建筑. 2024(02): 20-24 . 百度学术
4. 黄振. 昌九高铁扬子洲赣江公铁合建连续钢桁梁桥设计研究. 铁道标准设计. 2024(04): 88-94+108 . 百度学术
5. 张航,卢春房,高亮. 基于波噪比的高速铁路钢轨波磨快速检测方法. 铁道学报. 2024(04): 1-8 . 百度学术
6. 陈良江,孙宗磊,严爱国,郭远航,杨得旺. 高速铁路大跨度桥梁轨道静态长波不平顺设计控制参数研究. 铁道学报. 2024(04): 177-183 . 百度学术
7. 谭社会,时瑾,张雨潇. 高速铁路竖曲线平顺性优化及工程应用. 铁道工程学报. 2024(01): 13-19 . 百度学术
8. 王琰,赵兴,魏世斌,杨飞,魏子龙,从建力,刘晓东,费继友. 基于惯性的轨道平顺性动态弦测法研究. 中国铁道科学. 2024(04): 22-29 . 百度学术
9. 王同军,蒋辉,尤明熙,解婉茹,魏子龙,杨飞,李平. 基于模数驱动的高速铁路线路设备状态检测评估技术与实践. 铁道运输与经济. 2024(09): 1-14 . 百度学术
10. 程飞,段金超,何越磊,刘彦林. 千米跨度高铁桥梁的轨道不平顺时频特征分析. 铁道标准设计. 2024(12): 21-30 . 百度学术
11. 郝晋斐,陈春雷,赵紫珅,贺雨,韩志,王宁. 基于标定线的轨道几何检测系统精度评定方法. 铁道建筑. 2023(08): 49-54 . 百度学术
12. 张雨潇,时瑾,倪国华,王英杰. 有砟轨道捣固作业起道方案的综合修正方法. 西南交通大学学报. 2023(06): 1347-1356 . 本站查看
13. 高策. 高速铁路大跨度桥梁轨道平顺性控制标准研究. 铁路工程技术与经济. 2022(04): 1-4+21 . 百度学术
14. 张建,程朝阳,李颖,王凡,郝晋斐,韩志. 轨道几何动静态检测分析. 中国铁路. 2022(08): 180-185 . 百度学术
其他类型引用(6)
-