Optimization Control Strategy for Low-Altitude and Single-Layer Unmanned Aerial Vehicle Network Coverage
-
摘要:
为研究应急通信场景中无人机网络自主控制问题,采用多架旋翼无人机搭载6G一体化基站,通过机间组网形成低空单层无人机网络,对地面任务区域内的用户提供无线网络服务;针对典型场景构建数值模型,利用多智能体强化学习方法求解无人机网络的优化控制策略,并分析无人机基站数量、无人机基站通信距离对于任务地域无线网络覆盖效果的影响. 研究结果表明:利用强化学习方法得到的优化控制策略收敛效果较好;无人机网络覆盖得分和公平覆盖指数的学习曲线变化趋势相似,在第1000~2 000个episode之间快速增长,随后进入平台区;在无人机基站通信覆盖距离1.0 km、飞行高度300 m条件下,将无人机基站数量从3个增加到7个,网络覆盖得分提高53.28%,公平覆盖指数提高43.57%;当无人机基站数5个、飞行高度300 m条件下,基站通信距离从1.0 km增加到2.5 km时,无人机网络覆盖得分提高86.01%,公平覆盖指数提高41.47%.
Abstract:In order to study the autonomous control problem of unmanned aerial vehicle (UAV) networks in emergency communication scenarios, multiple rotary-wing UAVs equipped with 6G base stations were used, and a low-altitude and single-layer UAV network was formed through the interconnection between UAVs, thus providing wireless network services to users in the ground task area. A numerical model was constructed for typical scenarios, and a multi-agent reinforcement learning method was used to solve the optimization control strategy of the UAV network. The effects of the number of UAV base stations and the communication distance of UAV base stations on the wireless network coverage in the task area were investigated. The research results indicate that the optimization control strategy obtained by using reinforcement learning methods can converge well. The learning curves of the UAV network coverage score and fairness coverage index have similar trends. The curves rapidly increase between the 1000th and 2000th episode and then change slowly. Under the conditions of a communication coverage distance of 1 km and a flight altitude of 300 m for UAV base stations, the UAV network coverage score increases by 53.28%, and the fairness coverage index increases by 43.57% when the number of UAV base stations increases from 3 to 7. Under the condition of five UAV base stations and a flight altitude of 300 m, the UAV network coverage score increases by 86.01%, and the fairness coverage index increases by 41.47% when the communication distance of the base stations increases from 1.0 km to 2.5 km.
-
轨底坡是铁路轨道的重要几何参数. 合理的轨底坡可以改善轮轨匹配关系,有效降低轮轨接触压力,减少轮轨磨耗,降低轮轨接触疲劳损伤,提高轮轨使用寿命,同时也可提高车辆运行的平稳性[1],但在线路设计、验收和维护过程中几乎很少关注轨底坡. 《高速铁路轨道工程质量验收标准》(TB 10745—2010)[2]中无轨底坡的验收标准,并且在日常的轨道养护维修规则中也未提及关于轨底坡的相关规定. 在线路精调过程中只保证钢轨垂向平顺度和轨距不平顺符合要求,不对轨底坡进行测量和精调.
关于轨底坡的研究从未间断过. 陶功权等[3]建立了B型地铁车辆动力学模型,从动力学角度提出了LM、S1002和 DIN5573 三种不同车轮型面最优的轨底坡匹配;同时从静力学分析的角度提出了地铁车轮型面的最优轨底坡匹配[4]. 陈超[5]分析了LM型面不同轨底坡与磨耗之间的关系,给出了直线段和曲线段的轨底坡推荐值. 周宇等[6]建立基于临界平面法的裂纹萌生寿命预测模型,研究了不同轨底坡对曲线段钢轨疲劳裂纹寿命的影响. 都敏等[7]通过建立弹塑性有限元模型,从轮轨接触应力角度分析了不同轨底坡对磨耗的影响. 刘鹏飞等[8]针对30 t轴重重载线路研究了LM车轮踏面在不同轨底坡下对轮轨接触几何关系,分析了车辆动态曲线通过时轮轨横向力、磨耗指数等因素的影响. 邓建辉等[9]采用不同钢轨材料与LM踏面相匹配,分析了在不同轨底坡条件下轮轨接触斑状态,观测了现场损伤情况. 司道林等[10]通过不同轨底坡条件下,CHN75钢轨与LM车轮踏面的静态轮轨接触,分析了轨道的曲线动态通过性能,给出了1∶20轨底坡适合重载铁路的结论. 李霞等[11]改进了三维接触几何参数算法和三维弹性体非赫兹接触理论,并对比分析了不同轨底坡对轮轨接触参数、摩擦功和接触应力等影响. 关庆华等[12]对比了标准轨底坡条件下,利用基于赫兹接触理论的法向接触刚度计算公式与经验方法的差异. 李霞等[13]对比分析了在两种轨底坡条件下LM和LMA车轮踏面与CHN60钢轨踏面匹配应力结果,得出LM-CHN60 和轨底坡1∶20、LMA-CHN60和轨底坡1∶40匹配较好的结论. 曾向荣等[1]通过国内外对铁路系统的轨底坡取值情况和现场光带的调查,提出了轨底坡建议值. 沈钢等[14]从减轻钢轨侧磨角度,分析了在曲线轨道上设置内外轨合理的轨底坡配比后车辆曲线通过时的滚动圆半径差和轮轮导向性能对侧磨的影响. Sadefhi等[15]基于理论分析和试验评价了轨底坡对铁路轨道几何条件的影响,提出了综合考虑轨底坡影响的轨道几何评价指数.
综上所述,过去对于轨底坡的研究均基于同一轨道上具有相同轨底坡的前提,研究轨底坡对轮轨接触关系和车辆动力学行为的影响. 针对线路中轨底坡存在一定离散性的情况,特别是同一轨道上出现轨底坡变化对车辆动力学行为的影响,值得深入研究. 本文在同一侧钢轨具有不同轨底坡的情况下,分析轨底坡变化对车辆动力学性能的影响,提出轨道线路轨底坡调整与维修的合理化建议,对现有轨道设计与工务维修提供参考.
1. 轮轨静态接触几何分析
轮轨静态接触几何计算是进行轮轨系统关系分析的基础. 迹线法是常用的轮轨接触几何关系计算方法,该方法的算法和数值实现过程参考文献[16-17]. 轮轨接触点分布分析是对现场轮轨接触光带预测的重要指标,同时轮轨接触点分布对车轮踏面磨耗分布具有非常重要的影响. 接触点过于集中会使得车轮磨耗过于集中,容易形成车轮凹磨,以及钢轨局部应力集中,影响车辆运行稳定性[18]. 图1计算了轨底坡从倾斜角度从1∶10到1∶100中的最大、中间和最小3种情况的轮轨接触点分布. 图中车轮廓形与钢轨廓形连接红线为轮轨接触点位置连线,车轮横移量标识在虚线上方数字(左移为正,单位:mm). 可以看出:随轨底坡角度变小轮轨接触点在钢轨表面位置从由外向轨距角内侧偏移,且接触区域逐渐变大. 由此可知:当轨底坡从1∶10突变到1∶100,接触光带将由窄变宽. 通过观测某客运专线一直线轨底坡波动区段同侧钢轨上接触光带,发现接触光带由钢轨中心外侧较窄变成较宽且覆盖轨顶,随后由较宽且覆盖轨顶变较窄的现象.
等效锥度是轮轨匹配除接触点以外的另一重要因素,也是轮对恢复对中能力的体现,图2给出了在不同轨底坡下等效锥度随轮对横移量的变化. 针对LMD型面与CHN60型面在不同的轨底坡匹配中,轨底坡在1∶10~1∶100变化,在横移量小于6 mm时等效锥度呈现从最小到最大(轨底坡1∶30的情况),随后趋于平稳的过程. 在横移量较小的情况下,轨底坡从1∶10到1∶30过程,等效锥度波动比较明显.
2. 轨底坡对车辆动力学性能的影响
2.1 车辆动力学模型
使用多体动力学软件SIMPACK建立某高速车辆动力学模型. 由于前后转向架采用相同的参数,采用SIMPACK子结构模型方式搭建整车模型. 该模型包括1个车体、2个构架、4条轮对、8个轴箱共15个刚体. 轮对通过一系悬挂、轴箱转臂与构架相连,轮对采用轴箱转臂定位方式,一系悬挂由钢弹簧、减振器组成,采用弹簧阻尼单元模拟. 构架通过二系悬挂与车体相连,二系悬挂包括2个空气弹簧、2个横向减振器和横向止挡、2个牵引拉杆、2个抗蛇行减振器和1个抗侧滚扭杆. 模型中考虑一系垂向减振器、二系横向减振器、抗蛇行减振器和横向止挡的非线性特性,其非线性特性见图3.
采用标准60 kg/m CHN60钢轨型面,轨距为1435 mm,采用实测轨底坡,车轮半径为420 mm,车轮型面为LMD,轮背内侧距为1353 mm. 采用沈氏理论计算轮轨蠕滑力,轮轨摩擦系数为0.35.
2.2 动力学仿真分析
轨道作为车辆运行的承载体,轨道参数的变化最为直观的表现则体现在车辆运行品质. 本文针对轨道养护中只关注高低、方向和水平不平顺,忽略轨底坡突变的情况,以车辆运行平稳性和舒适性作为评价指标,分析标准轨底坡和实测线路轨底坡的变化对车辆的影响. 线路轨底坡输入为国内某条运营速度200 km/h的客运专线直线段实测数据,此线路运行车辆为城际动车组. 本文测试区段为填充式垫板区段,测量间隔为25 m,测量结果如表1所示. 通过使用轨道几何尺寸检测小车与轨底坡测量仪检测发现,此段线路未发现轨面高低、方向、水平、扭曲等不平顺超标,但测量发现轨底坡发生较大变化. 通过对现场的观察发现造成轨底坡变化的原因有:线路中使用充填式垫板和橡胶垫板两种类型,充填式垫板充填不密实,设置角度发生变化;长时间运行后,充填式垫板发生压溃等;橡胶垫板,由于钢轨内外侧扣件扣压力不一致,即两侧基于扣件螺栓的扭矩不一致;在轨道精调过程中出现安装偏置的情况;橡胶垫板在使用过程中出现断裂等情况,以上情况均会出现轨底坡变化,其中充填式垫板中表现的轨底坡变化最为明显. 仿真中轨底坡布置分为标准轨底坡(1∶40)、对称布置轨底坡(即右轨轨底坡与实测左轨相同),非对称布置轨底坡(左、右轨均用实测轨底坡)3种情况. 曲线几何参数为客运专线实际曲线参数,曲线半径3500 m、超高125 mm、缓和曲线长 250 m. 轨底坡则采用直线工况对应轨底坡,采用京津线实测轨道不平顺作为轨道激励. 在计算过程中,为排除轮轨磨耗对计算结果的影响,轮轨型面均采用标准型面,同时根据实测轨道的位置,将钢轨的型面按照实测轨底坡情况进行旋转,保证不同截面钢轨最高点和横向轨距点位置均在同一平面上,按照测试纵向里程位置进行设置,即轨底坡参数体现在轨面数据旋转上,钢轨截面之间通过B样条曲线形成映射,保证截面之间的平顺.
表 1 实测线路轨底坡Table 1. Measured cants on tracks距离 /m 曲/直线段 距离 /m 曲/直线段 左轨 左轨 左轨 左轨 0 1∶40 1∶40 625 1∶35 1∶30 150 1∶40 1∶40 650 1∶50 1∶10 175 1∶10 1∶25 675 1∶20 1∶50 200 1∶15 1∶20 700 1∶40 1∶25 225 1∶25 1∶40 725 1∶25 1∶10 250 1∶45 1∶50 750 1∶45 1∶50 275 1∶65 1∶65 775 1∶40 1∶30 300 1∶100 1∶15 800 1∶40 1∶40 325 1∶40 1∶30 825 1∶20 1∶10 350 1∶35 1∶50 850 1∶50 1∶35 375 1∶10 1∶20 875 1∶30 1∶40 400 1∶40 1∶40 900 1∶15 1∶100 425 1∶30 1∶40 925 1∶65 1∶65 450 1∶50 1∶45 950 1∶50 1∶45 475 1∶10 1∶25 975 1∶40 1∶25 500 1∶25 1∶40 1000 1∶20 1∶15 525 1∶50 1∶20 1025 1∶25 1∶10 550 1∶10 1∶50 1050 1∶40 1∶40 575 1∶30 1∶35 1100 1∶40 1∶40 600 1∶20 1∶20 1200 1∶40 1∶40 针对不同的轨底坡设置,通过使用Hopf分岔的方法计算了车辆的临界速度,如图4所示,临界速度随轨底坡变化(从1∶10到1∶100)呈现先提高,到1∶40时达到最大,随后下降最后趋于平缓的趋势. 由此可见,轨底坡的波动变化势必引起车辆临界速度的改变,进而影响车辆的运行平稳性.
故针对同一轨道的轨底坡变化,计算得出车辆在直线和曲线线路条件下垂向和横向sperling平稳性指标分别如图5、6所示. 垂向、横向平稳性指标均小于2.5,达到GB 5599—2019[19]标准规定的“优”级. 车辆在直线和曲线线路上的垂向和横向平稳性均随速度线性增大,其中横向平稳性随速度影响较大;图5可知:直线段和曲线段垂向平稳性指标随速度增加较为缓和,直线段标准轨底坡情况下维持在0.8. 垂向平稳性指标在对称和非对称布置轨底坡情况较标准轨底坡情况,分别增加了32.96%和34.52%. 直线段轨底坡变化对车辆垂向平稳性影响较大,而曲线段影响比较小.
由图6可知:直线线路条件下横向平稳性大于垂向平稳性,对称不规则轨底坡布置和非对称不规则轨底坡布置的平稳性均大于标准轨底坡布置条件,与标准条件相比平稳性指标最大值增加40.65%,曲线条件下增加18.23%. 曲线段的平稳性在3种轨底坡条件下基本一致. 因为车辆以不同速度通过曲线时,由于欠/过超高的存在造成车辆自身的振动大于轨底坡的影响,而直线段的影响主要由轨底坡决定.
本文也根据UIC 513:1994[20]车辆乘坐舒适度标准对车辆的舒适性进行了分析,其直线段和曲线段运行的车辆舒适性和平稳性两者表征基本一致.
从图5、6可以看出:轨底坡的变化在直线段对车辆运行的影响较大,从车体的横向晃动水平也可以看出(图7):轨底坡角度差变化较大的区段,车体横向晃动也比较明显,且与轨底坡角度变化具有伴随状态. 针对车体横向晃动进行频率分析(图8),发现非对称变化轨底坡布置情况下车体晃动频率表现为1.33 Hz,对称变化轨底坡布置情况下为1.62 Hz;若车辆运行速度不变,轨底坡变化间隔缩短一倍,则车辆横向晃动频率则可能随之增加,引起车辆构架加速度报警,进而增加车辆横向晃动的风险. 在曲线段同样存在车辆从过超高进入欠超高状态,发生车轮向曲线外侧横移加之高低股轨底坡差异,造成滚动圆半径差的突变,会加剧车辆的横向晃动.
3. 轨底坡变化对车轮磨耗和滚动接触疲劳分析
本节主要研究同一线路(直线、曲线)轨底坡变化对车辆运行中车轮磨耗和滚动接触疲劳的影响. 采取与上一节一致的工况条件,均针对导向车轮,利用磨耗指数和疲劳损伤指数作为评价指标.
3.1 车轮磨耗分析
采用磨耗指数作为车轮磨耗评价指标,以此分析同一轨道不同轨底坡对车轮磨耗的影响. 其中,第
$i\;\;{\text{(}}i = 1,2, \cdots ,8{\text{)}}$ 个车轮每一个计算时间步t下的磨耗指数为Wi,t=|Tx,iγx,i|+|Ty,iγy,i|, (1) 式中:
$ T_{x,i}^{} $ 、$ T_{y,i}^{} $ 分别为第i个车轮纵向和横向蠕滑力;$ \gamma _{x,i}^{} $ 、$ \gamma _{y,i}^{} $ 分别为第i个车轮接触斑处纵向和横向蠕滑率.然后再利用式(2)计算车辆通过直线或曲线时第 i 个车轮经过 N 个时间步后磨耗指数移动均方根(root mean square, RMS)值为
WRMS,i=√N∑n=1W2i,ntN, (2) 式中:
${W_{i,nt}}$ 为第 i 个车轮的 n 个时间步下的磨耗指数.利用式(1)、(2)计算不同轨底坡布置条件下轮轨磨耗指数均方根值,
$ N $ 取值为500. 由于导向轮对轮轨间相互作用更为剧烈,所以本文采用导向轮的计算结果来讨论不同轨底坡布置对车轮磨耗的影响,利用导向轮磨耗指数最大RMS值统计分析变化规律.图9为车辆以250 km/h 的速度在直线段不同轨底坡布置的车轮磨耗指数对比结果. 同一轮对左右轮的磨耗指数基本一致,但受到轨道坡非对称布置的影响比较大,磨耗指数随着相连钢轨轨底坡的变化而发生变化,且随着非对称布置的轨底坡偏差大而发生在后一段钢轨上,这由于经历轨底坡的大变化,车轮与钢轨接触点发生较大跳跃,造成左右轮径差发生变化,使得车辆发生横向较大蠕滑和横移,增大轮轨间的磨耗指数.
直线段不同轨底坡布置车轮的最大磨耗指数均随速度增加而增加(如图10所示),左右轮的磨耗指数相差较小. 其中在速度大于180 km/h条件下,非对称布置轨底坡对车轮磨耗指数的影响均大于对称布置,同时也大于标准布置轨底坡,两种轨底坡变化情况相对于标准轨底坡情况最大磨耗指数分别增加136.71%和27.65%;轨底坡对称布置和标准轨底坡布置对车轮磨耗指数的影响随速度缓慢增加后加速发展. 非对称布置情况则随速度成指数形式增长. 由图9、10可知:轨底坡非对称布置在直线条件下受速度影响较大.
与直线段的表征不同,由于车辆通过曲线段的欠/过超高情况下,轨底坡的不规则的影响小于曲线参数设置对车辆的影响,故出现了不同轨底坡设置的磨耗指数在速度250 km/h时相一致的情况. 从图11可以看出:导向轮最大磨耗指数也表现为随速度成线性增加的趋势.
3.2 车轮滚动接触疲劳分析
本文采用基于安定图基础上EKBERG提出的表面疲劳指数来评价轮轨接触状态的疲劳程度,从而考量轨道不同轨底坡对车轮表面疲劳的影响. 车轮表面疲劳指数如式(3)所示.
δsurf=μ−2πabk3Fz, (3) μ=√T2x+T2yFz, (4) 式中:μ为轮轨接触位置的牵引系数; a和b分别为轮轨椭圆接触斑的短半轴和长半轴;k为材料纯剪切屈服强度;Fz为轮轨接触斑处法向力;
${T_{x}}$ 和${T_{y}}$ 分别为轮轨接触斑处纵向蠕滑力和横向蠕滑力.由式(3)、(4)可知:轮轨较差的牵引和导向性能(使得纵向/横向蠕滑力数增大)或较糟糕的轮轨几何接触关系(接触斑面积小或轮轨法向力大)均可导致表面疲劳指数增大,加速轮轨材料的疲劳破坏. 表面疲劳指数是基于安定图提出的,因此不能预测轮轨材料的疲劳寿命,而是评价轮轨材料表面发生疲劳损坏的可能性;
$ {\delta _{{\text{surf}}}} $ > 0, 此时轮轨材料变形将发生棘轮效应,塑性变形会持续累积,即能预测表面疲劳出现的可能性.不同速度等级下的车轮疲劳指数如图12所示. 由图12(a)可知:直线段非对称轨底坡布置的表面疲劳指数在不同速度条件下均大于对称轨底坡布置,对称轨底坡布置大于标准轨底坡布置条件,其中非对称布置条件下的车轮表面疲劳指数在0.175左右波动,对称布置条件下车轮表面疲劳指数在1.600左右波动,而标准轨底坡布置则在1.400左右波动.
直线段对称变化和非对称轨底坡布置的左轮表面疲劳指数的最大值比标准条件分别增大25.14%和15.86%;右侧车轮的表面疲劳指数分别增大24.96%和18.29%.
由图12(b)可知:对于曲线段内轨侧车轮,表面疲劳指数在3种轨底坡布置条件下,均随速度增加发生较大的线性增加,且增加幅度一致. 而高股车轮表面疲劳指数基本维持不变,非对称布置条件车轮表面疲劳指数略大于其他两种轨底坡布置情况.
4. 结 论
本文从轮轨关系和车辆动力学两个方面分析了轨底坡变化对车辆动力学行为和轮轨损伤的影响. 从车辆运行的角度分析轨道养护维修的策略. 研究结果表明:
1) 直线段和曲线段在同一轨道上采用对称和非对称轨底坡布置,其车辆垂向、横向平稳性和舒适性指标均大于采用标准轨底坡布置情况. 其中直线段同一轨道对称和非对称轨底坡布置对车辆的平稳性影响较大. 在曲线段同一轨道对称和非对称轨底坡布置对车辆的横向平稳性影响较大.
2) 直线段不同轨底坡布置车轮的最大磨耗指数均随速度呈指数函数增加,左右轮的磨耗指数相差较小. 曲线段不同轨底坡布置车轮的最大磨耗指数均随速度呈线性增加且均大于直线段. 故车辆通过欠/过超高情况下,轨底坡的不规则的影响小于曲线参数设置对车辆的影响.
3) 在直线段相对于标准布置轨底坡的车轮疲劳指数最小,对称轨底坡布置小于非对称布置,三种情况车轮疲劳指数受速度影响较小. 曲线段低股侧车轮表面疲劳指数则与速度成线性增加的趋势,高股侧车轮则受速度影响较小.
综上所述,直线段的轨底坡变化对车辆动力学行为的影响最为直接. 在线路设计、施工、动静态验收和日常养护维修中,从车辆运行的平稳性和舒适性,以及车轮的磨耗以损伤角度,需要对同一轨道内的轨底坡变化予以关注. 在线路维修中针对同一轨道内轨底坡变化情况,如果不方便进行轨底坡调整时可以采用钢轨打磨的方式进行轨面调整,以满足轨底坡的要求.
-
表 1 仿真实验参数数值
Table 1. Parameters for simulation experiment
参数名称 数值 无人机基站数量/个 3 任务地域的长、宽/km 4、4 任务地域划分的方格数量/个 100 重点保障方格数量/个 5 无人机基站覆盖距离/km 1 无人机基站飞行高度/m 300 无人机基站最大飞行速度/(m·s−1) 20 重点方格覆盖得分 10 一般方格覆盖得分 1 无人机基站飞出边界处罚值 1 无人机基站间碰撞处罚值 1 表 2 强化学习主要参数
Table 2. Main parameters for reinforcement learning
参数名称 数值 神经网络层数/层 2 隐藏网络节点数/个 64 学习率 0.01 折扣因子 0.95 $\tau $ 0.99 batch size 1000 -
[1] 陈新颖,盛敏,李博,等. 面向6G的无人机通信综述[J]. 电子与信息学报,2022,44(3): 781-789. doi: 10.11999/JEIT210789CHEN Xinying, SHENG Min, LI Bo, et al. Survey on unmanned aerial vehicle communications for 6G[J]. Journal of Electronics & Information Technology, 2022, 44(3): 781-789. doi: 10.11999/JEIT210789 [2] 向庭立,王红军,杨刚,等. 分布式无人机网络覆盖优化算法[J]. 空军工程大学学报(自然科学版),2019,20(4): 59-65.XIANG Tingli, WANG Hongjun, YANG Gang, et al. Research on distributed UAV network coverage optimization algorithm[J]. Journal of Air Force Engineering University (Natural Science Edition), 2019, 20(4): 59-65. [3] 王巍,梁雅静,刘阳,等. 城市灾区无人机网络自适应覆盖优化算法[J]. 计算机工程与应用,2022,58(14): 258-268. doi: 10.3778/j.issn.1002-8331.2010-0211WANG Wei, LIANG Yajing, LIU Yang, et al. Adaptive coverage optimization algorithm for drone network in urban disaster areas[J]. Computer Engineering and Applications, 2022, 58(14): 258-268. doi: 10.3778/j.issn.1002-8331.2010-0211 [4] 王超. 基于强化学习的无线网络移动性管理技术研究[D]. 合肥: 中国科学技术大学,2021. [5] 靳晓洁,石建迈,伍国华,等. 无人机基站部署问题综述:模型与算法[J]. 控制理论与应用,2022,39(12): 2219-2232.JIN Xiaojie, SHI Jianmai, WU Guohua, et al. Review of the UAV base station deployment problem: models and algorithms[J]. Control Theory & Applications, 2022, 39(12): 2219-2232. [6] 郭艺轩,贾向东,曹胜男,等. 三维动态无人机网络覆盖性能与信道容量分析[J]. 重庆邮电大学学报(自然科学版),2022,34(4): 662-668. doi: 10.3979/j.issn.1673-825X.202101080012GUO Yixuan, JIA Xiangdong, CAO Shengnan, et al. Analysis of 3D dynamic UAV network coverage performance and channel capacity[J]. Journal of Chongqing University of Posts and Telecommunications (Natural Science Edition), 2022, 34(4): 662-668. doi: 10.3979/j.issn.1673-825X.202101080012 [7] 吕忠昊. 基于强化学习的无人机通信系统容量优化研究[D]. 合肥: 中国科学技术大学,2021. [8] 蒋逸凡,郭婧,费泽松. 多层高度的无人机-地面异构网络的覆盖性能[J]. 无线电通信技术,2021,47(5): 649-654. doi: 10.3969/j.issn.1003-3114.2021.05.020JIANG Yifan, GUO Jing, FEI Zesong. Coverage performance of UAV-terrestrial heterogeneous network with multiple altitudes[J]. Radio Communications Technology, 2021, 47(5): 649-654. doi: 10.3969/j.issn.1003-3114.2021.05.020 [9] 崔壮壮. 面向空地通信的无线信道特性和建模研究[D]. 北京: 北京交通大学,2022. [10] 马张枫. 面向B5G/6G无线网络的无人机信道建模研究[D]. 北京: 北京交通大学,2022. [11] 王莉,魏青,徐连明,等. 面向通信-导航-感知一体化的应急无人机网络低能耗部署研究[J]. 通信学报,2022,43(7): 1-20.WANG Li, WEI Qing, XU Lianming, et al. Research on low-energy-consumption deployment of emergency UAV network for integrated communication-navigating-sensing[J]. Journal on Communications, 2022, 43(7): 1-20. [12] 夏景明,刘玉风,谈玲. 基于蜂窝网络的多无人机能量消耗最优化算法研究[J]. 通信学报,2023,44(2): 185-197.XIA Jingming, LIU Yufeng, TAN Ling. Research on multi-UAV energy consumption optimization algorithm for cellular-connected network[J]. Journal on Communications, 2023, 44(2): 185-197. [13] 窦邵婷. 无人机辅助移动边缘计算的空地能耗折衷研究[D]. 南昌: 南昌大学,2022. [14] LIU C H, CHEN Z Y, TANG J, et al. Energy-efficient UAV control for effective and fair communication coverage: a deep reinforcement learning approach[J]. IEEE Journal on Selected Areas in Communications, 2018, 36(9): 2059-2070. doi: 10.1109/JSAC.2018.2864373 [15] LIU C H, MA X X, GAO X D, et al. Distributed energy-efficient multi-UAV navigation for long-term communication coverage by deep reinforcement learning[J]. IEEE Transactions on Mobile Computing, 2020, 19(6): 1274-1285. doi: 10.1109/TMC.2019.2908171 [16] QI H, HU Z Q, HUANG H, et al. Energy efficient 3-D UAV control for persistent communication service and fairness: a deep reinforcement learning approach[J]. IEEE Access, 2020, 8: 53172-53184. doi: 10.1109/ACCESS.2020.2981403 [17] JAIN R K, CHIU D M W, HAWE W R. A quantitative measure of fairness and discrimination for resource allocation in shared computer system[R]. Hudson MA: Digital Equipment Corporation, 1984. [18] LOWE R, WU Y, TAMAR A, et al. Multi-agent actor-critic for mixed cooperative-competitive environments [C]//Proceedings of the 31st International Conference on Neural Information Processing Systems. Long Beach: ACM, 2017: 6382-6393. -