Influence of Location Frequency on Travel Mode Extraction Using Cellular Phone Data
-
摘要:
作为影响手机信令数据定位质量的关键因素,定位频率对交通方式的识别精度具有重要影响. 为量化定位频率与交通方式识别精度之间的变化规律,首先,提出一种基于随机森林的交通方式识别模型;其次,在通信运营商的协助下,通过开展实地数据采集实验,完成手机信令数据及对应真实出行信息的同步采集,并利用该数据集对本文提出的交通方式识别模型进行验证;最后,通过数据抽样形成一系列拥有不同定位频率的手机信令数据集,利用该系列数据集对不同定位频率下的交通方式识别精度进行评估研究. 研究结果表明:本文模型对步行、非机动车、汽车和公共交通4种交通方式的总体识别准确率为79.2%;每种交通方式对定位频率的敏感性不同,其中非机动车与公交的敏感性更高,步行和汽车的敏感性相对较低;随着平均定位频率从48 s/条下降至241 s/条,非机动车和公交的整体识别精度下降幅度分别约为19.2%和21.5%,而步行与汽车的整体识别精度则分别下降12.8%与11.5%;综合考虑识别准确率与计算效率两方面的需求,建议将60 s/条作为用户筛选与数据抽样的最佳阈值.
Abstract:As a key factor affecting location quality of cellular phone data, location frequency has an important influence on the extraction accuracy of travel mode. In order to quantify the change rule between the location frequency and accuracy of travel mode extraction, a travel mode extraction model based on random forest is proposed. Second, with the help of communication operators, through a field data collection, individual cellular phone data and corresponding real travel information were simultaneously acquired. The dataset is used to verify the travel mode extraction model. Finally, a series of cellular phone datasets with different location frequencies are built through data sampling. With this series of datasets, the extraction accuracy of traffic modes under different location frequencies is evaluated. The evaluation results show that the overall extraction accuracy for walking, non-motorized vehicles, cars, and buses is 79.2%, and the sensitivity of each travel mode to location frequency is different. The sensitivity of non-motorized vehicles and buses is higher, and the sensitivity of walking and cars is relatively low. As the location frequency is decreased from 48 seconds per data to 241 seconds per data, the overall accuracy of non-motorize vehicles and buses is decreased by 19.2% and 21.5%, respectively, while that of walking and car is decreased by 12.8% and 11.5%, respectively. Owning to the requirements of extraction accuracy and computing efficiency, 60 seconds per data is recommended as the optimal threshold for user screening and data sampling.
-
Key words:
- intelligent traffic /
- travel mode /
- cellular phone data /
- location frequency /
- random forest
-
近年来,传感器有限的能量遏制着无线传感器网络(wireless sensor networks, WSN)的永续发展. 且当传感器节点的电池寿命即将结束时,常常会发生传感错误和链路故障. 因此,延长传感器节点的生命周期并维持其感知性能是WSN中的一个主要问题[1-2].
随着射频能量收集(radio frequency energy harvesting, RF-EH)技术[3]的不断发展,使得受限于能量的WSN可以实现自持作业. 然而,传感器节点与目的节点之间常常由于地形地貌、建筑物、距离等原因以及受路径衰落的影响,导致无线链路被阻塞或不存在直达路径,影响系统覆盖范围[4].于是,基于无线携能通信(simultaneous wireless information and powertransfer, SWIPT)的中继协作系统备受关注. 文献[5]随机地在蜂窝网络中部署能量站(power beacon, PB),建立随机几何模型,并研究数据链路中断约束下的混合网络部署问题. 文献[6]研究了双向能量收集(energy harvesting, EH)中继网络中联合波束赋形设计与时隙切换(time switching, TS)策略问题. 文献[7]将解码转发全双工中继网络中的中继能量建模为二级马尔可夫链,获得贪婪切换策略下的最优功率分配(power splitting, PS)因子,并以精确积分的形式推导相应的中断概率. 文献[8]研究了多径瑞利衰落信道下基于缓冲器辅助差分混沌移位键控的SWIPT中继系统,通过采用Meijer G函数和Gauss-Hermite算法,得到误码率和平均延迟的闭式表达式. 文献[9]针对基于SWIPT的全双工中继网络的最优中继选择问题,利用Karush-Kuhn-Tucker (KKT)条件和拉格朗日函数分别对最优中继选择及发射功率控制进行优化. 文献[10]考虑一种联合直连链路与中继链路的数据传输系统,推导选择式合并(selection combining, SC)策略下的系统中断概率表达式. 文献[11]针对多天线目的节点的中继通信网络提出4种协议,即静态TS因子下的SC、静态TS因子下的最大比合并(maximal ratio- combining, MRC)、最佳动态TS因子下的SC和最佳动态TS因子下的MRC,较为全面地研究系统的中断性能.
值得注意的是,以上文献研究的场景较为理想化,假设所有节点均能获得足够的初始能量,从而保持系统始终处于激活状态;在SWIPT多中继协作系统中[12-13],并未对目的节点采用多天线时的吞吐量(throughput, TH)性能进行优化分析. 鉴于此,本文针对EH-WSN系统提出基于PS策略的SWIPT多中继通信模型,研究联合优化TS因子与PS因子的吞吐量最大化中继选择算法,评估系统的中断性能.
1. 系统模型
本文考虑一种基于PS-SWIPT的EH-WSN系统模型,如图1所示. 该系统包括1个射频PB、N个传感器节点(1,2,⋯,j,⋯,N)、K个中继节点Ri (i = 1,2,⋯,K)和1个目的节点D. 每个传感器节点安设单天线,中继节点安设2根天线、目的节点安设M根天线. 假设传感器节点在半双工(half-duplex, HD)模式下工作,中继节点在全双工模式下工作[14]. 图中:hj为PB与传感器节点j之间的链路信道系数,hS,Ri、hRi,Dm分别为源节点S到中继节点Ri、Ri到目的节点D第m根天线的链路信道系数.
PB周期性地广播射频(radio frequency,RF)波,系统模型所有传感器节点和中继节点都从该RF信号中获取能量. 传感器节点j作为源节点S,经由中继节点Ri将传感信息传输到目的节点D. 假设无线信道为多径独立的Rayleigh衰落信道,且令信道系数在一个通信周期T内保持不变,而在不同时隙间独立变化[15]. |hj|2、|hS,Ri|2、|hRi,Dm|2服从均值分别为λj、λS,Ri、λRi,Dm的指数分布,例如λj=dj−ξ. 其中,dj为PB与传感器节点j之间的距离,ξ为路径损耗指数.
基于PS-SWIPT的EH-WSN系统模型采用时分广播(time division broadcasting, TDBC)协议. 1个通信周期T分为2个时隙. 第1个时隙(1−θ)T内 (0<θ<1),传感器节点和中继节点同时从PB发出的RF信号中收集能量;第2个时隙θT为传感器节点的协作传输阶段,传感器节点j作为源节点S以SWIPT方式将信息和能量同时传输至中继节点,中继节点再以解码转发方式将信息传输至目的节点D.TS因子θ控制着能量接收时隙长度和信息接收时隙长度,是重要的动态优化参数.
第1个时隙(1−θ)T:单天线传感器节点j 收集到的能量为[16]
Eharj=η|hj|2P(1−θ)T, (1) 式中:η为能量转化效率(0<η<1),P为PB的发射功率.
第2个时隙θT:传感器节点j作为源节点S的发射功率为
PS=EharjθT=η|hj|2P(1−θ)θ=k|hj|2P, (2) 式中:k=η(1−θ)/θ.
中继节点Ri接收来自源节点S的信号为
yRi=√PShS,RixS+√PRihRi,RixRi+nRi,a, (3) 式中:xS∈C,C为满足E{|xS|2}=1的源节点S发送信号;PRi是Ri的发射功率;xRi∈C,为Ri发送的信号;nRi,a为Ri处的加性高斯白噪声,服从独立同分布的复高斯随机变量,nRi,a ~ CN(0,σ2nRi,a);hRi,Ri为中继节点Ri的环回链路信道系数;√PRihRi,RixRi为Ri的环回自干扰信号.
基于PS因子ρi∈(0,1),Ri的接收信号yRi分为两部分:ρi部分用于信息传输,1−ρi部分用于能量收集. 信息传输信号yIDRi和能量收集信号yEHRi分别为
yIDRi=√ρiyRi+nRi,P=√ρi(√PShS,RixS+√PRihRi,RixRi+nRi,a)+nRi,P, (4) yEHRi=√1−ρiyRi=√1−ρi(√PShS,RixS+√PRihRi,RixRi+nRi,a), (5) 式中:nRi,P为Ri发射产生的人为噪声,且nRi,P ~CN(0,σ2nRi,P).
自干扰消除后[17],Ri的接收信号更替为
yID−SICRi=√ρi(√PShS,RixS+nRi,a)+nRi,P. (6) 由式(2)、(6),Ri的接收信噪比(signal-to-noise ratio, SNR)为
γRi=ρiPS|hS,Ri|2ρiσ2nRi,a+σ2nRi,P=ρik|hj|2P|hS,Ri|2ρiN0+N0=ρik|hj|2|hS,Ri|2Φρi+1, (7) 式中:σ2nRi,a=σ2nRi,P=N0(常数),Φ≜P/N0.
因能量部署站PB和中继节点的位置是固定的,单位发射功率下,假设每个中继节点在T内接收到的平均能量是Qavg,则在PB发射功率为P且能量收集时间为(1−θ)T时,中继节点Ri收集到的能量为QavgP(1−θ)T. 忽略中继节点Ri收集过程中噪声产生的微弱能量[8],则Ri收集了PB的能量,接收了源节点S发射信号的能量,并对自干扰信号进行能量自回收,最终收集的总能量为
ERi=ESWIPTRi+ηQavgP(1−θ)T, (8) 式中:ESWIPTRi=η(1−ρi)(k|hj|2P|hS,Ri|2+PRi|hRi,Ri|2)θT,为从源节点处收集到的能量.
当中继节点Ri将最终收集的能量ERi均用于发射,发射功率PRi=ERiθT. 假设T = 1,化简得到
PRi=η(1−ρi)k|hj|2P|hS,Ri|2θ+ηQavgP(1−θ)θ−η(1−ρi)|hRi,Ri|2θ. (9) 1.1 目的节点D采用SC策略
目的节点D采用SC策略时,节点D处第m根天线的接收信号为
ySCRi,Dm=√PRihRi,DmxRi+nDm, (10) 式中:nDm为加性高斯白噪声,且nDm~N(0,σ2nDm).
令σ2nDm=N0,则节点D第m根天线处的SNR为
γSCDm=PRimax|hRi,Dm|2σ2nDm=[η(1−ρi)k|hj|2P|hS,Ri|2θ+ηQavgP(1−θ)]max|hRi,Dm|2N0θ[1−η(1−ρi)|hRi,Ri|2]. (11) 目的节点D采用SC策略时,选取最佳天线数为
m∗=argmax1⩽ (12) 设变量Z的累积分布函数(cumulative distribution function, CDF)函数和概率密度函数(probability density function, PDF)分别为FZ(z)和fZ(z) ,令 Z = \mathop {\max }\limits_{m = 1,2, \cdots ,M} {\text{\{ }}|{h_{{{{R}}_i},{{{D}}_m}}}{|^2}{\text{\} }} ,则
{F}_{Z}({\textit{z}})=1+{\displaystyle \sum _{m=1}^{M}{\left(-1\right)}^{m}}{\text{C}}_{M}^{m}{\text{e}}^{-m{\textit{z}}{\lambda }_{{{R}}_{i},{{D}}_m}}\text{,} (13) {f_Z}({\textit{z}}) = {\lambda _{{{{R}}_i},{{{D}}_m}}}\sum\limits_{m = 1}^{M - 1} {{{\left( { - 1} \right)}^m}} {\text{C}}_{M - 1}^m{{\text{e}}^{ - (m + 1){\textit{z}}{\lambda _{{{{R}}_i},{{D}}_m}}}}, (14) 式中: {\text{C}}_M^m = \displaystyle\frac{{M!}}{{m!(M - m)!}} .
1.2 目的节点D采用MRC策略
目的节点D采用MRC策略时,可合并来自M根天线的信号,其接收信号为
y_{{{{R}}_{i},}{{D}}}^{{\text{MRC}}} = \sum\limits_{m = 1}^M {\sqrt {{P_{{{{R}}_i}}}} {h_{{{{R}}_i},{{{D}}_m}}}{x_{{{{R}}_i}}}} + {n_{{D}}}, (15) 式中:{n_{{D}}}为加性高斯白噪声,且{n_{{D}}}~N(0,{\sigma _{{n_{{D}}}}^2}) .
根据式(9)、(15),并令\sigma _{{n_{{D}}}}^2 = {N_0},得到节点D的SNR为
\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\gamma _{{D}}^{{\text{MRC}}} = \frac{{\displaystyle\sum\limits_{m = 1}^M {{P_{{{{R}}_i}}}|{h_{{{{R}}_i},{{{D}}_m}}}{|^2}} }}{{\sigma _{{n_{{D}}}}^2}} = \frac{{\left[ {\eta \left( {1 - {\rho _i}} \right) {k|{h_j}{|^2}P|{h_{{{S}},{{{R}}_i}}}{|^2}} \theta + \eta {Q_{{\rm{avg}}}}P(1 - \theta )} \right]\displaystyle\sum\limits_{m = 1}^M {|{h_{{{{R}}_i},{{{D}}_m}}}{|^2}} }}{{{N_0}\left[ {\theta - \eta \left( {1 - {\rho _i}} \right)|{h_{{{{R}}_i},{{{R}}_i}}}{|^2}\theta } \right]}} \text{.} (16) 令 W = \displaystyle\sum\limits_{m = 1}^M {|{h_{{R_i},{D_m}}}{|^2}} ,其PDF为
{f_W}(w) = \frac{{{{\lambda^M _{{{{R}}_i},{{D}}}}}}}{{(M - 1)!}}{w^{M - 1}}{{\rm{e}}^{ - w{\lambda _{{{{R}}_i},{{D}}}}}} . (17) 2. 中断概率与吞吐量分析
2.1 目的节点D采用SC策略
在基于PS-SWIPT的EH-WSN系统中,目的节点D采用SC策略的中断概率可表示为[18]
\; \; \; \; \;\; \; \; \;\; \; \; \; \; \;\; \; \; \; \; \; \; \; \; \; \; \;\begin{split} &{P_{{\rm{out}}}}{,_{{\text{SC}}}} \triangleq P_{\rm{r}} (\gamma _{{\rm{e2e}}}^{{\text{SC}}} < {\gamma _{{\rm{th}}}}) = {P_{\rm{r}}}\left(\mathrm{min}\left\{\frac{{\rho }_{i}{P}_{{{S}}}|{h}_{{{S}},{{{R}}}_{i}}{|}^{2}}{{\rho }_{i}{\sigma }_{{n}_{{{{R}}}_{i}}}^{2} + {\sigma }_{{n}_{{{{R}}}_{i},{\rm{P}}}}^{2}},\frac{{P}_{{{{R}}}_{i}}\mathrm{max}\;|{h}_{{{{R}}}_{i},{{{D}}}_{m}}{|}^{2}}{{\sigma }_{{n}_{{{{D}}}_{m}}}^{2}}\right\} < {\gamma }_{{\rm{th}}}\right)=\\ & \quad 1-{P_{\rm{r}}}\left(\frac{{\rho }_{i}{P}_{{{S}}}|{h}_{{{S}},{{{R}}}_{i}}{|}^{2}}{{\rho }_{i}{N}_{0} + {N}_{0}}\geqslant {\gamma }_{{\rm{th}}}\text{,}\frac{{P}_{{{{R}}}_{i}}\mathrm{max}\;|{h}_{{{{R}}}_{i},{{{D}}}_{m}}{|}^{2}}{{N}_{0}}\geqslant {\gamma }_{{\rm{th}}}\right)=1-{P_{\rm{r}}}\left(\frac{{\rho }_{i}k\left|{h}_{j}{|}^{2}\right|{h}_{{{S}},{{{R}}}_{i}}{|}^{2}\varPhi }{{\rho }_{i} + 1}\geqslant {\gamma }_{{\rm{th}}}\text{,}\right.\\ &\quad \left.\frac{\left[\eta \left(1-{\rho }_{i}\right)k\left|{h}_{j}{|}^{2}\right|{h}_{{{S}},{{{R}}}_{i}}{|}^{2}\theta + \eta {Q}_{{\rm{avg}}}(1-\theta )\right]\varPhi\; \mathrm{max}\;|{h}_{{{{R}}}_{i},{{{D}}}_{m}}{|}^{2}}{\theta -\eta \left(1-{\rho }_{i}\right)|{h}_{{{{R}}}_{i},{{{R}}}_{i}}{|}^{2} \theta } \geqslant {\gamma }_{{\rm{th}}}\right),\end{split} (18) 式中:Pr(·)为概率, \gamma _{{\rm{e2e}}}^{{\text{SC}}} \triangleq \min \{{\gamma _{{{{R}}_i}}},\gamma _{{{{D}}_m}}^{{\text{SC}}}\} , {\gamma _{{\rm{th}}}} 为预设SNR阈值.
令 X=\left|h_{j}\right|^{2}\left|h_{{{S}},{{R}}_{i}}\right|^{2} ,则其CDF为
\begin{split} & {F_X}(x) = {P_{\rm{r}}}\left( {X < x} \right) = {P_{\rm{r}}}\left( {|{h_j}{|^2} < \frac{x}{{|{h_{{{S}},{{{R}}_i}}}{|^2}}}} \right) =\\ &\quad\displaystyle\int_0^\infty {{F_{|{h_j}{|^2}}}} \left( {\frac{x}{{|{h_{{{S}},{{{R}}_i}}}{|^2}}}} \right) {f_{|{h_{{{S}},{{{R}}_i}}}{|^2}}}(|{h_{{{S}},{{{R}}_i}}}{|^2}){\rm{d}}|{h_{{{S}},{{{R}}_i}}}{|^2} =\\ & \quad1 - 2\sqrt {{\lambda _j}{\lambda _{{{S}},{{{R}}_i}}}x} {K_1}\left( {2\sqrt {{\lambda _j}{\lambda _{{{S}},{{{R}}_i}}}x} } \right) \text{,} \end{split} (19) 式中: {K_v} (·)为第二类v阶修正贝塞尔函数.
令 t = {\rho _i} + 1 , d = {\rho _i}k\varPhi , a = \eta (1 - {\rho _i})k\theta , b = \eta {Q_{{\rm{avg}}}}\times (1 - \theta ) , c = \theta - \eta (1 - {\rho _i})|{h_{{R_i},{R_i}}}{|^2}\theta ,则式(18)可以等价转化为
\begin{split} &{P}_{{\rm{out}}\text{,SC}}=1-{P_{\rm{r}}}\left(\frac{d\left|{h}_{j}{|}^{2}\right|{h}_{{{S}},{{{R}}}_{i}}{|}^{2}}{t}\geqslant {\gamma }_{{\rm{th}}}\text{,}\right.\\ &\quad\left.\frac{ \left(a\left|{h}_{j}{|}^{2}\right|{h}_{{{S}},{{{R}}}_{i}}{|}^{2} + b\right) \varPhi\;\mathrm{max}\;|{h}_{{{{R}}}_{i},{{{D}}}_{m}}{|}^{2} }{c}\geqslant {\gamma }_{{\rm{th}}}\right) =\\ &\quad 1-{P_{\rm{r}}}\left(X\geqslant \frac{{t\gamma }_{{\rm{th}}} }{d}\text{,}Z\geqslant \frac{{\gamma }_{{\rm{th}}} c}{(ax + b)\varPhi }\right)=\\ &\quad1-{\displaystyle {\int }_{\frac{{t\gamma }_{{\rm{th}}} }{d}}^{\infty }\left({\displaystyle {\int }_{\frac{{c\gamma }_{{\rm{th}}} }{(ax + b)\varPhi }}^{\infty }{f}_{Z}({\textit{z}})}{\rm{d}}{\textit{z}}\right)} {f}_{X}(x){\rm{d}}x =\\ &\quad1 - \int_{\frac{{{t\gamma _{{\rm{th}}}} }}{d}}^\infty {\left( {\sum\limits_{m = 1}^M {{{\left( { - 1} \right)}^{m + 1}}{\rm{C}}_M^m} {{\rm{e}}^{ - {\lambda _{{{{R}}_{i,}}{{D}}_m}}\frac{{{\gamma _{{\rm{th}}}} cm}}{{(ax + b) \varPhi}}}}} \right)} {f_X}(x){\rm{d}}x{\text{ }} . \end{split} (20) 通过使用文献[19]中的等式(8.486,18),可以计算得
{f_X}(x) = \frac{{{\rm{d}} {{F_X}(x)} }}{{{\rm{d}}x}} = 2{\lambda _j}{\lambda _{{{S}},{{{R}}_i}}}{K_0}\left( {2\sqrt {{\lambda _j}{\lambda _{{{S}},{{{R}}_i}}}x} } \right) . (21) 将式(21)代入式(20),得到
\begin{split} & {P_{{\rm{out}}{\text{,SC}}}} = 1 - \displaystyle\int_{\frac{{{t\gamma _{{\rm{th}}}} }}{d}}^\infty {\left( {\sum\limits_{m = 1}^M {{{\left( { - 1} \right)}^{m + 1}}{\rm{C}}_M^m} {{\rm{e}}^{ - {\lambda _{{{{R}}_{i,}}{{D}}_m}}\frac{{{\gamma _{{\rm{th}}}} cm }}{{(ax + b)\varPhi }}}}} \right)} \times \\ &\quad \left[ {2{\lambda _j}{\lambda _{{{S}},{{{R}}_i}}}{K_0}\left( {2\sqrt {{\lambda _j}{\lambda _{{{S}},{{{R}}_i}}}x} } \right)} \right]{\rm{d}}x . \end{split} (22) 根据解码转发协议,目的节点采取SC接收策略下的吞吐量为
T_{{{\text{H,SC}}}} = \theta {\log _2}(1 + \min \{{\gamma _{{{{R}}_i}}},\gamma _{D_m}^{{\text{SC}}}\}) \text{.} (23) 2.2 目的节点D采用MRC策略
目的节点D采用MRC策略的中断概率为
\begin{split} & {P_{{\rm{out}}{\text{,MRC}}}} \triangleq P_{\rm{r}} (\gamma _{{\rm{e2e}}}^{{\text{MRC}}} < {\gamma _{{\rm{th}}}}) =1 - \displaystyle\int_{\frac{{{t\gamma _{{\rm{th}}}} }}{d}}^\infty 2{\lambda _j}{\lambda _{{{S}},{{{R}}_i}}}\times \\ &{K_0}\left( {2 \sqrt {{\lambda _j}{\lambda _{{{S}},{{{R}}_i}}}x} } \right) \Biggl({30} \frac{{ \Gamma (M)}}{{(M - 1)!}} -\frac{1}{{(M - 1)!}} \times \Biggl.{30}\\ & \left.{{\rm{e}}^{ - \tfrac{{{\gamma _{{\rm{th}}}} c {\lambda _{{{{R}}_i},{{D}}}}}}{{(ax + b)\varPhi }}}}\sum\limits_{q = 0}^N {\frac{{{{\left( {\dfrac{{{\gamma _{{\rm{th}}}} c {\lambda _{{{{R}}_i},{{D}}}}}}{{(ax + b)\varPhi }}} \right)}^{M + q}}}}{{M(M + 1) \cdots (M + q)}}} \right){\rm{d}}x{\text{ }} , \end{split} (24) 式中:\gamma _{{\rm{e2e}}}^{{\text{MRC}}} \triangleq \min \{{\gamma _{{{{R}}_i}}},\gamma _{{D}}^{{\text{MRC}}}\},Γ(M)为伽马函数.
目的节点D采用MRC策略时系统吞吐量为
T_{{{\text{H,MRC}}}} = \theta {\log _2}(1 + \min \{{\gamma _{{{{R}}_i}}},\gamma _{{D}}^{{\text{MRC}}}\}) \text{.} (25) 3. 问题描述与优化求解
在保证通信服务质量(quality of service, QoS)和PB发射功率P、能量转化效率η等约束条件下,本文提出一种以吞吐量最大化为优化目标的最优中继选择算法. 通过联合优化TS因子θ与PS因子 {\rho _i} ,使得吞吐量TH最大,然后选择最佳中继,实现基于SWIPT的EH-WSN中继系统的吞吐量最大化.
TH性能优化问题(P1)建模为式(26)~(31)(以目的节点D采用SC策略为例).
\mathop {\max }\limits_{i ,{\rho _{i}},\theta } \;T_{{{\text{H,SC}}}} = \theta {\log _2}(1 + \min \{{\gamma _{{{{R}}_i}}},\gamma _{{{{D}}_m}}^{{\text{SC}}}\}), (26) {{\rm{s}}} .{\rm{t}}:\mathop {\min\limits_{i,{\rho _{i}},\theta } \{{\gamma _{{{{R}}_i}}},\gamma _{{{{D}}_m}}^{{\text{SC}}}\} \geqslant {\gamma _{{\rm{th}}}}} , (27) \quad\;\; {Q_{{\rm{avg}}}} \geqslant e , (28) \quad\;\;\; {\text{0 < }}P \leqslant {P_{\rm{m}}} , (29) \quad\;\;\; 0 < \theta < 1 , (30) \quad\;\;\; 0 < {\rho _i} < 1, (31) 式中:e为中继节点捕获的平均能量阈值,Pm为PB发射功率限制.
P1是一个复杂的0-1 NP-hard问题, 涉及中继选择以及参数θ与 {\rho _i} 的优化. 因此,本文将P1优化重新定义为一对耦合优化问题,分解为关于θ与 {\rho _i} 的内部优化问题(P2)以及选择最优中继节点的外部优化问题2个子问题.
内部优化问题P2的解决方案是:在假定中继节点Ri活跃状态的情况下,针对EH-WSN中的每个中继节点,搜寻最佳的θ与 {\rho _i} ,使其对应的系统TH值最大. 内部优化问题P2表示为式(27)~(32).
\mathop {\max }\limits_{{\rho _{i}},\theta } T{_{{\text{H,SC}}}} = \theta {\text{lo}}{{\text{g}}_2}(1 + \min \{{\gamma _{{{{R}}_i}}},\gamma _{{{{D}}_m}}^{{\text{SC}}}\}) \text{.} (32) 通过分析函数TH,SC与θ、 {\rho _i} 的关系,可以得知这是一个拟凸函数,在区间(0,1)上具有最优值θ*、\rho _{i}^{*} 使系统TH值最大,可采用斐波那契(黄金分割法)查找算法[20]搜索到θ*与\rho _{i}^{*} 。
然而,本文考虑基于θ与 {\rho _i} 联合优化下的中继选择算法,通过参数的动态调整,使系统的TH值最大,提高系统的整体性能. 根据式(7),计算中继节点Ri的接收信噪比 {\gamma _{{{{R}}_i}}} 对 {\rho _i} 的一阶偏导数,其值大于0,说明 {\gamma _{{{{R}}_i}}} 沿着 {\rho _i} 方向为单调递增函数;同理,由式(11)知,目的节点D的接收信噪比 \gamma _{{{{D}}_m}}^{{\text{SC}}} 对 {\rho _i} 的一阶偏导数小于0,说明 \gamma _{{{{D}}_m}}^{{\rm{SC}}} 沿着 {\rho _i} 方向为单调递减函数. 由此得出,当 {\gamma _{{{{R}}_i}}}(\rho_i ) = \gamma _{{{{D}}_m}}^{{\text{SC}}}(\rho_i ) 时,存在唯一的\rho _{i}^{*} 使系统TH值最大. 进而,将\rho _{i}^{*} 代入式(23),通过设置不同的θ值提升系统性能. 当每个中继节点对应最优值θ*与 \rho _i^* 获得最大TH值后,即可进行最佳中继节点的一维搜索. 最佳中继节点索引为
{i^*} = \arg {\max } \; T_{{\text{H,SC}}}({\rho _i^*},{\theta ^*}) . (33) 基于以上分析,在优化问题P1时,首先通过求解内部优化问题P2,提出一种动态联合优化方案,得到内层优化式的最优目标值;然后,根据θ*和 \rho _i^* 搜寻最佳中继节点,即可获得整体问题的最优解. 联合优化最优中继选择算法如图2所示. 其中: \gamma _{{{{D}}_m},i}^{{\text{SC}}} 为SC策略下信息经第i个中继节点传输到目的节点D处的信噪比; \gamma _{{\rm{e2e}},i}^{{\text{SC}}} 为SC策略下选取第i个中继节点时,中继节点Ri处和目的节点D处的信噪比最小值; {T_{{\text{H,SC}},i}} 为选取第i个中继节点后,在SC策略下的系统吞吐量; \mathop T\nolimits_{{\text{H,SC,}}i}^ * 为信息经最佳中继节点i* 传输时,SC策略下的系统吞吐量.
最优中继选择算法的计算复杂度为O(K2 + K),最优中继节点的选取是在联合优化θ和ρi的方案下提出的,相比在固定TS因子以及静态PS因子下的最优中继节点的选取[21-22],此算法可使系统变量间相互调节,提高EH-WSN系统性能.
4. 仿真结果与性能分析
为验证本文提出的基于PS-SWIPT的EH-WSN系统模型及中继选择算法的有效性,评估PB功率、时隙切换因子等参数对系统中断概率、吞吐量性能的影响,通过Monte Carlo仿真分析. 假设系统模型中有K = 6个可实现全双工的中继节点,η = 0.8,Qavg =0.5 J. 令所有Ri的自干扰信道增益均相等, |{h_{{{{R}}_i},{{{R}}_i}}}{|^2} = 0.1 ;所有噪声的方差相等, \sigma _{{n_{{{{R}}_{{i}}},{\rm{a}}}}}^2 = \sigma _{{n_{{{{R}}_{{i}}},{\rm{P}}}}}^2 = \sigma _{{n_{{{{D}}_m}}}}^2 = {N_0} = 1 ;所有中继具有相同的PS因子、TS因子. 进行约106次独立实验,使用瑞利衰落模型[23],采用正交幅度调制(QAM).
理论上,式(24)中的N取无穷大,但经过数次仿真实验发现,N取到一定数值后,结果会趋于稳定. 图3显示了遍历总次数对MRC接收策略下中断概率的影响,可以看出,当N>7时,Pout,MRC已趋于收敛,因此,N = 50.
图4为SC、MRC接收策略下PS因子ρi对系统中断概率和吞吐量的影响. 其中, {\gamma _{{\rm{th}}}} =1 dB,M =3根,θ = 0.8. 由图4可以看出:当ρi = 0时,源节点RF信号的所有功率都用于能量收集,此时,不论目的节点D采取何种接收策略,系统中断概率均为1.00,吞吐量为0;随ρi的增大,中断概率先减小后增大,吞吐量先增大后减小. SC接收策略在ρi =0.58时,对应中断概率最小,吞吐量最大;MRC接收策略在ρi = 0.71时,对应中断概率最小,吞吐量最大. 当P = 3 dBW时,SC、MRC策略下的最小中断概率分别为0.52、0.49;当P = 5 dBW时,SC、MRC策略下的最小中断概率分别为0.42、0.39. 当P = 3 dBW时,SC、MRC策略下的最大吞吐量分别为0.12、0.15 bit/(s·Hz);当P = 5 dBW时,SC、MRC策略下的最大吞吐量分别为0.18、0.23 bit/(s·Hz).
图5和图6分别为不同接收策略下PB发射功率以及天线数目对系统中断概率的影响. 其中, {\gamma _{{\rm{th}}}} =1 dB,θ = 0.8. 从图5可得,当PS因子ρi取值相同时,相同发射功率下,基于MRC策略的中断性能优于SC策略的性能. 这是因为,MRC策略可合并所有天线的接收信号,而SC策略仅选择了最佳通道接收信号. 从图6看出,当给定P值时,SC策略下的系统中断概率在M≥9根时基本保持不变,而MRC策略下的中断概率在M≥5根时趋于稳定. 在相同天线数目下,发射功率P对系统中断性能的影响远远大于接收策略对中断性能的影响.
图7为不同接收策略下TS因子θ对系统中断概率和吞吐量的影响. 其中, {\gamma _{{\rm{th}}}} = 1 dB,M = 3根,ρi =0.8. 图7(a)表明:当给定P、θ值时,MRC策略的中断性能始终优于SC策略的中断性能;若给定θ值,增大P,系统中断概率减小;此外,当θ逐渐增大,MRC策略在P = 3 dBW时的中断概率大于SC策略在P = 5 dBW时的中断概率. 这是由于当节点收集能量时间相同时,相比于发射功率,接收策略对中断概率的影响更小. 图7(b)表明:当θ取值逼近0时,因系统无法进行有效的信息传输,吞吐量较低;当θ持续增大,接近1.0时,传感器节点和中继节点因无法收集到足够能量,从而导致吞吐量趋于0.
图8对比了采用随机中继选择算法(Random)、最大最小中继选择算法(Max-Min)和本文提出的联合优化最优中继选择算法在不同TS因子时的系统最优吞吐量. 假设P = 5 dBW,M = 3根,Random和Max-Min在采取SC接收策略时,ρi = 0.58,MRC接收策略时ρi = 0.71,而本文算法ρi在(0,1.00)内动态变化. 由图8 可以看出:随着θ的变化,3种中继选择算法均可达到最大吞吐量;在相同接收策略下,Random的吞吐量最小,Max-Min次之,本文算法的吞吐量最大. 以MRC策略为例:当θ*= 0.21时,Random的最大吞吐量为0.54 bit/(s·Hz);当θ* = 0.23时,Max-Min的最大吞吐量为0.68 bit/(s·Hz);当θ* = 0.28时,本文算法的最大吞吐量为0.82 bit/(s·Hz). 由此可知,本文提出的算法通过联合优化θ和ρi,较好地实现了系统吞吐量性能的整体提升.
M=3根,3种算法下系统最大吞吐量与PB发射功率P之间的关系如图9所示. 可以看出,当P = 6 dBW,采取SC策略时,相比Random、Max-Min,本文算法的系统吞吐量增益分别为0.29、0.15 bit/(s·Hz);采取MRC策略时,相比Random、Max-Min,本文算法的系统吞吐量增益分别为0.32、0.16 bit/(s·Hz). 由此可知,本文所提方案能达到更大的系统吞吐量.
5. 结 论
本文基于PS-SWIPT技术,在PB辅助下构建了EH-WSN系统模型. 与其他WSN系统不同的是,所有节点先进行一段时间的能量收集,然后再用收集到的能量发射信息,且中继节点应用SWIPT技术还可得到源节点能量和自干扰信号自回收的能量补充. 在考虑目的节点D采用多天线的情况下,分别推导了SC和MRC接收策略下的中断概率、吞吐量的表达式. 在保证通信QoS等多约束条件下构建数学模型,将复杂的0-1 NP-hard问题拆分成2个子问题,并提出TS和PS因子联合优化下的最优中继选择算法. 仿真结果表明,各参数对EH-WSN中断性能影响明显,联合优化最优中继选择算法可使系统吞吐量性能得到优化. 未来可通过考虑非线性EH,将这项研究扩展到更广义的模型.
-
表 1 手机信令数据样例
Table 1. Samples of cellular phone data
用户全球标识码 设备标识码 位置区编号 基站小区编号 460***340 2185 ***7347 34054 1710732 460***340 2185 ***7347 34054 1710732 460***340 2185 ***7347 34054 1678945 日期 时刻 基站经度/(°) 基站纬度/(°) 2019-9-21 9:00:34 106.6992 26.58389 2019-9-21 9:01:41 106.7025 26.58639 2019-9-21 9:02:10 106.7025 26.58639 表 2 本研究使用的出行数据集构成
Table 2. Composition of dataset of interest
交通方式 数据量/条 出行段量/个 步行 12412 114 非机动车 9534 77 汽车 23655 207 公共交通 23458 186 合计 69059 584 表 3 特征参数的重要度排名
Table 3. Characteristic parameters ranking in terms of importance
变量 变量意义 重要度/% f 基站使用频率 10.02 Z11 11 min 时间窗直线距离 8.45 Ttotal 出行总时间 7.92 DOD 出行 OD 距离 7.30 Z9 9 min 时间窗直线距离 7.26 VaveOD OD 间平均速度 6.96 n 基站使用个数 6.36 Z7 7 min 时间窗直线距离 5.23 Z5 5 min 时间窗直线距离 5.16 V_{\mathrm{ave}Z_{11}} 11 min 时间窗直线平均速度 4.04 V_{\mathrm{ave}Z_9} 9 min 时间窗直线平均速度 3.54 V_{\mathrm{ave}Z_7} 7 min 时间窗直线平均速度 3.51 V_{\mathrm{ave}Z_5} 5 min 时间窗直线平均速度 2.98 L11 11 min 时间窗累积距离 2.97 L9 9 min 时间窗累积距离 2.54 V_{\mathrm{ave}L_{11}} 11 min 时间窗累积平均速度 2.44 V_{\mathrm{ave}L_9} 9 min 时间窗累积平均速度 2.40 L7 7 min 时间窗累积距离 2.28 V_{\mathrm{ave}L_7} 7 min 时间窗累积平均速度 2.08 L5 5 min 时间窗累积距离 1.71 V_{\mathrm{ave}L_5} 5 min 时间窗累积平均速度 1.50 Tb 相邻数据的时间差 1.26 Db 相邻数据的基站切换距离 1.10 Vb 相邻数据的基站切换速度 1.02 表 4 机器学习算法主要参数
Table 4. Main parameters in machine learning algorithms
算法 参数设置 参数值 支持向量机 核函数 径向基函数 核参数 σ 0.25 惩罚系数 \tau 1 BP 神经网络 神经元层数/层 2 神经元个数/个 (100,50) 隐藏层激活函数 Relu 权重优化算法 Sgd 初始学习率 0.05 表 5 测试集识别结果
Table 5. Recognition results of test dataset
交通方式 出行段数量/个 识别结果/个 步行 非机动 公交车 汽车 步行 37 33 1 2 1 非机动车 24 2 19 3 0 公共交通 65 0 8 46 10 汽车 58 0 2 9 47 合计 184 35 30 60 58 表 6 评价指标统计结果
Table 6. Statistical results of evaluation indicators
交通方式 出行段数量/个 P/% R/% Fscore/% 步行 37 94.3 89.2 91.7 非机动车 24 63.3 79.2 70.4 公共交通 65 76.7 71.9 74.2 汽车 58 81.0 81.0 81.0 合计 184 79.2 79.2 79.2 -
[1] 杨飞,姚振兴. 基于手机定位数据的个体出行行为特征分析与技术研究:方法与实证[M]. 上海: 同济大学出版社,2017:2-4. [2] 张博. 基于手机网络定位的OD调查的出行方式划分研究[D]. 北京: 北京交通大学,2010. [3] QU Y C, GONG H, WANG P. Transportation mode split with mobile phone data[C]//2015 IEEE 18th International Conference on Intelligent Transportation Systems. Gran Canaria: IEEE, 2015: 285-289. [4] LARIJANI A N, OLTEANU-RAIMOND A M, PERRET J, et al. Investigating the mobile phone data to estimate the origin destination flow and analysis; case study: Paris region[J]. Transportation Research Procedia, 2015, 6: 64-78. doi: 10.1016/j.trpro.2015.03.006 [5] ASGARI F. Inferring user multimodal trajectories from cellular network metadata in metropolitan areas[D]. Paris: University of Pierre & Marie Curie, 2016. [6] POONAWALA H, KOLAR V, BLANDIN S, et al. Singapore in motion: insights on public transport service level through farecard and mobile data analytics[C]//Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. San Francisco: ACM, 2016: 589-598. [7] DANAFAR S, PIORKOWSKI M, KRYSCZCUK K. Bayesian framework for mobility pattern discovery using mobile network events[C]//2017 25th European Signal Processing Conference (EUSIPCO). Kos: IEEE, 2017: 1070-1074. [8] 钟舒琦,邓如丰,邓红平,等. 基于兴趣点与导航数据的手机信令数据出行方式识别[J]. 中山大学学报(自然科学版),2020,59(3): 87-96.ZHONG Shuqi, DENG Rufeng, DENG Hongping, et al. Recognition of traffic mode of mobile phone data based on the combination of point of interest data and navigation data[J]. Acta Scientiarum Naturalium Universitatis Sunyatseni, 2020, 59(3): 87-96. [9] HUANG H S, CHENG Y, WEIBEL R. Transport mode detection based on mobile phone network data: a systematic review[J]. Transportation Research Part C: Emerging Technologies, 2019, 101: 297-312. doi: 10.1016/j.trc.2019.02.008 [10] BURKHARD O, BECKER H, WEIBEL R, et al. On the requirements on spatial accuracy and sampling rate for transport mode detection in view of a shift to passive signalling data[J]. Transportation Research Part C: Emerging Technologies, 2020, 114: 99-117. doi: 10.1016/j.trc.2020.01.021 [11] YANG F, WANG Y C, JIN P J, et al. Random forest model for trip end identification using cellular phone and points of interest data[J]. Transportation Research Record: Journal of the Transportation Research Board, 2021, 2675(7): 454-466. doi: 10.1177/03611981211031537 [12] 宋璐. 基于手机定位数据的交通OD分布研究[D]. 南京: 东南大学,2015. [13] 钟罡. 基于手机大数据的城市综合客运枢纽乘客出行行为分析方法研究[D]. 南京: 东南大学,2019. [14] 陈晓光. 基于手机信令数据的出行端点识别误差与交通小区划分尺度研究[D]. 成都: 西南交通大学,2020. [15] Breiman L. Random forest[J]. Machine Learning, 2001, 45(1): 5-32. doi: 10.1023/A:1010933404324 [16] CHENG L, CHEN X W, DE VOS J, et al. Applying a random forest method approach to model travel mode choice behavior[J]. Travel Behaviour and Society, 2019, 14: 1-10. doi: 10.1016/j.tbs.2018.09.002 期刊类型引用(1)
1. 王嘉鑫. 考虑手机信令频率的出行信息提取实证研究. 交通科技与管理. 2025(01): 14-16 . 百度学术
其他类型引用(2)
-