Site Effects of Linear Method and Modified Horizontal-to-Vertical Spectral Ratio
-
摘要:
为进一步研究工程地震动场地效应的影响,基于水平垂直谱比法(HVSR)、线性反演法2种经验方法对四川强震区地震动场地效应进行对比分析. 首先,依据震级、台站、震中距离等因素挑选出汶川地震余震中由17个强震动台站捕获的233组强震动波形;其次,基于龙门山地区铰链三段式衰减模型,采用线性反演法估计S波的品质因子
Q s,同时应用旋转HVSR、多向HVSR 2种方法解释了地震波传播中方位角对HVSR场地效应的影响机制;最后,分析了线性反演法与HVSR法计算的场地效应产生差异性的原因,在此基础上提出了改进的HVSR法以提高场地效应评估的准确性. 研究结果发现:该区域S波的品质因子与频率相关,且在0.4~20.0 Hz内近似等于199.2f 0.8 (f 为频率);HVSR的结果具有优势方向,随着方位角的改变,场地效应会在某一角度突然增大,与场地土层的各向异性有关;竖向地震动的放大,即场地土层、工程基岩或中深部硬岩层耦合形成的竖向场地效应,是HVSR法与线性反演法产生差异的主要原因.Abstract:In order to further study the influence of site effects from engineering ground motion, a comparative analysis of site effects from ground motion in the Sichuan strong earthquake area was carried out based on two empirical methods, namely, horizontal-to-vertical spectral ratio (HVSR) and linear inversion. Firstly, 233 sets of strong motion waveforms captured by 17 strong motion stations during the aftershocks of the Wenchuan Earthquake were selected based on the magnitude, station, distance from the epicenter, and other factors. Second, the linear inversion method was used to estimate the quality factor
Q s of the S-wave based on the hinged three-stage attenuation model in the Longmenshan area. Meanwhile, two methods, rotational HVSR and multidirectional HVSR, were applied to explain the mechanism of the site effect of azimuthal angle on HVSR in seismic wave propagation. Finally, the possible reasons for the variability of the site effects calculated by the linear inversion and HVSR methods were analyzed, based on which an improved HVSR method was proposed to improve the accuracy of the site effect assessment. The results show that the quality factor of the S-wave in the area is frequency-dependent and approximately equals to 199.2f 0.8 in the range of 0.4–20.0 Hz. The results of HVSR may have a certain dominant direction, and the site effect may increase suddenly at a certain angle with the change of the azimuthal angle, which may be related to the anisotropy of the soil layer at the site. The amplification of vertical ground motion, i.e., the vertical site effect formed by the coupling of soil layer at the site, engineered bedrock, or middle and deep hard rock layers, is the main reason for the difference between HVSR and linear inversion methods.-
Key words:
- site effects /
- Qs value /
- linear inversion /
- HVSR method /
- azimuthal angle
-
2004年,Donoho[1]提出了关于信号采样、压缩和重构的全新理论——压缩感知理论(compressive sensing,CS). 在大规模机器类型通信(massive machine type communication,mMTC)下,即使是在高峰期,活跃用户的数量也不超过10%[2],这使得压缩感知技术应用在大规模通信场景下成为可能. 压缩感知理论的研究主要集中在3个领域:信号的稀疏表示、高性能测量矩阵的构造以及信号的精准重构[3]. 其中,测量矩阵的构造将直接影响信号重构的误差大小,测量矩阵需要符合一定的条件,如有限等距性质[4](restricted isometry property,RIP),这是保证原始信号不失真重建的必要条件.
学者们尝试通过相关性理论衡量并优化测量矩阵的性能[5]. 研究表明,减小稀疏基与测量矩阵的相关系数能提高压缩感知算法的重构性能. 目前,针对测量矩阵的研究成果不胜枚举. 曾祥洲[6]提出一种基于交替最小化的优化算法,最小化Gram矩阵与目标矩阵差值的傅里叶范数,建立最优测量矩阵,解决最小化单个指标易导致其他指标恶化的问题. Xu等[7]提出一种基于等角紧框架(equiangular tight frame,ETF)的迭代最小化算法,在不改变测量矩阵对应Gram矩阵属性的情况下修改奇异值,以减小Gram矩阵列向量之间的相关性. 宋儒瑛等[8]基于分块矩阵的思想构造新的测量矩阵,验证了测量矩阵的行列数相差不大时所构造的测量矩阵可以代替等角紧框架矩阵. 魏从静[9]对Gram矩阵进行Schmidt正交化,以此增强矩阵列向量之间的独立性,计算过程中的规范正交基能有效提高数值计算过程的稳定性. He等[10]提出一种基于伪随机序列的测量矩阵优化构造方法,将随机高斯矩阵与伪随机序列和Hadamard矩阵相结合,使得测量矩阵拥有更好的性能、较低复杂度和较好的应用价值.
本文对测量矩阵的性能优化算法进行研究,基于Gram矩阵,通过特征值分解降低测量矩阵与稀疏基之间的平均相关性. 再基于ETF理论与梯度缩减迭代算法,使得Gram矩阵向等角紧框架矩阵逼近,降低其非主对角线元素最大值,从而降低最大相关性,提高重构质量.
1. 压缩感知算法与测量矩阵相关性
1.1 压缩感知算法
假设一个长度为N的信号x∈CN×1经过一个M×N(M<N)的测量矩阵Φ线性投影后,得到长度为M的测量值y∈CM×1,如式(1)所示.
y=Φx. (1) 压缩感知技术使用的前提是信号在某种变换基下具有稀疏性. 若x本身不稀疏,但在某个变换域上是稀疏的,式(1)可改写为
{y=Φx=Aθ,A=ΦΨ, (2) 式中:Ψ为N×N的稀疏变换矩阵,称为稀疏基或稀疏字典;θ为x在Ψ上的投影;A为感知矩阵.
由式(2)可以看出,通过接收信号y来重构原始信号x,本质上是求解线性方程组. 由于M<N,线性方程组有无穷多解. 但θ是稀疏的,未知数的个数较少,使得重构信号成为可能.
在RIP准则基础上所构造的测量矩阵都能在一定程度上保留信号原本信息,保证重构精度[11]. 当矩阵A满足RIP准则时,测量矩阵的有限等距常数δK满足式(3).
(1 - {\delta _K})||{\boldsymbol{x}}||_2^2 \leqslant ||{\boldsymbol{A x}}||_2^2 \leqslant (1 + {\delta _K})||{\boldsymbol{x}}||_2^2 , (3) 式中:K为信号的稀疏度.
RIP准则对测量矩阵进行了限制,使得经过投影后的压缩信号能够保留尽可能多的有用信息,用以在重构过程中更加精确地重构出信号.
当矩阵 \boldsymbol{A} 满足RIP准则时,压缩感知算法就能通过求解如式(4)所示的L0范数最小问题,对原始信号进行重构.
\left\{ {\begin{array}{*{20}{l}} {{\boldsymbol{\hat \theta }} = {\text{arg min}}\;||{\boldsymbol{\theta }}|{|_0}}, \\ {{\mathrm{s.t.}}\; {\boldsymbol{\varPhi \varPsi \theta }} = {\boldsymbol{y}},} \end{array}} \right. (4) 式中: \hat{\boldsymbol{\theta }} 为原始信号在{\boldsymbol{\varPsi}} 下的最稀疏系数向量.
得到 \hat{\boldsymbol{\theta }} 后,即可利用稀疏反变换重构出原始信号,如式(5)所示.
{\boldsymbol{\hat x = \varPsi \hat \theta }}\text{,} (5) 式中: \hat{{\boldsymbol{x}}} 为重构所得的信号.
求解L0范数最小问题是一个NP-hard问题,Donoho等[12]提出,在一定条件下,对L0范数问题进行求解可等价于对L1范数问题进行求解,所求得的解是相同的,即式(4)等价于式(6).
\left\{ {\begin{array}{*{20}{l}} {{\boldsymbol{\hat \theta }} = {\text{arg}}\;{\text{min}}\;||{\boldsymbol{\theta }}|{|_1}} ,\\ {{\mathrm{s.t.}}\;\;{\boldsymbol{\varPhi \varPsi \theta }}{\text{ = }}{\boldsymbol{y}}}. \end{array}} \right. (6) 式(6)可以转化为线性规划问题进行求解. 常用的求解方法有贪婪类算法[13]、凸松弛算法[14]、贝叶斯类算法[15]等.
1.2 mMTC场景上行链路系统模型
在大规模通信场景中,基站端无法保证每个用户都能单独利用资源块,故不可避免地会产生冲突问题,而基站侧也很难得知哪些用户是处于活跃状态,因此活跃用户检测的问题需要得到解决.
假设一个社区用户数为N的蜂窝上行链路,在大规模随机接入的场景下,同一时间点中的设备大多为非活跃状态[16]. 以 {a}_{n}\in \left\{\mathrm{0,1}\right\} 表示用户的活跃状态,0为非活跃状态,1为活跃状态,且 1\leqslant n\leqslant N ,则由 {a}_{n} 构成的向量 \boldsymbol{a}=({a}_{1},{a}_{2}, \cdots ,{a}_{{N}}) 中,大部分元素都为0,即 {{\boldsymbol{a}}} 具备稀疏性,这使得压缩感知技术应用于大规模通信场景成为可能.
假设每个用户都由基站分配了1个长度为M的导频序列 {\boldsymbol{\varphi }}_{n} ,则这N个用户的导频序列就能组成一个 M\times N 的矩阵 \boldsymbol{\varPhi } ,当矩阵 \boldsymbol{\varPhi } 满足有限等距性质准则时,就可以应用压缩感知理论,基于接收信号y,通过重构算法对原始信号进行估计,进而对活跃用户的身份进行估计.
基站接收到的信号可以表示为
{\boldsymbol{y}} = \sum\nolimits_{n = 0}^N {{{\boldsymbol{\varphi }}_n}{a_n}{{{h}}_n}} = {\boldsymbol{\varPhi x}} \text{,} (7) 式中: {{h}}_{n} 为第 n 个用户与基站之间的信道参数.
定义 {{x}}_{n}={a}_{n}{{h}}_{n} , \boldsymbol{x}=({{x}}_{1},{{x}}_{2},\cdots ,{{x}}_{\boldsymbol{N}})= ({a}_{1}{{h}}_{1}, {a}_{2}{{h}}_{2},\cdots , {a}_{N}{{h}}_{N}) . 显然, \boldsymbol{x} 呈现为稀疏状态. 若第 n 个用户为活跃状态,则 {{x}}_{n} 等于真实的信道参数;若用户为非活跃状态,则 {{x}}_{n} 为0. 综上可知,在mMTC场景中,活跃用户估计与信道估计可以联合实现.
1.3 测量矩阵列相关性与Welch下界
\boldsymbol{\varPhi } 的列相关性\mu 可以表示为列向量之间内积的最大值,如式(8)所示[17].
\mu = \max \left| {\left\langle {{{\boldsymbol{\varphi }}_i},{{\boldsymbol{\varphi }}_j}} \right\rangle } \right| \text{,} (8) 式中: {\boldsymbol{\varphi }}_{i}、{\boldsymbol{\varphi }}_{j} 分别为矩阵 \boldsymbol{\varPhi } 的第i、j列, 1\leqslant i, j\leqslant N, \mathrm{且}\;i\ne j .
对于矩阵 \boldsymbol{\varPhi } ,在其列向量单位化后,若 N\leqslant M \times (M + 1)/2 ,则称矩阵 \boldsymbol{\varPhi } 的列相关性存在下界,这个下界即Welch界,如式(9)所示.
\mu \geqslant \sqrt {\frac{{N - M}}{{(N - 1)M}}} . (9) 当式(9)取等号时,称该矩阵具备等角紧框架结构[18]. 特别地,若M\ll N,则下界将收敛至 \sqrt{1/M} . 通过使测量矩阵与稀疏基矩阵的互相关系数逼近Welch界,可以保证测量矩阵具有更好的压缩观测性能.
2. 基于矩阵分解与ETF理论的测量矩阵优化算法
测量矩阵 \boldsymbol{\varPhi } 与稀疏基 {\boldsymbol{\varPsi }} 之间的相关性是影响测量矩阵性能的因素之一. 2个矩阵之间的相关性定义为
\mu ({\boldsymbol{\varPhi }},{\boldsymbol{\varPsi }}) = \max \left| {\left\langle {{{\boldsymbol{\varphi }}_i},{{\boldsymbol{\gamma }}_{j}}} \right\rangle } \right| \text{,} (10) 式中: {\boldsymbol{\gamma }}_{j} 为矩阵 {\boldsymbol{\varPsi }} 的第j列.
但仅依靠此定义很难得出两矩阵之间的具体联系. 为此,Elad[19]引入了Gram矩阵,从另一个角度对测量矩阵 \boldsymbol{\varPhi } 和稀疏基 {\boldsymbol{\varPsi }} 之间的相关性进行了定义,将最大相关系数定义为Gram矩阵中非对角线元素绝对值的最大值.
定义平均相关系数 {\mu }_{\mathrm{a}\mathrm{v}\mathrm{g}} 为Gram矩阵中所有非主对角元素绝对值之和的平均值. 当 Gram 矩阵的非主对角元素中最大值较大而平均值较小时,如果仅依据最大值来判断,可能会误认为该矩阵性能不佳. 然而,由于其平均值相对较小,实际应用中的性能也相对良好. 因此,引入平均相关系数是为了避免因最大值与平均值差距过大而导致性能的误判.
首先,定义等价字典 \boldsymbol{D} , \boldsymbol{D}=\boldsymbol{\varPhi }{\boldsymbol{\varPsi }} ,假设 {\boldsymbol{\vartheta }}_{i} 是矩阵 \boldsymbol{D} 的第i列;然后,将等价字典 \boldsymbol{D} 的每列进行单位化处理,得到单位化字典矩阵 \tilde{\boldsymbol{D}}=[{\tilde{\boldsymbol{\vartheta }}}_{1}\;\;{\tilde{\boldsymbol{\vartheta }}}_{2}\;\;\cdots\;\; {\tilde{\boldsymbol{\vartheta }}}_{N}] ,并以此求出对应的Gram矩阵,如式(11)所示.
{\boldsymbol{G}} = {{{\tilde {\boldsymbol D}}}^{\mathrm{T}}}{{\tilde {\boldsymbol D}}} = \left[ {\begin{array}{*{20}{c}} 1&{{{\tilde {\boldsymbol{\vartheta}} }_1}{{\tilde {\boldsymbol{\vartheta}} }_2}}& \cdots &{{{\tilde {\boldsymbol{\vartheta}} }_1}{{\tilde {\boldsymbol{\vartheta}} }_N}} \\ {{{\tilde {\boldsymbol{\vartheta}} }_2}{{\tilde {\boldsymbol{\vartheta}} }_1}}&{\text{1}}& \cdots &{{{\tilde {\boldsymbol{\vartheta}} }_{\text{2}}}{{\tilde {\boldsymbol{\vartheta}} }_N}} \\ \vdots & \vdots &{}& \vdots \\ {{{\tilde {\boldsymbol{\vartheta}} }_N}{{\tilde {\boldsymbol{\vartheta}} }_1}}&{{{\tilde {\boldsymbol{\vartheta}} }_N}{{\tilde {\boldsymbol{\vartheta}} }_{\text{2}}}}& \cdots &1 \end{array}} \right] \text{.} (11) 2.1 基于特征值分解优化平均相关性
由上文可知,单位化后的等价字典 \tilde{\boldsymbol{D}} 对应的Gram矩阵是一个主对角线元素全为1的N维半正定矩阵,其秩为M,假设其M个非零特征值为 {\lambda }_{q}\;(q=1, 2, \cdots ,M) ,有 {\lambda }_{q} > 0 ,由于矩阵所有特征值的和等于矩阵对角线上的元素之和,因此可以推出式(12).
\sum\nolimits_{{{q}} = 1}^M {{\lambda _q} = N}. (12) 假设 {\boldsymbol{l}}_{q} 是Gram矩阵 \boldsymbol{G} 的某一特征向量, {{\lambda }}_{q} 是其对应的特征值,则有 \boldsymbol{G}{\mathrm{\lambda }}_{q}={\boldsymbol{l}}_{q}{\mathrm{\lambda }}_{q} . 又因为 \boldsymbol{G} 为对称矩阵,则 {\boldsymbol{G}}^{{\mathrm{T}}}\boldsymbol{Gl}_{q}=\boldsymbol{GG}{\boldsymbol{l}}_{q}=\boldsymbol{Gl}_{q}{\lambda }_{q}={\boldsymbol{l}}_{q}{\lambda }_{q}^{2} ,所以矩阵 {\boldsymbol{G}}^{\mathrm{T}}\boldsymbol{G} 的特征值为 \boldsymbol{G} 特征值的平方. 假设 {g}_{i,j} 是Gram矩阵 \boldsymbol{G} 中的第i行第j列的元素,则矩阵 {\boldsymbol{G}}^{\mathrm{T}}\boldsymbol{G} 对角线上的元素之和为 {\displaystyle\sum\nolimits _{i,j=1}^{N}}{{g}^{2}_{i,j}} ,于是推出式(13).
\sum\nolimits_{{{q}} = 1}^M {{{{{\lambda}^2 _q}}} = \sum\nolimits_{i = j}^M {{{{{g}^2_{i,j}}}}} } . (13) 考虑到非主对角线元素绝对值之和与其平方的和具有相同的单调性,因此,可以通过最小化非主对角线元素平方的和来降低平均互相关系数 {\mu }_{\mathrm{a}\mathrm{v}\mathrm{g}} ,实现平均相关性的优化,结合式(12),可将问题转化为式(14)所示的问题.
\left\{ {\begin{array}{*{20}{l}} {\text{min}}\;\displaystyle\sum\nolimits_{i \ne j} {{{{{g}^2_{i,j}}}} = \sum\nolimits_{{{q}} = 1}^M {{{{{\lambda}^2 _q}}} - \sum\nolimits_{{{i}} = 1}^M {{{{{g}^2_{i,{{i}}}}}}} } } , \\ {{\mathrm{s.t.}}\; \displaystyle\sum\nolimits_{{{q}} = 1}^M {{\lambda _q}{\text{ = }}N} .\;} \end{array}} \right. (14) 要在矩阵 \boldsymbol{G} 的特征值之和保持不变的前提下,求出上述问题最优解,就需要尽可能减小矩阵 \boldsymbol{G} 的特征值平方的和. 而矩阵 \boldsymbol{G} 的特征值都大于0,因此,将所有特征值设置为平均值即可. 对Gram矩阵 \boldsymbol{G} 进行特征值分解,如式(15)所示.
{\boldsymbol{G = P\varLambda }}{{\boldsymbol{P}}^{\mathrm{T}}}\text{,} (15) 式中: \boldsymbol{P} 为矩阵 \boldsymbol{G} 的特征向量组成的矩阵, \boldsymbol{\varLambda } 为特征值组成的对角矩阵.
将对角矩阵 \boldsymbol{\varLambda } 中的非零元素修改为 M/N ,得到新的矩阵 \hat{\boldsymbol{\varLambda }} ,再将对角矩阵 \hat{\boldsymbol{\varLambda }} 进行分解,如式(16)所示.
{\boldsymbol{\hat \varLambda = }}{{\boldsymbol{L}}^{\mathrm{T}}}{\boldsymbol{L}}\text{,} (16) 式中: \boldsymbol{L} 为大小为 M\times N 的矩阵.
{\boldsymbol{L}} 的主对角线中,对应 \hat{\boldsymbol{\varLambda }} 中非零项的元素设为 \sqrt{{N}/{M}} ,其余元素皆为0. 重新计算Gram矩阵,得到
{\boldsymbol{G = P}}{{\boldsymbol{L}}^{\mathrm{T}}}{\boldsymbol{L}}{{\boldsymbol{P}}^{\mathrm{T}}}. (17) 根据式(11),可以得到
{{\hat {\boldsymbol D} = {\boldsymbol{L}}}}{{\boldsymbol{P}}^{\mathrm{T}}}\text{,} (18) 式中: \hat{\boldsymbol{D}} 为更新后的字典矩阵.
2.2 基于ETF理论优化最大相关性
2.2.1 构造ETF矩阵
由于对字典矩阵 \boldsymbol{D} 进行了列单位化处理,故得到的Gram矩阵中对角线元素全为1,且非对角线元素的值也都在1和 −1之间. 通过Gram矩阵减小测量矩阵 \boldsymbol{\varPhi } 和稀疏基 {\boldsymbol{\varPsi }} 之间的相关性,等价于减小Gram矩阵的非对角线元素. 当两矩阵之间不相关时,其所对应的Gram矩阵的非对角线元素也将全为0,此时,Gram矩阵等价于单位矩阵E. 所以,使Gram矩阵向 {\boldsymbol{E}} 逼近,即可降低其最大相关性,如式(19)所示.
{\text{min}}\;\left\| {{\boldsymbol{G}} - {\boldsymbol{E}}} \right\|_2^2. (19) 要让2个矩阵相关性几乎为0,这在实际情况中是比较困难的[20]. 由于当矩阵满足等角紧框架理论时,其相关性呈最小状态[18],同时,考虑到矩阵非对角线元素几乎都是一些接近0的小数,因此将条件放宽,即使非主对角线元素小于等于某一阈值 \mu_0 ,使得矩阵 \boldsymbol{G} 的非主对角线元素朝 \mu_0 逼近, \mu_0 即为所期望的两矩阵之间的相关性. 假设与矩阵 \boldsymbol{G} 维度相同的单位矩阵 \boldsymbol{H}\;(\boldsymbol{H}=({H}_{i,j}),i\ne j) ,按照式(20)对矩阵 \boldsymbol{H} 进行修改.
{{{H}}_{i,j}} = \left\{ {\begin{array}{*{20}{l}} {{{g}_{i,j}}},\quad{\left| {{{g}_{i,j}}} \right| < \mu_0 }, \\ {\mu_0{\mathrm{sgn}}\;{{g}_{i,j}} },\quad{\left| {{{g}_{i,j}}} \right| > \mu_0 } . \end{array}} \right. (20) 将阈值 \mu_0 设置为Welch界,可以让测量矩阵与稀疏基矩阵的相关系数逼近下界[21],使得测量矩阵具有更好的性能.
对矩阵 \boldsymbol{H} 进行更新后,就需要使得Gram矩阵 \boldsymbol{G} 尽可能逼近矩阵 \boldsymbol{H} . 将关于矩阵 \boldsymbol{G} 、 \boldsymbol{H} 的表达式设为 f ,如式(21)所示.
f = \left\| {{\boldsymbol{G}} - {\boldsymbol{H}}} \right\|_2^2. (21) 为使矩阵 \boldsymbol{G} 尽可能逼近矩阵 \boldsymbol{H} ,将问题转化为求函数f的最小值,将 \boldsymbol{G}={\tilde{\boldsymbol{D}}}^{\rm{T}}\tilde{\boldsymbol{D}} 代入后,式(21)转化为式(22).
f = \left\| {{{{{\tilde {\boldsymbol D}}}}^{\mathrm{T}}}{{\tilde {\boldsymbol D}}} - {\boldsymbol{H}}} \right\|_2^2. (22) 但是矩阵 \boldsymbol{G} 的秩为 M ,而修改后的矩阵 \boldsymbol{H} 的秩为 N ,因此,考虑对矩阵 \boldsymbol{H} 降秩. 首先,进行特征值分解 \boldsymbol{H}=\boldsymbol{P}{\boldsymbol{\varLambda }}_{{H}}{\boldsymbol{P}}^{{\mathrm{T}}} ,并修改其特征值,得到秩为 M 的矩阵 {\boldsymbol{H}}_{{M}} ,如式(23)所示,其中, {\boldsymbol{\varLambda }}_{{H}} 为特征值组成的对角矩阵,特征值由大到小排列.
{{\boldsymbol{H}}_{M}} = {\boldsymbol{PI}}{{\boldsymbol{\varLambda }}_{{H}}}{{\boldsymbol{P}}^{\mathrm{T}}}\text{,} (23) 式中: \boldsymbol{P} 为矩阵 \boldsymbol{H} 的特征向量组成的矩阵; \boldsymbol{I}=\left[\begin{array}{cc}{\boldsymbol{E}}_{M}& {\boldsymbol{0}}\\ {\boldsymbol{0}}& {\boldsymbol{0}}\end{array}\right]\in {\mathbb{R}}^{N\times N} , {\boldsymbol{E}}_{{M}} 为维度为 {M} 的单位矩阵.
假设 {{{\lambda}} }_{{{H}}_{{M}}}=({\lambda }_{{{H}}_{{M}},1},\;{\lambda }_{{{H}}_{{M}},2},\; \cdots ,\; {\lambda }_{{{{H}}}_{{M}},{M}},\;0,\; \cdots, 0) ,是矩阵 {\boldsymbol{H}}_{{M}} 的特征值. 将所有特征值设为平均值,降低矩阵非主对角线的平方和,从而减少矩阵的平均相关性. 令 {\hat{\lambda }}_{{{H}}_{{M}}}=\dfrac{1}{M}\displaystyle\sum _{p=1}^{M}{\lambda }_{{{H}}_{{M}},p} ,则修改后的特征值矩阵 {\hat{\boldsymbol{\varLambda }}}_{{{H}}_{{M}}}={\mathrm{diag}}({\hat{\lambda }}_{{{H}}_{{M}}},{\hat{\lambda }}_{{{H}}_{{M}}}, \cdots ,{\hat{\lambda }}_{{{H}}_{{M}}},0,\cdots ,0) . 优化后的矩阵为
{{\boldsymbol{H}}_{\rm{opt}}} = {\boldsymbol{P}}{\hat{\boldsymbol{\varLambda }}_{{{\boldsymbol{H}}_{M}}}}{{\boldsymbol{P}}^{\mathrm{T}}}. (24) 此时,所求问题变为式(25)所示问题.
{\text{min}}\;\left\| {{{{{\tilde {\boldsymbol D}}}}^{\mathrm{T}}}{{\tilde {\boldsymbol D}}} - {{\boldsymbol{H}}_{{{\mathrm{opt}}}}}} \right\|_2^2 . (25) 2.2.2 基于梯度缩减算法求最优解
最优测量矩阵 \hat{\boldsymbol{\varPhi }} 存在解析解,可通过交替策略与奇异值分解[22]求出. 但其子问题的计算成本偏高,耗时较长. 因此,本文选择梯度缩减的思想对原问题求最优解.
由于矩阵 {\boldsymbol{H}}_{\mathrm{o}\mathrm{p}\mathrm{t}} 为常量,f是一个关于字典矩阵 \tilde{\boldsymbol{D}} 的函数,求f的最小值问题也就是求矩阵f关于字典矩阵 \tilde{\boldsymbol{D}} 的梯度,由此需要找出目标函数关于字典矩阵 \tilde{\boldsymbol{D}} 的下降方向,假设下降方向为k,如式(26)所示.
k = \frac{\partial }{{\partial{d_{i,j}}}}\left\| {{{{{\tilde {\boldsymbol D}}}}^{\mathrm{T}}}{{\tilde {\boldsymbol D}}} - {{\boldsymbol{H}}_{\rm{opt}}}} \right\|_2^2 \text{,} (26) 式中:({d_{i,j}})={{\tilde {\boldsymbol D}}}.
由矩阵分解规则变换为[23]
\begin{split} & k = \frac{\partial }{{\partial {d_{i,j}}}}{\mathrm{Tr}}\left\{ {({{{{\tilde {\boldsymbol D}}}}^{\mathrm{T}}}{{\tilde {\boldsymbol D}}} - {{\boldsymbol{H}}_{{{\mathrm{opt}}}}}){{({{{{\tilde {\boldsymbol D}}}}^{\mathrm{T}}}{{\tilde {\boldsymbol D}}} - {{\boldsymbol{H}}_{{{\mathrm{opt}}}}})}^{\mathrm{T}}}} \right\} = \\ &\quad 4{{\tilde {\boldsymbol D}}}({{{{\tilde {\boldsymbol D}}}}^{\mathrm{T}}}{{\tilde {\boldsymbol D}}} - {{\boldsymbol{H}}_{{{\mathrm{opt}}}}}) . \end{split} (27) 沿着下降方向迭代,逐渐迭代缩减目标值,如式(28)所示.
{{{\tilde {\boldsymbol D}}}_u} = {{{\tilde {\boldsymbol D}}}_{u - 1}} - 4\beta {{{\tilde {\boldsymbol D}}}_{u - 1}}({{\tilde {\boldsymbol D}}}_{u - 1}^{\mathrm{T}}{{{\tilde {\boldsymbol D}}}_{u - 1}} - {{\boldsymbol{H}}_{{{\mathrm{opt}}}}}) \text{,} (28) 式中:u 为迭代次数; {\tilde{\boldsymbol{D}}}_{u} 为第 u 次迭代后的字典矩阵; \beta 为每次缩减的步长,且 \beta > 0 ,通常按照经验取较小的值.
经过多次迭代后,通过逆运算得到最终结果 \hat{\boldsymbol{\varPhi }} ,如式(29)所示.
{{\hat {\boldsymbol \varPhi} }} = {{{\tilde {\boldsymbol D}}}_u}{{\boldsymbol{\varPsi }}^{ - 1}}. (29) 2.3 算法流程
首先,对Gram矩阵进行特征值分解,优化对角矩阵中的特征值,降低Gram矩阵非对角元素平均值;随后,构造出等角紧框架矩阵,并按照梯度缩减的策略使得Gram矩阵向等角紧框架矩阵逼近,减少其最大相关性,提高重构质量;最后,得到优化后的测量矩阵. 定义迭代终止参数 {\sigma } ,当式(30)成立时,停止迭代,输出优化后的测量矩阵.
\left\| {{{\tilde {\boldsymbol D}}}_u^{\mathrm{T}}{{{{\tilde {\boldsymbol D}}}}_u} - {{\boldsymbol{H}}_{{{\mathrm{opt}}}}}} \right\|_2^2 < \sigma . (30) 基于矩阵分解与ETF理论的测量矩阵优化算法如下所示:
输入:测量矩阵 \boldsymbol{\varPhi } 、测量矩阵 \boldsymbol{\varPhi } 的行数M与列数N,稀疏基{\boldsymbol{\varPsi }}、最大迭代次数t、缩减步长 \beta 、Welch界 \mu_0 ,迭代终止参数 {\sigma } ;
输出:优化后的测量矩阵 \hat{\mathit{\Phi }} ;
初始化:生成 {N}\times {N} 的单位矩阵 \boldsymbol{H} ,迭代次数 u=1 ,计算字典矩阵 \boldsymbol{D} ,并列标准化得到 {\tilde{\boldsymbol{D}}}_{0} ;
1) 生成Gram矩阵: \boldsymbol{G}={\tilde{\boldsymbol{D}}}_{u-1}^{{\mathrm{T}}}{\tilde{\boldsymbol{D}}}_{u-1} ;
2) 对矩阵 \boldsymbol{G} 进行特征值分解: \boldsymbol{G}={\boldsymbol{P}} {\boldsymbol{\varLambda }} {\boldsymbol{P}}^{{\mathrm{T}}} ;
3) 将矩阵 {\boldsymbol{\varLambda }} 的对角线元素中的非零项设置为N/M,得到 {\hat{\boldsymbol{\varLambda }}}_{{G}} ;
4) 重新计算Gram矩阵 {\boldsymbol{G}}={\boldsymbol{P}} {\hat{\boldsymbol{\varLambda }}} {\boldsymbol{P}}^{{\mathrm{T}}} ;
5) 将矩阵 {\hat{\boldsymbol{\varLambda }}} 进行分解, {\hat{\boldsymbol{\varLambda }}} ={\boldsymbol{L}}^{{\mathrm{T}}}\boldsymbol{L} ;
6) 代入 {\boldsymbol{G}} ,计算 {\boldsymbol{G}}={\boldsymbol{P}} {\boldsymbol{L}}^{{\mathrm{T}}}\boldsymbol{L}{\boldsymbol{P}}^{{\mathrm{T}}} ,令 {\hat{\boldsymbol{D}}}_{i}=\boldsymbol{L}{\boldsymbol{P}}^{{\mathrm{T}}} ;
7) 若 \left|{{g}}_{i,j}\right| \leqslant \mu_0 , {\mathit{H}}_{i,j}={{g}}_{i,j} ,若 \left|{{g}}_{i,j}\right| > \mu_0 , {\mathit{H}}_{i,j}= \mu_0 \;{\mathrm{sgn}}\left({g}_{i,j}\right) ,对矩阵 \boldsymbol{H} 进行修改;
8) 对矩阵 {\boldsymbol{H}} 特征值分解 ,\boldsymbol{H}={\boldsymbol{P}}{\boldsymbol{\varLambda }}_H{\boldsymbol{P}}^{{\mathrm{T}}} ;
9) 利用矩阵 \boldsymbol{I}=\left[\begin{array}{cc}{\boldsymbol{E}}_{M}& {\boldsymbol{0}}\\ {\boldsymbol{0}}& {\boldsymbol{0}}\end{array}\right] 对矩阵 \boldsymbol{H} 降秩,并重新计算 {\boldsymbol{H}}_{M}={\boldsymbol{P}}_{{H}}\boldsymbol{I}{\boldsymbol{\varLambda }}_{{H}}{\boldsymbol{P}}_{{H}}^{{\mathrm{T}}} ;
10) 对 {\boldsymbol{H}}_{M} 特征值分解, {\boldsymbol{H}}_{M}={\boldsymbol{P}}{\boldsymbol{\varLambda }}_{{{H}}_{M}}{\boldsymbol{P}}^{{\mathrm{T}}} , {\boldsymbol{\varLambda }}_{{{H}}_{M}}= {\mathrm{diag}}({\lambda }_{{{H}}_{{M}},1}, {\lambda }_{{{H}}_{{M}},2}, \cdots , {\lambda }_{{{H}}_{{M}},M},0, \cdots ,0) ;
11) 令 {\hat{\lambda }}_{{\boldsymbol{H}}_{\mathrm{M}}}=\displaystyle\frac{1}{M}\sum _{p=1}^{M}{\lambda }_{{\boldsymbol{H}}_{\mathrm{M}},p} ,修改特征值矩阵 {\hat{\boldsymbol{\varLambda }}}_{{{H}}_{M}}= {\mathrm{diag}}({\hat{\lambda }}_{{{H}}_{{M}}},{\hat{\lambda }}_{{{H}}_{{M}}}, \cdots ,{\hat{\lambda }}_{{{H}}_{{M}}},0, \cdots ,0) ;
12) {\boldsymbol{H}}_{{\mathrm{opt}}}={\boldsymbol{P}}{\hat{\boldsymbol{\varLambda }}}_{{{H}}_{M}}{\boldsymbol{P}}^{{\mathrm{T}}} ;
13) {\tilde{\boldsymbol{D}}}_{u}={\tilde{\boldsymbol{D}}}_{u-1}-4\beta {\tilde{\boldsymbol{D}}}_{u-1}({\tilde{\boldsymbol{D}}}_{u-1}^{{\mathrm{T}}}{\tilde{\boldsymbol{D}}}_{u-1}-{\boldsymbol{H}}_{{\mathrm{opt}}}) ;
14) 若 {\left|\right|{\tilde{\boldsymbol{D}}}_{u}^{{\mathrm{T}}}{\tilde{\boldsymbol{D}}}_{u}-{\boldsymbol{H}}_{{\mathrm{opt}}}\left|\right|}_{2}^{2} < \sigma ,进入16),否则进入15);
15) 若 u < t ,则 u=u + 1 ,返回1),否则进入16);
16) 输出 \hat{\boldsymbol{\varPhi }}={\tilde{\boldsymbol{D}}}_{u}{\boldsymbol{\varPsi }}^{-1} .
3. 算法仿真
为验证本文优化算法的有效性,在MATLAB上进行仿真,以正交匹配追踪(orthogonal matching pursuit,OMP)作为重构算法,实验参数如表1所示.
表 1 参数表Table 1. Parameters参数名称 参数值 \boldsymbol{\varPhi } 随机导频矩阵 {\boldsymbol{\varPsi }} 单位矩阵 t/次 1000 \beta 0.01 信道类型 随机瑞利衰落 导频长度 100 信号长度 256 潜在用户数/人 30 图1比较了 \boldsymbol{\varPhi } 与 {\boldsymbol{\varPsi }} 的相关系数随观测维度M的变化趋势. 由图可见,经过基于矩阵分解与ETF理论的改进后,测量矩阵与稀疏基之间的相关性明显降低.
图2比较了不同稀疏度的情况下不同算法错误估计活跃用户的数量. 从图中可以看出:信号稀疏度低于30时,各算法都能准确地估计活跃用户,但当稀疏度大于30以后,随着稀疏度不断增加,错误估计的活跃用户数量都在增加;本文提出的优化算法性能较好.
图3比较了不同稀疏度下,单次重构所消耗的时间. 文献[6-10]所提及的矩阵优化算法复杂度分别为 {O}\left({{N}}^{2}\right){、}{O}\left({{N}}^{2}\right){、}{O}\left(1\right){、}{O}\left({N}\right){、}{O}\left({N}\right) ,本文所提出的算法复杂度为 {O}\left({{N}}^{2}\right) . 从图中可以看出,本文提出的算法所消耗的时间较多,是因为通过特征值分解优化了平均相关性,构造出ETF矩阵后又对其进行降秩与降低平均相关性的操作,计算流程较多,因此单次重构时间相对较长.
图4比较了不同信噪比(SNR)下信号稀疏度为30时,通过不同算法进行信道估计所得的均方误差(MSE). 从结果可以看出,随着信噪比的增加,各算法均方误差都在降低,其中,本文提出的测量矩阵优化算法效果最好.
图5比较了在不同信噪比下信号稀疏度为30时不同算法所得的误码率(BER). 由图可知,随着信噪比的增加,各个算法的误码率也逐渐下降,其中,本文提出的测量矩阵改进算法性能最好.
通过上述仿真实验可以看出,本文提出的基于矩阵分解和ETF理论的测量矩阵改进算法,虽然在时间复杂度上有所不足,但在重构性能、信道估计与活跃用户检测上有一定的优势.
4. 总 结
在大规模通信场景下,基于测量矩阵与稀疏基所构造出的Gram矩阵,提出一种矩阵分解与ETF理论相结合的优化算法. 主要结论如下:
1) 所提出的算法有效减小了测量矩阵与稀疏基之间的相关性,提高了信号重构的质量,优化了测量矩阵在信道估计与活跃用户检测中的性能.
2) 未来可对该算法时间复杂度进行优化,以提高重构的效率. 该算法单次重构时间相对较高,在后续研究中将尝试在保证算法性能的基础上,降低其时间复杂度.
-
-
[1] KAKLAMANOS J, CABAS A, PAROLAI S, et al. Introduction to the special section on advances in site response estimation[J]. Bulletin of the Seismological Society of America, 2021, 111(4): 1665-1676. doi: 10.1785/0120210152 [2] LEE V W, TRIFUNAC M D. Should average shear-wave velocity in the top 30 m of soil be used to describe seismic amplification?[J]. Soil Dynamics and Earthquake Engineering, 2010, 30(11): 1250-1258. doi: 10.1016/j.soildyn.2010.05.007 [3] BORA S S, SCHERBAUM F, KUEHN N, et al. Development of a response spectral ground-motion prediction equation (GMPE) for seismic-hazard analysis from empirical Fourier spectral and duration models[J]. Bulletin of the Seismological Society of America, 2015, 105(4): 2192-2218. doi: 10.1785/0120140297 [4] Y BARD P, BORA S S, HOLLENDER F, et al. Are the standard VS-kappa host-to-target adjustments the only way to get consistent hard-rock ground motion prediction?[J]. Pure and Applied Geophysics, 2020, 177(5): 2049-2068. doi: 10.1007/s00024-019-02173-9 [5] BORCHERDT R. Effects of local geology on ground motion near San Francisco Bay[J]. Bulletin of the Seismological Society of America, 1970, 60: 29-61. [6] NAKAMURA Y. A method for dynamic characteristics estimation of subsurface using microtremor on the ground surface[J]. Quarterly Report of Rtri, 1989, 30(1): 25-30. [7] ANDREWS D J. Objective determination of source parameters and similarity of earthquakes of different size[M]//Earthquake Source Mechanics. Washington D. C.: American Geophysical Union, 2013: 259-267. [8] 王宏伟,任叶飞,温瑞智,等. 地震动非参数化谱反演可靠性分析[J]. 西南交通大学学报,2022,57(1): 182-190. doi: 10.3969/j.issn.0258-2724.20200241WANG Hongwei, REN Yefei, WEN Ruizhi, et al. Reliability analysis on non-parametric spectral inversion of seismic ground motion[J]. Journal of Southwest Jiaotong University, 2022, 57(1): 182-190. doi: 10.3969/j.issn.0258-2724.20200241 [9] 周影. 复杂板块构造下地震动路径衰减及震源特性研究[D]. 哈尔滨:中国地震局工程力学研究所,2021. [10] LERMO J, CHÁVEZ-GARCÍA F J. Site effect evaluation using spectral ratios with only one station[J]. Bulletin of the Seismological Society of America, 1993, 83(5): 1574-1594. doi: 10.1785/BSSA0830051574 [11] AMERI G, OTH A, PILZ M, et al. Separation of source and site effects by generalized inversion technique using the aftershock recordings of the 2009 L’Aquila earthquake[J]. Bulletin of Earthquake Engineering, 2011, 9(3): 717-739. doi: 10.1007/s10518-011-9248-4 [12] ATKINSON B, MEREU R. The shape of ground motion attenuation curves in southeastern Canada[J]. Bulletin of the Seismological Society of America, 1992, 82(5): 2014-2031. doi: 10.1785/BSSA0820052014 [13] REN Y F, WEN R Z, YAMANAKA H, et al. Site effects by generalized inversion technique using strong motion recordings of the 2008 Wenchuan earthquake[J]. Earthquake Engineering and Engineering Vibration, 2013, 12(2): 165-184. doi: 10.1007/s11803-013-0160-6 [14] 宋健,师黎静,党鹏飞,等. 考虑海域衰减特性的日本相模湾海底场地放大研究[J]. 土木工程学报,2021,54(12): 74-84.SONG Jian, SHI Lijing, DANG Pengfei, et al. Study on site amplification of strong ground motion stations considering attenuation characteristics of the sea area in the Sagami Bay area, Japan[J]. China Civil Engineering Journal, 2021, 54(12): 74-84. [15] 姚鑫鑫,任叶飞,岸田忠大,等. 强震动记录的数据处理流程:去噪滤波[J]. 工程力学,2022,39(增1): 320-329.YAO Xinxin, REN Yefei, AN Tianzhongda, et al. The procedure of filtering the strong motion record: denoising and filtering[J]. Engineering Mechanics, 2022, 39(S1): 320-329. [16] KONNO K, OHMACHI T. Ground-motion characteristics estimated from spectral ratio between horizontal and vertical components of microtremor[J]. Bulletin of the Seismological Society of America, 1998, 88(1): 228-241. doi: 10.1785/BSSA0880010228 [17] LI J Y, ZHOU B G, RONG M S, et al. Estimation of source spectra, attenuation, and site responses from strong-motion data recorded in the 2019 Changning earthquake sequence[J]. Bulletin of the Seismological Society of America, 2020, 110(2): 410-426. doi: 10.1785/0120190207 [18] PAIGE C C, SAUNDERS M A. Algorithm 583: LSQR: sparse linear equations and least squares problems[J]. ACM Transactions on Mathematical Software, 1982, 8(2): 195-209. doi: 10.1145/355993.356000 [19] 林向东,葛洪魁,徐平,等. 近场全波形反演:芦山7.0级地震及余震矩张量解[J]. 地球物理学报,2013,56(12): 4037-4047. doi: 10.6038/cjg20131209LIN Xiangdong, GE Hongkui, XU Ping, et al. Near field full waveform inversion: Lushan magnitude 7.0 earthquake and its aftershock moment tensor[J]. Chinese Journal of Geophysics, 2013, 56(12): 4037-4047. doi: 10.6038/cjg20131209 [20] WANG H W, REN Y F, WEN R Z. Source parameters, path attenuation and site effects from strong-motion recordings of the Wenchuan aftershocks (2008-2013) using a non-parametric generalized inversion technique[J]. Geophysical Journal International, 2018, 212(2): 872-890. doi: 10.1093/gji/ggx447 [21] 赵翠萍,陈章立,华卫,等. 中国大陆主要地震活动区中小地震震源参数研究[J]. 地球物理学报,2011,54(6): 1478-1489.ZHAO, Cuiping. , CHEN Zhangli, HUA Wei, et al. Study on source parameters of small to moderate earthquake in the main seismic active regions, China mainland, Chinese. Journal of Geophysics. 54(6): 1478-1489. [22] 任叶飞. 基于强震动记录的汶川地震场地效应研究[D]. 哈尔滨:中国地震局工程力学研究所,2014. [23] 李红光,冷崴. H/V谱比方法在强震记录应用中几个影响因素的初步研究[J]. 地震工程学报,2019,41(1): 169-176. doi: 10.3969/j.issn.1000-0844.2019.01.169LI Hongguang, LENG Wei. Preliminary study on the influencing factors of the horizontal-to-vertical spectral ratio applied in strong motion[J]. China Earthquake Engineering Journal, 2019, 41(1): 169-176. doi: 10.3969/j.issn.1000-0844.2019.01.169 [24] RONG M S, FU L Y, WANG Z M, et al. On the amplitude discrepancy of HVSR and site amplification from strong-motion observations[J]. Bulletin of the Seismological Society of America, 2017, 107(6): 2873-2884. doi: 10.1785/0120170118 [25] PAROLAI S. The importance of converted waves in comparing H/V and RSM site response estimates[J]. Bulletin of the Seismological Society of America, 2004, 94(1): 304-313. doi: 10.1785/0120030013 -