Voiceprint Recognition of Discharge Aliasing Signals from 750 kV Transformer and Pin-Plate Based on Sparse Representation Theory and Convolutional Neural Network
-
摘要:
变压器绝缘水平和健康状态对电网的安全稳定至关重要,为研究750 kV变压器内部存在放电故障时,箱体外采集的可听声信号中可能混杂有电晕声、鸟鸣等其他干扰信号的工程实际问题,提出一种基于稀疏表示理论(SBSS)与卷积神经网络(CNN)的750 kV变压器与尖板放电混叠信号的声纹识别方法. 首先,采集武胜750 kV变电站变压器正常运行声信号作为背景声,构建针-板放电模型得到放电声信号和现场常见干扰声作为前景声,通过添加不同信噪比的前景声到背景声中构造混叠声信号;然后,利用基于稀疏表示理论的盲分离算法实现目标前景声纹图谱和冗余背景声纹图谱的分离;最后,对CNN模型超参数进行优化,以提高模型对分离后的各类前景声纹谱图的分类性能. 研究结果表明:通过盲源分离算法可以剔除冗余背景声干扰,使神经网络聚焦于前景声的分类识别;本文方法可实现混叠声信号中前景声纹的分离,分离后,CNN、支持向量机(SVM)和反向传播神经网络(BPNN)的识别准确率分别提高7.6%、17.2%和14.3%.
Abstract:Transformer insulation level and health state are crucial to the safety and stability of the power grid. In order to study the practical engineering problem that the audible acoustic signals collected outside the box may be mixed with other interference signals, such as corona sound and bird song when there is a discharge fault inside the 750 kV transformer, a voiceprint recognition of 750 kV transformer and pin-plate discharge aliasing signals based on sparse representation theory (SBSS) and convolutional neural network (CNN) was proposed. Firstly, the normal operation sound signal of Wusheng 750 kV Substation was collected as the background sound, and the discharge sound signal and the common interference sound in the field were used as the foreground sound by constructing the pin-plate discharge model. The aliasing sound signal was constructed by adding the foreground sound with different signal-to-noise ratios to the background sound. Secondly, the blind separation algorithm based on SBSS was used to realize the separation of target foreground and redundant background voiceprint spectra. Finally, the hyperparameters of the CNN model were optimized to improve the classification performance of the model on the separated various types of foreground voiceprint spectra. The results show that the blind source separation algorithm can eliminate the redundant background sound interference so that the neural network can focus on the classification and recognition of foreground sound. The proposed method can separate foreground voiceprint in the aliasing sound signals, and the recognition accuracies of the CNN, the support vector machine (SVM), and the back-propagation neural network (BPNN) after separation are improved by 7.6%, 17.2%, and 14.3%, respectively.
-
变压器作为电力系统中的重要电气设备,其绝缘水平和健康状态是保障电网安全稳定的前提[1-2]. 受制造工艺及运行环境影响,变压器内部金属毛刺、悬浮颗粒等绝缘缺陷使其周围极易出现不均匀电场,导致绝缘劣化加速,发生局部放电[3-5],准确识别放电可为变压器异常状态预警提供重要参考.
在工业场景中,通过各种传感器收集设备的状态数据,结合人工智能算法对设备进行运行状态评估可大幅提升运维的效率[6-8]. 可听声信号蕴含丰富的变压器运行状态信息,相对于振动信号检测,可听声检测具有不停电测量和非接触式诊断的优点[9];同时,由于声波传播的衰减程度与频率的平方成正比,可听声检测也极大克服了超声信号在传播过程中的大幅信息衰减[10]. 在特征提取方面,峰值、峭度、偏度、波形因子、裕度因子等统计参数常用于描述信号时域特征[11];傅里叶变换等通常用来获取信号的全局频率分布,主频、次频及频带能量占比等常用于提取信号的频域特征[12-13];时域分析和频域分析在工程中被广泛使用,从本质上讲,他们只适用于分析平稳信号,难以完整反映非平稳信号中的局部特征信息. 变压器正常运行时声信号较平稳,而放电等各类异常声信号具有较强的时变性和非平稳性,单域特征描述较为片面,时域和频域相结合的时频分析能够提取非平稳信号频率随时间变化的时频特征,克服单一域分析的局限性[14]. 同时,通过时频分析得到的信号声纹谱图将一维信号可视化为二维图像,更为直观地展示声信号的特征信息,反映变压器的运行状态. 设备状态可视化技术也是目前信号处理和现场监测的常用手段之一.
基于信号盲分离算法和稀疏表示理论,文献[15]运用快速独立分量分析实现了断路器合闸期间各类源信号的盲分离,此方法通常要求现场声音传感器数量大于等于信号源数目,分离出的各类源信号的排列顺序与上下幅值具有随机性. 文献[16]利用集合经验模态分解和稀疏表示理论对声音信号矩阵进行去噪,此方法的目的是获得成分相对单一的变压器背景声信号,异常前景噪声均被去除,其原始信号矩阵由一维时域信号分割、裁剪、拼接而成. 文献[17-18]采用基于稀疏表示的分类算法,分别对断路器机械故障和干式变压器铁芯绕组松动故障的声音信号特征向量进行识别. 目前,盲分离算法的应用对象多为一维声音信号,且适用场景有限,缺少广泛意义;稀疏表示理论作为近年来信号处理领域的研究热点,主要应用于信号重构和分类场景,而将其应用于信号盲分离的研究尚少,特别是针对二维图像数据的分离. 基于研究现状,本文对稀疏表示理论在二维图像信号盲分离方面的应用进行了探究.
对变压器运行状态进行监测时,其声纹谱图中的异常部分可能是设备故障产生的放电声,也可能是讲话声、鸟鸣声等其他现场干扰,以上声信号统称为前景声纹. 考虑到基于先验知识而设计的各种去噪算法的局限性,本文摒弃了传统方法对各类未知现场噪声的抑制和去除环节,而是选择在变压器正常运行背景声中直接分离出未知类型的前景声纹[19],然后,对各类型前景声纹进行放电故障或噪声干扰的判断与识别[20-21],实现用统一的分离识别代替复杂的去噪筛选.
传统的局部放电识别方法首先通过人工构造特征参量,提取特征参数后将其输入分类器进行识别,此思路对声纹图像的适用度有限. 随着各类智能算法的快速发展,卷积神经网络等深度学习算法克服了人工提取的主观性和局限性[22],在大规模图像学习和分类方面发挥了重要作用,已应用于新一代电力系统的状态诊断,目前主要集中于直流电缆[23]、气体绝缘开关[24]等设备的放电识别. 本文基于稀疏盲分离得到的声纹谱图,进一步探究其在油浸式变压器放电声纹识别方面的应用.
电抗器和变压器内部均存在铁芯和绕组,属于油浸式设备. 750 kV电抗器正常运行期间,声音信号的频率分量主要集中在
1000 Hz以内. 西北地区一台750 kV电抗器运行期间产生异常声信号,对该设备解体后发现其内部有明显放电痕迹. 对故障期间采集的声信号进行分析发现,1000 ~7500 Hz频率分量有明显增加,与放电信号在1000 Hz以上频率分量有较多分布的现象相吻合. 因此,实际的故障电抗器声信号可以视为正常运行期间声信号和故障放电声信号的叠加. 本文提出采用混合叠加变压器正常运行声信号和针板电极放电声信号模拟变压器内部放电声信号的方法具有一定的合理性和可行性.本文首先采集武胜750 kV变电站变压器正常运行声信号作为背景声;搭建模拟放电实验平台,将变压器油中放电声信号与其他常见干扰声信号作为前景声;将不同信噪比的各类型前景声以随机位置添加到变压器运行背景声中,构造可模拟现场环境的混叠声信号. 然后,利用基于稀疏表示理论的盲分离算法对混叠声纹时频谱图进行前景声纹的分离提取;调整优化卷积神经网络的结构参数,对分离出的前景声纹谱图进行学习和识别. 最后,将本文方法与传统特征提取和识别算法进行对比分析.
1. 基本原理
1.1 声纹时频谱图
非平稳信号的特征信息会随时间变化发生改变,传统的时域和频域分析方法大多只适用于平稳信号的全局信息提取,难以准确反映非平稳信号在时频域上的局部特征信息. 时频谱图建立了非平稳信号在时域和频域之间的联系,能够反映信号频率分布随时间刻度变化的规律,可以完整直观地展现声信号的局部特征和全局特征,为声纹的特征提取与识别提供了极大便利. 图1为声纹时频谱图的绘制流程. 图中,DCT为离散傅里叶变换.
在进行时频谱图绘制时,首先要对原始声信号进行分帧及加窗操作. 分帧是通过特定长度的窗口在非平稳的放电声信号上移动加权,从而将其分割成为短时平稳的信号片段,这些片段称为帧. 为保持帧与帧之间的连续性并使其平滑过渡,分帧一般采用交叠分割的方法,即前一帧和后一帧保持一定的交叠部分,称为帧移,关系式为
M=T−LαL(1−α), (1) 式中:M为帧数,L为帧长,T为声信号长度,α为重叠率.
将每帧信号片段进行加窗处理,改善频谱泄漏带来的影响. 本文选择具有较好时间和频率聚集特性的汉明窗,窗函数为
w(n)={0.54−0.46cos(2πnN−1),0⩽n⩽N−1,0,其他, (2) 式中:n为时间,N为汉明窗长度.
将加窗处理的信号片段进行短时离散傅里叶变换,得到线性时频谱. 频谱函数为
W(f)=N−1∑n=0w(n)e−j2πNfn,0⩽n,0⩽f⩽N−1N, (3) 式中:f为频率.
功率谱密度为
X=10lg|W(f)|2. (4) 1.2 基于稀疏表示理论的声纹盲分离
本文以变压器正常运行背景声的功率谱密度矩阵为基准,选择K-SVD (K-singular value decomposition)算法训练基准声纹字典;然后,以基准声纹字典为变换域,利用正交匹配追踪算法(orthogonal matching pursuit,OMP)重构混叠信号声纹谱图在此变换域上的声纹,实现混叠信号中目标前景声纹与背景声纹的分离,并对前景声纹类型作进一步判断识别.
1.2.1 稀疏表示理论
稀疏表示理论在声纹识别中是获取声纹功率谱密度矩阵A∈RU × P在某一组字典D∈RU × K上的稀疏表示系数矩阵θ∈RK × P,其表达式和数学模型分别如式(5)和图2所示.
{\boldsymbol{A}} \approx {\boldsymbol{D}}{\boldsymbol{\theta}}. (5) 字典D包含一组基函数的矩阵,用于表示信号. 字典矩阵的列是基函数,通常是过完备的,即包含的基函数数量大于信号空间的维数. θ包含了信号在字典矩阵中的稀疏表示,θ中的大部分元素为0,只有少数元素非零,这些非零元素对应的基函数是信号的主要成分.
1.2.2 K-SVD字典学习和OMP算法
本文选择的K-SVD字典学习算法可以灵活地与OMP算法结合使用,泛化能力较强. 其利用输入的原始矩阵F和初始化字典,通过K步SVD分解计算的迭代,逐步更新字典D,并使用OMP算法求解稀疏表示系数向量θ,得到让θ尽量稀疏的字典D,其优化迭代过程可以分为稀疏编码阶段和字典更新阶段.
1) 稀疏编码
固定字典D,利用OMP算法计算稀疏表示系数θ. 给定OMP算法初始化条件:将残差R定义为输入矩阵Z,定义空集合S为测量矩阵,稀疏表示系数θ所有元素设为0.
首先,计算字典D中与残差R内积最大的原子,并将其添加到集合S中;其次,利用式(6)得到新的稀疏系数向量 \hat {\boldsymbol{\theta}} .
\hat {\boldsymbol{\theta}} = {\mathrm{arg min}}\;{\left\| {{\boldsymbol{S}}{\boldsymbol{\theta}} - {\boldsymbol{Z}}} \right\|_2}. (6) 然后,利用式(7)更新残差Rnew,直至稀疏向量 {{\hat {\boldsymbol{\theta}} }} 在字典D下的稀疏度无法降低,再更新字典D.
{{\boldsymbol{R}}_{{\mathrm{new}}}} = {\boldsymbol{R}} - {\boldsymbol{S}}\hat {\boldsymbol{\theta}} . (7) 2) 字典更新
利用得到的稀疏表示系数向量,更新字典D的第m列原子dm (1≤m≤K),目标函数改写为
\left\| {{\boldsymbol{F}} - {\boldsymbol{D}}{\boldsymbol{\theta }}} \right\|_2^2 = \left\| {{\boldsymbol{F}} - \sum\limits_{j = 1}^P {{{\boldsymbol{d}}_j}{\boldsymbol{\theta }}_{}^{(j)}} } \right\|_2^2 = \left\| {{{\boldsymbol{E}}_m} - {{\boldsymbol{d}}_m}{\boldsymbol{\theta }}^{(m)}} \right\|_2^2, (8) 式中:{\boldsymbol{\theta}}^{(j)} 为F的K个列向量的稀疏表示系数矩阵的第j行,Em为除去原子dm时所有K列向量的误差.
记ωm为θ(m)的非零索引,如式(9)所示.
{\omega _m} = \left\{ {i|1 \leqslant i \leqslant G,{{\boldsymbol{\theta }}^{(m)}}(i) \ne {\boldsymbol{0}}} \right\} , (9) 式中:G为信号长度.
根据ωm选择Em的列构成矩阵Bm,对矩阵Bm进行奇异值分解得到Bm=U {\boldsymbol{\varDelta}} VT. 用U的第1列更新dm;用VT第1列乘以 {\boldsymbol{\varDelta}} 中第1个元素,以此更新θ(m)对应索引ωm相应位置的元素.
得到当前误差矩阵Em后,只需要调整dm和θ(m),使其乘积与Em的误差值尽可能小. 当字典的全部列向量都更新完毕时,再利用更新后的字典继续进行稀疏编码和字典更新过程,经过多轮迭代,直至目标函的数值趋于收敛,由此得到最终的学习字典D.
1.2.3 分离步骤
1) 变压器运行声信号基准字典训练
选择常用的离散余弦字典Dc作为初始字典,将变压器正常运行背景声的功率谱密度矩阵X作为原始信号矩阵,设置误差约束常数k,利用K-SVD算法进行学习、训练、更新,得到变压器正常运行背景声信号时频谱图的对应字典D,并将其作为基准声纹字典进行下一步运算. 矩阵{\boldsymbol{D}}_{\mathrm{c}} 中第a行第b列的元素为
{D}_{{\mathrm{c}}}(a,b) = \left\{\begin{array}{l} \dfrac{1}{\sqrt{\zeta }},\quad a=1,b=1 ,2,\cdots, M,\\ \dfrac{1}{\sqrt{\varrho}}\mathrm{cos}\dfrac{(a - 1)(2b - 1){\text{π}} }{2\varrho},\;\; a > 1,b = 1 ,2,\cdots, M, \end{array}\right. (10) 式中:ζ 为信号在时间上的长度,即每个基函数的点数,对应离散余弦变换中信号的维度;ϱ为频率分量数量,即字典中不同频率基函数的个数,对应频率轴的分辨率,控制基函数的频率分布.
2) 前景声纹的分离与提取
对于混叠声信号时频谱图的功率谱密度矩阵X,利用OMP算法计算其在基准声纹字典D上的稀疏表示系数θt,重构信号(Xr=Dθt)为分离出的变压器正常运行背景声时频谱图,信号余量Z - Dθt则为分离出的目标前景声纹.
基于稀疏表示理论的盲源分离方法流程如图3所示.
1.3 卷积神经网络
本文从混叠声信号中分离出未知类型的前景声纹,利用卷积神经网络对前景声纹进行放电或干扰的判断和识别,实现变压器运行状态监测. 图4为基于SBSS和CNN的声纹识别系统示意.
卷积神经网络含有输入层、卷积层、池化层、全连接层和输出层等一般结构.
输入层将不同类型声纹谱图的功率谱密度作为输入. 在卷积层操作中,卷积核通过特定步长的移动对输入数据进行卷积计算,利用激活函数\sigma (·)计算得到该层特征数据,其过程可表示为
{C_e} = \sigma ({C_{e - 1}} \otimes {{{Q}}_e} + {b_e}), (11) 式中:Ce为卷积神经网络第e层特征图,Qe为第e层卷积核的权重,be为第e层的偏置项.
池化层用于对卷积操作得到的数据进行降维,提高网络计算效率,如式(12)所示.
{C_e} = p({C_{e - 1}}), (12) 式中:p(•)为池化操作.
全连接层对上一层输出的特征数据进行加权求和,利用激活函数h(·)继续求解,完成目标分类. 加权求和计算如式(13)所示.
y_{w, q}(x)=h\left(\sum_{u=1}^{n} p_{u} x_{u} + q_{u}\right), (13) 式中:y_{w, q}(x) 为全连接层神经元的输出值,pu为第u个输入特征的权重,xu为第u个输入特征的值,qu为第u个神经元的偏置量.
卷积神经网络作为深度学习领域的经典算法,能够利用自身网络结构及参数自适应地逐步逐层提取图像特征,在一定程度上避免了传统识别方法需要人工构造特征的主观性和局限性.
2. 声信号采集与混叠实验
为获得变压器正常运行声信号作为背景声,本文在武胜750 kV变电站对变压器正常运行声信号进行采集. 根据GB/T 3785.1—2023[25],声音测量频率范围应覆盖25 Hz~16 kHz. 本文选用COMICA-VM20超心型电容式驻极指向麦克风,其灵敏度范围为 −43~−23 dB,频响范围为20 Hz~20 kHz,并基于GoldWave数据采集软件对变压器声信号进行采集,采样频率44.1 kHz. 根据GB/T 1094.10—2022[26],采集时麦克风指向方向垂直于变压器油箱壁,位置距离油箱壁50 cm,为尽可能减少风机噪声影响,仅采集变压器正面运行声音,测点以九宫格状均匀分布.
为获得变压器典型油纸绝缘缺陷放电声信号作为前景声,本文构造了针板人工缺陷模型[27-28],用以模拟金属尖端等绝缘缺陷的形态结构和产生的不均匀电场,以实验室背景噪声为环境底噪,采集其在25号克拉玛依变压器油中的放电声信号,如图5所示. 图中:Φ为直径,r为半径.
实验平台接线如图6所示,包括工频变压器(容量6 kVA,额定电压60 kV,分压器分压比为
1000 ∶1)、控制箱、保护电阻(阻值为10 kΩ)、电容分压器、低压臂电容、油箱和针板放电模型,麦克风参数设置与750 kV变电站现场采集时相同.油中放电随机性强,且随电压升高逐渐剧烈. 本文随机截取不同电压等级下放电声信号中的不同放电脉冲区域,单次截取时长控制在2 s以内. 此时,每个截取样本的信噪比、样本时长、所含脉冲个数、脉冲形态和放电程度各不相同,有效模拟了放电的随机性和复杂性,表征涵盖了不同的劣化程度,得到的放电样本库特征信息丰富,从而避免了样本中放电特征的重复.
现场声信号一般认为是由多种源信号合成叠加所得[29],本文设计信号混叠实验,以750 kV变电站变压器正常运行声信号作为背景声,将上述截取样本以随机位置添加到时长为2 s的变压器运行背景声中,构造可模拟现场环境的混叠声信号,图7为随机混叠示意. 此时,同一截取样本可能混叠在不同背景声信号中的不同位置,再次模拟了放电的随机性和复杂性.
将变电站现场可能存在的讲话声、鸟鸣声等环境声信号添加到变压器正常运行背景声中,构造混叠声信号,如表1所示.
表 1 声纹样本Table 1. Voiceprint samples前景声 背景声 混叠信号 样本数/个 时长/s 放电声 武胜变 放电声 + 武胜变 135 2 说话声 武胜变 说话声 + 武胜变 135 2 鸟鸣声 武胜变 鸟鸣声 + 武胜变 135 2 放电声和环境声都会在正常运行声纹谱图中产生异常声纹区域,当检测到异常区域时,则对声纹谱图中的异常前景声纹进行分离和识别,若识别为环境声则表示运行正常,若识别为放电声则表示运行异常,作出放电故障预警.
3. 结果分析
3.1 声纹时频谱图和稀疏盲分离
绘制声纹时频谱图时,为兼顾分帧片段的特征代表性和信息准确性,本文选择的分帧帧长为0.02 s,即1个工频周期,帧移为0.01 s.
变压器正常运行声信号的时域波形平稳,代表声音频率能量分布的特征频带主要集中在1 kHz以下,1 kHz以上的高频部分未出现特征频带,整体频率分布随时间变化表现平稳;而放电声的时域波形存在明显时变脉冲,声纹谱图中特征频带主要集中在1 kHz以上的高频区域,呈条形贯通状分布,具有时间随机性、位置随机性和强度随机性.
采用第1.2节的稀疏盲分离算法实现混叠声信号中非平稳信号和连续平稳信号之间的分离,混叠及分离声纹谱如图8所示. 鸟鸣声主要集中在4~8 kHz的高频区域,谱图形貌并不规则;说话声频带分布因人而异,与变压器运行声存在一定频带范围的交集. 综上所述,正常声信号谱图在1 kHz以上的高频区域,不存在特征声纹,且谱图频率分布均匀稳定;而各类异常声信号具有较强的时变性和非平稳性,特征频带多集中于1 kHz以上的高频区域,谱图形貌特征各异.
由图8可见,各类型的非平稳前景声纹均从混叠声纹谱图中被最大限度地分离出来,其中,分离前景声谱图是去掉各部分背景噪声所得到的声纹谱图,分离出的前景声纹与背景过渡平滑,为后期建立样本库对其进行类型识别提供了基础条件.
为初步评价分离效果,本文以750 kV变电站变压器正常运行声信号功率谱密度作为参考,将分离出的背景声纹与参考谱图进行相似度对比,计算如式(14)所示,结果如表2. 由表2可知,分离出的背景声纹谱图与参考谱图的相似度均大于0.80[30].
表 2 分离背景与参考谱图声纹相似度对比Table 2. Voiceprint similarity comparison of separated background and reference spectra谱图类型 放电声 说话声 鸟鸣声 J 0.87 0.89 0.87 J = \frac{{\displaystyle\sum\nolimits_{s = 1}^R {\displaystyle\sum\nolimits_{d = 1}^P {({O_{sd}} - {{\overline O }_{sd}})} } ({Y_{sd}} - {{\overline Y }_{sd}})}}{{\sqrt {{{\displaystyle\sum\nolimits_{s = 1}^R {\displaystyle\sum\nolimits_{d = 1}^P {({O_{sd}} - {{\overline O }_{sd}})^2} } }}{{\displaystyle\sum\nolimits_{s = 1}^R {\displaystyle\sum\nolimits_{d = 1}^P {({Y_{sd}} - {{\overline Y }_{sd}})^2} } }}} }} \text{,} (14) 式中:O=(Osd)∈RR × P,为参考谱图的功率密度矩阵;Y=(Ysd)∈RR × P,为分离出的背景声纹的功率密度; {\overline O _{sd}} 与 {\overline Y _{sd}} 分别为矩阵O和Y所有元素的均值;J为皮尔逊相关系数,表示分离背景与参考图谱的声纹相似度.
3.2 CNN网络参数与识别结果
在进行网络学习之前,需要将分离出的前景声纹谱图划分为训练集和验证集. 本文将同一类别标签下的135组样本随机选取100个作为训练集,剩余35个作为验证集,将带标签样本随机排序后输入到CNN进行训练和识别.
由于CNN在每次训练时权重参数都是随机初始化的,训练结果不可避免地呈现出一定的数值波动. 此外,样本的质量、计算机硬件的性能等因素也可能对训练结果产生影响. 为应对这些不确定性,本文在每种参数配置下均进行多次训练,并综合考虑网络稳定性和识别结果的准确性,最终确定网络的最佳参数设置.
3.2.1 网络结构
CNN网络结构参数,如卷积核尺寸和步长、池化核的尺寸和步长、卷积层与池化层数量等,均对网络训练迭代过程及识别效果有着显著影响. 经过参数调整与优化尝试,得到如表3所示的网络结构参数.
表 3 CNN网络结构参数Table 3. Parameters of CNN structure结构层 通道数/个 核尺寸 激活函数/池化类型 输入层 1 卷积层 16 5 × 5 ReLU 池化层 16 3 × 3 Max Pooling 卷积层 32 5 × 5 ReLU 池化层 32 3 × 3 Max Pooling 卷积层 64 5 × 5 ReLU 池化层 64 3 × 3 Max Pooling 卷积层 128 5 × 5 ReLU 全连接层 1024 Softmax 输出层 3 CNN网络结构中的卷积核尺寸和移动步长、池化核尺寸和移动步长、卷积层和池化层数量等网络结构参数会影响网络训练的迭代过程和识别效果,本文通过多次参数调整和寻优得到的网络结构参数如表3所示. 为缓解梯度消失或梯度爆炸,在卷积层使用常见的ReLU激活函数,且在每批数据前向传递时,对每一层进行规范化操作,使得数据满足均值为0,方差为1的正态分布;Max Pooling作为常用的一种池化方式,能够保留更多纹理特征信息,减少网络计算量,防止过拟合;全连接层的Softmax函数将多分类问题以概率的形式展现出来,是Sigmoid函数在多分类问题上的推广.
3.2.2 训练参数
批尺寸、学习率、优化器等参数影响网络的训练速度和最终准确率.
批尺寸是进行1次参数学习所使用的样本数量,本文保持总迭代次数为600次不变,选取以5为间隔步长的不同批尺寸以对比识别结果,部分参考结果如图9所示.
在批尺寸为5、10时,每次训练结果的数值波动较大,选择准确率众数值作为参考;在批尺寸为15、20、25时,每次训练所得准确率的数值波动较小,网络迭代过程较稳定,准确率值随批尺寸的增大而减小;综合考虑时间和准确率,本文选择15为批尺寸参数.
过高的学习率前期学习速度较快,但在迭代后期学习效率逐渐变差,易造成网络不收敛;学习率过小会减慢训练速度,同时影响结果准确性. 如图10所示,学习率为3\times 10^{-1} 时,验证集准确率曲线失真严重,出现不同程度凹陷;学习率为3\times 10^{-3} 、3\times 10^{-4} 、3\times 10^{-5} 时,验证集准确率曲线的最终准确率逐渐减小. 由于各学习率总迭代时间相差不大,综合考虑后,本文选用3\times 10^{-2} 为学习率参数.
本文选择了Sgdm、Rmsprop、Adam优化器进行对比实验. Sgdm在梯度下降中引入动量机制,减小了参数陷入局部最小值的可能性,但缺少对学习率的自适应更新;Rmsprop在考虑迭代衰减的情况下由大到小自适应地对学习率进行调整;Adam是Sgdm和Rmsprop的结合,其既引入了动量机制,又可自适应调整学习率,训练过程中学习率整体保持在较为平稳的范围,是目前应用最为广泛的深度学习优化器之一.
如图11所示,Adam优化器网络迭代过程较为稳定,最终识别准确率较高;另外2类优化器的网络迭代过程均出现了不同程度的下降和凹陷,最终识别准确率数值波动较大,故本文选用Adam优化器进行网络识别.
3.2.3 对比分析
为评估系统特征提取与分类方法的性能,将传统方法与深度学习算法进行对比分析. 采用传统的灰度梯度共生矩阵法提取声纹谱图的梯度优势、均方差、灰度熵等15种灰度纹理特征[21],将特征参数分别输入到支持向量机(SVM)和反向传播(BP)神经网络,将识别结果与CNN进行对比分析. SVM采用RBF核函数,c、g参数寻优采用交叉验证法(c为正则化参数,表示模型对错误分类点的惩罚力度;g为核函数的高斯核带宽参数,表示数据映射到高维空间后的分布),BP神经网络学习率为
0.0001 ,权重和阈值寻优采用负梯度下降法.为进一步评价稀疏盲分离算法的效果,验证分离的必要性,采用不同方法对混叠声纹(分离前)和前景声纹(分离后)进行识别,并对比其准确率. 如表4所示,无论分离前或分离后,传统的分类识别方法由于人工特征提取的主观性和局限性,无法全面反映谱图特征,识别准确率较低;而CNN通过构建网络自动逐层提取图像特征,减少了前期人工特征构造的局限性,具有较高的识别准确率.
表 4 不同方法的声纹识别准确率对比Table 4. Comparison of voiceprint recognition effects of different methods% 谱图类型 CNN SVM BP 混叠声纹谱 91.43 65.71 43.81 前景声纹谱 99.05 82.86 58.10 4. 结 论
1) 本文通过混叠750 kV变压器正常运行期间声信号与针-板放电声信号,模拟变压器故障信号,可扩充故障声信号样本库.
2) 变压器正常运行期间的声纹谱图特征频带主要集中于1 kHz以下,频率分布随时间平稳变化,而放电等各类异常声信号谱图特征频带多集中于1 kHz以上的高频区域.
3) 采用稀疏盲分离算法对不同的混叠声纹谱图进行处理,分离出的前景声纹保留了目标声纹特征,剔除了冗余背景信息,使神经网络能够更加专注于具有代表性的前景声纹特征;与未经分离的声纹谱图相比,采用CNN、SVM和BP 3种算法,分离后的前景声纹的识别准确率分别提高了7.6%、17.2%和14.3%.
4) 相对传统特征提取和分类方法,本文利用CNN自动逐层提取各类前景声的谱图特征,在一定程度上避免了人工特征构造的主观性与局限性. 在以分离后的前景声纹谱图为识别对象的对比实验中,优化后的CNN与SVM和BP算法识别率相比,分别提高16.19%和40.95%.
致谢:甘肃省电力公司电力科学研究院科技项目(52272219000Q)的支持.
-
表 1 声纹样本
Table 1. Voiceprint samples
前景声 背景声 混叠信号 样本数/个 时长/s 放电声 武胜变 放电声 + 武胜变 135 2 说话声 武胜变 说话声 + 武胜变 135 2 鸟鸣声 武胜变 鸟鸣声 + 武胜变 135 2 表 2 分离背景与参考谱图声纹相似度对比
Table 2. Voiceprint similarity comparison of separated background and reference spectra
谱图类型 放电声 说话声 鸟鸣声 J 0.87 0.89 0.87 表 3 CNN网络结构参数
Table 3. Parameters of CNN structure
结构层 通道数/个 核尺寸 激活函数/池化类型 输入层 1 卷积层 16 5 × 5 ReLU 池化层 16 3 × 3 Max Pooling 卷积层 32 5 × 5 ReLU 池化层 32 3 × 3 Max Pooling 卷积层 64 5 × 5 ReLU 池化层 64 3 × 3 Max Pooling 卷积层 128 5 × 5 ReLU 全连接层 1024 Softmax 输出层 3 表 4 不同方法的声纹识别准确率对比
Table 4. Comparison of voiceprint recognition effects of different methods
% 谱图类型 CNN SVM BP 混叠声纹谱 91.43 65.71 43.81 前景声纹谱 99.05 82.86 58.10 -
[1] 吴广宁,周芃,高波,等. 不同水分含量油浸纸板沿面放电发展过程及特性[J]. 西南交通大学学报,2020,55(3): 552-560.WU Guangning, ZHOU Peng, GAO Bo, et al. Discharge development and characteristics of oil-immersed pressboard surface with different moisture contents[J]. Journal of Southwest Jiaotong University, 2020, 55(3): 552-560. [2] 贾亚飞,朱永利,王刘旺,等. 基于VMD和多尺度熵的变压器内绝缘局部放电信号特征提取及分类[J]. 电工技术学报,2016,31(19): 208-217.JIA Yafei, ZHU Yongli, WANG Liuwang, et al. Feature extraction and classification on partial discharge signals of power transformers based on VMD and multiscale entropy[J]. Transactions of China Electrotechnical Society, 2016, 31(19): 208-217. [3] 律方成,牛雷雷,王胜辉,等. 基于紫外成像和改进YOLOv3的瓷悬式绝缘子放电严重程度评估[J]. 高电压技术,2021,47(2): 377-386.LÜ Fangcheng, NIU Leilei, WANG Shenghui, et al. Discharge severity assessment of porcelain suspension insulators based on UV images and improved YOLOv3[J]. High Voltage Engineering, 2021, 47(2): 377-386. [4] 郭蕾,曹伟东,白龙雷,等. 乙丙橡胶电缆终端气隙局部放电过程及特征提取[J]. 西南交通大学学报,2021,56(5): 1011-1019,1028.GUO Lei, CAO Weidong, BAI Longlei, et al. Partial discharge process and feature extraction of air gap in EPR cable terminal[J]. Journal of Southwest Jiaotong University, 2021, 56(5): 1011-1019,1028. [5] 高佳程,朱永利,贾亚飞,等. 基于改进SVDD算法与马氏距离的未知局部放电类型的识别[J]. 电工技术学报,2018,33(15): 3510-3517.GAO Jiacheng, ZHU Yongli, JIA Yafei, et al. Pattern recognition of unknown types of partial discharge based on improved SVDD algorithm and mahalanobis distance[J]. Transactions of China Electrotechnical Society, 2018, 33(15): 3510-3517. [6] 从建力,王源,徐舟,等. 振噪融合的地铁钢轨波磨快速测量方法[J]. 西南交通大学学报,2023,58(3): 677-684.CONG Jianli, WANG Yuan, XU Zhou, et al. Rail corrugation measurement method based on vibration-noise fusion in metro system[J]. Journal of Southwest Jiaotong University, 2023, 58(3): 677-684. [7] 卜秀孟,王力东,黎清蓉,等. 高速磁浮车-桥耦合振动控制参数影响分析[J]. 西南交通大学学报,2024,59(4): 848-857,866.BU Xiumeng, WANG Lidong, LI Qingrong, et al. Influence analysis of vibration control parameters for high-speed maglev train-bridge coupling[J]. Journal of Southwest Jiaotong University, 2024, 59(4):848-857,866. [8] 刘伟,赵春发,娄会彬,等. 基于虚拟激励法的磁浮车桥耦合系统随机振动分析[J]. 西南交通大学学报,2024,59(4): 823-831.LIU Wei, ZHAO Chunfa, LOU Huibin, et al. Stochastic vibration analysis of maglev train-bridge coupling system based on pseudo excitation method[J]. Journal of Southwest Jiaotong University, 2024, 59(4):823-831. [9] 张重远,罗世豪,岳浩天,等. 基于Mel时频谱-卷积神经网络的变压器铁芯声纹模式识别方法[J]. 高电压技术,2020,46(2): 413-423.ZHANG Zhongyuan, LUO Shihao, YUE Haotian, et al. Pattern recognition of acoustic signals of transformer core based on Mel-spectrum and CNN[J]. High Voltage Engineering, 2020, 46(2): 413-423. [10] 张瑞琪. 基于声学信号的变压器放电故障诊断方法研究[D]. 武汉:华中科技大学,2018. [11] 游颖敏,王景芹,舒 亮,等. 基于音频特征的交流接触器电寿命预测方法[J]. 电工技术学报,2021,36(9): 1986-1998.YOU Yingmin, WANG Jingqi SHU Liang, et al. The method of electrical life prediction considering the audio characteristics of AC contactor[J]. Transactions of China Electrotechnical Society, 2021, 36(9): 1986-1998. [12] 金潇. 基于声信号的配电变压器故障诊断方法研究[D]. 武汉:武汉大学,2017. [13] 武立平,吴强,丰遥,等. 基于振动信号SVM分类的变压器状态识别[J]. 高压电器,2019,55(11): 232-238.WU Liping, WU Qiang, FENG Yao, et al. State recognition of transformer based on SVM classification of vibration signals[J]. High Voltage Apparatus, 2019, 55(11): 232-238. [14] 符凯. 基于HHT的非平稳信号特征提取方法及应用研究[D]. 重庆:重庆大学,2015. [15] 孙玉伟,罗林根,陈敬德,等. 含噪背景下基于盲源分离与NSVDD的断路器机械故障诊断方法[J]. 高电压技术,2022,48(3): 1104-1113.SUN Yuwei, LUO Lingen, CHEN Jingde, et al. Mechanical fault diagnosis method of circuit breaker based on blind source separation and NSVDD under noisy background[J]. High Voltage Engineering, 2022, 48(3): 1104-1113. [16] 周东旭,王丰华,党晓婧,等. 基于稀疏表示理论的特高压交流变压器声信号盲分离研究[J]. 电网技术,2020,44(8): 3139-3148.ZHOU Dongxu, WANG Fenghua, DANG Xiaojing, et al. Blind separation of UHV power transformer acoustic signal preprocessing based on sparse representation theory[J]. Power System Technology, 2020, 44(8): 3139-3148. [17] 孙玉伟,罗林根,陈敬德,等. 基于声音特征与改进稀疏表示分类的断路器机械故障诊断方法[J]. 电网技术,2022,44(3): 1214-1222.SUN Yuwei, LUO Lingen, CHEN Jingde, et al. Mechanical fault diagnosis method of circuit breaker based on sound characteristics and improved sparse representation classification[J]. Power System Technology, 2022, 44(3): 1214-1222. [18] 周东旭,王丰华,党晓婧,等. 基于压缩观测与判别字典学习的干式变压器声纹识别[J]. 中国电机工程学报,2020,40(19): 6380-6390.ZHOU Dongxu, WANG Fenghua, DANG Xiaojing, et al. Dry type transformer voiceprint recognition based on compressed observation and discrimination dictionary learning[J]. Proceedings of the CSEE, 2020, 40(19): 6380-6390. [19] 刘云鹏,王博闻,岳浩天,等. 基于50 Hz倍频倒谱系数与门控循环单元的变压器偏磁声纹识别[J]. 中国电机工程学报,2020,40(14): 4681-4694,4746.LIU Yunpeng, WANG Bowen, YUE Haotian, et al. Identification of transformer bias voiceprint based on 50 Hz frequency multiplication cepstrum coefficients and gated recurrent unit[J]. Proceedings of the CSEE, 2020, 40(14): 4681-4694,4746. [20] CAO J W, CAO M, WANG J Z, et al. Urban noise recognition with convolutional neural network[J]. Multimedia Tools and Applications, 2019, 78(20): 29021-29041. doi: 10.1007/s11042-018-6295-8 [21] ALAMIR M A. A novel acoustic scene classification model using the late fusion of convolutional neural networks and different ensemble classifiers[J]. Applied Acoustics, 2021, 175: 107829.1-107829.8. [22] 陈晓雷,孙永峰,李 策,等. 基于卷积神经网络和双向长短期记忆的稳定抗噪声滚动轴承故障诊断[J]. 吉林大学学报(工学版),2022,52(2): 296-309.CHEN Xiaolei, SUN Yongfeng, LI Ce, et al. Stable anti-noise fault diagnosis of rolling bearing based on CNN-BiLSTM[J]. Journal of Jilin University (Engineering and Technology Edition), 2022, 52(2): 296-309. [23] 朱煜峰,许永鹏,陈孝信,等. 基于卷积神经网络的直流XLPE电缆局部放电模式识别技术[J]. 电工技术学报,2020,35(3): 659-668.ZHU Yufeng, XU Yongpeng, CHEN Xiaoxin, et al. Pattern recognition of partial discharges in DC XLPE cables based on convolutional neural network[J]. Transactions of China Electrotechnical Society, 2020, 35(3): 659-668. [24] 万晓琪,宋辉,罗林根,等. 卷积神经网络在局部放电图像模式识别中的应用[J]. 电网技术,2019,43(6): 2219-2226.WAN Xiaoqi, SONG Hui, LUO Lingen, et al. Application of convolutional neural networks in pattern recognition of partial discharge image[J]. Power System Technology, 2019, 43(6): 2219-2226. [25] 全国电声学标准化技术委员会. 电声学 声级计 第1部分:规范:GB/T 3785.1—2023[S]. 北京:中国标准出版社,2023.全国电声学标准化技术委员会. 电声学 声级计 第1部分: 规范: GB/T 3785.1—2023[S]. 北京: 中国标准出版社, 2023. [26] 中国电器工业协会. 电力变压器 第10部分:声级测定:GB/T 1094.10—2022[S]. 北京:中国标准出版社,2022. [27] 范文杰,张志斌,夏昌杰,等. 多手段测量下的油纸绝缘针板电极局部放电的演化规律分析[J]. 高电压技术,2022,48(3): 914-927.FAN Wenjie, ZHANG Zhibin, XIA Changjie, et al. Evolution law of partial discharge of oil-paper insulated needle-plate electrode based on multi-method measurement[J]. High Voltage Engineering, 2022, 48(3): 914-927. [28] 程养春,张振亮. 基于随机森林的变压器多源局部放电诊断[J]. 中国电机工程学报,2018,38(17): 5246-5256,5322.CHENG Yangchun, ZHANG Zhenliang. Multi-source partial discharge diagnosis of transformer based on random forest[J]. Proceedings of the CSEE, 2018, 38(17): 5246-5256,5322. [29] 潘宁. 复杂电磁环境下时频混叠信号的识别与分离[D]. 郑州:郑州大学,2021. [30] 纪德洋,金锋,冬雷,等. 基于皮尔逊相关系数的光伏电站数据修复[J]. 中国电机工程学报,2022,42(4): 1514-1523.JI Deyang, JIN Feng, DONG Lei, et al. Data repairing of photovoltaic power plant based on Pearson correlation coefficient[J]. Proceedings of the CSEE, 2022, 42(4): 1514-1523. -