基于SBSS与CNN的750 kV变压器与尖板放电混叠信号的声纹识别

包艳艳 杨广泽 陈伟 冯婷娜

引用本文: 包艳艳, 杨广泽, 陈伟, 冯婷娜. 基于SBSS与CNN的750 kV变压器与尖板放电混叠信号的声纹识别[J]. 西南交通大学学报. doi: 10.3969/j.issn.0258-2724.20230177
Citation: BAO Yanyan, YANG Guangze, CHEN Wei, FENG Tingna. Voiceprint Recognition of 750 kV Transformer and Pin-Plate Discharge Aliasing Signals Based on Sparse Representation Theory and Convolutional Neural Network[J]. Journal of Southwest Jiaotong University. doi: 10.3969/j.issn.0258-2724.20230177

Voiceprint Recognition of 750 kV Transformer and Pin-Plate Discharge Aliasing Signals Based on Sparse Representation Theory and Convolutional Neural Network

  • 摘要:

    变压器绝缘水平和健康状态对电网的安全稳定至关重要,为研究750 kV变压器内部存在放电故障时,箱体外采集的可听声信号中可能混杂有电晕声、鸟鸣等其他干扰信号的工程实际问题,提出一种基于稀疏表示理论(SBSS)与卷积神经网络(CNN)的750 kV变压器与尖板放电混叠信号的声纹识别方法. 首先,采集武胜750 kV变电站变压器正常运行声信号作为背景声,构建针-板放电模型得到放电声信号和现场常见干扰声作为前景声,通过添加不同信噪比的前景声到背景声中构造混叠声信号;然后,利用基于稀疏表示理论的盲分离算法实现目标前景声纹图谱和冗余背景声纹图谱的分离;最后,对CNN模型超参数进行优化,以提高模型对分离后的各类前景声纹谱图的分类性能. 研究结果表明:通过盲源分离算法可以剔除冗余背景声干扰,使神经网络聚焦于前景声的分类识别;本文方法可实现混叠声信号中前景声纹的分离,分离后,CNN、支持向量机(SVM)和反向传播神经网络(BPNN)的识别准确率分别提高7.6%、17.2%和14.3%.


  • 图 1  声纹时频谱图绘制流程

    Figure 1.  Voiceprint time-frequency spectrum drawing process

    图 2  稀疏表示模型

    Figure 2.  SBSS model

    图 3  变压器声纹谱图稀疏盲分离方法流程

    Figure 3.  Process of sparse blind separation method for transformer voiceprint spectra

    图 4  基于SBSS和CNN的声纹识别系统示意

    Figure 4.  Voiceprint recognition system based on SBSS and CNN

    图 5  放电模型设计图

    Figure 5.  Design drawings of discharge models

    图 6  模拟放电实验接线图

    Figure 6.  Wiring diagram for simulated discharge experiment

    图 7  随机混叠示意

    Figure 7.  Random aliasing

    图 8  混叠及分离声纹谱图

    Figure 8.  Aliasing and separated voiceprint spectra

    图 9  不同批尺寸识别准确率对比

    Figure 9.  Comparison of recognition accuracies of different batch sizes

    图 10  不同学习率识别准确率对比

    Figure 10.  Comparison of recognition accuracies of different learning rates

    图 11  不同优化器识别准确率对比

    Figure 11.  Comparison of recognition accuracies of different optimizers

    表  1  声纹样本

    Table  1.   Voiceprint samples

    前景声 背景声 混叠信号 样本数/个 时长/s
    放电声 武胜变 放电声 + 武胜变 135 2
    说话声 武胜变 说话声 + 武胜变 135 2
    鸟鸣声 武胜变 鸟鸣声 + 武胜变 135 2
    表  2  分离背景与参考谱图声纹相似度对比

    Table  2.   Voiceprint similarity comparison of separated background and reference spectra

    谱图类型 放电声 说话声 鸟鸣声
    谱图相似度 0.87 0.89 0.87
    表  3  CNN网络结构参数

    Table  3.   Parameters of CNN structure

    卷积层165 × 5ReLU
    池化层163 × 3Max Pooling
    卷积层325 × 5ReLU
    池化层323 × 3Max Pooling
    卷积层645 × 5ReLU
    池化层643 × 3Max Pooling
    卷积层1285 × 5ReLU
    表  4  不同方法的声纹识别准确率对比

    Table  4.   Comparison of voiceprint recognition effects of different methods %

