• ISSN 0258-2724
  • CN 51-1277/U
  • EI Compendex
  • Scopus 收录
  • 全国中文核心期刊
  • 中国科技论文统计源期刊
  • 中国科学引文数据库来源期刊

基于知识图谱的高速列车知识融合方法

王淑营 李雪 黎荣 张海柱

李恒超, 刘香莲, 刘鹏, 冯斌. 基于多尺度感知的密集人群计数网络[J]. 西南交通大学学报, 2024, 59(5): 1176-1183, 1214. doi: 10.3969/j.issn.0258-2724.20220823
引用本文: 王淑营, 李雪, 黎荣, 张海柱. 基于知识图谱的高速列车知识融合方法[J]. 西南交通大学学报, 2024, 59(5): 1194-1203. doi: 10.3969/j.issn.0258-2724.20220193
LI Hengchao, LIU Xianglian, LIU Peng, FENG Bin. Dense Crowd Counting Network Based on Multi-scale Perception[J]. Journal of Southwest Jiaotong University, 2024, 59(5): 1176-1183, 1214. doi: 10.3969/j.issn.0258-2724.20220823
Citation: WANG Shuying, LI Xue, LI Rong, ZHANG Haizhu. Knowledge Fusion Method of High-Speed Train Based on Knowledge Graph[J]. Journal of Southwest Jiaotong University, 2024, 59(5): 1194-1203. doi: 10.3969/j.issn.0258-2724.20220193

基于知识图谱的高速列车知识融合方法

doi: 10.3969/j.issn.0258-2724.20220193
基金项目: 国家重点研发计划(2020YFB1708000);四川省重大科技专项(2022ZDZX0003)
详细信息
    作者简介:

    王淑营(1974—),女,教授,博士,研究方向为智能制造、工业大数据应用、复杂装备知识图谱,E-mail:w_shuying@126.com

  • 中图分类号: U270;TP391.1

Knowledge Fusion Method of High-Speed Train Based on Knowledge Graph

  • 摘要:

    为解决高速列车各领域知识之间关联不明、难以检索和应用等问题,首先分析高速列车多源异构知识的组织形式,并结合高速列车产品结构树和阶段领域,构建高速列车领域知识图谱模式层和知识图谱;其次,通过双向编码变换器-双向长短期记忆网络-条件随机场(BERT-BILSTM-CRF)模型进行实体识别,得到阶段领域本体的映射;然后,将高速列车实体属性分为结构化和非结构化2类,并分别使用Levenshtein距离和连续词袋模型-双向长短期记忆网络(CBOW-BILSTM)模型计算相应属性的相似度,得到对齐实体对;最后,结合高速列车产品编码结构树进行映射融合,构建高速列车领域融合知识图谱. 应用本文方法对高速列车转向架进行实例验证的结果表明:在命名实体识别方面,基于BERT-BILSTM-CRF模型得到的实体识别准确率为91%;在实体对齐方面,采用Levenshtein 距离、CBOW-BILSTM模型计算实体相似度的准确率和召回率的调和平均数(F1值)分别为82%、83%.

     

  • 人群计数主要任务是估计场景中的总人数,在公共安全管理、城市空间规划、交通调度等领域有着广泛应用[1] ,受到国内外研究者大量关注. 随着城市人口数量持续增长,各种人群聚集性活动频繁开展,例如旅游景点、大型体育馆、热门商圈等常出现人群大量聚集现象[2],对人群计数的需求日益增加. 然而,在实际场景中,由于目标尺度多样、同一图像尺度连续变化以及图像间存在显著的密度差异等问题,使得人群计数任务仍然面临着较大挑战.

    传统的人群计数主要采用基于检测[3]和基于回归[4]的方法对稀疏场景中的人群目标进行计数,但这些方法均依赖手工特征,难以适用于密集人群场景. 同时,缺乏对人群空间分布信息的关注,使得计数结果缺乏可信度和解释性. 为解决上述问题,文献[5]提出了基于密度估计的方法,通过学习人群图像特征和密度图之间的线性映射并对密度图积分实现对人群的计数. 该方法不仅揭示了人群的空间分布特征,还在高密度场景提高了计数性能. 因此,本文仍关注基于密度估计的人群计数方法研究.

    近年来,由于卷积神经网络 (convolutional neural networks,CNN)具有强大的特征提取能力,被广泛应用于人群计数领域并取得显著效果[1-2]. Wang等[6]首次结合CNN提出人群计数模型,但未考虑目标尺度变化对模型性能的影响,导致计数准确度低. 在此基础上,Zhang等[7]提出一个多列卷积神经网络(multi-column convolutional neural network,MCNN),其利用三列具有不同卷积核的分支构建网络模型,以捕获不同感受野下的多尺度特征.

    MCNN的提出为多分支人群计数研究奠定基础[8-9],但其模型结构存在冗余,且计算成本高. 因此,Li等[10]结合VGG-16 (visual geometry group 2016)[11]前10层和空洞卷积[12]提出CSRNet (congested scene recognition network),可在简化结构同时更好聚合拥挤场景中的多尺度特征. 考虑到空洞卷积有扩大感受野而不增加计算量的优势[13],左静等[14]以空洞卷积为基础,构建多尺度特征提取模块,提升人群计数的准确性. Chen等[15]提出一种尺度金字塔网络(scale pyramid network,SPN),采用并行单列结构,通过空洞卷积构成尺度金字塔模块,提取深层多尺度信息. Sindagi等[16]从特征融合的角度出发,引入一种多级自下而上和自上而下的融合网络,通过将浅层信息和深层信息以双向方式在不同尺度之间进行交互,提高多尺度融合的有效性. Zhou等[17]在提出的多尺度生成对抗网络中,利用来自不同层级的融合特征检测大尺度变化的人群,并通过对抗训练模式进行人群密度估计. Jiang等[18]利用网格式编-解码网络 (trellis encoder-decoder network,TED-Net)分层聚合特征,提高对尺度变化目标的表达. Tian等[19]为缓解在不同人群密度下泛化性不足的问题,构建多个不同密度场景下的预训练子网络以挖掘泛密度信息. 此外,文献[8,20-21]等还利用上下文信息来优化计数任务,进而提高模型在复杂场景中的适应性与精确度.

    上述方法虽然能获取人群特征信息,但仅通过简单的特征提取对输入图像进行处理,忽略目标尺度连续变化的特性. 因此,如何利用网络模型去提取尺度连续变化的人群特征,减少空间细节信息丢失、有效融合多层次尺度特征仍是亟待解决的问题. 为此,本文提出一种基于多尺度感知的密集人群计数网络(dense crowd counting network based on multi-scale perception,MSPNet),网络结构主要由空洞卷积模块(dilated convolution module,DCM)、上下文感知模块(context-aware module,CAM)以及多尺度特征聚合模块(multi-scale feature aggregation module,MSAM)组成. 具体而言,将VGG-16提取的初级特征分别经过DCM与CAM模块以获取丰富的细粒度和上下文信息,进而利用MSAM模块挖掘多尺度特征并实现有效聚合,最后通过标准卷积获得最终的预测密度图. 在ShangHai Tech[7]、UCF_CC_50[22]、UCF_QNRF[23]以及NWPU[24]数据集上进行实验验证,结果表明本文方法具有较好的计数性能.

    本文提出的基于多尺度感知的密集人群计数网络结构如图1所示. 图中:Conv3-256-2表示卷积运算中卷积核为3、通道数为256、空洞率为2,其余类推;3*Conv表示该层卷积执行3次.

    图  1  基于多尺度感知的密集人群计数网络结构
    Figure  1.  Structure of dense crowd counting network based on multi-scale perception

    根据人群计数经验可知,VGG-16网络[11]主要使用3 × 3大小的标准卷积,结构简单灵活,常被用作初级特征提取器[10,20]. 因此,本文使用VGG-16网络的前10层作为主干网. 对于输入图像I,经过主干网提取,得到特征fv,如式 (1)所示.

    fv=Fvgg(I),
    (1)

    式中:Fvgg(·)为特征提取函数.

    考虑到密集人群图像中存在大量的小尺度目标,故在主干网络后设计小空洞率的空洞卷积模块,用于挖掘图像细节信息,具体结构如图1中DCM所示.

    此外,为增强网络对大尺度范围的感知能力,本文设计上下文感知模块,主要将输入特征经过不同尺度的平均池化以学习上下文信息,并将其与空洞卷积模块的输出特征融合,以得到丰富的多尺度信息. 在此基础上,还提出多尺度特征聚合模块,进一步聚合多层次特征以应对尺度的连续变化. 最后,通过标准卷积,生成高质量密度图,进而实现人群图像计数.

    Zhao等[25]在所提出PSPNet (pyramid scene parsing network)模型中,利用不同尺度的池化分支设计了金字塔池化模块(pyramid pooling module,PPM),可有效聚合上下文信息,但各尺度特征之间缺乏信息交互. 因此,本文在PPM的基础上提出上下文感知模块,其结构如图1中CAM所示.

    首先,将输入特征按尺度划分为4个由粗到细的不同组别,并分别对每组进行池化和1 × 1卷积操作,每组池化核大小分别是1 × 1、2 × 2、3 × 3、6 × 6. 然后,使用双线性插值进行上采样,得到与输入大小相同的尺度感知特征fc,j,如式(2)所示.

    fc,j=Ub(F0(Pave(fv,j),θj)),
    (2)

    式中:j为尺度,Pave(·)为平均池化函数, F0(·)为1 × 1大小的卷积运算,Ub(·)为双线性插值函数,θj为网络参数.

    其次,为充分利用人群图像中不同尺度的上下文信息,CAM采用自上而下、逐分支相加的方式聚合不同分支的对比特征. 然后,通过特征拼接操作拼接4个分支的输出特征并与原始特征进行跨通道融合. 最后,将融合后特征输入到后续卷积层中,输出最终结果.

    在主干网络后引入CAM结构,可以由粗到细的层次化方式捕获不同尺度的特征信息,从而获得丰富的多尺度上下文特征.

    受文献[26]启发,将语义信息引入浅层特征,将空间信息嵌入深层特征,可以有效融合不同尺度的特征. 基于此,本文提出一个由FEB组成的多尺度特征聚合模块.

    FEB为MSAM的核心部分,其结构如图2所示. 图中,Conv3-1表示卷积核为3、空洞率为1,其余类推. 首先,为降低计算复杂度,输入特征在经过1 × 1卷积后被平均划分为4个特征子集,依次分别为x1x4. 其中,每个特征子集的通道数量降为输入特征的1/4. 除x1外,其他每个xkk=2,3,4)都有一组对应的空洞卷积,其空洞率分别为(1,2,3), (3,4,5), (5,6,7),该设置方式可减少空洞卷积的网格效应,提高信息连续性. 同时,以残差的形式与其他子集连接. 对于第k个子集,其相应的输出为

    图  2  特征增强块结构
    Figure  2.  Structure of feature enhancement block
    fe,k={xk,k=1,Ck,3(kn=2Cn,2(nl=2Cl,1(xk))),k=2,3,4,
    (3)

    式中:Ck,3(·)为第k行的第3个空洞卷积操作,其他类似结构以此类推.

    融合fe,k并细化特征图,得到FEB结构的输出特征ffeb

    ffeb=fin(F1(4k=1fe,k)φ(F2(F1(4k=1fe,k)))),
    (4)

    式中:fin为FEB结构的输入,F1(·)和F2(·)均为标准卷积,φ(·)为sigmoid激活函数,为逐个元素相加,⨂为逐个元素相乘.

    在FEB中,通过设置空洞卷积间空洞率互质以及将每个扩展层都与其他层紧密连接的方式有效减少像素信息的丢失. 同时,在网络中使用空洞率为3和5的空洞卷积各2次,避免感受野大小的跳跃变化. 总之,FEB通过提高感受野范围的连续性,丰富了尺度多样性,更有利于提取尺度连续变化的人群特征.

    然而,由于FEB之间缺乏关联,本文结合密集残差连接策略[27]设计了MSAM结构. 通过融合不同网络层的多尺度特征,实现不同深度网络间的跨层连接. 其中,将较浅层的细节信息整合到深层中使得后续层的信息更加丰富. 同时,对特征的再次利用可减少由于网络加深引起的信息丢失,提高模型性能.

    本文方法代码基于Pytorch框架实现,并且在Windows10操作系统和NVIDIA GeForce RTX 3080 GPU配置下进行实验. 此外,模型训练采用Adam优化器,学习率设为1×10−4,且动量设为0.9,每批次样本包含10张图像. 为使模型充分训练,在图像的不同位置执行随机翻转、剪切操作,以提升模型鲁棒性.

    2.1.1   真实密度图生成

    采用自适应高斯核[6]方法来生成真实密度图DGT,如式(5)所示.

    {DGT=Mm=1δ(ppm)Gσm(x),σm=βdm,
    (5)

    式中:M为图像中头部标记点总数;p为图像坐标;pm为第m个头部标记点坐标;δ(ppm)为冲击函数;Gσm(·)为高斯核滤波器;σm为高斯核大小;β为超参数,取值为0.3;dmpm与3个相邻目标的平均距离.

    2.1.2   损失函数

    为生成高质量预测密度图,使用如式(6)的联合损失函数L.

    L=L1+λL2,
    (6)
    L1=1NtrNtri=1|G(Ii;θ)DGT|,
    (7)
    L2=1NtrNtri=1Ss=11z2sPave(G(Ii;θ),zs)Pave(DGT,zs)1,
    (8)

    式中:L1为绝对值损失,L2为多尺度密度级一致性损失[28]λ为平衡损失函数L1L2的权重参数,Ntr为训练图像批次量,Ii为第i张训练图像,G(Ii;θ)为第i张图像的预测密度图,θ为网络参数,S为尺度级别数,zs为第s级平均池化的输出大小.

    2.1.3   评价指标

    平均绝对误差(mean absolute error,MAE)和均方根误差(root mean square error,RMSE)是人群计数中常用的评估准则[1-2],其定义如式(9)、(10)所示.

    eMAE=1NteNtei=1|yGT,iyi|,
    (9)
    eRMSE=[1NteNtei=1(yGT,iyi)2]12,
    (10)

    式中:Nte为测试图像数量,yGT,iyi分别为第i张测试图像的实际人数和预测人数.

    2.2.1   数据集

    Shanghai Tech数据集包含Part_A和Part_B两部分[7], Part_A是从网上随机收集的482张密集图像,Part_B是拍摄于上海繁华街道的716张稀疏图像.

    UCF_CC_50是第一个密集人群图像数据集[22]. 该数据集共有50张不同分辨率的灰度图像,密度大且包含多个不同复杂场景,非常具有挑战性. 根据文献[22],在实验时使用五折交叉验证法来验证模型性能.

    UCF_QNRF数据集由Idrees等[23]提出,共有1535张高分辨率的密集图像. 该数据集的场景、角度和光线变化丰富多样,且分布杂乱,挑战难度很大.

    NWPU是西北工业大学于2020年公开的大型数据集[24],共有5109张高分辨率图像,其中包含351个负样本,涵盖多种复杂场景,是目前规模最大、最具挑战的人群计数数据集.

    2.2.2   实验结果分析

    在4个数据集上进行训练,并与现有方法进行比较,结果如表1所示. 表中,数字加粗表示最优值,余表同.

    表  1  不同方法在Shanghai Tech、UCF_CC_50、UCF_QNRF、NWPU数据集上的对比结果
    Table  1.  Comparison results of different methods on Shanghai Tech, UCF_CC_50, UCF_QNRF, and NWPU datasets
    模型Shanghai Tech Part_AShanghai Tech Part_BUCF_ CC_50UCF_ QNRFNWPU
    MAERMSEMAERMSEMAERMSEMAERMSEMAERMSE
    MCNN[7]110.2173.226.441.3377.6509.1277.0426.0218.5700.6
    CSRNet[10]68.2115.010.616.0266.1397.5120.3208.5104.8433.4
    PDD-CNN[29]64.799.18.814.3205.4311.7115.3190.2
    TEDNet[18]64.2109.18.212.8249.4354.5113.0188.0
    KDMG[30]63.899.27.812.799.5173.0100.5415.5
    BL[31]62.8101.87.712.7229.3308.288.7154.893.6470.3
    CAN[20]62.3100.07.812.2212.2243.7107.0183.093.5489.9
    MCANet[32]60.1100.26.811.0181.3258.6100.8185.9
    SC2Net[33]58.997.76.911.4209.4286.398.5174.589.7348.9
    MSPNet62.595.76.911.0156.5223.387.7148.281.9300.3
    下载: 导出CSV 
    | 显示表格

    表1可知,本文所提方法在4个数据集上都具有很强的竞争力. 在Shanghai Tech数据集的模型性能对比中,相较于SC2Net[33],MSPNet的MAE略有损失,这是由于该数据集中存在较多背景干扰,在一定程度上影响了模型计数的准确性,但RMSE在Part_A上降低2.0%,在Part_B上降低3.5%,表明MSPNet具有较好的稳定性. 在小样本数据集UCF_CC_50中,与MCANet[32]相比,MSPNet的MAE降低13.7%,RMSE降低13.6%. 同时,对于场景丰富的UCF_QNRF数据集,MSPNet与BL[31]相比,MAE降低1.1%,RMSE降低4.3%,相较于其他对比模型均表现出良好的计数性能,这是因为本文在聚合上下文和多尺度信息基础上,构建了密集连接的多尺度特征聚合模块,进而减少了尺度连续变化的影响. 在UCF_CC_50和UCF_QNRF数据集上的实验结果表明,MSPNet可在密集场景中取得较好的准确性. 此外,在人数变化范围大的NWPU数据集中,MSPNet在对比模型中取得最好的MAE和RMSE,虽然负样本的加入增大了训练难度,但有助于提升模型的泛化性,且通过实验充分证明了MSPNet具有更好的鲁棒性.

    为进一步验证本文所提模型的预测效果,图3展示MSPNet在不同数据集上的部分可视化预测结果. 由图3可见,MSPNet生成的预测密度图与真实密度图更接近,在4个数据集上都取得较好的计数结果,表明MSPNet具有良好的多尺度特征提取能力.

    图  3  部分可视化结果
    Figure  3.  Partial visualization results
    2.3.1   CAM结构的消融实验

    为进一步验证CAM可有效提升模型性能,将原始PPM与CAM结构在Shanghai Tech数据集Part_A上做消融实验,结果如表2所示.

    表  2  CAM结构的消融实验结果
    Table  2.  Ablation experiments of CAM structure
    方法 MAE RMSE
    本文+PPM 63.6 105.4
    本文+CAM 62.5 95.7
    下载: 导出CSV 
    | 显示表格

    表2可知,本文使用CAM结构时性能有所改进,MAE降低1.1,RMSE降低9.7,因为CAM可有效促进各尺度特征信息之间的交互,增强上下文感知能力,提升模型的鲁棒性.

    2.3.2   模块结构的消融实验

    所提模型主要由CAM、DCM和MSAM 3个模块组成,为进一步验证各部分结构的合理性和有效性,在ShangHai Tech数据集Part_A上分别对CAM、DCM、CAM+MSAM、DCM+MSAM,DCM+CAM、DCM+CAM+MSAM进行消融实验研究,实验结果如表3所示.

    表  3  模块结构的消融实验结果
    Table  3.  Ablation experiments of different module structures
    方法 MAE RMSE
    CAM 68.2 118.8
    DCM 66.2 113.0
    DCM+CAM 64.9 109.8
    CAM+MSAM 65.5 111.4
    DCM+MSAM 64.0 111.5
    DCM+CAM+MSAM 62.5 95.7
    下载: 导出CSV 
    | 显示表格

    表3中不难发现,单个CAM和DCM均可以在一定程度上获取人群信息,但其计数准确度较低. 将DCM和CAM融合后,计数性能有所提升,说明融合结构提取的多尺度信息更丰富. 而所提方法在融合结构基础上,密集连接了4层FEB结构,以增强各网络层的信息传递,提高尺度连续变化的建模能力,在MAE和RMSE上均取得最好的计数结果. 此外,CAM和DCM分别与MSAM进行结合后,MAE分别降为65.5和64.0,RMSE分别降为111.4和111.5,表明MSAM结构对特征聚合具有良好的增强作用.

    2.3.3   FEB层数选择消融实验

    MSAM是整个模型中的重要组成部分,其核心结构是FEB. 因此,为验证FEB级联层数的合理性,在ShangHai Tech数据集Part_A上进行消融实验,结果如表4所示.

    表  4  FEB层选择消融实验结果
    Table  4.  Ablation experiments of number selection for FEB
    FEB 层数/层 MAE RMSE
    0 64.9 109.8
    2 63.5 103.4
    4 62.5 95.7
    6 67.1 115.8
    下载: 导出CSV 
    | 显示表格

    表4可以看出,随着FEB层数由0增加到4层时,模型计数性能随之提升,而FEB层数为6层时,由于信息冗余度过高,造成输出尺度混乱,从而导致计数精度降低. 通过对比实验,选择4层FEB来构建MSAM可有效提高模型性能.

    1) 提出了基于多尺度感知的密集人群计数网络,并在4个基准数据集上进行性能验证,其评价指标优于其他对比方法,针对不同的密集人群图像均具有良好的计数精度和鲁棒性.

    2) 多尺度特征聚合模块以密集残差的连接方式级联4个特征增强块,有效聚合跨层次特征,提高多尺度信息的连续性. 在消融实验中充分证明该模块能有效提高尺度连续变化的建模能力.

    3) 基于金字塔池化结构设计的上下文感知模块,能促进各分支间多尺度信息的交互,增强多尺度上下文信息的表达.

    在后续工作中,将从提高算法对背景信息的鲁棒性角度出发,引入注意力机制以更好地聚焦人群区域,进一步弱化背景干扰和人群分布杂乱等带来的影响,提高人群计数性能.

  • 图 1  基于知识图谱的高速列车知识融合

    Figure 1.  Knowledge fusion of high-speed train based on knowledge graph

    图 2  高速列车产品结构映射

    Figure 2.  Mapping of high-speed train product structure

    图 3  本体模式构建流程

    Figure 3.  Construction process of ontology pattern

    图 4  领域本体映射流程

    Figure 4.  Mapping process of domain ontology

    图 5  基于属性相似度的实体对齐算法流程

    Figure 5.  Entity alignment algorithm based on attribute similarity

    图 6  语义相似度模型

    Figure 6.  Model of semantic similarity

    图 7  实体映射融合流程

    Figure 7.  Fusion process of entity mapping

    图 8  故障领域本体

    Figure 8.  Ontology of fault domain

    图 9  故障领域知识图谱

    Figure 9.  Knowledge graph of fault domain

    图 10  属性权值测试

    Figure 10.  Attribute weight test

    图 11  相似度阈值取值计算

    Figure 11.  Calculation of similarity threshold value

    图 12  融合本体

    Figure 12.  Fusion ontology

    图 13  设计域和运维域融合知识图谱

    Figure 13.  Fusion knowledge graph of design domain and maintenance domain

    表  1  结构树划分

    Table  1.   Partition of structure trees

    结构树 知识来源 特点分析
     产品族主结构树  产品族模型数据、标准类数据、模板类数据  具有快速重用的特点,不涉及具体的参数值,是设计实例的模板结构,具有元节点编码作为唯一标识
     产品设计结构树  需求数据、几何数据、设计规则、物理属性数据、工艺数据  与设计产出相对应,是按需求设计实例化的结果,具有模块编码作为唯一标识
     产品实例结构树  工艺质量数据、故障数据、制造成本数据  设计实例实物化的结果,与设计实例具有多对一的关系,制造码为唯一标识
    下载: 导出CSV

    表  2  高速列车实体属性

    Table  2.   Entity attributes of high-speed train

    数值型(结构化属性)文本型(非结构化属性)
     运营速度、转向架最大宽度、转向架最大高度、车轮直径(新轮)、车轮直径(半磨耗)、齿轮中心距、轴重 转向架型式、车轮型式、车轮踏面型式、车轴型式、牵引电机型式、牵引拉杆材料、齿轮箱材料
    下载: 导出CSV

    表  3  单位和约束匹配模板

    Table  3.   Matching template of unit and constraint

    约束单位
    不大于mm
    不大于%
    不得超过L
    ±g
    下载: 导出CSV

    表  4  数据集构成

    Table  4.   Composition of dataset

    数据集 实体数 关系数 实体数
    可对齐 不可对齐
    故障数据 13258 41152 8925 4333
    维修数据 10506 35282 8925 1581
    下载: 导出CSV

    表  5  BERT-BILSTM-CRF模型参数

    Table  5.   Parameters of BERT-BILSTM-CRF model

    参数名 参数值
    批大小/批 4
    学习率 0.001
    丢失率 0.5
    训练轮次/轮 10
    字向量维度/维 768
    序列长度/个 128
    下载: 导出CSV

    表  6  实体识别对比实验

    Table  6.   Comparative experiment of entity recognition %

    实验方法 准确率 召回率 F1 值
    Word2vec-BILSTM 86 83 84
    Word2vec-BILSTM-CRF 90 87 88
    BERT-BILSTM 89 86 87
    BERT-BILSTM-CRF 91 88 89
    下载: 导出CSV

    表  7  相似度计算对比实验

    Table  7.   Comparative experiment of similarity calculation

    相似度计算方法 F1 值/%
    Levenshtein 距离 82
    Jaro-Winkler 距离 79
    语义相似度(CBOW) 77
    语义相似度(BILSTM) 81
    语义相似度(CBOW-BILSTM) 83
    下载: 导出CSV
  • [1] 丁国富,姜杰,张海柱,等. 我国高速列车数字化研发的进展及挑战[J]. 西南交通大学学报,2016,51(2): 251-263. doi: 10.3969/j.issn.0258-2724.2016.02.005

    DING Guofu, JIANG Jie, ZHANG Haizhu, et al. Development and challenge of digital design of high-speed trains in China[J]. Journal of Southwest Jiaotong University, 2016, 51(2): 251-263. doi: 10.3969/j.issn.0258-2724.2016.02.005
    [2] 刘峤,李杨,段宏,等. 知识图谱构建技术综述[J]. 计算机研究与发展,2016,53(3): 582-600.

    LIU Qiao, LI Yang, DUAN Hong, et al. Knowledge graph construction techniques[J]. Journal of Computer Research and Development, 2016, 53(3): 582-600.
    [3] RUTA M, SCIOSCIA F, GRAMEGNA F, et al. A knowledge fusion approach for context awareness in vehicular networks[J]. IEEE Internet of Things Journal, 2018, 5(4): 2407-2419. doi: 10.1109/JIOT.2018.2815009
    [4] ZHAO X J, JIA Y, LI A P, et al. Multi-source knowledge fusion: a survey[C]//2019 IEEE Fourth International Conference on Data Science in Cyberspace (DSC). Hangzhou: IEEE, 2019: 119-127.
    [5] ABDELLATIF M, FARHAN M S, SHEHATA N S. Overcoming business process reengineering obstacles using ontology-based knowledge map methodology[J]. Future Computing and Informatics Journal, 2018, 3(1): 7-28. doi: 10.1016/j.fcij.2017.10.006
    [6] KAUSHIK N, CHATTERJEE N. Automatic relationship extraction from agricultural text for ontology construction[J]. Information Processing in Agriculture, 2018, 5(1): 60-73. doi: 10.1016/j.inpa.2017.11.003
    [7] DAI Z J, WANG X T, NI P, et al. Named entity recognition using BERT BiLSTM CRF for Chinese electronic health records[C]//2019 12th International Congress on Image and Signal Processing, BioMedical Engineering and Informatics (CISP-BMEI). Suzhou: IEEE, 2019: 1-5.
    [8] JIANG L, SHI J Y, WANG C Y. Multi-ontology fusion and rule development to facilitate automated code compliance checking using BIM and rule-based reasoning[J]. Advanced Engineering Informatics, 2022, 51: 101449.1-101449.15.
    [9] 王雪鹏,刘康,何世柱,等. 基于网络语义标签的多源知识库实体对齐算法[J]. 计算机学报,2017,40(3): 701-711. doi: 10.11897/SP.J.1016.2017.00701

    WANG Xuepeng, LIU Kang, HE Shizhu, et al. Multi-source knowledge bases entity alignment by leveraging semantic tags[J]. Chinese Journal of Computers, 2017, 40(3): 701-711. doi: 10.11897/SP.J.1016.2017.00701
    [10] TRISEDYA B D, QI J Z, ZHANG R. Entity alignment between knowledge graphs using attribute embeddings[J]. Proceedings of the AAAI Conference on Artificial Intelligence, 2019, 33(1): 297-304. doi: 10.1609/aaai.v33i01.3301297
    [11] ZHU Q, WEI H, SISMAN B, et al. Collective multi-type entity alignment between knowledge graphs[C]//Proceedings of the Web Conference 2020. Taipei: ACM, 2020: 2241–2252.
    [12] ZAD S, HEIDARI M, HAJIBABAEE P, et al. A survey of deep learning methods on semantic similarity and sentence modeling[C]//2021 IEEE 12th Annual Information Technology, Electronics and Mobile Communication Conference (IEMCON). Vancouver: IEEE, 2021: 466-472.
    [13] TSENG C W, CHOU J J, TSAI Y C. Text mining analysis of teaching evaluation questionnaires for the selection of outstanding teaching faculty members[J]. IEEE Access, 2018, 6: 72870-72879. doi: 10.1109/ACCESS.2018.2878478
    [14] ZHANG W T, JIANG S H, ZHAO S, et al. A BERT-BiLSTM-CRF model for Chinese electronic medical records named entity recognition[C]//2019 12th International Conference on Intelligent Computation Technology and Automation (ICICTA). Xiangtan: IEEE, 2019: 166-169.
    [15] ZHANG M Y, WANG J, ZHANG X J. Using a pre-trained language model for medical named entity extraction in Chinese clinic text[C]//2020 IEEE 10th International Conference on Electronics Information and Emergency Communication (ICEIEC). Beijing: IEEE, 2020: 312-317.
    [16] NGUYEN H T, DUONG P H, CAMBRIA E. Learning short-text semantic similarity with word embeddings and external knowledge sources[J]. Knowledge-Based Systems, 2019, 182: 104842.1-104842.9.
    [17] PUTERA UTAMA SIAHAAN A, ARYZA S, HARIYANTO E, et al. Combination of Levenshtein distance and Rabin-Karp to improve the accuracy of document equivalence level[J]. International Journal of Engineering & Technology, 2018, 7: 17-21.
    [18] MANAF K, PITARA S, SUBAEKI B, et al. Comparison of carp Rabin algorithm and jaro-winkler distance to determine the equality of sunda languages[C]//2019 IEEE 13th International Conference on Telecommunication Systems, Services, and Applications (TSSA). Bali: IEEE, 2019: 77-81.
  • 加载中
图(13) / 表(7)
计量
  • 文章访问数:  423
  • HTML全文浏览量:  157
  • PDF下载量:  86
  • 被引次数: 0
出版历程
  • 收稿日期:  2022-03-16
  • 修回日期:  2022-07-04
  • 网络出版日期:  2024-05-29
  • 刊出日期:  2022-07-11

目录

/

返回文章
返回