• ISSN 0258-2724
  • CN 51-1277/U
  • EI Compendex
  • Scopus 收录
  • 全国中文核心期刊
  • 中国科技论文统计源期刊
  • 中国科学引文数据库来源期刊

半监督卷积神经网络的词义消歧

张春祥 唐利波 高雪瑶

王志杰, 成彪, 杨广庆, 高古顺, 王贺. 竖向荷载作用下加筋埋地管道力学与变形行为细观分析[J]. 西南交通大学学报, 2025, 60(1): 119-127. doi: 10.3969/j.issn.0258-2724.20230046
引用本文: 张春祥, 唐利波, 高雪瑶. 半监督卷积神经网络的词义消歧[J]. 西南交通大学学报, 2022, 57(1): 11-17, 27. doi: 10.3969/j.issn.0258-2724.20200105
WANG Zhijie, CHENG Biao, YANG Guangqing, GAO Gushun, WANG He. Mesoscopic Study on Mechanical and Deformation Behaviors of Reinforced Buried Pipelines Under Vertical Loads[J]. Journal of Southwest Jiaotong University, 2025, 60(1): 119-127. doi: 10.3969/j.issn.0258-2724.20230046
Citation: ZHANG Chunxiang, TANG Libo, GAO Xueyao. Word Sense Disambiguation Based on Semi-Supervised Convolutional Neural Networks[J]. Journal of Southwest Jiaotong University, 2022, 57(1): 11-17, 27. doi: 10.3969/j.issn.0258-2724.20200105

半监督卷积神经网络的词义消歧

doi: 10.3969/j.issn.0258-2724.20200105
基金项目: 国家自然科学基金(61502124, 60903082);中国博士后科学基金(2014M560249);黑龙江省自然科学基金(F2015041, F201420);黑龙江省普通高校基本科研业务费专项资金资助(LGYC2018JC014)
详细信息
    作者简介:

    张春祥(1974—),男,教授,博士,研究方向为自然语言处理与计算机图形学,E-mail:z6c6x666@163.com

    通讯作者:

    高雪瑶(1979—),女,教授,博士,研究方向为计算机图形学与自然语言处理,E-mail:xueyao_gao@163.com

  • 中图分类号: TP391.2

Word Sense Disambiguation Based on Semi-Supervised Convolutional Neural Networks

  • 摘要:

    为了解决有标签语料获取困难的问题,提出了一种半监督学习的卷积神经网络(convolutional neural networks, CNN)汉语词义消歧方法. 首先,提取歧义词左右各2个词汇单元的词形、词性和语义类作为消歧特征,利用词向量工具将消歧特征向量化;然后,对有标签语料进行预处理,获取初始化聚类中心和阈值,同时,使用有标签语料对卷积神经网络消歧模型进行训练,利用优化后的卷积神经网络对无标签语料进行语义分类,选取满足阈值条件的高置信度语料添加到训练语料之中,不断重复上述过程,直到训练语料不再扩大为止;最后,使用SemEval-2007:Task#5作为有标签语料,使用哈尔滨工业大学无标注语料作为无标签语料进行实验. 实验结果表明:所提出方法使CNN的消歧准确率提高了3.1%.

     

  • 城市地下管网作为城市基础设施建设中至关重要的一环,长期承受各种各样的上部荷载作用. 一旦管道发生破坏,轻则使路面破坏、影响交通,重则发生气体泄漏、引发火灾等次生灾害,威胁人身及财产安全[1]. 因此,研究埋地管道的力学与变形行为,以及如何对地下埋地管道进行防护尤为重要.

    目前,对埋地管道的力学与变形性能研究主要从模型试验与数值模拟2个方面开展. 周恩全等[2]通过模型试验,证明在粉土中加入橡胶颗粒能够有效减小冲击荷载下路基表层沉降和管道应变及弯矩响应;张虎等[3]通过建立缩尺模型,研究冲击荷载作用下管道力学响应,并建立相应有限元模型进行数值模拟分析,验证数值模型的准确性;钟紫蓝等[4]通过三维有限元模拟对中密砂中不同深径比条件下不同破坏模式以及极限承载力的差异进行了讨论;肖成志等[5]通过有限元数值模拟与模型试验对比分析,验证了有限元数值方法的可靠性,并综合分析静载作用下各铺设因素对管道性能的影响.

    近年来,土工格栅由于其高强度、低蠕变以及与土之间嵌锁作用好等优点,广泛应用于路堤、挡土墙和边坡当中,以提高其稳定性[6]. 目前,已有学者将其应用于埋地管道的防护:Moghaddas Tafreshi等[7]通过模型试验,研究土工格栅加筋对往复荷载作用下管道变形和土体表面沉降的影响,结果表明,土工格栅可以显著减少管道垂向直径的变化和土体表面沉降;肖成志等[8]通过模型试验展示土工格栅在埋设过程中各类参数对管道防护效果的影响;刘宽等[9]通过有限元软件ABAQUS,将管道与土工格栅按线弹性体考虑,分析静载作用下加载板宽度、土体内摩擦角以及管道埋深等因素对管道力学性能和变形特征的影响;肖成志等[10]通过有限元软件证明了增加土工格栅埋设长度对限制管道在循环荷载作用下的变形有显著作用.

    数值模拟是试验研究的重要补充,而有限元软件只能模拟连续介质,不能真实体现出土体的非连续介质特性. 离散元方法考虑填料的大变形,也能模拟填料与加筋材料之间的咬合作用以及两者相对运动情况. 离散元模拟在岩土工程领域已经有广泛应用,如边坡工程,采矿、地下开挖和隧道工程,以及岩体动力学和隧道工程等方面[11].

    目前,在竖向荷载作用下埋地管道力学性能及土工格栅加筋防护应用的数值模拟成果主要以有限元模拟结果为主,对系统内部土颗粒、土工格栅和管道三者之间的相互作用分析不够充分,且从细观层面对土、土工格栅和管道之间的相对运动与荷载传递规律的分析不够深入.

    鉴于此,本文采用离散元软件,通过颗粒流程序(PFC)基本命令与FISH语言共同进行命令流的编制,建立复杂埋地管道数值仿真分析模型,研究竖向荷载作用下管道埋深与筋材埋深对管道-土体-土工格栅耦合系统力学性能的影响,分析其内部颗粒间接触力分布、颗粒移动规律等. 旨在通过阐述细观变化引起的宏观响应,增进对土工格栅加筋埋地管道力学与变形特性的认识.

    为分析竖向荷载作用下埋地管道的力学与变形特性,建立室内模型试验系统,如图1所示. 图中:D为管道模型外径,u为加筋后土工格栅埋深,H为竖向荷载作用下管道埋深,l为加筋后土工格栅长度. 模型箱内部尺寸长、宽、高分别为1000、580、700 mm,模型箱前后壁为钢化玻璃,以便对试验过程进行实时观察. 管道正上方采用一块厚度为10 mm,长、宽分别为500、200 mm的钢板施加竖向荷载. 为防止加载板在加载时产生竖向挠曲,在加载板上方中间局部焊接工字钢. 同时,在加载板上布设数显百分表以记录加载过程中的沉降数据,前后对称各布置一个并取其平均值作为结果以减小试验误差.

    图  1  模型试验示意
    Figure  1.  Model test

    模型试验填料选择干净的粗砂,粒径较为均匀,其范围为0.5~2.0 mm,不均匀系数Cu=2.04,曲率系数Cc=1.01. 试验中控制填料的压实度为95%.

    试验管道使用U-PVC塑料排水管,管道外径为110 mm,壁厚为3.2 mm.

    试验中筋材为双向拉伸塑料土工格栅,其网孔尺寸为31 mm × 31 mm,抗拉强度为11.6 kN/m.

    为表征砂土、管道和土工格栅的物理力学特性,分别对3种材料的离散元细观参数进行标定.

    2.1.1   砂土

    采用线性接触模型以无黏结圆盘颗粒对砂土进行建模. 为提高计算机的计算效率,许多学者通过采用放大颗粒尺寸的方法以得到满意的结果[12]. 在本研究中,将砂土颗粒的粒径尺寸放大3倍. 离散元模型中砂土粒径级配曲线如图2所示. Wang等[13]提出一种将砂土的三维孔隙率向二维孔隙率转换的方法,经过抛物线方程转换与迭代计算,最终确定初始二维孔隙率为0.151.

    图  2  砂土颗粒粒径级配曲线
    Figure  2.  Particle size distribution curves of sands

    对离散元砂土颗粒分别进行法向荷载50、100、200、300 kPa下的数值直剪试验,结果如图3所示. 可以看出:离散元模拟中,砂土颗粒直剪特性与室内试验中砂土直剪试验结果基本吻合.

    图  3  砂土直剪试验结果
    Figure  3.  Direct shear test results of sands
    2.1.2   管道

    采用能够同时表征接触力与弯矩作用的平行黏结接触模型对管道进行模拟. D=110 mm,由直径相同的圆盘颗粒构成,颗粒直径为管道壁厚,即3.2 mm,依据塑料管材环刚度的测定试验建立管道数值压缩试验模型,对管道模型细观参数进行标定.

    标定过程中上墙以恒定速率向下移动,对管道模型施加竖直方向荷载,并监测管道的压缩变形量以及管道模型对墙体的反作用力,获取压缩过程中管道模型的荷载-变形关系曲线,管道数值压缩模型与标定结果曲线如图4所示.

    图  4  管道压缩荷载-位移关系曲线
    Figure  4.  Compression load-displacement curves of pipelines
    2.1.3   土工格栅

    土工格栅离散元模型也采用平行黏结接触模型. 格栅模型由一串直径3 mm的圆盘颗粒组成,相当于将实际格栅厚度放大了3倍,以与砂土颗粒放大倍数相匹配. 在二维的PFC模拟(PFC2D)中,由于将三维网孔结构的土工格栅简化成二维离散元模型,为表征实际土工格栅与砂土颗粒之间的嵌锁咬合作用,参照Wang等[14]的方式在横肋对应位置处上下各设置3个突出的颗粒. 土工格栅拉伸数值模型及其标定后的对比结果如图5所示.

    图  5  土工格栅数值模拟与试验结果对比
    Figure  5.  Comparison between numerical simulation and test results of geogrid
    2.1.4   离散元模型参数取值

    通过在标定过程中不断调整细观参数以及参考文献[15-16]中的取值,最终确定数值模拟中砂土、管道和土工格栅的细观参数,如表1所示. 表中:ρ1为颗粒相对密度,E1为平行黏结有效模量,S1为平行黏结法向强度,S2为平行黏结切向强度. 离散元标定结果与试验结果相匹配,表明PFC2D模拟中所采用的砂土、管道和土工格栅所输入的细观参数能够很好地反映砂土、管道和土工格栅的宏观力学特性.

    表  1  离散元模型参数取值
    Table  1.  Parameter used in discrete element model
    名称 接触模型 孔隙率 ρ1/
    (kg·m−3
    颗粒
    直径/mm
    摩擦系数 有效模量/MPa 刚度比 E1/MPa 平行黏结刚度比 黏结激活间隙 S1/
    (MPa·m−1
    S2/
    (MPa·m−1
    砂土 线性 0.151 2650 1.5~6.0 4.00 20 1
    管道 平行黏结 1500 3.2 0.25 8 2 1900.0 2 10−5 400.0 400.0
    土工格栅 平行黏结 905 3.0 0.30 8 1 64.5 1 10−5 24.5 24.5
    下载: 导出CSV 
    | 显示表格

    离散元数值模型依据试验中模型观测方向尺寸,即以实际模型长 × 高尺寸1∶1进行建模,模型长1000 mm,高700 mm. 数值模型建立过程参照实际模型试验时的填筑步骤,总体自下而上生成. 施加竖向荷载前离散元数值模型示意如图6所示.

    图  6  加筋埋地管道离散元数值模型示意
    Figure  6.  Numerical discrete element model of reinforced buried pipelines

    本研究拟分析竖向荷载作用下管道埋深H、加筋后土工格栅埋深u对土体中含管道系统特性的影响,模拟方案如表2所示. 表中:B为加载板宽度. 在整体模型中,采用墙体命令wall作为加载板. 加载方式采用分级伺服加载,每级荷载10 kPa. 数值模拟与模型试验相同,均是以加载板底部砂土地基剪切破坏为加载的终止条件. 当模型达到破坏条件时,伺服加载会因达不到平衡条件进而持续进行加载,使砂土地基发生过量沉降导致其发生剪切破坏,此时视上一级荷载为极限荷载.

    表  2  离散元数值模拟方案
    Table  2.  Numerical simulation scheme of discrete element
    名称 H l u
    未加筋 1.5D/2.0D/2.5D
    土工格栅加筋 1.5D 5.0D 0.25B/0.50B/0.75B
    下载: 导出CSV 
    | 显示表格

    为验证离散元模拟结果的准确性,以模型试验中未加筋时管道埋深H=1.5D,2.0D,2.5D 3种工况为例,将不同H下加载板沉降随荷载变化曲线与各工况下模型系统极限承载力的离散元数值模拟结果和室内模型试验数据进行对比,结果如图78所示.

    图  7  不同管道埋深时加载板荷载-沉降关系曲线
    Figure  7.  Load-settlement curves of loading plate under different buried depths of pipelines
    图  8  不同管道埋深时模型系统极限承载力结果对比
    Figure  8.  Comparison of ultimate bearing capacity results of model system under different buried depths of pipelines

    图7可以看出:离散元模拟得到的加载板沉降随荷载变化曲线与室内模型试验结果变化规律基本一致,即加载板沉降量随H的增加而增加;同级荷载下模拟数据与实测数据较为接近,但极限承载力在数值上有较大差异.

    图8可知:虽然模型的极限承载力数值模拟结果与实测值大小存在差异,但是具有相同的变化趋势,即随着H的增加,模型的极限承载力增加,表明增加管道上方的填土厚度有助于提高模型的极限承载力.

    通过图7图8的对比结果可知,离散元数值模拟与实际模型箱试验的结果吻合较好,验证了本离散元模型的可行性以及模型中材料参数取值的合理性. 因此,本文将基于PFC2D离散元方法对不同管道埋深与单层加筋不同土工格栅埋深时管道系统的内部细观力学特性进行深入研究.

    通过调整管道上方填土的高度,对未加筋时不同管道埋深即H/D=1.5,2.0,2.5 3种工况条件下模型内部颗粒间接触力、颗粒位移和管道垂直径向变形等进行分析.

    模型内部荷载传递是通过颗粒间的接触力链传递的,接触力链的分布特征实质是土中荷载传递特征的体现. 图9为竖向荷载p=70 kPa作用下不同工况土体内部颗粒接触力链分布对比. 不同工况中线条均按同一比例绘制,力链越粗表示接触力越大. 需要说明的是,p=70 kPa为数值模拟中管道埋深H=1.5D时所对应的极限荷载. 由图9可知,加载板荷载在土体中以一定的角度扩散,并且在向下传递的过程中逐渐消散;整体来看,当H不同时力链分布均呈现出中间大、两侧小的分布规律;随着H的增大,荷载的传递路径增加,管道上方土颗粒对荷载的消散作用增强,所以管道受到荷载的影响作用减弱.

    图  9  不同管道埋深时模型内部接触力链分布
    Figure  9.  Distribution of contact force chain in model under different buried depths of pipelines

    图10为不同工况模型内部颗粒位移对比,位移值在同一等分范围内颗粒用同一种颜色进行标记. 从图中可以看出:不同管道埋深条件下各工况颗粒位移具有相似的变形模式,即颗粒最大位移均发生在加载板下方;加载板下方土体明显形成一个三角压密区,压密区向两侧挤压,土中产生塑性区,并贯通至地面,形成连续滑动面,此时土体从加载板两侧被挤出,形成竖向隆起. 塑性贯通区下方土颗粒位移等值线向下发展,经过管道时发生明显变化,管道下方土颗粒位移值远小于两侧同高度土颗粒,证明管道承受了主要的竖向荷载作用;在相同竖向荷载作用下,随着管道埋深的增加,加载板下方土体颗粒产生的沉降值更大,同时由于管道上方可以产生压缩变形的土体厚度增加,加载板的沉降量更大;管道埋深越浅时,加载板下方的三角形压密区距离管道位置更近,大变形量的上覆土对管道变形产生更大的影响;由于管道距土表距离减小,管道对上方土体产生更大的反作用,导致相同荷载作用下管道埋深越小时加载板下方塑性区更大,加载板两侧产生的土体表面隆起更大,也就是说管道的埋深越小,其上方填土更容易发生剪切破坏.

    图  10  不同管道埋深时模型内部颗粒位移云图
    Figure  10.  Particle displacement cloud diagram in model under different buried depths of pipelines

    图11为不同管道埋深下管道垂直径向变形量随荷载变化曲线对比. 可以看出,在相同荷载作用下,管道垂直径向变形量随着管道埋深的增加而减小. 以管道埋深H=1.5D的极限荷载为例进行分析,在70 kPa竖向荷载作用下,当H从1.5D增加到2.0D时,管道垂直径向变形量减小了12%,当H增加到2.5D时,与H=1.5D相比,管道垂直径向变形量减少了17%,这些结果与前文得到的结论基本一致,并且肖成志等[5]也曾在有限元模拟中得到类似的结果.

    图  11  不同管道埋深时管道垂直径向变形量随荷载变化
    Figure  11.  Variation of vertical radial deformation of pipelines with load under different buried depths of pipelines

    通过对未加筋时不同工况的对比可以发现,在管道埋深越小时,上覆土体越容易发生剪切破坏,承载力低且管道的垂直径向变形量大,因此,本节针对H=1.5D的工况分别进行单层土工格栅加筋,对其荷载-沉降曲线、模型内部颗粒间接触力、颗粒位移和管道垂直径向变形等进行分析,u分别取0.25B、0.50B和0.75B.

    图12为管道埋深H=1.5D时管道上方不同土工格栅埋深条件下加载板荷载-沉降关系曲线. 从图中可以看出:在对管道上方进行加筋后,与未加筋时相比,在相同荷载作用下加载板沉降量均不同程度减小,而且加载板沉降量随着土工格栅埋深的减小而减小;土工格栅加筋后模型的极限承载力均增加,当u=0.25B时,与未加筋时相比,其极限承载力从70 kPa提高到了110 kPa,提高了约57.2%;当土工格栅的埋深增加后,土工格栅对模型承载力的提高作用逐渐减弱;加筋后各工况加载板沉降量与极限承载力变化趋势与肖成志等[17]在模型试验中得到的结果相同.

    图  12  不同土工格栅埋深时加载板荷载-沉降关系曲线
    Figure  12.  Load-settlement curves of loading plate under different buried depths of geogrid

    图13为土工格栅加筋时不同筋材埋深下管道垂直径向变形量随荷载变化对比. 从图中可以看出:当u=0.75B时,加载过程中管道的垂直径向变形量与未加筋时相差不大;当u=0.25B时,管道变形量减小明显,与u=0.75B相比,管道垂直径向变形量减小了约27.9%. 这表明土工格栅距离土体表面越近即土工格栅埋深越浅时,其加筋对管道的防护作用越好. 但需要注意的是,为保证土工格栅可以充分发挥其嵌锁作用,土工格栅上方需要留有一定厚度的土体,即土工格栅的埋深不能过浅.

    图  13  不同土工格栅埋深时管道垂直径向变形随荷载变化
    Figure  13.  Variation of vertical radial deformation of pipelines with load under different buried depths of geogrid

    图14为土工格栅加筋后竖向荷载p=70 kPa作用下不同工况模型内部土体颗粒沉降位移云图. 可见:1) 当u=0.25B时,与未加筋时相比,加载板两侧的隆起现象得到明显改善;颗粒向下沉降变形的方式主体上变成了由土工格栅埋设位置处向下发展,土体的整体性增强,土体塑性区变形受到一定的限制. 2) 当u=0.50B时,其加筋位置恰好位于未加筋时土体剪切破坏区域中部,与未加筋时工况相比,土体的变形模式变化不大,但此时加载板与土工格栅之间土体已经接近塑性破坏的状态. 由于土工格栅与土的相互作用,在后续施加下一级荷载后,土体并未出现破坏,这也体现了土工格栅的加筋效果. 同时,朗肯被动区滑动面与水平面的夹角逐渐减小,并且左右两侧被动区滑裂面由加载板两端点下方向加载板内部分延伸. 3) 当u=0.75B时,加筋使土体的滑动面向土表移动,且滑动区域范围减小. 4) 在产生沉降的土体中部进行土工格栅加筋时,土体沉降变形的扩散范围有一定程度的改善. 但是土工格栅距离上部加载板距离太远,不能充分发挥加筋作用.

    图  14  不同土工格栅埋深时模型内部颗粒位移云图
    Figure  14.  Particle displacement cloud diagram in model under different buried depths of geogrid

    图15为加筋后竖向荷载p=70 kPa作用下不同工况土体内部力链图分布情况. 不同工况中线条均按同一比例绘制,黑色代表压力,绿色代表拉力,力链越粗表示接触力越大. 从图中可以看出,由于土工格栅与土相互作用,土压力经过土工格栅后传递到管道与未加筋时分布更加均匀. 对比图15(b)~(d)可以发现:土工格栅位置越靠上,其上方土体间力链的扩散角越小;竖向荷载附加应力均匀传递至土工格栅位置后在土工格栅处产生应力扩散,使土工格栅下部土压力分布更加均匀;当u=0.50B时(图15(c)),加载板下方被动区滑裂面由加载板两侧端点向加载板内侧延伸,导致该位置处颗粒发生较大位移,此处力链相较于u=0.25Bu=0.75B明显减小;对于土工格栅拉力而言,土工格栅的最大拉力出现在加载板下方;竖向荷载附加应力扩散现象随着填土深度的增加愈加明显,导致土工格栅埋深大时拉力作用范围增大,力链也更粗;当u=0.75B时,其对上方土压力分布的改善不明显.

    图  15  不同土工格栅埋深时模型内部接触力链分布
    Figure  15.  Distribution of contact force chain in model under different buried depths of geogrid

    图16为竖向荷载p=70 kPa作用下各工况土工格栅拉力定量分布情况. 与图14进行对比分析可以发现:土工格栅拉力产生骤然变化的位置主要处于模型内部颗粒位移变化较大处. 当u=0.25B时,其距离填土顶部加载板较近,拉力在加载板端点下方突增;随着u的增加,土工格栅拉力最大值逐渐趋近于加载板下方中心;随着距管道中心距离的逐渐增大,土工格栅拉力呈现逐渐减小的变化规律;由于荷载在土体中的扩散效应,加载板下方外侧土工格栅拉力随着筋材埋深的增加而增大.

    图  16  管道上方土工格栅拉力定量分布对比
    Figure  16.  Quantitative distribution comparison of geogrid tension above pipelines

    本文基于室内模型试验,建立离散元数值模型,对细观参数进行标定,验证了数值模拟结果的合理性,从细观层面探究管道埋深和土工格栅埋深对管道系统性能的影响,得出以下结论:

    1) 模型系统极限承载力随着管道埋深的增大而增大;相同竖向荷载作用下,管道埋深越大,加载板竖向沉降量越大,管道垂直径向变形量越小.

    2) 对管道上方进行单层土工格栅加筋后,模型系统极限承载力均不同程度增大,当u=0.25B时极限承载力最大. 随着土工格栅埋深逐渐增大,加筋效果逐渐减弱,相同竖向荷载作用下加载板沉降量和管道垂直径向变形量均增加.

    3) 接触力链分布图与颗粒位移分布图可从细观角度更好地理解管道周围的荷载传递规律与土体变形特性. 未加筋时土体内部土压力分布呈现出中间大、两侧小的分布规律. 相同竖向荷载作用下管道埋深越大,受竖向荷载附加应力的影响越小;管道埋深越小,管道上方土体塑性贯通区越大.

    4) 当u=0.25B时,其加筋作用很大程度上减小了管道上方土体的潜在塑性破坏区,并使土体内部土压力分布更加均匀;当土工格栅加筋位置在土体塑性破坏区下方时,土工格栅加筋对土体破坏的模式影响较小.

  • 图 1  特征提取

    Figure 1.  Feature extraction

    图 2  特征矩阵构建过程

    Figure 2.  Construction process of feature matrix

    图 3  softmax层

    Figure 3.  softmax layer

    图 4  不同阈值和类别数下的平均消歧准确率

    Figure 4.  Average disambiguation accuracy at different thresholds and category numbers

    图 5  不同比例和类别数下的平均消歧准确率

    Figure 5.  Average disambiguation accuracy at different ratios and category numbers

    表  1  不同阈值的平均消歧准确率

    Table  1.   Average disambiguation accuracy of different thresholds %

    类别
    数/类
    歧义
    词汇
    T = TmaxT = TminT = TmedT = Tavg
    2表面

    单位
    动摇
    儿女
    镜头
    开通
    气息
    气象
    使
    眼光
    88.3
    88.9
    77.8
    86.7
    90.2
    50.0
    60.5
    64.2
    93.8
    70.2
    76.9
    82.4
    72.2
    94.4
    80.0
    86.3
    57.1
    58.8
    66.5
    87.5
    72.5
    84.6
    76.4
    88.9
    94.4
    93.3
    92.4
    50.0
    58.8
    68.6
    87.5
    76.3
    76.9
    82.4
    88.9
    94.4
    73.3
    96.3
    50.7
    58.8
    67.3
    93.8
    79.6
    84.6
    3
    成立

    旗帜
    日子
    长城
    62.0
    84.6
    66.7
    50.0
    51.6
    68.0
    61.9
    88.2
    66.7
    62.5
    48.4
    68.0
    52.4
    80.8
    55.6
    50.0
    48.4
    68.0
    71.4
    76.9
    77.8
    68.8
    48.4
    80.0
    4

    56.0
    66.7
    61.5
    56.0
    61.1
    64.1
    56.0
    61.1
    64.1
    56.0
    61.1
    53.8
    平均准确率70.771.070.073.2
    下载: 导出CSV

    表  2  不同比率下的平均消歧准确率

    Table  2.   Average disambiguation accuracy of different rates %

    类别
    数/类
    歧义
    词汇
    r = 1r = 5r = 10r = 50r = 100
    2表面

    单位
    动摇
    儿女
    镜头
    开通
    气息
    气象
    使
    眼光
    82.4
    88.9
    94.5
    86.7
    82.2
    64.3
    58.8
    64.2
    93.8
    72.5
    84.6
    82.4
    77.8
    94.5
    80.0
    88.9
    50.0
    58.8
    68.6
    87.5
    72.5
    76.9
    76.0
    83.3
    88.9
    80.0
    84.6
    57.1
    58.8
    66.5
    87.5
    70.2
    76.9
    82.4
    88.9
    83.3
    80.0
    90.7
    50.0
    58.8
    66.5
    87.5
    74.9
    84.6
    88.3
    88.9
    94.5
    86.7
    92.4
    57.1
    58.8
    68.0
    93.8
    75.4
    88.0
    3
    成立

    旗帜
    日子
    长城
    71.4
    76.9
    72.2
    60.5
    48.4
    60.0
    61.9
    84.6
    61.1
    56.3
    48.4
    68.0
    52.4
    76.9
    72.2
    56.3
    51.6
    68.0
    61.9
    76.9
    61.1
    62.5
    48.4
    68.0
    71.4
    80.8
    66.7
    62.5
    51.6
    64.0
    4

    60.0
    55.6
    66.7
    64.0
    72.2
    64.1
    60.0
    67.1
    61.5
    60.0
    50.0
    71.8
    64.0
    66.7
    64.0
    平均准确率72.270.969.870.474.2
    下载: 导出CSV

    表  3  3 组实验的平均消歧准确率

    Table  3.   Average disambiguation accuracy of three groups of experiments %

    类别
    数/类
    歧义词汇DBNCNN本文方法
    2表面

    单位
    动摇
    儿女
    镜头
    开通
    气息
    气象
    使
    眼光
    61.1
    55.6
    58.8
    62.5
    70.0
    53.3
    70.0
    71.4
    62.5
    62.5
    71.4
    82.3
    72.2
    82.3
    93.7
    94.9
    53.3
    85.0
    64.2
    87.5
    81.2
    71.4
    82.4
    88.9
    94.4
    73.3
    96.3
    50.7
    58.8
    67.3
    93.8
    79.6
    84.6
    3
    成立

    旗帜
    日子
    长城
    50.0
    63.3
    50.0
    55.6
    46.9
    38.1
    64.9
    66.6
    55.5
    72.2
    50.0
    71.4
    71.4
    76.9
    77.8
    68.8
    48.4
    80.0
    4

    43.5
    50.0
    30.0
    52.1
    50.0
    70.0
    56.0
    61.1
    53.8
    平均准确率56.371.073.2
    下载: 导出CSV
  • [1] LESK M. Automatic sense disambiguation using machine readable dictionaries: how to tell a pine code from an ice cream[C]//The Figth Annual International Conference on Systems Documentation. Toronto: ACM Press, 1986: 24-26
    [2] 杨安,李素建,李芸. 基于领域知识和词向量的词义消歧方法[J]. 北京大学学报(自然科学版),2017,53(2): 204-210.

    YANG An, LI Sujian, LI Yun. Word sense disambiguation based on domain knowledge and word vector model[J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2017, 53(2): 204-210.
    [3] FRANCO R L, IVAN L A , PINTO D, et al. Context expansion for domain-specific word sense disambiguation[J]. IEEE Latin America Transactions, 2015, 13(3): 784-789. doi: 10.1109/TLA.2015.7069105
    [4] 唐共波,于东,荀恩东. 基于知网义原词向量表示的无监督词义消歧方法[J]. 中文信息学报,2015,29(6): 23-29. doi: 10.3969/j.issn.1003-0077.2015.06.004

    TANG Gongbo, YU Dong, XUN Endong. An unsupervised word sense disambiguation method based on sememe vector in HowNet[J]. Journal of Chinese Information Processing, 2015, 29(6): 23-29. doi: 10.3969/j.issn.1003-0077.2015.06.004
    [5] ARAB M, JAHROMI M Z, FAKHRAHMAD S M. A graph-based approach to word sense disambiguation. An unsupervised method based on semantic relatedness[C]//2016 24th Iranian Conference on Electrical Engineering (CEE). Shiraz: IEEE, 2016: 250-255.
    [6] 孟禹光,周俏丽,张桂平,等. 引入词性标记的基于语境相似度的词义消歧[J]. 中文信息学报,2018,32(8): 9-18. doi: 10.3969/j.issn.1003-0077.2018.08.003

    MENG Yuguang, ZHOU Qiaoli, ZHANG Guiping, et al. Word sense disambiguation based on context simila- rity with POS tagging[J]. Journal of Chinese Information Processing, 2018, 32(8): 9-18. doi: 10.3969/j.issn.1003-0077.2018.08.003
    [7] 鹿文鹏,黄河燕,吴昊. 基于领域知识的图模型词义消歧方法[J]. 自动化学报,2014,40(12): 2836-2850.

    LU Wenpeng, HUANG Heyan, WU Hao. Word sense disambiguation with graph model based on domain knowledge[J]. Acta Automatica Sinica, 2014, 40(12): 2836-2850.
    [8] DUQUE A, STEVENSON M, MARTINEZ-ROMO J, et al. Co-occurrence graphs for word sense disambiguation in the biomedical domain[J]. Artificial Intelligence in Medicine, 2018, 87: 9-19. doi: 10.1016/j.artmed.2018.03.002
    [9] TRIPODI R, PELILLO M. A game-theoretic approach to word sense disambiguation[J]. Computational Linguistics, 2017, 43(1): 31-70. doi: 10.1162/COLI_a_00274
    [10] XU Xueping, YU Jianping, PIAO Xiaoyu. Contribution of governors to word sense disambiguation of English preposition[J]. ICIC Express Letters, 2015, 6(3): 723-730.
    [11] 杨陟卓. 基于上下文翻译的有监督词义消歧研究[J]. 计算机科学,2017,44(4): 252-255, 280. doi: 10.11896/j.issn.1002-137X.2017.04.053

    YANG Zhizhuo. Supervised WSD method based on context translation[J]. Computer Science, 2017, 44(4): 252-255, 280. doi: 10.11896/j.issn.1002-137X.2017.04.053
    [12] CARDELLINO C, ALONSO ALEMANY L. Exploring the impact of word embeddings for disjoint semisupervised Spanish verb sense disambiguation[J]. Inteligencia Artificial, 2018, 21(61): 67-81. doi: 10.4114/intartif.vol21iss61pp67-81
    [13] HUANG Z H, CHEN Y D, SHI X D. A novel word sense disambiguation algorithm based on semi-supervised statistical learning[J]. International Journal of Applied Mathematics and Statistics, 2013, 43(13): 452-458.
    [14] MAHMOODVAND M, HOURALI M. Semi-supervised approach for Persian word sense disambiguation[C]// 2017 7th International Conference on Computer and Knowledge Engineering (ICCKE). Mashhad: IEEE, 2017: 104-110.
    [15] 刘子图,全紫薇,毛如柏,等. NT-EP:一种无拓扑结构的社交消息传播范围预测方法[J]. 计算机研究与发展,2020,57(6): 1312-1322. doi: 10.7544/issn1000-1239.2020.20190584

    LIU Zitu, QUAN Ziwei, MAO Rubai, et al. NT-EP:a non-topology method for predicting the scope of social message propogation[J]. Journal of Computer Research and Development, 2020, 57(6): 1312-1322. doi: 10.7544/issn1000-1239.2020.20190584
    [16] 刘勇,谢胜男,仲志伟,等. 社会网中基于主题兴趣的影响最大化算法[J]. 计算机研究与发展,2018,55(11): 2406-2418. doi: 10.7544/issn1000-1239.2018.20170672

    LIU Yong, XIE Shengnan, ZHONG Zhiwei, et al. Topic-interest based influence maximization algorithm in social networks[J]. Journal of Computer Research and Development, 2018, 55(11): 2406-2418. doi: 10.7544/issn1000-1239.2018.20170672
    [17] 薛涛,王雅玲,穆楠. 基于词义消歧的卷积神经网络文本分类模型[J]. 计算机应用研究,2018,35(10): 2898-2903. doi: 10.3969/j.issn.1001-3695.2018.10.004

    XUE Tao, WANG Yaling, MU Nan. Convolutional neural network based on word sense disambiguation for text classification[J]. Application Research of Computers, 2018, 35(10): 2898-2903. doi: 10.3969/j.issn.1001-3695.2018.10.004
    [18] PESARANGHADER A, MATWIN S, SOKOLOVA M, et al. DeepBioWSD:effective deep neural word sense disambiguation of biomedical text data[J]. Journal of the American Medical Informatics Association, 2019, 26(5): 438-446. doi: 10.1093/jamia/ocy189
    [19] BORDES A, GLOROT X, WESTON J, et al. A semantic matching energy function for learning with multi-relational data[J]. Machine Learning, 2014, 94(2): 233-259. doi: 10.1007/s10994-013-5363-6
    [20] CHEN S J, HUNG C. Word sense disambiguation based sentiment lexicons for sentiment classification[J]. Knowledge-Based Systems, 2016, 110: 224-232. doi: 10.1016/j.knosys.2016.07.030
  • 期刊类型引用(1)

    1. 闫亚亚,邢红兵. 基于节点词全句共现的动态词义消歧研究. 语言科学. 2024(04): 354-364 . 百度学术

    其他类型引用(2)

  • 加载中
图(5) / 表(3)
计量
  • 文章访问数:  439
  • HTML全文浏览量:  245
  • PDF下载量:  26
  • 被引次数: 3
出版历程
  • 收稿日期:  2020-03-05
  • 修回日期:  2020-08-09
  • 网络出版日期:  2021-11-13
  • 刊出日期:  2020-09-15

目录

/

返回文章
返回