曾国艳 徐扬 陈树伟 姜世攀

曾国艳, 徐扬, 陈树伟, 姜世攀. 基于多属性决策的一阶逻辑子句选择方法[J]. 西南交通大学学报. doi: 10.3969/j.issn.0258-2724.20230023
ZENG Guoyan, XU Yang, CHEN Shuwei, JIANG Shipan. First-Order Logic Clause Selection Method Based on Multi-Criteria Decision Making[J]. Journal of Southwest Jiaotong University. doi: 10.3969/j.issn.0258-2724.20230023
doi: 10.3969/j.issn.0258-2724.20230023
基金项目: 国家自然科学基金项目(61976130)




  • 中图分类号: TP311;O14

First-Order Logic Clause Selection Method Based on Multi-Criteria Decision Making

  • 摘要:

    基于一阶逻辑的自动定理证明器(ATP)是知识表达和自动推理研究中占据重要地位,而启发式策略则是提升ATP性能的关键研究方向. 主流的启发式策略通常通过描述子句属性来确定属性优先级,从而选择子句,但属性优先级受人为因素影响,且评估子句耗时较长. 为此,本文基于矛盾体分离(S-CS)规则,提出一种新的多属性决策(MCDM)子句评估方法. 首先,利用熵权法对子句属性进行客观赋权;其次,结合偏好顺序结构评估法(PROMETHEE Ⅱ)对子句进行评估,得到子句的完全排序;最后,将提出的MCDM方法加入自动定理证明器contradiction separation extension 1.5(CSE 1.5)、Vampire 4.7和Eprover (E 2.6)中,分别形成新的证明器MCDM_CSE、 MCDM_V和MCDM_E. 对MCDM_CSE测试了国际定理证明器问题库TPTP (Thousands of Problems for Theorem Provers)中一阶逻辑格式的定理,并对MCDM_V和MCDM_E测试了2022年CADE (Conference on Automated Deduction)竞赛例(一阶逻辑组). 实验表明:MCDM_CSE比CSE 1.5多证明了151个定理(来自TPTP),并且能够证明Vampire 4.7无法证明的5个定理、E 2.6无法证明的41个定理以及Prover9无法证明的293个定理;在更短的平均时间内,MCDM_V比Vampire 4.7多证明了6个定理(来自CADE 2022),MCDM_E比E 2.6多证明了8个定理.


  • 图 1  基于 PROMETHEE Ⅱ的候选子句选择框架

    Figure 1.  Framework diagram for candidate clause selection based on PROMETHEE Ⅱ

    图 2  基于 PROMETHEE Ⅱ的 S-CS 算法流程

    Figure 2.  Flowchart of S-CS algorithm based on PROMETHEE Ⅱ

    图 3  不同ATP在2022年CADE竞赛的CPU时间比较

    Figure 3.  Comparison of CPU time of different ATPs for the CADE 2022 competition

    表  1  MCDM_CSE和CSE 1.5在不同难度等级下证明的定理数量对比

    Table  1.   Comparison of the number of theorems proved by MCDM_CSE and CSE 1.5 at different difficulty levels

    难度等级MCDM_CSECSE 1.5
    [0, 0.1)10611073
    表  2  MCDM_CSE证明难度大于0.9的定理所需的证明时长

    Table  2.   Time consumed by MCDM_CSE to prove theorems with difficulty greater than 0.9

    定理名称 难度等级 证明时间/s
    SEU413 + 2 0.92 26.81
    SWB088 + 1 0.97 137.78
    SWB090 + 1 0.97 126.04
    NUM736 + 4 1.00 65.49
    SYO625-1 1.00 219.51
    SYO587 + 1 1.00 218.41
    表  3  对已证明定理(按难度等级)在国际知名自动定理证明器中证明数量的比较

    Table  3.   Comparison of the number of theorems (by difficulty level) proved by internationally known ATPs

    Vampire 4.7253921138
    E 2.625321210
    表  4  2022年CADE竞赛的比较结果

    Table  4.   Comparative results on the CADE 2022 competition

    自动定理证明器 平均时间/s 证明个数/个
    MCDM_V 15.3 462
    Vampire 4.7 16.1 456
    MCDM_E 27.4 387
    E 2.6 31.7 380
