DeepSWIP：当神经网络遇见反事实推理——用加权模型计数打开因果推断的新大门

TL;DR

DeepSWIP 是一种面向 DeepProbLog 神经概率逻辑程序的单世界反事实推理语义框架。它通过"神经物质化"技术，将神经网络感知模块的输出转化为普通 ProbLog 的离散选择，再借助单世界干预程序（SWIPs）和加权模型计数（WMC）完成精确反事实计算。在有限基础化和唯一支持模型假设下，DeepSWIP 相对于学习到的物质化反事实模型是精确的。实验表明，该方法在 MPI3D 数据集上以 12,000 个查询验证了变换的正确性，同时实现了 2.14 倍的推理加速。此外，研究者还在 SUMO 自动驾驶仿真实验中揭示了神经校准退化对反事实估计的偏差影响，并提出了基于 AIPW 估计器的去偏方案。这项工作为神经符号系统中的因果推断开辟了新路径。

论文信息

论文标题：DeepSWIP: Quotient-WMC Counterfactuals for Neural Probabilistic Logic Programs
作者：Saimun Habib, Vaishak Belle, Fengxiang He
arXiv ID：2606.20526v1
分类：cs.AI（人工智能）
代码仓库：https://github.com/saibib/deep_SWIP
关键词：神经符号系统、反事实推理、加权模型计数、概率逻辑编程、因果推断

研究背景与动机

神经符号系统的崛起

在人工智能的研究长河中，连接主义（以深度学习为代表）和符号主义（以逻辑推理为代表）一直是两条并行发展的主线。深度学习擅长从海量数据中提取模式，在图像识别、自然语言处理等领域取得了令人瞩目的成就；而符号推理则以其可解释性、逻辑一致性和组合泛化能力著称。近年来，研究者们越来越意识到，将两者融合的"神经符号系统"（Neurosymbolic Systems）可能是通往更强大、更可信人工智能的关键路径。

DeepProbLog 就是这一融合浪潮中的杰出代表。它在经典概率逻辑编程语言 ProbLog 的基础上，引入了神经网络作为感知原语。这意味着，你可以用逻辑规则来表达领域知识和推理结构，同时让神经网络负责处理感知层面的任务——比如从图像中识别数字、从传感器数据中提取特征等。这种架构在手写数字加法推理、概率规划等任务上展现出了独特的优势。

从关联到因果：推理的缺失环节

然而，DeepProbLog 和大多数神经符号系统一样，其标准推理模式是关联性的（associational）。也就是说，系统能够回答"如果我们观察到 X，那么 Y 的概率是多少？"这类问题，但它无法回答更深层次的反事实问题："如果当时 X 没有发生，Y 会怎样？"

这种反事实推理能力的缺失并非细枝末节。在因果推断的理论框架中（以 Judea Pearl 的因果阶梯为代表），反事实推理位于因果推理层次结构的最高层。它不仅是科学推理的核心，也是许多实际应用的基础——从医学中的个体化治疗效果评估，到自动驾驶中的安全验证，再到法律中的责任认定，反事实推理无处不在。

举一个直观的例子：假设一个自动驾驶系统在某个路口发生了事故。关联性推理只能告诉我们"在这种传感器读数下，事故发生概率较高"。但反事实推理能够回答更关键的问题："如果当时传感器读数不同（比如行人距离更远），事故是否还会发生？"这种能力对于理解因果关系、验证系统安全性至关重要。

现有方案的困境

在纯概率逻辑编程（如 ProbLog）的领域内，反事实推理已经有了成熟的解决方案。单世界干预程序（Single World Intervention Programs, SWIPs）技术通过在单一可能世界上执行干预操作，实现了精确的反事实推理。结合加权模型计数（Weighted Model Counting, WMC），这一方法在理论上是完备的，在实践中也是高效的。

但问题在于，当神经网络组件被引入概率逻辑程序时，事情变得复杂了。神经网络的输出是连续的、高维的概率分布，而传统的 SWIPs 方法是建立在离散的逻辑选择之上的。如何将连续的神经网络输出无缝地融入离散的反事实推理框架？如何确保这种融合在理论上是正确的、在实践中是高效的？这正是 DeepSWIP 试图解决的核心挑战。

此外，神经网络的校准问题也给反事实推理带来了额外的困难。一个"校准良好"的神经网络，其输出的概率应该与实际频率一致。但在实践中，深度学习模型的校准往往随着分布偏移而退化，这种退化会直接传播到反事实估计中，导致有偏的结论。

研究动机的总结

综上所述，DeepSWIP 的研究动机可以归纳为三个层面：

理论层面：为神经符号系统提供一套严格的反事实推理语义，填补从关联推理到因果推理的理论空白。
方法层面：开发一种将神经网络输出转化为可进行精确反事实计算的离散形式的技术桥梁，同时保持计算效率。
应用层面：在实际场景（如自动驾驶安全验证）中验证反事实推理的有效性，并解决神经校准退化带来的实际问题。

核心发现

发现一：神经物质化——连接连续与离散的桥梁

DeepSWIP 最核心的技术贡献是提出了神经物质化（Neural Materialization）的概念。这一技术的基本思想是：将神经网络在特定上下文中输出的概率值，转化为概率逻辑程序中的离散"选择"（choices）。

想象一下，你有一个神经网络，输入一张手写数字图像，输出"这是数字 3"的概率为 0.85。在 DeepProbLog 的标准推理中，这个 0.85 会被直接用于概率计算。但在反事实推理中，我们需要能够"干预"这个随机变量——比如强制它为某个特定值。

神经物质化就是做这件事的：它将"神经网络输出 0.85"这个连续事件，转化为一个离散的概率选择——"以 0.85 的概率选择数字 3，以 0.15 的概率选择其他数字"。一旦完成了这种转化，神经网络的输出就变成了普通的 ProbLog 选择，可以直接使用 SWIPs 技术进行反事实推理。

发现二：商式加权模型计数形式

在理论分析方面，DeepSWIP 揭示了 ProbLog 条件的商式加权模型计数（Quotient-WMC）形式。这一发现具有深远的意义。

具体来说，当我们在概率逻辑程序中进行条件推理时（即计算"给定证据 E，查询 Q 的概率"），这个条件概率可以表示为两个加权模型计数的商：分子是同时满足查询和证据的模型的加权计数，分母是满足证据的模型的加权计数。

这一形式化的美妙之处在于，它清晰地标识了哪些神经概率是"活跃的"——即哪些神经网络的输出真正影响了最终的反事实估计。更进一步，它还解释了三个重要的现象：

干预清洗（Intervention Cleaning）：当我们对某个变量进行干预时，原来依赖于该变量的所有因果路径都需要被"清洗"——这正是 SWIPs 技术中"单世界"语义的体现。
校准敏感性（Calibration Sensitivity）：当神经网络的输出概率不准确时，这种不准确会如何传播到反事实估计中。
稀有证据不稳定性（Rare-Evidence Instability）：当观察到的证据在训练分布中极为罕见时，反事实估计的可靠性会显著下降。

发现三：精确性保证

DeepSWIP 在两个关键假设下提供了精确性保证：

有限基础化假设（Finite Grounding）：概率逻辑程序中的变量可以被完全实例化为有限数量的基项。
唯一支持模型假设（Unique Supported Model）：每个可能世界中恰好有一个支持模型。

在这两个假设下，DeepSWIP 的反事实计算相对于学习到的物质化反事实模型（Materialized FCM）是精确的。这意味着，只要神经网络的输出是准确的（即校准良好），DeepSWIP 给出的反事实概率就是正确的。

发现四：实验验证的三重证据

论文通过三组实验验证了 DeepSWIP 的有效性：

MPI3D 精确性验证：在包含 12,000 个查询的大规模实验中，DeepSWIP 的变换结果与 DeepTwin 构造完全一致，同时实现了 2.14 倍的推理加速。
SUMO 自动驾驶实验：揭示了神经校准退化如何导致反事实估计的偏差。
AIPW 去偏估计器：提出了一种基于随机化策略的 AIPW 估计器，有效消除了大部分一阶偏差。

技术方法详解

概率逻辑编程基础：从积木世界说起

在深入 DeepSWIP 的技术细节之前，让我们先建立一些直觉。想象一个简单的"积木世界"：桌上有几块积木，每块积木可能是红色或蓝色，我们需要根据某些规则来推理它们的颜色和位置关系。

在 ProbLog 中，这样的世界可以用概率事实来描述：

0.7::color(block1, red).
0.3::color(block1, blue).

这表示积木 1 有 70% 的概率是红色，30% 的概率是蓝色。逻辑规则可以表达更复杂的知识：

on(X, Y) :- color(X, red), color(Y, blue).

这意味着"如果 X 是红色且 Y 是蓝色，则 X 在 Y 上面"。

概率推理的任务就是：给定某些观察（证据），计算某个查询的概率。这可以通过枚举所有可能世界（即所有可能的颜色组合），对每个可能世界检查是否满足证据和查询，然后加权求和来完成——这就是加权模型计数（WMC）的核心思想。

DeepProbLog：当神经网络成为感知器

DeepProbLog 在上述框架中引入了神经网络。假设我们有一个手写数字识别神经网络，输入图像，输出 0-9 各数字的概率。在 DeepProbLog 中，这可以表示为：

nn(digit_net, [image], [0.1, 0.05, 0.02, 0.7, ...]) :: digit(X).

这里的 nn(...) 是一个神经原语，它将神经网络的输出直接嵌入到概率逻辑程序中。当我们需要推理"两张手写数字图片相加"时，系统会：

用神经网络识别每张图片的数字（感知层）
用逻辑规则进行加法推理（推理层）
通过概率推理计算最终结果的概率分布（概率层）

这就是 DeepProbLog 的核心架构——神经感知与逻辑推理的无缝融合。

反事实推理：什么是"如果当时..."

现在，让我们进入反事实推理的世界。考虑一个简单的例子：张三吸烟，后来得了肺癌。反事实问题是："如果张三当时不吸烟，他还会得肺癌吗？"

在因果推断理论中，这个问题需要三个步骤（Pearl 的三层因果模型）：

抽象（Abstraction）：从观测数据中学习因果模型。
干预（Action）：在模型中进行"做"操作（do-calculus），如强制某人不吸烟。
反事实（Counterfactual）：在干预后的模型中，推断特定个体的结果。

对于概率逻辑程序，反事实推理需要在同一个可能世界中同时考虑"实际发生了什么"和"如果干预了会怎样"。这就是"单世界"（Single World）的含义——我们不是在两个不同的可能世界中分别计算，而是在同一个世界中比较两种情景。

单世界干预程序（SWIPs）：如何在逻辑程序中做反事实

SWIPs 的核心技术可以类比为"时间旅行"。想象你有一台时间机器，可以回到过去的某个时刻，改变一个决定，然后观察结果会如何不同。但关键约束是：除了你改变的那个决定之外，一切都保持不变（即在同一个可能世界中）。

在 ProbLog 中，SWIPs 的实现方式是：对于每个概率事实（如 0.7::color(block1, red)），引入两个"版本"——一个表示实际世界中的值，另一个表示干预后的值。通过巧妙的程序变换，系统可以在同一个逻辑程序中同时推理两种情景。

形式化地说，给定一个 ProbLog 程序 P 和一组干预 I，SWIPs 构造一个变换后的程序 P'，使得 P' 中的可能世界与 P 中的可能世界一一对应，但在每个可能世界中，被干预的变量被强制为指定的值。

DeepSWIP 的核心：神经物质化变换

现在，我们可以理解 DeepSWIP 的核心贡献了。问题是：如何将 SWIPs 技术应用于 DeepProbLog？

挑战在于，DeepProbLog 中的神经原语（如 nn(digit_net, ...)）不是普通的概率事实——它们是由神经网络参数化定义的连续概率分布。SWIPs 要求每个概率事实有明确的"实际值"和"干预值"，但神经原语没有这样的离散结构。

DeepSWIP 的解决方案是神经物质化（Neural Materialization）：

第一步：固定上下文推理。对于给定的输入（如一张手写数字图片），运行神经网络，得到每个数字的概率分布。这一步将神经网络的连续输出"固定"为一组具体的概率值。

第二步：转化为 ProbLog 选择。将这些概率值转化为普通的 ProbLog 概率事实。例如：

原始：nn(digit_net, [image], [0.1, 0.05, 0.02, 0.7, ...]) :: digit(X).
物质化后：
0.7::digit(3).
0.1::digit(0).
0.05::digit(1).
...

第三步：应用 SWIPs。在物质化后的程序上，直接使用标准的 SWIPs 技术进行反事实推理。

这个过程可以用一个建筑比喻来理解：神经网络就像是一个工厂，生产各种颜色的砖块（概率分布）。标准的 DeepProbLog 只关心工厂的总体产出。但 DeepSWIP 先将工厂的产出"库存清点"（物质化），然后把这些砖块按照颜色分类堆放（转化为 ProbLog 选择），最后在这些砖块上搭建反事实推理的大厦（应用 SWIPs）。

加权模型计数与商式形式

一旦神经原语被物质化为普通的 ProbLog 选择，反事实推理就可以通过加权模型计数（WMC）来完成了。

WMC 的基本思想是：每个可能世界有一个"权重"，等于其中所有概率事实取值的乘积。条件概率 P(Q|E) 可以计算为：

P(Q|E) = WMC(Q ∧ E) / WMC(E)

其中 WMC(φ) 表示满足公式 φ 的所有可能世界的权重之和。

DeepSWIP 进一步揭示了这个商式形式的深层含义。在物质化后的程序中，每个神经概率（即神经网络输出的每个类别概率）都会出现在分子或分母中。通过分析哪些神经概率"活跃地"影响了最终的反事实概率，我们可以：

理解干预的效果：干预一个变量时，哪些神经概率被"清洗"了？
评估校准敏感性：如果某个神经概率被扰动了 δ，反事实概率会变化多少？
诊断不稳定性：当证据概率极小时，商式的分母接近零，导致估计不稳定。

精确性的理论保证

DeepSWIP 的精确性定理可以非正式地陈述为：

在有限基础化和唯一支持模型的假设下，对于任何神经概率逻辑程序 P、证据 E、查询 Q 和干预 I，DeepSWIP 计算的反事实概率等于在物质化反事实模型（FCM）上的精确反事实概率。

这里的"物质化 FCM"是指：先将所有神经网络在所有相关上下文中的输出预计算出来，构建一个完整的离散因果模型，然后在这个模型上进行标准的反事实推理。DeepSWIP 的优势在于，它不需要显式地构建这个完整的模型——它只需要在需要时进行局部的物质化，从而大大减少了计算和存储开销。

用一个图书馆的比喻来说明：物质化 FCM 相当于把整个图书馆的书全部复印一份放在手边（完整但昂贵）。DeepSWIP 则相当于知道每本书的位置，需要时才去取阅（按需且高效），但最终读到的内容是一样的（精确性保证）。

实验结果分析

实验一：MPI3D 数据集上的精确性验证

MPI3D 是一个合成的 3D 对象数据集，包含多种对象属性（形状、颜色、大小、方位角等），常用于因果表示学习研究。

实验设置：研究者在 MPI3D 上构建了一个 DeepProbLog 程序，使用神经网络识别 3D 对象的各个属性，然后用逻辑规则定义属性之间的因果关系。实验生成了 12,000 个反事实查询，每个查询包含：一组证据、一个查询变量和一个干预操作。

对比基线：DeepTwin 构造。这是概率逻辑编程中实现反事实推理的标准方法——它通过"复制"整个程序（一个副本表示实际世界，另一个副本表示反事实世界），然后在两个副本之间建立关联。

实验结果：

指标	DeepSWIP	DeepTwin
精确性	与 DeepTwin 完全一致	基准
推理速度	2.14× 加速	基准
程序复杂度	单程序	双程序（2× 变量）

DeepSWIP 在所有 12,000 个查询上与 DeepTind 的结果完全一致，验证了其变换的正确性。同时，由于避免了 DeepTwin 的内源性变量复制（即不需要维护两个可能世界的并行副本），DeepSWIP 实现了 2.14 倍的推理加速。

这一加速的来源可以理解为：DeepTwin 相当于同时跑两场模拟（实际世界和反事实世界），而 DeepSWIP 只跑一场模拟，但在其中巧妙地嵌入了两种情景的推理。变量数量的减少直接转化为推理效率的提升。

实验二：SUMO 自动驾驶仿真中的校准敏感性

SUMO（Simulation of Urban Mobility）是一个广泛使用的交通仿真平台。研究者在 SUMO 中构建了一个高速公路合流（HOV，High-Occupancy Vehicle）场景，使用神经网络预测车辆的意图（合流或保持车道），然后用 DeepSWIP 进行反事实推理。

关键发现：当神经网络的校准质量下降时（例如，由于训练分布与测试分布不匹配），DeepSWIP 的反事实估计会出现系统性偏差。具体表现为：

校准良好的神经网络：反事实估计的偏差在 5% 以内。
校准退化的神经网络：反事实估计的偏差可达 20% 以上。

这一发现具有重要的实践意义。它表明，在安全关键应用（如自动驾驶）中使用反事实推理时，神经网络的校准质量不是可有可无的指标，而是直接影响推理可靠性的关键因素。

研究者通过商式 WMC 形式对此进行了理论解释：当神经概率被高估或低估时，这种误差会通过商式的分子和分母传播到最终的反事实概率中。在某些情况下（如稀有证据），这种误差甚至会被放大。

实验三：AIPW 去偏估计器

针对神经校准退化导致的偏差问题，研究者提出了一种基于增强逆概率加权（AIPW, Augmented Inverse Probability Weighting）的去偏估计器。

核心思想：AIPW 估计器结合了两种策略——（1）通过逆概率加权修正选择偏差，（2）通过结果回归模型修正模型偏差。这种"双重稳健"（doubly robust）的性质意味着，只要两种策略之一是正确的，最终估计就是无偏的。

实验结果：在 SUMO HOV 实验中，AIPW 估计器成功消除了大部分一阶偏差，将平均处理效应（ATE）的估计偏差从 15% 降低到 3% 以内。对于群体均值的估计，偏差也被控制在 2% 以内。

与现有工作对比

与 DeepTwin 的对比

DeepTwin 是在概率逻辑编程中实现反事实推理的经典方法。它通过"克隆"整个程序来构建反事实世界，每个概率事实都有两个版本（实际版本和反事实版本）。

维度	DeepSWIP	DeepTwin
理论基础	SWIPs + WMC	程序克隆
变量数量	O(n)	O(2n)
神经网络支持	原生（通过物质化）	无直接支持
精确性	精确（在假设下）	精确
推理效率	更高	较低

DeepSWIP 的主要优势在于：（1）原生支持神经网络组件，无需修改 DeepTwin 的克隆机制；（2）通过减少变量数量实现了更高效的推理。

与因果推断框架的对比

在统计因果推断领域，反事实推理通常基于结构因果模型（SCM）和潜在结果框架。这些方法侧重于从观测数据中估计因果效应，而非在逻辑程序中进行符号化的反事实推理。

DeepSWIP 与这些方法的关系是互补而非竞争的：

统计因果推断方法更适用于连续变量和大规模观测数据的场景。
DeepSWIP 更适用于具有明确逻辑结构和概率语义的场景，特别是当领域知识可以用逻辑规则表达时。

与因果表示学习的对比

近年来，因果表示学习（Causal Representation Learning）试图在深度学习中嵌入因果结构。这些方法通常通过学习因果图或解耦表示来实现因果推理。

DeepSWIP 的不同之处在于：它不是在神经网络内部嵌入因果结构，而是在神经网络之上构建因果推理层。这种"模块化"的设计允许独立地改进感知模块（神经网络）和推理模块（逻辑程序），具有更好的灵活性和可解释性。

潜在应用与影响

自动驾驶安全验证

DeepSWIP 最直接的应用场景之一是自动驾驶系统的安全验证。在自动驾驶中，我们经常需要回答反事实问题：

"如果行人突然出现在车前，系统会如何反应？"
"如果传感器读数略有不同，决策是否会发生变化？"
"如果另一辆车的速度更快，事故是否可以避免？"

DeepSWIP 提供了一种在概率逻辑框架中精确回答这些问题的方法。结合 SUMO 等仿真平台，可以系统地评估自动驾驶系统在各种反事实情景下的行为，从而提高系统的安全性和可解释性。

医学因果推断

在精准医学中，反事实推理是评估个体化治疗效果的核心工具。例如："如果对患者 A 使用药物 B 而非药物 C，治疗效果会如何不同？"

DeepSWIP 可以与医学知识图谱结合，构建概率逻辑程序来表达疾病、症状、治疗之间的因果关系，然后用神经网络处理临床数据（如医学影像、基因表达数据），最终通过反事实推理实现精准的治疗效果评估。

公平性与偏见检测

在 AI 公平性研究中，反事实公平性（Counterfactual Fairness）是一个重要的概念。它要求：如果一个人的敏感属性（如种族、性别）不同，但其他属性保持不变，模型的预测不应改变。

DeepSWIP 可以用于检测机器学习系统中的反事实不公平性。通过构建包含敏感属性和决策逻辑的概率程序，可以系统地测试系统在反事实情景下的公平性表现。

可解释 AI

DeepSWIP 的商式 WMC 形式提供了天然的可解释性。通过分析哪些神经概率"活跃地"影响了最终的反事实推理结果，我们可以理解模型的决策过程，识别关键的影响因素，从而提高 AI 系统的透明度和可信度。

局限性与未来方向

当前局限性

有限基础化假设：DeepSWIP 要求概率逻辑程序可以被有限地基础化。对于某些具有无穷域的程序，这一假设可能不成立。
唯一支持模型假设：DeepSWIP 要求每个可能世界中恰好有一个支持模型。对于包含循环依赖或相互递归规则的程序，这一假设可能过于严格。
神经校准依赖：DeepSWIP 的精确性依赖于神经网络的良好校准。当校准退化时，反事实估计会出现偏差。虽然 AIPW 估计器可以缓解这一问题，但不能完全消除。
计算复杂度：尽管 DeepSWIP 比 DeepTwin 更高效，但加权模型计数本身是 #P-hard 问题。对于大规模程序，精确计算可能仍然不可行。
可扩展性：当前实验主要在合成数据和小规模场景上进行。对于真实世界的大型知识库和复杂因果图，DeepSWIP 的可扩展性还有待验证。

未来研究方向

近似推理：开发基于采样或变分方法的近似反事实推理算法，以处理大规模程序。例如，可以利用重要性采样或蒙特卡洛树搜索来近似 WMC。
端到端学习：将反事实推理能力嵌入到神经网络的训练过程中，使得神经网络不仅学习关联模式，还学习因果结构。这可以通过可微分的 WMC 近似来实现。
在线校准：开发自适应的神经网络校准方法，使得系统在部署过程中持续监测和修正校准偏差，从而提高反事实估计的可靠性。
分布式推理：对于大规模概率逻辑程序，开发分布式 WMC 算法，利用并行计算加速反事实推理。
与其他因果框架的融合：探索 DeepSWIP 与结构因果模型（SCM）、潜在结果框架等经典因果推断方法的统一理论，建立更一般的神经符号因果推理框架。
真实世界应用：在医学诊断、法律推理、金融风控等领域开展真实世界的应用研究，验证 DeepSWIP 在实际场景中的有效性和可扩展性。
连续变量扩展：将 DeepSWIP 从离散变量扩展到连续变量，使其能够处理更广泛的应用场景。这可能需要结合概率编程语言（如 Stan、Pyro）中的连续推理技术。

总结

DeepSWIP 是一项兼具理论深度和实践价值的研究工作。它成功地将概率逻辑编程中的反事实推理技术（SWIPs + WMC）扩展到了神经符号系统，为 DeepProbLog 提供了精确的反事实推理语义。

从技术贡献来看，DeepSWIP 的核心创新在于神经物质化——一种将神经网络连续输出转化为离散概率选择的桥梁技术。这一技术不仅使得 SWIPs 可以直接应用于神经符号程序，还通过商式 WMC 形式提供了对校准敏感性和稀有证据不稳定性的理论解释。

从实验验证来看，DeepSWIP 在 MPI3D 数据集上以 12,000 个查询验证了其精确性，并实现了 2.14 倍的推理加速。在 SUMO 自动驾驶仿真实验中，它揭示了神经校准退化对反事实估计的影响，并提出了有效的去偏方案。

从更广阔的视角来看，DeepSWIP 代表了神经符号系统向因果推理能力迈进的重要一步。在当前 AI 界日益关注可解释性、公平性和安全性的背景下，这种能够在逻辑框架中进行精确因果推理的能力，将为构建更可信、更负责任的 AI 系统提供坚实的技术基础。

正如论文作者所言，DeepSWIP 的代码已在 GitHub 上开源，这为后续研究和应用提供了便利。我们期待看到更多基于这一框架的创新工作，在理论和应用两个层面推动神经符号因果推理的发展。

本文基于 arXiv 论文 2606.20526v1 撰写，论文作者为 Saimun Habib、Vaishak Belle 和 Fengxiang He。论文代码仓库：https://github.com/saibib/deep_SWIP