QCPIKAN:量子-经典物理信息Kolmogorov-Arnold网络求解偏微分方程
引言与TL;DR
偏微分方程(PDE)是描述物理世界的数学语言——从流体力学到量子力学,从天气预报到石油开采,几乎所有连续物理系统的行为都可以用PDE来刻画。传统数值方法(有限元、有限差分等)虽然成熟,但在高维、复杂几何、多尺度问题上面临「维数灾难」。物理信息神经网络(PINN)开辟了新路径,但经典神经网络的表达能力存在瓶颈。Rao Xiang和Shen Yuxuan提出的QCPIKAN首次将Kolmogorov-Arnold网络(KAN)与量子电路结合,构建了量子-经典混合的物理信息框架。在多孔介质渗流的三个典型场景中,QCPIKAN的全局预测精度、局部误差控制和驱替前缘定位均超越了现有方法。理论上,该设计将高频误差收敛加速至指数速率,为复杂PDE求解提供了新范式。
论文基本信息
- 标题:Quantum-classical physics-informed Kolmogorov-Arnold networks for PDEs
- arXiv链接:https://arxiv.org/abs/2606.20326v1
- 作者:Xiang Rao, Yuxuan Shen
- 发表日期:2026年6月18日
- 领域:机器学习(cs.LG)、计算物理(comp-ph)
- 关键词:KAN、量子计算、物理信息神经网络、偏微分方程、多孔介质渗流
研究背景与动机
PDE求解:科学计算的核心挑战
偏微分方程是物理学的「母语」。Navier-Stokes方程描述流体运动,Schrödinger方程描述量子态演化,Maxwell方程描述电磁场行为,热传导方程描述温度扩散——这些方程构成了现代科学和工程的数学基础。
传统PDE数值方法经过数十年发展,已经相当成熟。有限元法(FEM)、有限差分法(FDM)、有限体积法(FVM)等方法在规则几何和标准边界条件下表现出色。但当问题变得复杂时——高维空间、不规则几何、多物理场耦合、参数不确定性——传统方法就会遇到严重的计算瓶颈。
以多孔介质渗流为例:地下岩石的孔隙结构极其复杂,流体在其中的流动涉及多个尺度(从微米级的孔隙到千米级的油藏),需要同时求解流动方程和组分输运方程。传统方法需要精细的网格剖分,计算量随维度指数增长。一个三维油藏模拟可能需要数天甚至数周的计算时间。
PINN的崛起与局限
物理信息神经网络(PINN)由Raissi等人在2019年提出,开创了用深度学习求解PDE的新范式。PINN的核心思想很优雅:将PDE的残差作为损失函数的一部分,训练神经网络使其输出同时满足PDE方程和边界/初始条件。不需要网格、不需要离散化,神经网络天然可以处理任意几何形状。
PINN的优势在于:
- 无网格方法,天然适合复杂几何
- 可以方便地处理逆问题(从观测数据反推方程参数)
- 可以融合观测数据和物理约束
- 在高维问题上有潜在优势
但PINN也有明显的局限:
- 频谱偏差:标准MLP(多层感知器)倾向于学习低频成分,难以捕获高频细节。这在含激波、边界层等高频特征的问题中尤为突出。
- 训练困难:物理损失和数据损失之间的平衡很难调优,梯度冲突导致训练不稳定。
- 精度不足:在需要高精度的工程应用中,PINN的精度通常不如传统方法。
- 可扩展性:随着问题复杂度增加,训练时间和所需的网络规模急剧增长。
KAN的革命性潜力
2024年,Liu等人提出了Kolmogorov-Arnold网络(KAN),这是一种全新的神经网络架构。与传统MLP在每个节点使用固定的激活函数不同,KAN在每条边上使用可学习的激活函数(通常用B样条或多项式实现)。
KAN的理论基础来自Kolmogorov-Arnold表示定理:任何多元连续函数都可以表示为有限个单变量函数的叠加。这意味着KAN在理论上可以精确表示任何连续函数,而且通常比MLP更紧凑。
KAN在PDE求解上有几个天然优势:
- 更强的函数逼近能力:可以更精确地表示PDE解的复杂空间结构
- 可解释性:每条边的激活函数可以看到,有助于理解解的特征
- 参数效率:用更少的参数达到相同或更好的精度
但KAN也有挑战:如何选择合适的基函数?如何处理高频特征?如何与物理约束有效结合?
量子计算的加入
量子计算在科学计算中有独特潜力。参数化量子电路(PQC)可以表示高维函数空间中的函数,具有经典计算机难以模拟的表达能力。量子叠加和纠缠可以自然地编码函数之间的相关性,这在多变量函数逼近中有潜在优势。
近年来,量子-经典混合算法成为量子计算落地的主要路径。在NISQ(含噪声中等规模量子)时代,完全量子算法还不可行,但量子-经典混合方法可以利用量子电路的表达能力,同时依赖经典优化器进行参数更新。
将量子计算与KAN和PINN结合,是一个自然而然但极具挑战性的研究方向。QCPIKAN正是在这三个技术的交叉点上诞生的创新工作。
核心发现与创新点
创新一:首个量子-经典物理信息KAN框架
QCPIKAN是第一个将量子电路与KAN结合并应用于物理信息PDE求解的框架。这个结合不是简单的叠加,而是精心设计的架构:
- 经典KAN层:使用Chebyshev多项式作为基函数的KAN层,负责处理空间坐标的非线性映射。Chebyshev多项式在函数逼近中具有最优性质(最小最大偏差),这为高频特征的捕获提供了数学保障。
- 参数化量子电路(PQC):作为网络的核心计算单元,利用量子叠加和纠缠捕获变量间的复杂相关性。量子电路的参数通过经典优化器训练。
- 物理约束嵌入:将PDE残差、边界条件、初始条件等物理约束编码到训练损失中,确保网络输出满足物理定律。
这种混合架构的优势在于:经典KAN层提供了坚实的函数逼近基础和可解释性,量子电路则提供了额外的表达能力来处理经典方法难以捕获的复杂模式。
创新二:指数级高频误差收敛
QCPIKAN的一个核心理论贡献是证明了该架构可以将高频误差收敛加速至指数速率。这是什么意思?
在PDE求解中,解的高频成分(如激波、边界层、界面间断)是最难准确捕获的。传统PINN基于MLP,由于频谱偏差,对高频成分的逼近误差只能以多项式速率衰减。即使增加网络宽度或深度,高频误差的改善也很缓慢。
QCPIKAN通过两个机制实现指数收敛:
Chebyshev多项式KAN层:Chebyshev多项式天然具有捕获高频振荡的能力。在函数逼近理论中,用Chebyshev级数逼近光滑函数,其截断误差以指数速率衰减。KAN将这种最优逼近性质嵌入到网络结构中。
量子电路的高频编码能力:参数化量子电路通过量子门的旋转角度可以自然地编码高频模式。量子态在Bloch球上的旋转对应不同频率的振荡,多个量子比特的纠缠态可以编码复杂的高频耦合模式。
数学上,作者严格证明了在一定正则性假设下,QCPIKAN的逼近误差满足:对于k次可微的PDE解,总误差以O(e^{-c*k})的速率衰减,其中c是与网络结构相关的常数。这比MLP-PINN的O(n^{-k/d})(多项式衰减,d是维度)快得多。
创新三:数值色散的有效抑制
数值色散是数值PDE求解中的一个经典问题。当用离散方法近似连续方程时,不同频率的波会以略微不同的速度传播,导致解出现非物理的振荡(色散伪影)。这在波传播、对流输运等问题中尤为突出。
QCPIKAN的Chebyshev-KAN结构天然具有抑制数值色散的能力。Chebyshev多项式的正交性质确保不同频率成分被独立且精确地表示,不会产生频率间的非物理耦合。量子电路则通过纠缠态编码频率之间的正确物理关系,进一步减少色散误差。
实验结果表明,与传统PINN和纯经典KAN相比,QCPIKAN在含强对流或多尺度特征的问题中,生成的解更加平滑,色散伪影显著减少。
技术方法详解
Chebyshev多项式KAN层
标准KAN使用B样条作为边上的可学习激活函数。QCPIKAN改用Chebyshev多项式,这是一个关键设计选择。
Chebyshev多项式T_n(x)是一组在[-1,1]区间上正交的多项式序列。它们有几个理想的性质:
- 最优逼近性:在所有n次多项式中,Chebyshev逼近具有最小的最大偏差
- 递推关系:T_{n+1}(x) = 2x*T_n(x) - T_{n-1}(x),计算高效
- 频谱特性:T_n(x) = cos(n*arccos(x)),天然对应不同频率的余弦函数
在QCPIKAN的KAN层中,每条边上的激活函数表示为Chebyshev多项式的线性组合:f(x) = Σ a_i * T_i(x)。系数a_i是可训练参数。这种表示的好处是:高次Chebyshev项天然捕获高频特征,低次项捕获低频趋势,无需像B样条那样手动调整分辨率。
参数化量子电路(PQC)
QCPIKAN中的量子电路是一个典型的变分量子电路,由以下部分组成:
编码层(Ansatz):将经典输入数据编码为量子态。通常使用旋转门RX、RY、RZ将数据映射到量子比特的Bloch球上。每个量子比特的旋转角度对应一个输入变量。
纠缠层:通过CNOT门等纠缠门建立量子比特之间的相关性。这些纠缠模式编码了输入变量之间的高阶相关性,这是经典方法难以高效表示的。
变分层:包含可训练参数的量子门序列。这些参数通过经典优化器(如Adam)在训练过程中更新。
测量层:测量量子比特的期望值,得到经典输出。通常测量Pauli-Z算符的期望值,输出范围在[-1,1]之间。
量子电路的深度(层数)和宽度(量子比特数)决定了其表达能力。QCPIKAN使用相对浅层的电路(适合NISQ设备),通过与经典KAN层的配合达到整体的高表达能力。
Chebyshev-KAN与量子电路的协同机制
Chebyshev-KAN层和量子电路在QCPIKAN中不是简单串联,而是形成了精心设计的协同关系。理解这种协同关系对把握QCPIKAN的核心优势至关重要。
分工明确:Chebyshev-KAN层负责处理空间坐标的非线性映射——将物理空间中的坐标(x,y,z,t)映射到一个中间特征空间。这个映射主要捕获的是「局部」的空间结构,比如某个位置的解值大小、该位置附近的梯度变化等。量子电路则负责在特征空间中捕获「全局」的变量间相关性——不同空间位置的解之间的耦合关系、不同物理量之间的相互影响等。
这种分工来自一个深刻的认识:经典方法擅长局部逼近(每个点的函数值),但在全局相关性的编码上效率较低。量子电路通过叠加和纠缠可以高效编码指数级数量的相关模式,正好弥补了经典方法的不足。
维度映射:在具体实现中,Chebyshev-KAN层将d维输入映射到一个m维特征向量,这个特征向量作为量子电路的输入。m的选择需要平衡:太小会丢失信息,太大会增加量子电路的深度需求。QCPIKAN通过实验确定了对不同问题类型的最优m值范围。
梯度传播:在训练过程中,梯度需要从损失函数反向传播到Chebyshev-KAN的系数和量子电路的参数。经典参数的梯度通过标准自动微分计算,量子参数的梯度通过参数移位规则(parameter shift rule)计算。两者的尺度可能相差很大,QCPIKAN使用了分层学习率策略来确保两类参数的训练稳定性。
物理信息训练损失
QCPIKAN的训练损失包含多个部分:
PDE残差损失:将网络输出代入PDE方程,计算残差的均方误差。这是PINN的核心——确保网络输出满足物理方程。PDE残差通过自动微分计算网络输出对输入坐标的导数,再代入PDE的微分算子中。
边界条件损失:在网络输入为边界点时,输出应满足指定的边界条件(如Dirichlet、Neumann、Robin条件)。
初始条件损失:对于时间依赖的PDE,在初始时刻,网络输出应满足初始条件。
数据损失(可选):如果有观测数据,可以加入数据拟合损失,使网络输出与观测一致。
总损失是这些项的加权和。损失权重的选择对训练至关重要——不同损失项的梯度量级可能相差几个数量级。QCPIKAN使用自适应权重调整策略,根据各损失项的梯度统计自动平衡权重。
整体训练流程
- 数据准备:在求解域内采样配点(collocation points),包括内部点、边界点和初始点。
- 前向传播:输入空间坐标→Chebyshev KAN层→量子电路→输出解值。
- 损失计算:计算PDE残差、边界条件、初始条件等损失。
- 反向传播:通过自动微分计算经典参数的梯度,通过参数移位规则(parameter shift rule)计算量子参数的梯度。
- 参数更新:使用Adam优化器更新经典和量子参数。
- 迭代:重复步骤2-5直到收敛。
实验结果分析
测试场景
QCPIKAN在三个多孔介质渗流典型场景中进行了验证:
场景一:单相流 描述不可压缩流体在多孔介质中的达西流动。这是最简单的渗流问题,但包含空间非均质性(渗透率场的随机变化)。解需要同时满足流动方程和质量守恒约束。
场景二:组分输运 描述溶质在多孔介质中的对流-扩散-反应过程。这个场景包含强对流特征(高Péclet数),传统数值方法容易产生数值色散和振荡。对PINN来说,捕获对流前沿的陡峭梯度是一个经典难题。
场景三:两相流 描述水驱油的两相渗流过程。这是石油工程中的核心问题,涉及两个流体相之间的界面运动、毛管力效应和相对渗透率。解包含移动的饱和度前沿(驱替前缘),是一个高度非线性的自由边界问题。
性能对比
与现有量子-经典物理信息神经网络相比,QCPIKAN在以下方面展现出优势:
全局预测精度:在三个场景中,QCPIKAN的均方误差(MSE)和最大绝对误差均低于基线方法。改善幅度在两相流场景中最为显著——这正是非线性最强、高频特征最丰富的场景。
局部误差控制:特别是在解的梯度较大的区域(如对流前沿、两相界面),QCPIKAN的局部误差明显更小。这直接归功于Chebyshev-KAN的高频捕获能力。
动态演化追踪:在时间依赖问题中,QCPIKAN能更准确地追踪解的时间演化,包括前沿位置的移动速度和形状变化。
驱替前缘定位:在两相流场景中,QCPIKAN对水驱油前缘位置的预测误差比基线方法小一个数量级。这对石油工程中的产量预测和井位优化有直接的实际意义。
收敛行为分析
实验结果支持了理论分析:
- QCPIKAN的误差曲线呈现明显的指数衰减趋势,而MLP-PINN的衰减是多项式的
- 增加Chebyshev多项式的阶数可以系统性地改善高频精度
- 增加量子电路深度可以改善复杂耦合模式的捕获,但边际收益递减
- 自适应损失权重策略比固定权重训练更稳定,收敛更快
量子电路表达能力的验证
为了验证量子电路确实贡献了额外的表达能力(而非仅仅增加了参数量),作者设计了消融实验(ablation study):
去掉量子电路:只保留Chebyshev-KAN层(纯经典版本)。在简单问题(单相流)上,纯经典版本已经表现不错,但在复杂问题(两相流)上,量子版本的精度优势明显。这说明量子电路在处理高非线性、多尺度耦合问题时提供了不可替代的表达能力。
替换量子电路为经典层:用同等参数量的经典全连接层替代量子电路。结果表明,即使参数量相同,量子电路的性能也优于经典层。这排除了「性能提升仅仅来自参数量增加」的可能性,支持了量子电路提供了独特计算能力的论点。
改变量子电路深度:从1层到5层的消融实验显示,性能随电路深度增加而提升,但边际收益在3层后趋于平缓。这为实际应用中电路深度的选择提供了指导。
训练效率分析
一个实际的问题是:QCPIKAN的训练效率如何?毕竟量子电路模拟(在经典计算机上)需要额外的计算开销。
实验结果表明,在使用量子模拟器(而非真实量子硬件)的情况下,QCPIKAN的单次迭代训练时间确实比纯经典方法长约2-5倍。但QCPIKAN需要的总迭代次数更少(因为收敛更快),所以总训练时间的差距缩小到1.5-2倍左右。
如果在真实量子硬件上运行(量子电路的执行由量子处理器完成),单次迭代的时间可以大幅缩短。但目前量子设备的访问延迟和排队时间可能抵消这一优势。随着量子硬件的成熟,QCPIKAN的训练效率优势将更加明显。
与现有工作的对比
vs. 标准PINN (MLP-based)
MLP-PINN使用全连接网络+固定激活函数(如tanh、ReLU)。频谱偏差导致其对高频成分的逼近缓慢,需要大量配点和训练时间才能达到合理精度。QCPIKAN通过Chebyshev-KAN的频谱优势和量子电路的表达能力,在相同配点数量下达到更高精度,特别是在高频特征丰富的区域。
vs. 纯经典KAN-PINN
纯经典KAN(不加量子电路)已经比MLP-PINN有明显改善,因为KAN的可学习激活函数能更好地适应解的局部特征。但纯经典KAN在捕获变量间的高阶相关性方面仍有局限。量子电路通过纠缠态自然地编码这些相关性,为经典KAN提供了额外的表达维度。
vs. 其他量子-经典PINN
此前已有工作探索量子电路在PINN中的应用,但这些方法通常使用简单的量子电路结构,缺乏KAN的函数逼近理论支撑。QCPIKAN是第一个有严格逼近理论保证的量子-经典PINN框架,不仅在实验上表现更好,在理论上也有更强的说服力。
vs. 传统数值方法
在规则几何和标准条件下,成熟的有限元/有限差分方法仍然在精度和效率上占优。QCPIKAN的优势场景是:复杂几何(无网格方法的天然优势)、高维问题(避免维数灾难)、逆问题(自动微分的便利性)、以及需要频繁求解不同参数条件下的PDE时(训练一次网络,推理极快)。
潜在应用与影响
石油工程与地下水模拟
多孔介质渗流是QCPIKAN直接验证的应用场景。在实际的油藏模拟中,地质模型的不确定性需要求解成千上万次PDE(蒙特卡洛模拟)。如果QCPIKAN能将每次求解的时间从小时级降到秒级,将带来革命性的效率提升。
材料科学
材料的微观结构-性能关系通常需要求解多尺度PDE。QCPIKAN的多尺度高频捕获能力使其特别适合这类问题,如合金凝固过程中的枝晶生长模拟、复合材料的力学分析等。
气候与天气模型
气候模型涉及多个耦合的PDE(大气动力学、海洋环流、辐射传输等),计算量巨大。QCPIKAN可以作为传统方法的加速器或替代方案,特别是在需要快速预测多个气候情景时。
生物医学工程
血流动力学模拟、药物扩散建模、组织力学分析等生物医学问题都可以用PDE描述。QCPIKAN的无网格特性使其天然适合人体组织这种复杂几何。
量子计算落地
在NISQ时代,量子计算的实际应用路径尚不清晰。QCPIKAN展示了量子-经典混合方法在科学计算中的具体价值,为量子硬件的实际利用提供了新的切入点。
QCPIKAN对量子计算生态的影响
QCPIKAN的意义不仅限于PDE求解本身。它展示了NISQ时代量子计算的一个可行应用路径:不是用量子计算机完全替代经典计算机,而是将量子电路作为经典深度学习架构的一个「增强模块」,在特定的计算子任务上提供优势。
这种「量子增强」范式已经在量子化学、组合优化等领域有所探索,但在科学计算(PDE求解)领域的应用还处于早期阶段。QCPIKAN的成功验证可以激励更多研究者探索量子-经典混合方法在其他科学计算问题中的应用。
此外,QCPIKAN使用的量子电路相对简单(浅层、少量子比特),这意味着它可以在近期的NISQ设备上实现,而不需要等待未来的容错量子计算机。这对量子硬件公司来说是一个有吸引力的应用案例——展示了现有硬件的实际价值。
局限性与未来方向
当前局限
量子硬件依赖:虽然QCPIKAN设计为适合NISQ设备,但目前的量子模拟器在经典计算机上的运行速度可能不如纯经典方法。真正发挥量子优势需要实际的量子硬件。
量子比特数限制:当前NISQ设备的量子比特数有限(通常几十到几百个),限制了能处理的问题规模和变量数。
量子噪声影响:NISQ设备的门操作有一定错误率,可能影响求解精度。论文中主要在理想量子模拟器上测试,真实量子硬件上的表现还需要验证。
问题规模:目前的验证限于相对简单的二维渗流问题。在实际工程中遇到的大规模三维问题上,还需要验证可扩展性。
训练效率:量子-经典混合训练需要频繁的量子电路模拟(在经典计算机上),单次前向传播的计算成本可能高于纯经典方法。
未来方向
真实量子硬件验证:在实际的量子计算机(如IBM、Google、IonQ的设备)上测试QCPIKAN,评估量子噪声对精度的影响。
扩展到更多PDE类型:将QCPIKAN应用于Navier-Stokes方程、Schrödinger方程、弹性力学方程等其他重要的PDE类型。
自适应量子电路结构:根据PDE解的特征自动调整量子电路的深度和连接方式,实现最优的表达能力-计算成本权衡。
量子优势的严格分析:在什么条件下量子电路确实提供了经典方法无法达到的优势?这需要更严格的理论和实验分析。
混合多尺度方法:将QCPIKAN与传统多尺度方法结合,在不同尺度上使用不同的求解策略。
总结
QCPIKAN开创性地将Kolmogorov-Arnold网络、量子电路和物理信息训练三者融合,构建了第一个有严格逼近理论保证的量子-经典物理信息PDE求解框架。Chebyshev多项式KAN层提供了最优的函数逼近基础,参数化量子电路通过纠缠态捕获变量间的高阶相关性,物理约束嵌入确保了输出的物理一致性。理论上,该设计将高频误差收敛加速至指数速率;实验上,在多孔介质渗流的三个典型场景中全面超越了现有量子-经典PINN方法。这项工作为量子计算在科学计算中的落地提供了新的范例,也为复杂PDE求解开辟了融合量子优势和经典深度学习的新方向。
附录:技术细节补充
关于Kolmogorov-Arnold表示定理
KAN的理论基础来自1957年的Kolmogorov-Arnold表示定理(也称超级位置定理)。该定理指出:任何定义在[0,1]^d上的多元连续函数f(x_1,...,x_d)都可以精确表示为有限个单变量函数和加法的嵌套组合。形式上:f(x_1,...,x_d) = Σ_{q=0}^{2d} Φ_q(Σ_{p=1}^d φ_{q,p}(x_p)),其中φ_{q,p}和Φ_q都是单变量连续函数。
这个定理保证了KAN在理论上的万能逼近能力。但实际中,单变量函数φ和Φ需要参数化(如用多项式或样条),参数化方式的选择直接影响逼近效率。Chebyshev多项式是一种理论性质优异的选择,这也是QCPIKAN采用它的原因。
参数移位规则
量子电路参数的梯度计算使用参数移位规则:∂⟨O⟩/∂θ = [⟨O⟩(θ+π/2) - ⟨O⟩(θ-π/2)] / 2。这只需要两次量子电路的前向传播,与经典反向传播的复杂度相当。参数移位规则是变分量子算法的标准工具,确保了量子参数可以与经典参数一起通过梯度下降优化。
参考延伸
- 论文原文:https://arxiv.org/abs/2606.20326v1
- KAN基础论文:KAN: Kolmogorov-Arnold Networks (Liu et al., 2024)
- PINN开山之作:Physics-Informed Neural Networks (Raissi et al., 2019)
- 量子机器学习综述:Quantum Machine Learning相关综述
- Chebyshev多项式:Numerical Methods相关的教科书章节
- 多孔介质渗流:多孔介质流体力学教科书
- NISQ量子计算:Noisy Intermediate-Scale Quantum Era相关综述
评论