一维量子多体问题的求解,长期依赖张量网络方法提供的系统性近似框架。在无穷矩阵乘积态(iMPS)的变分计算中,处理幂律衰减相互作用(比如库仑型 \(1/r^\alpha\))时,研究者们习惯上会先做一步"翻译"——把目标哈密顿量替换成一组指数衰减项的有限极点和。这个操作虽然让标准的MPO(矩阵乘积算符)算法得以直接使用,却悄悄在计算中埋下了一个系统误差来源:哈密顿量表征残差。
Qi Yang 的最新工作提出了一条完全不同的技术路线。核心思想是:不构造任何近似哈密顿量,直接通过转移矩阵函数来处理代数衰减尾部。论文在 arXiv 上以编号 2606.20522v1 发表,同时归类于强关联电子体系(cond-mat.str-el)和量子物理(quant-ph)两个领域。
有限极点近似的传统做法及其局限
为了理解这项工作的意义,有必要先回顾传统方案的运作逻辑。标准MPO算法天然适用于有限关联长度的系统——也就是说,哈密顿量中的相互作用项必须能写成有限个指数衰减函数之和。对于幂律衰减的长程相互作用,精确的MPO表示需要无穷大的键维,这在数值上不可行。
为绕开这个困难,计算物理社区发展出一套成熟的近似方案:用Makover和McGady等人推广的有限极点分解方法,将幂律函数 \(1/r^\alpha\) 在复平面上展开为有限个指数项的叠加。形式上写作:
\[ \frac{1}{r^\alpha} \approx \sum_{k=1}^{N_p} c_k \, e^{-\lambda_k r} \]
其中 \(c_k\) 和 \(\lambda_k\) 是通过拟合确定的系数和衰减率,\(N_p\) 是极点数目。极点越多,拟合精度越高,但每个极点都会增加MPO的键维,进而推高计算成本。更关键的问题在于,即使 \(N_p\) 取得足够大,这个近似总会引入一个系统偏差——论文中称之为"哈密顿量表征残差"。这个偏差不是统计噪声,不能通过增加采样或优化迭代来消除,它来自模型本身的近似构造。
在大多数远离临界点的参数区域,这个残差可能很小,不会影响物理结论。但当系统处于量子相变临界点附近、关联长度发散、各种物理量呈现幂律标度行为时,即便是微小的哈密顿量偏差也可能把临界点的诊断信号移位,导致研究者误判相变的位置或普适类。
转移矩阵函数方法的核心构建
Qi Yang 提出的方案完全绕开了有限极点分解这一步。方法的关键洞察在于:对于一个固定的有限键维 \(D\) 的MPS态,幂律衰减项的期望值可以通过转移矩阵的解析结构精确求和。
具体来说,考虑一个幂律项 \(e^{iQr}/r^\alpha\) 在MPS态下的期望值贡献。传统的做法是把它拆成指数项再逐项求和。新方法则直接利用转移矩阵 \(T_A\) 的谱分解性质。对于一个给定的MPS,定义修正转移矩阵:
\[ \widetilde{T}_A = \text{某种规范化的转移矩阵} \]
然后,幂律项的求和等价于对转移矩阵施加一个特定的矩阵函数:
\[ F_{\alpha,Q}(\widetilde{T}_A) = \frac{\text{Li}_\alpha(e^{iQ} \cdot z)}{z} \]
这里的 \(\text{Li}_\alpha(z)\) 是多对数函数(polylogarithm),也称为 Jonquière 函数。多对数函数在数学物理中有深厚的根基:\(\alpha=1\) 时退化为普通对数,\(\alpha=2\) 时是 dilogarithm(Spence函数),\(\alpha=3\) 是 trilogarithm,在费米子理论、弦理论和凝聚态物理中反复出现。
这个公式的物理含义很直观:转移矩阵编码了MPS态中相邻格点之间的关联结构,而多对数函数恰好负责把转移矩阵的本征值"按幂律加权求和"。当 \(\widetilde{T}_A\) 的主导本征值趋近于1时(对应临界态),多对数函数的解析性质确保了求和的正确收敛。
矩阵函数的数值计算:Krylov子空间方法
矩阵函数 \(f(A)\) 的计算在数值线性代数中是一个经典课题。当矩阵维度 \(D\) 较小时(比如 \(D < 100\)),直接做特征值分解然后对每个本征值应用标量函数是最简单的做法。但在iMPS计算中,键维 \(D\) 可能达到数百甚至上千,直接特征值分解的成本为 \(O(D^3)\),而矩阵与向量乘法仅为 \(O(D^2)\)。
论文采用 Krylov 子空间方法来计算矩阵函数作用在向量上的结果。基本思路是:给定矩阵 \(A\) 和向量 \(v\),要计算 \(f(A)v\),先构建 Krylov 子空间:
\[ \mathcal{K}_m(A, v) = \text{span}\{v, Av, A^2v, \ldots, A^{m-1}v\} \]
然后在这个低维子空间中投影,把矩阵函数的计算降维到一个 \(m \times m\) 的小矩阵上。由于 \(m\) 通常远小于 \(D\),计算成本大幅降低。对于多对数函数这种具有分支切割的解析函数,Krylov 方法的收敛性尤其值得仔细分析——论文在这方面给出了具体的数值验证。
梯度计算:Fréchet伴随与隐式不动点微分
变分优化的核心不只是能量的计算,还需要能量关于变分参数的梯度。在涉及矩阵函数的场景中,梯度计算的技术难度显著提升。
论文的梯度方案由两个关键组件构成:
Fréchet 导数的伴随方法。矩阵函数的 Fréchet 导数描述了矩阵扰动如何传播到函数值的扰动。形式上,对于 \(f(A)\),Fréchet 导数是一个线性映射 \(L_f: E \mapsto Df(A)[E]\),满足:
\[ f(A + E) = f(A) + L_f(E) + O(\|E\|^2) \]
在反向模式自动微分中,需要计算 Fréchet 导数的伴随算子。论文将此与 Krylov 方法结合,避免了显式构造完整的 Fréchet 导数矩阵。
隐式不动点微分。iMPS的规范形式通过一个不动点方程确定。传统的显式微分方法需要对不动点方程做迭代微分,这在矩阵函数介入后变得更加复杂。隐式函数定理提供了一条更干净的路径:利用不动点方程的Jacobian直接求解梯度,而不必追踪整个迭代过程的微分。论文证明,将 Fréchet 伴随方法与隐式不动点微分结合后,梯度计算是数值稳定的。
基准测试一:长程自由费米子
论文首先在一个可精确求解的模型上验证方法的正确性——具有幂律跳跃的长程自由费米子链。自由费米子模型的哈密顿量可以对角化为独立模态,因此可以得到任意精度的参考解。
在这个基准测试中,转移矩阵函数方法的计算结果与精确对角化的参考值完全吻合。更重要的是,与有限极点近似方案的对比表明:当极点数目不足时,传统方法在远离基态能量的高能激发态上出现可察觉的偏差,而转移矩阵函数方法不存在这类问题,因为它根本没有引入任何哈密顿量近似。
基准测试二:逆平方海森堡模型族与 Haldane-Shastry 点
第二个基准测试涉及一个更具物理意义的模型族——逆平方海森堡自旋链。哈密顿量为:
\[
H = \sum_{i 这个模型在特定参数点具有非凡的精确可解性。其中最著名的是 Haldane-Shastry(HS)模型,它是一个具有逆平方相互作用的各向同性海森堡链,其基态和低能谱可以通过 Yangian 对称性的代数方法精确求得。HS 模型的基态是著名的 Jastrow 型波函数,其关联函数以幂律形式衰减,且衰减指数已精确知道。 在这组基准测试中,论文系统比较了转移矩阵函数方法、有限极点近似方法与精确解三者之间的差异。结果确认:转移矩阵函数方法在各参数点上都给出了与精确解一致的结果,而有限极点方法的精度取决于极点数目和拟合策略。 Haldane-Shastry 点的测试尤其有说服力,因为该点的物理性质(基态能量、自旋关联函数的幂律指数、低能激发谱的分数化特征)都有精确解析结果,可以逐项核对。论文报告的数值结果与解析预期之间的偏差始终控制在机器精度级别的有限键维效应范围内。 如果说前面两个基准测试验证了方法的正确性,那么长程横场 Ising 模型的计算则展示了方法的实际价值。该模型的哈密顿量为: \[
H = -\sum_{i 这个模型的相图取决于衰减指数 \(\alpha\) 和横场强度 \(h\)。当 \(\alpha\) 较小时,长程相互作用占主导,系统表现出平均场型的相变行为;当 \(\alpha\) 较大时,短程效应恢复,相变落入二维 Ising 普适类。在中间的某个 \(\alpha\) 范围内,存在一个交叉区域,相变的临界指数连续依赖于 \(\alpha\)——这被称为长程临界行为。 论文选取了一个已知精确临界场强的参数点,分别使用有限极点近似哈密顿量和转移矩阵函数方法来计算纠缠熵和关联长度等临界诊断量。 结果令人警醒。使用有限极点近似哈密顿量时,纠缠熵的有限尺寸标度分析给出的"临界场强"与已知精确值之间存在系统性偏移。偏移的方向和大小取决于极点数目和拟合方案。这意味着:研究者在不知精确临界点的情况下使用有限极点方法,可能得到一个错误的临界点估计,而且无论怎样增加极点数目都无法可靠地消除这个偏差——因为拟合残差的行为并不单调收敛。 相比之下,转移矩阵函数方法在同一参数点上直接重现了预期的临界标度行为。纠缠熵的对数修正系数、关联长度的幂律发散指数等关键诊断量都与已知的临界理论预期一致。 这个对比清楚地说明了为什么要避免有限极点近似:在临界点附近,系统对哈密顿量的任何微小扰动都高度敏感,而有限极点表征残差恰好是一种系统性的微扰,它的效应在远离临界点时无害,在临界点附近却足以误导物理判断。 论文对几个影响数值稳定性和效率的实现细节给出了详尽讨论。 规范形式的选择。iMPS的规范形式(左规范、右规范或混合规范)直接影响转移矩阵的谱性质。论文采用了混合规范形式,使得转移矩阵的主导本征值恰好为1,其余本征值的模严格小于1。这个选择确保了多对数函数求和的收敛性。 Krylov 子空间的维度控制。Krylov 子空间的维度 \(m\) 控制了矩阵函数近似的精度。太小的 \(m\) 导致近似不足,太大的 \(m\) 增加计算成本且可能引入数值不稳定性。论文通过比较不同 \(m\) 值下的能量收敛行为来确定合适的截断,报告的典型值在 20-40 之间。 多对数函数的特殊计算。标准数学库对多对数函数的支持参差不齐。论文讨论了几种计算 \(\text{Li}_\alpha(z)\) 的数值方案,包括级数展开、积分表示和函数方程递推,并根据参数范围选择最稳定的方案。 内存和计算成本分析。与有限极点MPO方法相比,转移矩阵函数方法的每次迭代成本更高(因为 Krylov 方法需要多次矩阵-向量乘法),但消除了 \(N_p\) 个极点带来的MPO键维膨胀。论文给出的粗略估计表明,当极点数目 \(N_p > 5\) 时,新方法在总计算时间上已经具有竞争力,而且不存在系统残差。 在量子化学领域,处理长程库仑相互作用时也有类似的"分解"策略——Resolution of Identity、Cholesky 分解和密度拟合等方法都是将双电子积分分解为有限秩的形式。这些方法的误差分析框架与本文讨论的有限极点残差有相似之处。 在张量网络方法的内部,也有其他处理长程相互作用的策略。例如,将系统映射到高维格点后利用 MPO 的几何结构来编码长程项,或者使用多层的 MERA(多尺度纠缠重整化ansatz)来天然地处理不同尺度的关联。转移矩阵函数方法的独特之处在于,它严格保持在一维MPS的框架内,不引入额外的几何假设,因此适用范围更加明确。 从数学角度看,转移矩阵函数方法与量子场论中的有效作用量技术有概念上的类比。在有效作用量方法中,高能自由度被积掉后留下一个非局域的有效相互作用,其形式通常是动量空间中的解析函数。转移矩阵函数中的多对数函数正是这种非局域相互作用在实空间格点模型上的体现。 论文明确指出,当前实现针对的是具有平移不变性的一维系统。向准一维系统(梯子模型、柱状几何)的扩展是直接的,因为转移矩阵的结构在这些几何中仍然成立。向二维系统的推广则更具挑战性,因为二维张量网络(如PEPS)的收缩本身就是近似的,引入矩阵函数会进一步增加技术复杂度。 对于时间演化问题,转移矩阵函数方法同样有潜在应用。长程相互作用系统的实时演化是张量网络方法的一个前沿课题,而有限极点近似在时间演化中引入的误差可能随时间累积。直接使用转移矩阵函数可能改善长时间演化的保真度,尽管这需要将当前的静态变分框架推广到实时演化算法中。 另一个有前景的方向是将方法推广到有限温度的热力学计算。在纯态虚时间演化或有限温度 purification 方法中,长程相互作用的处理同样面临有限极点近似的问题。转移矩阵函数框架原则上可以无缝嵌入这些有限温度方案。 Qi Yang 的这项工作解决了一个长期被忽视但实际影响深远的技术问题。在iMPS计算中处理幂律衰减相互作用时,研究者们一直在使用有限极点近似作为标准操作,很少质疑这个近似步骤引入的系统误差是否会影响物理结论。论文通过严格的公式推导和全面的数值基准测试,证明了这种担忧是有根据的——特别是在临界点附近,有限极点残差可以实质性地扭曲物理诊断。 转移矩阵函数方法的提出不仅提供了一个更精确的替代方案,更重要的是开辟了一个新的计算范式:不近似哈密顿量,而是利用MPS态本身的解析结构来精确处理长程项。这种思路可能对其他涉及非局域相互作用的张量网络计算产生启发。 论文的技术实现——Krylov子空间矩阵函数计算、Fréchet伴随梯度、隐式不动点微分——构成了一套自洽且数值稳定的计算框架,可以直接集成到现有的iMPS变分代码中。对于研究长程相互作用量子系统的计算物理工作者来说,这是一个值得认真考虑的工具升级。关键应用:长程 Ising 链的临界行为诊断
技术实现的若干细节
与现有方法的联系与区别
方法的适用范围与潜在扩展
总结性评述
评论