热力学硬件上的密码子优化：用分子热涨落做计算，能耗降低百万倍

制药行业面临一个尖锐的矛盾：新药研发对计算资源的需求持续膨胀，而全球能源供应的压力也在同步加大。mRNA疫苗和蛋白质药物的设计流程中，密码子优化（codon optimization）是一道标准工序——它决定了mRNA序列中每个氨基酸对应的三联体密码子具体选哪一个，直接影响翻译效率、mRNA稳定性和蛋白质折叠质量。这道工序本质上是一个组合优化问题，搜索空间随着蛋白质长度指数增长，传统计算方式的能耗问题越来越突出。

2026年6月15日，Andraz Jelincic和Ross C. Walker在arXiv上发表了一篇论文（编号2606.17327），题为《Energy-efficient codon optimization on thermodynamic hardware》。这篇工作的核心主张非常明确：将密码子优化问题转化为伊辛模型（Ising model），使其可以在热力学采样单元（Thermodynamic Sampling Unit, TSU）上执行，从而实现比GPU低约10^6倍的能耗。据作者所知，这是第一个将制药应用场景映射到热力学硬件、并基于原型硬件实测数据给出能耗估算的具体案例。

密码子优化到底在优化什么

遗传密码具有简并性（degeneracy）。编码20种氨基酸的密码子总共有61个（外加3个终止密码子），这意味着大多数氨基酸对应2个、4个甚至6个不同的密码子。一个300个氨基酸的蛋白质，其编码序列的可能组合数可以轻松达到10的100次方量级。密码子优化的目标，就是在这些组合中找到一个"好"的序列。

"好"的标准通常是多维的。密码子适应指数（Codon Adaptation Index, CAI）衡量的是密码子选择与宿主生物高表达基因偏好的一致程度。GC含量需要落在特定范围内以保证mRNA的化学稳定性。mRNA二级结构的最小自由能（Minimum Free Energy, MFE）影响核糖体的结合和翻译起始效率。连续重复密码子会导致核糖体暂停甚至移码。这些因素相互纠缠，改动一个密码子可能同时影响多个指标。

传统的密码子优化软件采用启发式方法：贪心算法逐个替换密码子，遗传算法（Genetic Algorithm, GA）通过选择、交叉、变异在解空间中搜索，模拟退火算法用温度参数控制搜索的随机性。这些方法各有长短，但共同点是都需要大量浮点运算，跑在CPU或GPU上，耗电量是实打实的。

热力学计算：不压制涨落，而是利用涨落

经典计算机的设计哲学是压制噪声。晶体管在确定的高电平和低电平之间切换，所有中间状态都被视为错误。热力学计算（thermodynamic computing）反其道而行之：它把物理系统中无处不在的热涨落（thermal fluctuations）视为计算资源，而不是需要消除的干扰。

这个思路的物理基础是玻尔兹曼分布。一个处于热平衡的系统，其微观状态的概率正比于exp(-E/kT)，其中E是能量，k是玻尔兹曼常数，T是温度。如果把一个组合优化问题的目标函数编码为物理系统的能量函数（哈密顿量），那么让系统自然弛豫到热平衡态，采样得到的低能态就对应优化问题的近优解。

伊辛模型是这种映射的标准载体。伊辛模型原本是统计力学中描述铁磁相变的经典模型：每个格点有一个自旋变量（取值+1或-1），相邻自旋之间存在耦合。系统的哈密顿量为H = -Σ J_ij s_i s_j - Σ h_i s_i，其中J_ij是耦合常数，h_i是外场。通过精心设计J_ij和h_i，可以将各种组合优化问题编码进去——包括MAX-CUT、旅行商问题、以及本文讨论的密码子优化。

热力学采样单元（TSU）是一种专门为伊辛采样设计的硬件。它不是通过数字电路模拟自旋动力学，而是用真实的物理涨落来驱动采样过程。目前已有的TSU原型芯片在能耗上展现出巨大潜力：对于特定类型的组合优化问题，TSU的能效比传统数字处理器高出几个数量级。

从密码子优化到伊辛模型的转化

论文的关键技术贡献之一，是把密码子优化问题精确地映射到伊辛模型上。这个映射需要解决几个具体的编码问题。

首先是变量表示。蛋白质中每个位置的密码子选择是一个离散变量，可能取值从2到6个不等。伊辛模型的自旋变量只有两个取值。作者采用了多自旋编码（multi-spin encoding）：对于一个有k个候选密码子的位置，用k个二值变量来表示，加上一个约束确保恰好只有一个变量为"开"。这个约束可以通过惩罚项嵌入哈密顿量中。

其次是目标函数的编码。CAI值的优化可以转化为最大化Σ w_i(s_i)，其中w_i是第i个位置选择特定密码子时的CAI贡献。GC含量约束可以用自旋变量的线性组合来表达。mRNA二级结构约束涉及碱基配对的远程相互作用，需要引入自旋-自旋耦合项。重复密码子惩罚也需要耦合项。

所有这些约束和目标被组合成一个统一的哈密顿量。权重参数的调优是一个工程问题：如果某个约束的惩罚权重太低，优化结果可能违反该约束；如果太高，又会压缩其他目标的优化空间。作者在论文中给出了他们的参数选择策略。

论文还测试了另一种编码方式——Potts模型采样。Potts模型是伊辛模型的推广，每个格点的自旋可以取q个离散值（q大于2），这天然适合表示密码子选择变量，不需要多自旋编码。Potts采样在某些实现中可能更高效，但硬件支持程度不如伊辛采样成熟。

基准测试：SARS-CoV-2刺突蛋白

作者选择SARS-CoV-2刺突蛋白（spike protein）作为基准测试对象。刺突蛋白是新冠病毒表面的关键结构蛋白，也是mRNA疫苗的主要靶标。它的编码序列约3822个核苷酸，编码1274个氨基酸，密码子组合空间极其庞大。

三种方法被纳入比较：

Potts采样：直接在Potts模型上进行热力学采样，每个位置的自旋取值对应候选密码子。

伊辛采样：使用多自旋编码将问题映射到标准伊辛模型，在TSU上执行。

遗传算法基线：标准遗传算法实现，在GPU上运行，作为对照组。

优化质量方面，三种方法的结果非常接近：Potts采样得分约240，伊辛采样约238，遗传算法约234。这些得分基于作者定义的多目标评价函数，综合考虑了CAI、GC含量、mRNA二级结构和重复密码子等因素。得分差异在统计上并不显著，说明三种方法在解的质量上处于同一水平。

真正的差异出现在能耗上。基于TSU原型硬件的功耗实测数据和外推模型，作者估算TSU解决刺突蛋白密码子优化问题的总能耗约为GPU方案的10的负6次方量级——一百万倍的差距。这个数字的背后，是TSU利用物理涨落完成采样的根本优势：它不需要为每个采样步骤执行数十亿次浮点运算，而是让物理系统自己"找到"低能态。

能耗差距的物理解释

为什么TSU能比GPU省这么多能量？这需要从两个层面理解。

第一层是算法层面。遗传算法运行在GPU上时，每一代种群的评估需要对所有个体计算目标函数值。目标函数涉及CAI查表、GC含量统计、mRNA折叠的动态规划（Zuker算法），每一步都是精确的浮点运算。而TSU的采样过程不需要显式计算目标函数值——系统通过热涨落自然地偏好低能态，采样结果的概率分布直接反映玻尔兹曼分布。

第二层是物理层面。GPU的每个浮点运算都涉及晶体管的开关切换，每次切换耗散的能量在10的负15次方到10的负12次方焦耳量级。而TSU的热力学采样单元利用的是环境热能（kT量级，约4乘以10的负21次方焦耳），采样过程本身的能耗极低。当然，TSU也需要控制电路、读出电路等辅助部分，这些会增加额外能耗，但总体仍然远低于GPU的运算能耗。

需要指出的是，10的6次方倍的能耗差距是在特定假设条件下得出的估算值。实际部署中的差距可能因问题规模、硬件成熟度、辅助电路开销等因素而有所不同。但即使折扣一个数量级，十万倍的能效提升仍然具有实际意义。

开源与可复现性

作者将所有代码以开源协议发布。这对于学术社区来说是一个重要的贡献——其他研究者可以复现论文中的基准测试结果，也可以在此基础上扩展到其他蛋白质序列或其他组合优化问题。代码的开源也有助于社区开发更高效的伊辛映射方案和参数调优策略。

更大的图景：热力学计算在制药中的应用前景

密码子优化只是制药计算流程中的一小环。蛋白质结构预测、分子对接（molecular docking）、虚拟筛选（virtual screening）、先导化合物优化（lead optimization）——这些环节同样涉及大规模的组合优化或采样问题。如果TSU技术持续成熟，这些领域都有可能受益。

蛋白质设计领域近年来深度学习方法进展迅速，AlphaFold、RFdiffusion等工具已经改变了蛋白质工程的格局。但这些工具在生成候选序列后，仍然需要优化密码子选择以确保高效表达。更广泛地说，蛋白质设计中的序列空间搜索、能量函数评估、构象采样等问题，其数学结构与伊辛模型有天然的对应关系。

药物发现中的虚拟筛选通常需要评估数百万化合物与靶标蛋白的结合亲和力。这个过程可以用分子动力学模拟来完成，但计算成本极高。如果能把结合能评估的关键步骤映射到伊辛模型上，TSU或许能提供一种低成本的替代方案。当然，这需要更复杂的映射技术和更成熟的硬件支持。

技术挑战与局限

任何新兴硬件技术都面临从原型到实用的鸿沟。TSU目前的主要限制包括：

规模限制：当前TSU原型芯片的自旋数量有限，能处理的伊辛模型规模受限。密码子优化问题的伊辛表示可能需要数千到数万个自旋变量（取决于蛋白质长度和编码方式），超出现有原型的容量。这需要更大的芯片或更高效的编码方案来解决。

精度与可控性：热力学采样的结果服从玻尔兹曼分布，但实际硬件中分布的精确度取决于物理实现的质量。非理想效应（如非平衡动力学、自旋间的寄生耦合）可能导致采样偏差。

编程模型：TSU不是通用处理器，不能直接运行Python或C代码。用户需要把问题转化为伊辛模型，再映射到TSU的物理架构上。这个编程模型与传统计算差异很大，需要新的编译工具链和抽象层。

集成与部署：制药公司的计算基础设施围绕CPU/GPU集群和云服务构建。引入TSU需要硬件采购、软件适配、人员培训等一系列投入。TSU的性价比优势需要足够明显，才能推动行业采纳。

与其他硬件加速器的竞争：量子退火机（如D-Wave）同样擅长伊辛采样。FPGA上的伊辛采样器也在持续发展。TSU需要在能效、规模、成本和可编程性上与这些替代方案竞争。

为什么这件事值得重视

全球计算能耗正在以令人不安的速度增长。数据中心的电力消耗已占全球总发电量的相当比例，而AI训练和推理的需求仍在飙升。制药行业是计算密集型产业的代表之一——一款新药从发现到上市平均需要10到15年和数十亿美元，其中计算成本占据了越来越大的份额。

热力学计算提供了一个不同的思路：不是用更多晶体管和更高频率来暴力求解，而是顺应物理规律来完成计算。密码子优化是一个相对"干净"的组合优化问题——目标函数明确、约束清晰、解空间有良好的结构——非常适合作为热力学计算的早期应用案例。

Jelincic和Walker的这篇论文，其价值不在于它解决了一个具体的技术问题，而在于它建立了一条从制药需求到新型硬件的完整路径：问题定义、数学建模、硬件映射、基准验证、能耗估算。这条路径可以被复制到其他问题上，为热力学计算在生物制药领域的应用提供了方法论基础。

密码子优化听起来是一个小众的技术问题，但它是mRNA药物开发的基础设施之一。COVID-19大流行期间，mRNA疫苗的快速设计和量产证明了这项技术平台的巨大价值。如果密码子环节能耗降低百万倍，整个mRNA药物的开发和生产成本都有望进一步下降——这对全球公共卫生的意义不言而喻。

结语

热力学计算还处于早期阶段，距离大规模商用还有相当的距离。但这篇论文展示的方向值得密切关注：把物理系统的自然行为转化为计算资源，用最少的能量完成最有价值的计算任务。密码子优化是这条路径上的一个里程碑，后续必然会有更多制药场景被映射到热力学硬件上。对于关注可持续计算和绿色制药交叉地带的研究者和工程师来说，这是一个清晰的技术信号。