自回归潜扩散造大环肽：PepALD如何用基础模型重新定义多肽药物设计

引言：大环肽——药物开发中"够不着"的宝藏

在现代药物化学的版图上，大环肽（macrocyclic peptides）占据着一个独特而尴尬的位置。它们比小分子大，比抗体小，恰好卡在那个"中间尺寸"——理论上能触及传统小分子难以攻克的细胞内靶点，又比庞大的单克隆抗体更灵活。然而，这种理论上的优势长期停留在纸面上，因为设计一个真正具备细胞穿透能力、又能精准结合目标蛋白的大环肽，其难度堪比在三维空间中同时解四道相互耦合的方程。

问题的核心在于，大环肽的设计不是一个单目标优化问题，而是多重约束下的联合搜索。你需要同时控制非天然单体的化学组成、环拓扑结构（谁连着谁、以什么方式连接）、膜渗透性（能不能穿过细胞膜进入细胞内部），以及与目标蛋白的结合亲和力（能不能卡在靶点上不走）。这四个维度的任何一个单独拿出来都是一道难题，放在一起则构成了一片巨大的组合空间，传统实验筛选方法面对这片空间几乎无能为力。

计算方法曾经给出过一些希望。SMILES字符串生成模型和HELM（Hierarchical Editing Language for Macromolecules）字符串生成模型是两类主流方法。SMILES方法直接在原子级别操作，序列空间极长，一个中等大小的环肽用SMILES表示可能需要数百个字符，这对序列模型的注意力机制构成巨大压力——距离越远，模型越容易丢失全局约束信息。HELM方法将单体作为符号单元处理，序列长度大幅缩短，但问题在于，这些符号缺乏化学语义——模型把一个非天然氨基酸当成一个没有内在结构的ID来处理，就像用颜色编码来描述音乐，表面简洁，实质上丢失了大量关键信息。

2026年6月，来自Zhang、Yi、Ju和Gu的研究团队在arXiv上发表了PepALD（Autoregressive Latent Diffusion for Peptides），这是一种全新的大环肽从头生成框架，试图从根本上打破上述困局。

方法论解剖：PepALD的四层架构

PepALD的核心设计哲学可以用一句话概括：不要在符号空间里做生成，要在化学空间里做生成。这个哲学落实到技术层面，分成了四个相互咬合的模块。

第一层：HELM单体的结构化化学嵌入

传统HELM方法的问题在于，每个单体只是一个离散符号。模型看到的是"单体A、单体B、单体C"，至于A是什么氨基酸、侧链有多长、有没有杂环，模型一概不知。PepALD的做法是给每个HELM单体构建一个结构化化学嵌入（structured chemical embedding）。

具体来说，这个嵌入不是简单地从一个查找表里取出一个向量，而是编码了单体的多种化学属性：主链特征、侧链（R基团）的几何和电子性质、可旋转键数量、氢键供体和受体分布、疏水性参数等。这意味着，当模型处理序列中的第N个残基时，它不仅知道"N是什么"，还知道"N的化学性格是什么"、"N和前面的残基在化学上可能产生什么相互作用"。

这种嵌入策略的深层意义在于，它把化学先验知识注入了模型的表征空间。模型不需要从零学习"含有芳香环的单体倾向于形成π-π堆积"这类基本化学规律——这些规律已经通过嵌入的结构编码隐式地传达了。

第二层：化学知情潜空间中的上下文条件扩散

有了好的单体表征，下一步是在什么空间里做生成。PepALD没有选择直接在序列空间中生成下一个残基，而是采用了一个潜空间扩散过程。

具体流程是这样的：对于序列中每个即将生成的位置，模型首先将当前的上下文信息（已生成的残基序列）编码为一个上下文向量。然后，在一个经过化学结构信息训练的潜空间中，通过扩散模型（diffusion model）生成该位置的残基表征。这里的"化学知情"（chemically informed）是关键——潜空间不是随便学到的，而是专门设计来保留化学结构的局部连续性和可解释性。

为什么用扩散模型而不是直接回归？因为残基的选择本质上是一个多模态分布——给定相同的上下文，可能有多种化学上合理的候选单体。扩散模型天生擅长建模这种多峰分布，而直接回归会把所有可能性"平均"成一个不存在的中间态。

上下文条件的实现方式也值得注意。模型不是简单地把前面的残基嵌入拼接起来，而是通过一个注意力机制计算上下文表征，让每个位置的残基都能"看到"序列中其他位置的信息。对于环肽来说，这一点尤为重要，因为环闭合意味着序列的首尾相连，远处的残基之间的相互作用可能比相邻残基更强烈。

第三层：R基团感知的环闭合预测

大环肽之所以"大"、之所以"环"，是因为序列首尾之间（或非相邻残基之间）通过化学键连接形成环状结构。这个环闭合点的选择和闭合化学的确定是大环肽设计的核心难点之一。

传统方法往往把环闭合作为一个后处理步骤——先生成线性序列，再决定怎么闭合成环。PepALD的做法不同，它在自回归生成过程中就同时预测环闭合信息。

具体而言，当模型在自回归地逐个生成残基时，它同时维护一个环闭合预测模块。这个模块利用当前已有的序列信息和R基团特征，动态评估：哪个位置之间的闭合在化学上最可行？闭合应该使用什么化学反应（例如，二硫键、酰胺键、乳酸键还是click化学）？闭合点两侧的R基团是否具备反应所需的官能团？

这种"边生成边闭合"的策略带来了两个优势。第一，它避免了后处理中的不兼容问题——线性序列生成完了才发现两端没有合适的官能团来闭合，这种尴尬在PepALD中不会出现，因为模型在生成早期就已经开始考虑闭合需求。第二，它允许闭合决策对序列生成产生反馈影响——如果模型在某个时刻"决定"了环闭合方案，后续的残基生成可以据此调整，比如补充闭合所需的互补官能团。

R基团感知是这个模块的另一大特色。非天然氨基酸的R基团千变万化，从简单的甲基到复杂的杂芳环，它们不仅影响单体的化学性质，也直接影响环闭合的可行性和几何约束。PepALD将R基团的详细结构信息纳入环闭合预测，使得闭合方案的选择不再是粗粒度的"能连就行"，而是精细到"在R基团的哪个原子上、以什么角度、形成什么键"。

第四层：胜者保护的扩散偏好优化

模型生成了一堆候选大环肽，怎么从中选出最好的？传统的做法是用打分函数（scoring function）对候选者排序。PepALD更进一步，它通过一种叫做"胜者保护扩散偏好优化"（winner-protected diffusion-adapted preference optimization）的方法，把亲和力奖励信号直接对齐到去噪过程中。

这个方法的名字很长，但核心思想其实不难理解。在扩散模型中，生成过程是从噪声逐步去噪的过程。偏好优化（preference optimization）的本质是：让模型学会从相同的噪声起始点出发，优先走向"好"的生成结果而非"差"的。具体到PepALD，"好"和"差"由分子对接（docking）等计算评估方法给出的亲和力奖励来定义。

"胜者保护"（winner-protected）是一个重要的技术细节。在标准的偏好优化中，模型可能会为了增加"好结果"的概率而过度压缩分布，导致生成多样性丧失。胜者保护机制确保优化过程不会破坏已经表现良好的生成模式，即在提升低质量样本的同时，对高质量样本的生成概率给予额外的保护。这类似于进化中的"精英保留"策略——改良种群的同时不要把最好的个体改丢了。

扩散适配（diffusion-adapted）则意味着偏好优化不是在最终输出空间上做的，而是在扩散过程的中间步骤上做的。这是因为扩散模型的生成过程是多步的，每一步都在逐步精化表征。如果只在最终输出上做优化，模型可能学到的是"在最后一步做修正"的捷径，而不是"在整个生成过程中保持正确方向"的全局最优策略。通过在多个去噪步骤上施加偏好信号，PepALD确保了优化的深度和稳定性。

实验验证：PepALD交出了什么答卷

理论说得再漂亮，终究要靠实验说话。PepALD的实验评估从多个维度展开，覆盖了生成质量和奖励优化两大核心指标。

在生成质量方面，PepALD需要证明它生成的大环肽在化学上是合理的、多样的、并且与已知药物分子分布匹配。研究团队将PepALD与多个代表性基线方法进行了对比，包括基于SMILES的生成模型、基于HELM的符号生成模型、以及其他潜空间方法。PepALD在化学有效性（生成的分子在化学上是否可行）、唯一性（生成了多少不同的分子）和新颖性（生成的分子中有多少是训练集中未见过的）等标准指标上展现了显著优势。

在奖励优化方面，PepALD的表现尤为突出。通过将分子对接给出的亲和力奖励信号整合到去噪过程中，PepALD生成的候选肽在预测亲和力分布上明显优于基线方法。更重要的是，胜者保护机制确保了这种优化不会以牺牲多样性为代价——PepALD生成的高亲和力候选者不是千篇一律的变体，而是覆盖了化学空间的不同区域。

技术意义：超越PepALD本身

PepALD的意义不仅限于大环肽生成本身，它在方法论层面提出了几个值得关注的范式转变。

第一，它证明了"化学知情的潜空间"在分子生成中的价值。过去，很多分子生成模型在潜空间的构造上比较随意——用标准的自编码器学到什么就是什么。PepALD的做法是明确地将化学结构约束编码进潜空间，使潜空间的几何结构与化学性质对应。这个思路可以推广到蛋白质、核酸、甚至材料科学中的其他分子类型。

第二，它展示了自回归生成和扩散模型的协同潜力。自回归模型擅长处理序列依赖关系，扩散模型擅长建模复杂分布。PepALD用自回归框架处理残基的顺序生成，用扩散模型处理每个位置上的化学多样性，两者的结合比任何一方单独使用都更强大。

第三，"边生成边闭合"的策略为需要满足全局约束的生成任务提供了新思路。环闭合本质上是一个全局约束——它要求序列的首尾（或特定位置）具有互补的化学性质。传统方法先生成后检查的模式在面对复杂全局约束时效率低下，PepALD的内嵌约束预测方式更为优雅和高效。

局限性与未来方向

任何方法都有边界，PepALD也不例外。

首先，PepALD的评估主要依赖计算方法（如分子对接），而非实验验证。分子对接给出的亲和力预测虽然有参考价值，但与真实的生物活性之间存在不小的鸿沟。PepALD生成的候选肽在实际生物实验中的表现，需要后续的工作来验证。

其次，PepALD处理的约束维度虽然比现有方法多，但距离真正全面的大环肽设计仍有差距。比如，药代动力学性质（ADMET）、合成可及性、体内稳定性等重要因素，目前尚未被纳入生成过程的约束条件。将这些因素整合进来，可能需要更大规模的多目标优化框架。

第三，模型的计算成本不可忽视。潜空间扩散、自回归生成、环闭合预测、偏好优化——这四层架构的每一层都需要计算资源，叠加起来的训练和推理开销可能限制PepALD在大规模筛选场景中的应用。如何在保持生成质量的同时降低计算成本，是一个值得探索的方向。

最后，非天然单体库的覆盖范围直接影响PepALD的化学空间探索能力。目前的单体库虽然丰富，但与理论上的非天然氨基酸空间相比仍然有限。如何将PepALD与单体设计方法结合，实现单体和序列的联合优化，是另一个有前景的研究方向。

行业影响：从论文到产业的距离

大环肽药物开发是一个高风险、高回报的领域。目前全球范围内，仅有少数大环肽药物获批上市（如环孢素A、达托霉素等），但进入临床试验阶段的大环肽候选物数量正在快速增长。PepALD这类计算工具的价值在于，它可以大幅缩短候选物发现阶段的时间和成本——把原本需要数年的大规模筛选压缩到数周甚至数天的计算生成加虚拟筛选。

当然，从计算生成到临床候选物之间还有很长的路要走。PepALD生成的候选肽需要经过湿实验验证、体外活性测试、细胞毒性评估、动物模型验证等一系列步骤。但至少在起点这一步，PepALD提供了一个比随机筛选或经验导向设计更高效的出发点。

对于国内的AI制药企业来说，PepALD的方法论也值得借鉴。当前国内AI制药赛道竞争激烈，但大多数企业集中在小分子和抗体领域，大环肽方向的计算方法相对稀缺。PepALD的技术路线——化学知情嵌入、潜空间扩散、约束内嵌生成、偏好优化对齐——构成了一个完整的技术栈，其中的每个模块都可以单独移植或改进。

结语

PepALD在大环肽生成这个充满挑战的交叉领域，交出了一份技术含量扎实的工作。它不是简单的"把大语言模型的套路搬过来"，而是在分子表征、生成架构、约束处理和优化策略四个层面都做了针对性的设计。化学知情的嵌入让模型真正"理解"单体，潜空间扩散保留了生成多样性，R基团感知的环闭合预测解决了全局约束问题，胜者保护偏好优化平衡了质量提升和多样性保持。这些设计选择共同构成了一套有说服力的技术方案，为大环肽的计算驱动药物设计开辟了新的路径。