当大语言模型成为肽段工程师：Pepti-Agent 如何用 MCP 协议重塑多目标肽段设计流程

引言：肽段——介于小分子与生物制剂之间的"黄金地带"

在药物开发的谱系中，治疗性肽段（therapeutic peptides）占据着一个极其特殊的位置。它们比常见的小分子药物大，却比抗体等完整蛋白质小得多；它们拥有蛋白质级别的靶向特异性，又保留了化学合成的可操作性。这种"两头沾光"的特性让肽段在过去二十年间成为新药研发的热门候选——从糖尿病治疗中的 GLP-1 受体激动剂，到抗癌领域的肿瘤穿透肽，肽段药物正在以每年数十亿美元的市场规模扩张。

然而，肽段设计的核心困难从来不在于"能不能做出来"，而在于"能不能同时满足所有要求"。一条由十几到几十个氨基酸组成的序列，需要同时在溶解度（solubility）、溶血活性（hemolytic activity）和非特异性表面吸附（nonspecific surface fouling）这三个维度上达标。这三项指标看似独立，实则由高度重叠的序列特征所控制——疏水性残基在提高膜穿透能力的同时往往会增加溶血风险；带电残基改善溶解度却可能引入非特异性吸附。牵一发而动全身，优化其中一项往往会导致另外两项恶化。

传统的做法是依赖经验丰富的药物化学家手动迭代，结合湿实验验证逐步逼近最优解。但这种"试错循环"耗时极长、成本极高，且高度依赖个人经验。计算方法的引入——用生成模型提出候选序列，用性质预测模型打分筛选——理论上可以大幅加速这一过程。问题在于，现有计算管线通常以"硬编码脚本"的形式存在：生成器、预测器、变异算子被拧成一团，难以检查、难以扩展、更难以复用。更致命的是，许多系统在"精修"（refinement）阶段依赖大语言模型的自然语言推理来决定如何修改序列，而不是基于每个候选序列当前的实际性质状态来做出决策。

2025 年 6 月，来自卡内基梅隆大学的 Houxu Chen、Achuth Chandrasekhar 和 Amir Barati Farimani 在 arXiv 上发表了一篇题为《Pepti-Agent: An AI Agent for Peptide Design and Optimization》的论文，提出了一个全新的解决方案。他们构建了一个闭环（closed-loop）、肽段专用的框架，将生成、预测和变异操作拆分为独立的、可通过 MCP（Model Context Protocol）协议调用的工具，由大语言模型控制器在每一步精修中实时读取预测器输出，依据每个序列的当前多维性质状态来决定下一步操作。

这篇文章将从背景、架构、核心组件、工作流程、实验设计和未来展望六个层面，深入剖析 Pepti-Agent 的设计理念与技术实现。

第一章：MCP 协议——让 AI 工具调用变得可审计

要理解 Pepti-Agent 的架构哲学，首先需要理解它所采用的 Model Context Protocol（MCP）。MCP 是一种专门为大语言模型设计的工具调用协议，其核心思想是：将每一个可调用的能力（生成、预测、变异……）封装为一个独立的、有明确输入输出接口的"工具"（tool），由 LLM 控制器在运行时根据任务需要动态选择和调用。

这与传统的"脚本式"管线形成了鲜明对比。在传统管线中，所有步骤被硬编码在一个 Python 脚本里：先调用生成器生成一批候选，再调用预测器打分，再根据某个规则（比如"把疏水残基换成亲水残基"）做变异，循环往复。这种做法有三个致命缺陷：

第一，不透明。当系统输出一个候选序列时，你很难回溯"为什么这个序列会被选中"——中间经过了多少轮精修？每一轮的性质变化如何？哪些变异被接受了、哪些被拒绝了？

第二，不可扩展。如果你想把溶血预测器换成一个更新的版本，或者增加一个新的性质维度（比如蛋白酶稳定性），你通常需要重写整个脚本的控制逻辑。

第三，不复用。每个实验室的管线都是自己写的、自己维护的，彼此之间几乎没有可移植性。

MCP 协议通过"工具化"的设计解决了这三个问题。在 Pepti-Agent 中，每一种能力——无论是 PeptideGPT 的序列生成、ProtBERT 的性质预测，还是残基变异算子——都被封装为一个独立的 MCP 工具，拥有明确的输入输出 schema。LLM 控制器在每一步决策时，会查看所有可用工具的描述和当前的上下文信息（包括之前每一步的预测结果），然后选择调用哪个工具、传入什么参数。

关键之处在于，MCP 框架会自动记录控制器的每一步决策：调用了哪个工具、传入了什么参数、返回了什么结果。这形成了一条完整的、可审计的"执行轨迹"（execution trace），让研究者可以在事后完整重现整个设计过程。

第二章：PeptideGPT——面向肽段的专用生成模型

Pepti-Agent 的"创意引擎"是 PeptideGPT，一种专门为肽段序列生成而训练的生成模型。与通用的蛋白质语言模型（如 ESM 系列）不同，PeptideGPT 只关注肽段长度范围（通常 5-50 个氨基酸）的序列分布，因此在短序列生成上具有更高的精度和更低的冗余度。

PeptideGPT 的架构基于 GPT 的自回归范式：从一个起始 token 开始，逐个位置预测下一个氨基酸残基，直到生成终止 token。每个位置的预测基于前面所有已生成残基的条件概率分布。这种自回归设计天然适合序列生成任务，因为它能够捕捉残基之间的长程依赖关系——一个在位置 5 的赖氨酸可能会影响位置 20 的天冬氨酸的选择概率。

在 Pepti-Agent 的框架中，PeptideGPT 并非只生成一次。系统会根据任务需要多次调用生成工具，每次生成一批候选序列。这些候选序列随后被送入性质预测器进行评估，只有通过筛选的序列才会进入后续的精修环节。

论文中提到，Pepti-Agent 实际上支持多个任务特定的 PeptideGPT 模型。这意味着针对不同的设计目标（比如"高溶解度低溶血"vs"高膜穿透低吸附"），系统可以调用不同的生成模型，从而在源头上就倾向于生成更接近目标的候选序列。

第三章：ProtBERT 分类器——三位一体的性质预测

生成候选序列只是第一步。真正的挑战在于评估每一条序列在多个性质维度上的表现。Pepti-Agent 使用三个独立的 ProtBERT-based 分类器，分别预测溶解度、溶血活性和非特异性表面吸附。

ProtBERT 是一种基于 BERT 架构的蛋白质语言模型，在大规模蛋白质序列数据库上进行了预训练。与传统的理化特征提取方法（比如计算疏水性指数、净电荷等）不同，ProtBERT 通过注意力机制直接从氨基酸序列中学习高维特征表示，能够捕捉到手工特征难以描述的复杂模式——比如特定残基组合对溶解度的协同影响，或者特定序列 motif 与溶血活性之间的关联。

三个分类器的独立性是 Pepti-Agent 设计中的一个重要决策。这意味着每个性质维度都有自己的特征空间和决策边界，避免了多任务学习中可能出现的任务间干扰。同时，独立的分类器也使得系统可以灵活地替换或升级任何一个性质预测器，而不会影响其他组件。

在实际工作流程中，每当 LLM 控制器请求对某个候选序列进行评估时，三个分类器会并行运行，返回各自维度的预测分数。这些分数会被实时注入到控制器的上下文中，成为下一步决策的直接依据。

这种"实时反馈"机制是 Pepti-Agent 与传统管线的核心区别之一。在传统管线中，精修阶段通常是"盲目的"——变异算子根据预定义规则（比如"把疏水残基换成亲水残基"）修改序列，而不考虑当前序列在各个维度上的实际得分。Pepti-Agent 则让 LLM 控制器在每一步精修前都能看到最新的三维得分，从而做出更有针对性的决策。比如，如果当前序列的溶解度得分已经很高但溶血得分偏低，控制器可能会选择调用专门降低溶血活性的变异算子，而不是做无差别的随机突变。

第四章：变异算子——精修的核心机制

Pepti-Agent 提供了两个可互换的变异算子（mutation operators），用于在候选序列的基础上进行单残基级别的编辑。所谓"单残基变异"，是指每次只修改序列中的一个氨基酸位置——将其替换为另一种氨基酸。

这种设计背后有一个重要考量：肽段的性质往往对单个残基的变化非常敏感。一条 20 个氨基酸的肽段，改变其中一个位置的残基，可能就会从"高溶解度"变成"低溶解度"，或者从"不溶血"变成"强溶血"。因此，单残基变异是一种精细的、可控的编辑手段，能够在保持序列整体结构大致不变的前提下，针对性地调节特定性质。

两个变异算子的设计思路不同。一个算子可能是"保守型"的，倾向于用理化性质相近的残基替换当前位置的残基（比如把亮氨酸换成异亮氨酸），从而在微调性质的同时尽量保持序列的其他特性不变。另一个算子可能是"激进型"的，倾向于用理化性质差异较大的残基替换，从而在需要大幅调整某个性质时使用。

LLM 控制器在选择变异算子时，会参考当前序列在三个性质维度上的得分。如果三个维度都接近达标，控制器可能选择保守算子做微调；如果某个维度严重偏离目标，控制器可能选择激进算子做大幅度调整。

变异后的新序列会再次被送入三个分类器进行评估。只有当新序列在至少一个维度上有所改善，且不导致其他维度严重恶化时，该变异才会被"接受"（accepted）。这个接受-拒绝的判断过程同样由 LLM 控制器基于实时预测结果来完成，而不是由预定义的硬编码规则来决定。

论文特别强调了变异算子的"可互换性"（interchangeable）。这意味着研究者可以轻松地引入新的变异算子——比如基于进化保守性的算子、基于结构约束的算子、或者基于特定领域知识的算子——而无需修改框架的其他部分。这种模块化设计大大增强了系统的灵活性和可扩展性。

第五章：闭环工作流程——从生成到精修的完整循环

Pepti-Agent 的完整工作流程可以概括为以下几个阶段：

阶段一：任务定义。 用户通过自然语言描述设计目标，比如"设计一条溶解度大于 0.8、溶血概率小于 0.2、非特异性吸附概率小于 0.15 的 15 残基肽段"。LLM 控制器解析这个任务描述，确定需要使用的生成模型和性质阈值。

阶段二：候选生成。 控制器调用 PeptideGPT 生成一批初始候选序列（比如 50 条）。每条序列附带一个唯一标识符。

阶段三：初始筛选。 所有候选序列被送入三个 ProtBERT 分类器进行评估。控制器根据阈值筛选出有潜力的候选（比如 10 条），淘汰明显不合格的序列。

阶段四：迭代精修。 对于每一条通过筛选的候选序列，控制器进入精修循环：

读取当前序列在三个维度上的最新得分
选择最需要改善的维度
选择合适的变异算子
生成变异后的新序列
对新序列进行评估
比较新旧序列的得分，决定是否接受变异
记录这一步的完整决策轨迹
重复以上步骤，直到序列在所有维度上达标，或达到最大迭代次数

阶段五：候选排序。 精修完成后，所有存活的候选序列按照综合得分进行排序，输出给用户作为实验验证的优先推荐。

整个流程的关键特征是"闭环"：生成器提出候选，预测器评估候选，变异算子修改候选，控制器根据预测结果决定下一步——形成一个完整的反馈回路。每一步的输入都依赖于上一步的输出，整个过程是自适应的、有状态的。

第六章：执行轨迹——可复现性的基石

Pepti-Agent 最具创新性的设计之一，是它对执行轨迹（execution trace）的系统性记录。在每一次运行中，框架会记录以下信息：

控制器决策：在每一步，控制器选择了哪个工具、传入了什么参数、基于什么上下文做出了这个选择。
预测器输出：每一步精修前后，候选序列在三个性质维度上的得分变化。
变异记录：哪些变异被接受了、哪些被拒绝了，以及接受/拒绝的原因。

这些信息被组合成一条完整的、按时间顺序排列的执行轨迹。研究者可以通过回放这条轨迹，完整重现任何一条候选序列从诞生到最终状态的全部历史。

这种可审计性在药物发现领域尤为重要。当一个候选序列被推荐进入湿实验验证时，药物化学家需要理解"为什么这条序列被认为是有潜力的"。Pepti-Agent 的执行轨迹提供了这个"为什么"的完整答案：它经历了几轮精修？每一轮改了哪个位置的残基？改完后溶解度提升了多少？溶血活性有没有恶化？

更重要的是，执行轨迹为不同多目标设计策略的基准测试提供了统一的数据基础。研究者可以比较不同的生成模型、不同的变异算子、不同的接受-拒绝策略在相同任务上的表现，而比较的依据就是这些结构化的执行轨迹。

第七章：与传统管线的对比

为了更清晰地理解 Pepti-Agent 的优势，我们可以将其与传统的肽段设计管线进行对比。

传统管线的工作方式：

生成器和预测器被硬编码在一个 Python 脚本中
精修逻辑通常是预定义的规则（比如"如果溶血得分高，就把疏水残基换成带电残基"）
中间过程不记录或只记录少量日志
修改任何组件都需要重写控制逻辑
不同任务需要从零开始搭建新管线

Pepti-Agent 的工作方式：

每个组件都是独立的 MCP 工具，通过标准接口通信
精修逻辑由 LLM 控制器基于实时数据动态决策
完整的执行轨迹被自动记录
替换任何组件只需提供新的 MCP 工具，控制逻辑不变
新任务只需要改变任务描述，框架自动适配

这种对比揭示了一个更深层的趋势：AI agent 架构正在从"脚本自动化"走向"工具化协作"。在脚本自动化范式中，AI 的角色是执行预定义的步骤；在工具化协作范式中，AI 的角色是基于实时信息做出决策，并调用合适的工具来执行这些决策。

第八章：局限性与未来方向

尽管 Pepti-Agent 在架构设计上展现了诸多创新，但论文也坦诚地讨论了若干局限性。

依赖预测器精度。 整个框架的闭环质量取决于三个 ProtBERT 分类器的预测精度。如果分类器对某个性质的预测存在系统性偏差，那么基于这些预测做出的精修决策可能不会导向真正改善该性质的变异。这是一个典型的"garbage in, garbage out"问题。

搜索空间的局限。 单残基变异虽然精细，但也意味着搜索空间是局部的。如果初始候选序列距离全局最优解较远，单残基变异可能需要很多步才能逼近目标，甚至可能陷入局部最优。未来的工作可能需要引入更大的变异步长（比如多残基同时变异）或者全局搜索策略。

LLM 控制器的可靠性。 Pepti-Agent 的精修质量高度依赖 LLM 控制器的决策能力。虽然实时预测结果提供了客观的决策依据，但控制器在解读这些结果和选择变异策略时仍然可能犯错。如何评估和提升控制器的决策质量，是一个需要进一步研究的问题。

实验验证的缺失。 论文主要聚焦于计算框架的设计和内部基准测试，尚未报告湿实验验证的结果。Pepti-Agent 推荐的候选序列在实际生物实验中的表现如何，是决定其实际价值的关键问题。

未来的研究方向可能包括：

引入结构预测工具（比如 AlphaFold 或 ESMFold）作为额外的 MCP 工具，让控制器在精修时考虑三维结构约束
开发多残基变异算子，扩大搜索空间
集成主动学习策略，让系统在精修过程中动态调整预测器的训练数据
将框架扩展到其他类型的生物分子设计（比如核酸适配体、蛋白质结合肽等）

第九章：更广泛的启示——AI Agent 在科学发现中的角色

Pepti-Agent 的出现不仅仅是肽段设计领域的一个技术进步，它更深层地反映了 AI agent 在科学研究中角色的转变。

过去几年，AI 在科学领域的应用主要集中在"预测"层面——用深度学习模型预测蛋白质结构、预测药物-靶点相互作用、预测材料性质。这些预测能力确实强大，但它们本质上是被动的：你给模型一个输入，它给你一个输出，仅此而已。

Pepti-Agent 代表的是一种更主动的范式：AI 不仅能预测，还能基于预测结果做出决策、调用工具、迭代改进，最终输出经过多轮优化的结果。这种"感知-决策-行动"的闭环结构，让 AI 从一个"工具"变成了一个"代理"（agent）——它有目标、有策略、有反馈。

这种转变的意义远不止于肽段设计。在材料科学中，类似的 agent 架构可以用于多目标材料筛选——同时优化强度、导电性和可加工性。在药物化学中，agent 可以同时考虑药效、毒性和药代动力学性质。在合成生物学中，agent 可以同时优化代谢通量、细胞生长速率和产物稳定性。

MCP 协议的采用更是为这种跨领域迁移提供了技术基础。由于所有组件都通过标准化接口通信，一个为肽段设计开发的变异算子可能经过适当修改就能用于核酸序列的优化；一个用于预测肽段溶解度的模型可能可以迁移到预测小分子溶解度的任务中。

当然，这种 agent 范式也带来了新的挑战。如何确保 agent 的决策是可靠的？如何避免 agent 在迭代过程中偏离目标？如何让 agent 的行为对人类研究者是可解释和可干预的？这些问题不仅涉及技术层面，还涉及人机协作的伦理和实践层面。

第十章：技术细节补充

为了让读者对 Pepti-Agent 的实现有更具体的认知，本节补充若干技术细节。

MCP 工具的接口规范。 每个 MCP 工具都有一个 JSON Schema 定义的输入接口和输出接口。例如，PeptideGPT 的输入可能包括"序列长度"和"温度参数"，输出是一组候选序列及其对数概率。ProtBERT 分类器的输入是一条氨基酸序列，输出是一个 0 到 1 之间的概率值。变异算子的输入是一条序列和目标位置，输出是变异后的序列。

LLM 控制器的提示设计。 控制器的系统提示中包含了所有可用工具的描述、任务目标的定义、以及精修策略的指导原则。控制器在每一步接收到的上下文包括：当前序列、当前三维得分、之前所有步骤的执行轨迹摘要、以及本轮可选的工具列表。

接受-拒绝策略。 论文中描述的变异接受策略并非简单的"帕累托改进"（即在所有维度上都不变差）。相反，控制器被允许做出权衡性决策——比如在溶解度小幅下降的情况下接受一个能显著降低溶血活性的变异，如果任务优先级更偏向降低溶血风险的话。

计算资源需求。 Pepti-Agent 的一次完整运行（从生成到精修完成）需要调用 LLM 控制器数十到数百次，加上每步调用三个分类器和一个变异算子。这意味着单次运行的计算成本主要由 LLM 的调用次数和分类器的推理时间决定。

结语

Pepti-Agent 的核心贡献不在于它使用了多么前沿的生成模型或预测模型，而在于它展示了一种将 AI agent 架构应用于多目标分子设计的可行范式。通过 MCP 协议将生成、预测和变异操作拆分为独立的、可审计的工具，通过 LLM 控制器实现基于实时数据的闭环精修，通过完整的执行轨迹保证设计过程的可复现性——这些设计理念的组合，让肽段设计从"脚本驱动"的自动化走向了"agent 驱动"的智能化。

对于中国的药物研发社区而言，Pepti-Agent 提供的启示是多方面的。首先，MCP 协议的工具化思路可以应用于国内正在蓬勃发展的 AI 制药平台，提升管线的模块化和可复用性。其次，LLM 作为控制层的范式降低了领域专家使用 AI 工具的门槛——研究者只需要用自然语言描述设计目标，而不需要编写复杂的 Python 脚本。最后，执行轨迹的记录机制为 AI 辅助药物设计的合规性审查提供了技术基础，这对于推进 AI 制药的监管框架具有重要意义。

当然，一切计算推荐最终都要经过湿实验的检验。Pepti-Agent 能否真正加速肽段药物的发现，还需要在真实药物研发项目中得到验证。但至少在架构层面，它为"如何让 AI 更好地服务于分子设计"这个问题提供了一个值得认真参考的答案。

论文信息：Houxu Chen, Achuth Chandrasekhar, Amir Barati Farimani. "Pepti-Agent: An AI Agent for Peptide Design and Optimization." arXiv:2606.15422v1, 2025.