Google首次捕获AI构建的零日漏洞:LLM生成的2FA绕过漏洞改变网络安全格局

2026年5月11日,Google威胁情报组(GTIG)披露了网络安全史上首个确认的AI生成零日漏洞。一个犯罪团伙利用大语言模型构建了针对开源Web管理工具的2FA绕过漏洞,准备发动大规模攻击。AI生成零日漏洞不再是理论假设——攻击门槛正在急剧下降。
事件概述:AI写的零日漏洞,真的来了

2026年5月11日,Google威胁情报组(GTIG)发布了一项震动整个安全行业的披露:他们发现了一个犯罪团伙正在准备利用一个此前未知的零日漏洞发动大规模攻击,而这个漏洞的利用代码——一个Python脚本——是由AI大语言模型生成的。这是网络安全史上首次确认的AI生成零日漏洞在真实攻击场景中的应用。
该漏洞针对一个广泛部署的开源Web系统管理工具,允许攻击者绕过双因素认证(2FA)。攻击者已经获得了目标系统的有效用户凭证(通过钓鱼、凭证填充或从数据经纪人购买),但2FA层阻止了他们进一步利用。这个AI生成的零日漏洞正是为了突破这最后一道防线而设计的。
GTIG首席分析师John Hultquist表示,该犯罪团伙是一个"知名的大规模利用犯罪集团",在Google介入时尚未部署该零日漏洞。Google随后与受影响供应商协调披露,漏洞已被修补。但这次事件的意义远超单个漏洞本身——它标志着AI辅助网络攻击从理论走向实战的转折点。
技术分析:为什么AI擅长发现这类漏洞

该零日漏洞是一个"语义逻辑漏洞"(semantic logic vulnerability)——不是缓冲区溢出或内存损坏这类底层缺陷,而是开发者在代码中硬编码了一个与应用认证执行逻辑矛盾的信任假设。用通俗的话说:开发者在代码的某个地方假设"如果用户已经通过了第一因素认证,那么第二因素可以信任",但这个假设在特定条件下不成立。
这种高阶逻辑错误恰恰是AI系统的强项。大语言模型在海量代码上训练,学习了代码模式、惯例和常见错误。一个硬编码的信任假设——人类代码审查员因为代码"看起来正确"而容易忽略的微妙逻辑错误——正是LLM通过大规模代码分析能够识别的类型。
GTIG研究人员在利用脚本中识别出多个AI生成代码的标志性特征:
| AI生成特征 | 具体表现 |
|---|---|
| 过度文档化 | 大量教育性docstring,包含虚构的CVSS评分 |
| 代码风格 | 教科书式的格式化,与人类开发者不一致 |
| ANSI颜色类 | 完整的颜色输出实现,超出利用脚本的正常需求 |
| 帮助菜单 | 详细的命令行帮助系统,类似CLI工具的文档 |
| 错误处理 | 过度完善的异常处理,远超实际利用需要 |
这些特征揭示了一个重要事实:攻击者可能使用了通用AI模型(可能是越狱版本或本地部署的模型),让AI完成了大部分工作,人工编辑极少。Google排除了Gemini和Anthropic的Claude作为来源模型,但未公开具体使用了哪个LLM。
AI生成恶意代码的标志性特征对比

| 特征维度 | 人类编写的利用代码 | AI生成的利用代码 |
|---|---|---|
| 文档注释 | 极少或无 | 大量教育性docstring |
| 代码风格 | 紧凑、直接 | 教科书式、过度格式化 |
| 错误处理 | 最小化 | 过度完善 |
| 辅助功能 | 无 | 完整的帮助菜单、颜色输出 |
| CVSS评分 | 不包含 | 包含(可能是虚构的) |
| 变量命名 | 简短、约定俗成 | 描述性、过长 |
| 代码长度 | 精简 | 冗长 |
对2FA安全模型的根本性挑战
双因素认证长期以来被视为账户安全的基石——"在所有地方启用2FA"是安全行业的金科玉律。其核心逻辑是:即使攻击者窃取了密码,没有第二因素(通常是认证器应用的验证码或短信码)也无法登录。
这次事件动摇了这一假设。该漏洞利用的不是底层密码学的缺陷,而是2FA实现中的逻辑缺陷。攻击者需要有效的用户凭证——所以2FA并非被"从外部零知识绕过"。但一旦获得凭证(通过钓鱼、凭证填充或从数据经纪人购买),2FA层可以被完全跳过。
这对整个身份认证生态系统有深远影响:
- 2FA不是万能的——实现质量与协议本身同样重要
- 凭证泄露的危害升级——过去"有密码没用因为有2FA"的假设不再成立
- 代码审查需要AI辅助——人类审查员容易忽略的逻辑缺陷,AI可以发现
- 攻击者也在用AI——防守方必须将AI纳入威胁模型
Google GTIG的发现时间线
| 日期 | 事件 |
|---|---|
| 2026年初 | GTIG监测到犯罪团伙的异常活动 |
| 2026年4月 | 分析确认利用代码为AI生成 |
| 2026年5月11日 | GTIG正式公开披露 |
| 2026年5月11日 | 受影响供应商发布补丁 |
| 2026年5月14日 | 多家安全媒体详细报道 |
AI辅助网络攻击的演进路径
这次事件并非孤立的。2026年已经出现了多个AI辅助攻击的标志性事件:
PROMPTFLUX恶意软件:一种自我变形的恶意软件,使用LLM在运行时重写自身代码以逃避检测。传统基于签名的防病毒软件对其完全无效。
Gemini驱动的后门:Anthropic此前披露了一个中国国家级网络间谍活动,其中攻击者使用AI模型辅助后门开发。
AI辅助漏洞研究:Google自己的Big Sleep项目(前身为Project Naptime)已经证明AI系统可以发现人类遗漏的漏洞。现在攻击者也在使用同样的技术。
根据Google威胁情报组的统计,2021年至2025年间,每年在野外发现的零日漏洞数量分别为106、63、98、75和90个。2026年按当前趋势预计将约88个。AI辅助漏洞发现很可能会加速这一数字的增长。
企业防御建议
面对AI辅助攻击的新现实,企业需要调整防御策略:
立即行动:
- 审计所有Web管理工具的2FA实现,特别是开源方案
- 确保所有系统已打最新补丁
- 实施纵深防御——不要仅依赖2FA作为唯一的额外认证层
中期规划:
- 将AI辅助威胁纳入威胁建模
- 部署AI驱动的代码审查工具,在开发阶段发现逻辑漏洞
- 实施行为分析——即使凭证和2FA都通过了,异常行为仍应触发告警
长期策略:
- 投资AI安全研究,用AI发现AI生成的攻击模式
- 参与行业情报共享,及时获取AI辅助攻击的最新指标
- 重新评估零信任架构的实施深度
# 检查常见开源Web管理工具的2FA配置
# 以常见工具为例
# 1. 检查是否有硬编码的信任假设
grep -r "trust.*factor\|skip.*2fa\|bypass.*auth" /path/to/app/
# 2. 审计认证流程的会话管理
grep -r "session.*valid\|token.*trust" /path/to/app/
# 3. 检查是否有条件性2FA绕过逻辑
grep -r "if.*authenticated\|if.*verified" /path/to/app/auth/
数据来源与参考文献
- Google Threat Intelligence Group. "First AI-Built Zero-Day Caught in the Wild." Google Blog, May 11, 2026.
- ProbablyPwned. "Google Catches First AI-Generated Zero-Day Exploit in the Wild." probablypwned.com, May 11, 2026.
- SudoFlare. "World's First AI-Built Zero-Day Exploit: Hackers Used AI to Create a 2FA Bypass." sudoflare.com, May 21, 2026.
- NerdLevelTech. "Google Catches First AI-Built Zero-Day in the Wild (2026)." nerdleveltech.com, May 14, 2026.
- LinkedIn - Spencer J. "The First AI-Built Zero-Day: How Google Caught a Cybercrime Group." linkedin.com, 2026.
- F5 Labs. "The Vulnerability Curve Bent With the AI Curve." f5.pm, 2026.
更新时间:2026-06-25
评论