返回首页

CVE-2026-7482 Ollama Bleeding Llama:CVSS 9.1的AI基础设施内存泄露漏洞深度解析(2026)

-2026-7482 Ollama Bleeding Llama:CVSS 9.1的基础设施内存泄露漏洞深度解析(2026)

hero

2026年6月,安全研究团队Cyera披露了Ollama平台的严重安全漏洞CVE-2026-7482(CVSS 9.1),该漏洞允许未经认证的远程攻击者泄露整个Ollama进程的内存内容,全球超过30万台暴露在公网的Ollama服务器面临数据泄露风险。这是2026年AI基础设施领域最严重的安全事件之一。

漏洞概述:AI推理引擎的致命缺陷

section

CVE-2026-7482被命名为"Bleeding Llama"(流血的羊驼),是一个存在于Ollama AI推理引擎中的未认证内存泄露漏洞。Ollama是当前最流行的本地大语言模型()运行框架之一,允许开发者在本地或私有服务器上运行Llama、、Gemma等开源模型。

Cyera安全研究团队在2026年5月发现该漏洞,攻击者无需任何认证凭据,仅通过构造特定的HTTP请求,即可触发Ollama服务的内存读取操作,获取进程内存中包含的敏感数据。这些数据可能包括密钥、模型权重片段、用户会话数据,甚至服务器上其他进程的信息。

漏洞的CVSS v3.1评分为9.1分(满分10分),属于级别。评分高的原因在于:攻击复杂度极低(无需认证、无需特殊条件)、影响范围极广(全球30万+服务器)、机密性影响严重(完全泄露进程内存)。

属性 详情
CVE编号 CVE-2026-7482
CVSS评分 9.1 (Critical)
漏洞类型 未认证内存泄露 (CWE-200)
影响产品 Ollama < 0.9.5
攻击复杂度 低,无需认证
影响范围 全球30万+暴露服务器
发现者 Cyera Team
公开日期 2026年6月

技术原理:从HTTP请求到内存泄露的完整攻击链

section

漏洞的核心问题在于Ollama的HTTP API在处理特定类型的推理请求时,未正确校验输入参数的边界条件。攻击者可以通过以下步骤触发内存泄露:

第一步:服务发现。Ollama默认监听11434端口,且默认配置下无认证机制。攻击者通过Shodan或Censys等搜索引擎可以快速定位暴露在公网的Ollama实例。

第二步:构造恶意请求。攻击者向Ollama的/api/generate/api/chat端点发送精心构造的请求,在prompt参数中嵌入超长或特殊格式的payload,导致服务端的内存缓冲区处理异常。

第三步:内存读取。由于Ollama在处理错误时未正确清理内存缓冲区,服务器的响应中会混入进程内存中的其他数据片段,包括相邻内存地址的内容。

第四步:数据提取。攻击者反复发送类似请求,逐步拼接出完整的内存内容,提取其中的敏感信息。

攻击流程示意:
[攻击者] --构造恶意请求--> [Ollama API :11434]
         <--泄露内存数据--  [进程内存: API密钥/模型权重/会话数据]

这种攻击模式类似于经典的Heartbleed漏洞(CVE-2014-0160),但针对的是AI推理基础设施而非SSL/TLS协议。

影响范围评估:30万+服务器暴露在公网

Cyera研究团队通过互联网扫描发现,全球约有30万台Ollama服务器直接暴露在公网,未配置任何访问控制。这些服务器主要分布在:

地区 暴露数量(估算) 占比
中国 ~120,000 40%
美国 ~75,000 25%
欧洲 ~45,000 15%
其他地区 ~60,000 20%

受影响最严重的场景包括:

  1. 企业AI开发环境:许多公司将Ollama部署在云服务器上供团队使用,但未配置或IP白名单。
  2. GPU云实例:AWS、GCP、阿里云等云平台上的GPU实例,开发者为方便调试直接暴露11434端口。
  3. 边缘计算节点:部署在边缘设备上的Ollama实例,通常安全配置更弱。
  4. 研究机构:高校和研究机构的GPU集群,安全意识相对薄弱。

更严重的是,部分服务器的进程内存中可能包含其他服务的凭据(如数据库密码、云平台API密钥),攻击者可以通过Ollama漏洞横向渗透到整个基础设施。

检测方法:快速排查你的服务器是否受影响

section

方法一:端口扫描检测

# 检查本机是否暴露Ollama端口
ss -tlnp | grep 11434

# 从外部检测(替换为目标IP)
nmap -p 11434 -sV target_ip

# 使用curl测试Ollama是否可访问
curl -s http://target_ip:11434/api/tags | head -c 500

方法二:版本检查

# 检查Ollama版本(受影响版本 < 0.9.5)
ollama --version

# 或通过API检查
curl -s http://localhost:11434/api/version

方法三:漏洞验证脚本

import requests
import sys

def check_ollama_vuln(target):
    try:
        r = requests.get(f"http://{target}:11434/api/version", timeout=5)
        if r.status_code == 200:
            version = r.json().get("version", "unknown")
            print(f"Ollama version: {version}")
            parts = version.split(".")
            major, minor, patch = int(parts[0]), int(parts[1]), int(parts[2])
            if (major, minor, patch) < (0, 9, 5):
                print("[CRITICAL] Vulnerable to CVE-2026-7482!")
                return True
            else:
                print("[SAFE] Version patched.")
                return False
    except Exception as e:
        print(f"Connection failed: {e}")
        return False

if __name__ == "__main__":
    target = sys.argv[1] if len(sys.argv) > 1 else "localhost"
    check_ollama_vuln(target)

修复方案与临时缓解措施

方案一:升级到修复版本(推荐)

Ollama官方已在0.9.5版本中修复了该漏洞,主要改进包括:

# 停止Ollama服务
sudo systemctl stop ollama

# 升级Ollama
curl -fsSL https://ollama.com/install.sh | sh

# 验证版本
ollama --version
# 应输出: ollama version 0.9.5 或更高

# 重启服务
sudo systemctl start ollama

方案二:网络层防护(临时缓解)

如果无法立即升级,可以通过网络层限制访问:

# iptables限制Ollama端口仅允许本地访问
sudo iptables -A INPUT -p tcp --dport 11434 -s 127.0.0.1 -j ACCEPT
sudo iptables -A INPUT -p tcp --dport 11434 -j DROP

# 或使用ufw
sudo ufw deny 11434
sudo ufw allow from 127.0.0.1 to any port 11434

方案三:反向代理+认证

server {
    listen 443 ssl;
    server_name ollama.example.com;
    ssl_certificate /path/to/cert.pem;
    ssl_certificate_key /path/to/key.pem;
    auth_basic "Ollama Access";
    auth_basic_user_file /etc/nginx/.htpasswd;
    location / {
        proxy_pass http://127.0.0.1:11434;
        proxy_set_header Host $host;
        proxy_set_header X-Real-IP $remote_addr;
    }
}

同类AI基础设施漏洞对比

漏洞 产品 CVSS 类型 影响
CVE-2026-7482 Ollama 9.1 内存泄露 30万+服务器
CVE-2026-42271 9.8 命令注入 AI代理框架
CVE-2026-21858 n8n 10.0 工作流自动化
CVE-2024-37891 vLLM 8.6 认证绕过 模型推理服务

AI基础设施正在成为攻击者的重点目标。与传统Web应用不同,AI推理服务通常运行在高配GPU服务器上,一旦被攻破,攻击者不仅能获取敏感数据,还能利用GPU资源进行加密货币挖矿或训练恶意模型。

防御建议与最佳实践

  1. 网络隔离:Ollama等AI推理服务不应直接暴露在公网,必须通过VPN或内网访问。
  2. 认证机制:在Ollama前端部署认证层(如OAuth2 Proxy、 Basic Auth)。
  3. 版本管理:建立AI工具链的版本监控机制,及时跟进安全更新。
  4. 内存保护:启用操作系统的ASLR、Stack Canary等内存保护机制。
  5. 日志监控:监控Ollama的访问日志,检测异常的API调用模式。
  6. 最小权限:以非root用户运行Ollama,限制文件系统访问范围。
# 创建专用用户运行Ollama
sudo useradd -r -s /bin/false ollama
sudo chown -R ollama:ollama /usr/share/ollama
sudo systemctl edit ollama
# 添加: User=ollama

数据来源与参考文献

  1. Cyera Research. "Bleeding Llama: Critical Unauthenticated Leak in Ollama." cyera.com/research, June 2026.
  2. NVD. "CVE-2026-7482." National , nvd.nist.gov, 2026.
  3. . Known Exploited Vulnerabilities Catalog. .gov, 2026.
  4. Shodan. Ollama Internet Exposure Scan . shodan.io, 2026.
  5. Ollama . " Advisory: CVE-2026-7482." github.com/ollama/ollama, 2026.

更新时间: 2026-06-13 作者: 安全情报分析团队

评论