2026年AI推理基础设施大战:Baseten 15亿美元融资背后的产业逻辑

2026年6月,AI推理赛道正在经历一场前所未有的资本狂欢。从Baseten到Cognition,从Modal Labs到OpenAI,一场围绕"推理层"的基础设施战争已经打响。
一、融资狂潮:五个月估值翻2.6倍的神话
2026年6月18日,AI推理基础设施公司Baseten宣布完成15亿美元融资,估值高达130亿美元。要知道,就在五个月前的2026年1月,这家公司刚以50亿美元的估值完成了3亿美元的Series E轮融资。五个月,估值从50亿飙升至130亿,涨幅达160%——这在科技融资史上极为罕见。
更值得关注的是,这轮融资采用了"双层估值"结构:部分投资者以110亿美元估值入场,另一部分则以130亿美元估值进入。这种结构在AI创业公司中越来越常见,反映了不同投资者对同一资产的判断分歧。
据《华尔街日报》报道,Baseten的核心业务是为开源AI模型提供推理软件层,帮助企业以更低成本、更高效率部署大语言模型。随着Llama、Mistral、DeepSeek等开源模型的崛起,市场对"便宜又好用"的推理基础设施需求暴增。
| 时间 | 融资轮次 | 金额 | 估值 |
|---|---|---|---|
| 2026年1月 | Series E | 3亿美元 | 50亿美元 |
| 2026年6月 | Series F | 15亿美元 | 110-130亿美元 |
二、推理成为AI的新战场
过去两年,AI行业的焦点集中在"训练"——谁的模型更大、更强、更智能。但进入2026年,风向正在转变。推理(Inference)——即让训练好的模型实际工作——正在成为新的兵家必争之地。
原因很简单:训练是一次性成本,推理是持续成本。当一个大语言模型被数十亿用户每天调用时,推理成本会迅速超过训练成本。OpenAI、Anthropic等头部公司每年在推理上的支出已经占到总运营成本的60%以上。
对Baseten这类公司而言,这是一个巨大的结构性机会。它们不需要自己训练模型,而是帮别人更便宜、更快地"跑"模型。这种"卖铲子"的商业模式,在淘金热中往往是最稳赚不赔的。
推理成本结构示意(每百万token,2026年Q2)
┌─────────────────────────────────────────┐
│ 闭源模型(GPT-4级别) $15-30 │
│ 开源模型+云推理 $3-8 │
│ 开源模型+自建推理 $1-3 │
│ 开源模型+Baseten优化 $0.5-2 │
└─────────────────────────────────────────┘
三、Cognition AI:当AI写出了90%的自身代码
如果说Baseten代表的是"推理基础设施"赛道,那么Cognition AI代表的则是"AI Agent"赛道的最高热度。
2026年5月27日,Cognition AI——Devin(全球首个AI软件工程师)的开发商——宣布完成10亿美元融资,估值达到250亿美元。而就在七个月前,其估值还"只有"102亿美元。
最令人震惊的数据不是估值,而是运营层面的:Cognition超过90%的代码现在由Devin自己编写。这意味着一个AI编程工具公司,已经实现了"用自己造的产品来造自己"的递归式增长。
据彭博社报道,Cognition在2025年10月收购了编程IDE工具Windsurf后,ARR(年化经常性收入)在九个月内翻了一倍多,从100万美元增长到7300万美元。
四、Modal Labs:推理赛道的第三极
Baseten并非唯一享受资本盛宴的推理公司。同期,另一家AI推理创业公司Modal Labs也传出正在洽谈约25亿美元估值的新融资。
Modal Labs的定位略有不同——它更偏向于"无服务器推理平台",开发者无需管理GPU集群,只需上传模型代码,Modal自动处理弹性扩缩容。这种"推理即服务"的模式对中小型AI团队尤其有吸引力。
三家公司的竞争格局可以概括为:
| 公司 | 最新估值 | 核心定位 | 目标客户 |
|---|---|---|---|
| Baseten | 130亿美元 | 开源模型推理优化层 | 企业级AI团队 |
| Modal Labs | 25亿美元 | 无服务器推理平台 | 中小型开发者 |
| Cognition AI | 250亿美元 | AI编程Agent | 软件开发团队 |
五、开源模型崛起:推理需求的底层驱动力
推理基础设施的爆发,根本原因是开源大模型的崛起。
2024-2026年间,Meta的Llama系列、Mistral、DeepSeek等开源模型在多个基准测试上逐步逼近甚至超越闭源模型。企业不再需要为GPT-4级别的能力支付高昂的API费用——他们可以下载开源模型,在自己的基础设施上运行。
但"能跑"和"跑得好"是两回事。开源模型的推理优化需要深厚的工程技术:量化压缩、KV缓存优化、动态批处理、多卡并行策略……这些正是Baseten等公司的核心竞争力。
以DeepSeek-R1为例,这个中国团队开发的推理模型在发布后迅速成为开源社区的明星。但要在生产环境中以低成本、低延迟运行DeepSeek-R1,企业需要专业的推理优化——Baseten在这方面的技术积累使其成为首选合作伙伴。

六、资本的疯狂与理性的回归
如此大规模的融资是否意味着泡沫?
支持者认为,AI推理是一个"赢家通吃"的市场。就像AWS定义了云计算时代,谁先建立起大规模、低成本的推理网络,谁就能在AI时代占据基础设施层的核心位置。
质疑者则指出,推理成本正在快速下降。NVIDIA每一代新芯片(从H100到B100到B200)都在大幅提升推理性能,同时价格也在下降。如果硬件进步的速度超过软件壁垒的建立速度,那么"推理优化"的价值可能会被快速稀释。
关键风险评估矩阵:
┌──────────────┬────────────────┬──────────────────┐
│ 风险因素 │ 发生概率 │ 影响程度 │
├──────────────┼────────────────┼──────────────────┤
│ 硬件快速降价 │ 高 (70%) │ 中等 │
│ 大厂自建推理 │ 中 (50%) │ 高 │
│ 开源社区优化 │ 高 (65%) │ 中等 │
│ 需求持续增长 │ 极高 (90%) │ 正面高 │
└──────────────┴────────────────┴──────────────────┘
七、对创业者的启示
这场推理基础设施大战给创业者带来几个重要信号:
第一,"卖铲子"仍然是好生意。 不是每家公司都要做大模型,帮别人更好地使用大模型,同样是一个巨大的市场。
第二,开源生态创造了新的价值链。 开源模型的崛起并不意味着所有价值都流向了终端用户——中间层(推理优化、部署工具、监控系统)同样有巨大的商业机会。
第三,速度就是一切。 Baseten五个月估值翻2.6倍的故事告诉我们,在AI时代,窗口期极短。如果你找到了一个真实的市场需求,必须以最快的速度建立壁垒。
第四,关注中国市场。 DeepSeek等中国AI公司的崛起正在改变全球AI竞争格局,也为推理基础设施公司创造了新的市场机会。
八、展望:推理即新的云计算
回顾云计算的发展历程,AWS在2006年推出S3和EC2时,很少有人预见到它会成为一个年收入超过1000亿美元的业务。AI推理基础设施正在走一条类似的路径。
不同的是,AI推理的需求增长速度远快于当年的云计算。据行业估算,2026年全球AI推理市场的规模将达到300-400亿美元,到2030年可能突破2000亿美元。
Baseten、Modal Labs等公司能否成为"AI时代的AWS",还需要时间验证。但有一点是确定的:推理层将成为AI产业链中最关键的基础设施之一,而围绕它的竞争才刚刚开始。
数据来源:TechCrunch、华尔街日报、Bloomberg、Pymnts、The Next Web、Awesome Agents等公开报道,截至2026年6月21日。
评论