2026年AI推理基础设施大战：Baseten 15亿美元融资背后的产业逻辑

AI推理数据中心

2026年6月，AI推理赛道正在经历一场前所未有的资本狂欢。从Baseten到Cognition，从Modal Labs到OpenAI，一场围绕"推理层"的基础设施战争已经打响。

一、融资狂潮：五个月估值翻2.6倍的神话

2026年6月18日，AI推理基础设施公司Baseten宣布完成15亿美元融资，估值高达130亿美元。要知道，就在五个月前的2026年1月，这家公司刚以50亿美元的估值完成了3亿美元的Series E轮融资。五个月，估值从50亿飙升至130亿，涨幅达160%——这在科技融资史上极为罕见。

更值得关注的是，这轮融资采用了"双层估值"结构：部分投资者以110亿美元估值入场，另一部分则以130亿美元估值进入。这种结构在AI创业公司中越来越常见，反映了不同投资者对同一资产的判断分歧。

据《华尔街日报》报道，Baseten的核心业务是为开源AI模型提供推理软件层，帮助企业以更低成本、更高效率部署大语言模型。随着Llama、Mistral、DeepSeek等开源模型的崛起，市场对"便宜又好用"的推理基础设施需求暴增。

时间	融资轮次	金额	估值
2026年1月	Series E	3亿美元	50亿美元
2026年6月	Series F	15亿美元	110-130亿美元

二、推理成为AI的新战场

过去两年，AI行业的焦点集中在"训练"——谁的模型更大、更强、更智能。但进入2026年，风向正在转变。推理（Inference）——即让训练好的模型实际工作——正在成为新的兵家必争之地。

原因很简单：训练是一次性成本，推理是持续成本。当一个大语言模型被数十亿用户每天调用时，推理成本会迅速超过训练成本。OpenAI、Anthropic等头部公司每年在推理上的支出已经占到总运营成本的60%以上。

对Baseten这类公司而言，这是一个巨大的结构性机会。它们不需要自己训练模型，而是帮别人更便宜、更快地"跑"模型。这种"卖铲子"的商业模式，在淘金热中往往是最稳赚不赔的。

推理成本结构示意（每百万token，2026年Q2）
┌─────────────────────────────────────────┐
│  闭源模型（GPT-4级别）  $15-30          │
│  开源模型+云推理        $3-8            │
│  开源模型+自建推理      $1-3            │
│  开源模型+Baseten优化   $0.5-2          │
└─────────────────────────────────────────┘

三、Cognition AI：当AI写出了90%的自身代码

如果说Baseten代表的是"推理基础设施"赛道，那么Cognition AI代表的则是"AI Agent"赛道的最高热度。

2026年5月27日，Cognition AI——Devin（全球首个AI软件工程师）的开发商——宣布完成10亿美元融资，估值达到250亿美元。而就在七个月前，其估值还"只有"102亿美元。

最令人震惊的数据不是估值，而是运营层面的：Cognition超过90%的代码现在由Devin自己编写。这意味着一个AI编程工具公司，已经实现了"用自己造的产品来造自己"的递归式增长。

据彭博社报道，Cognition在2025年10月收购了编程IDE工具Windsurf后，ARR（年化经常性收入）在九个月内翻了一倍多，从100万美元增长到7300万美元。

Baseten并非唯一享受资本盛宴的推理公司。同期，另一家AI推理创业公司Modal Labs也传出正在洽谈约25亿美元估值的新融资。

Modal Labs的定位略有不同——它更偏向于"无服务器推理平台"，开发者无需管理GPU集群，只需上传模型代码，Modal自动处理弹性扩缩容。这种"推理即服务"的模式对中小型AI团队尤其有吸引力。

三家公司的竞争格局可以概括为：

公司	最新估值	核心定位	目标客户
Baseten	130亿美元	开源模型推理优化层	企业级AI团队
Modal Labs	25亿美元	无服务器推理平台	中小型开发者
Cognition AI	250亿美元	AI编程Agent	软件开发团队

五、开源模型崛起：推理需求的底层驱动力

推理基础设施的爆发，根本原因是开源大模型的崛起。

2024-2026年间，Meta的Llama系列、Mistral、DeepSeek等开源模型在多个基准测试上逐步逼近甚至超越闭源模型。企业不再需要为GPT-4级别的能力支付高昂的API费用——他们可以下载开源模型，在自己的基础设施上运行。

但"能跑"和"跑得好"是两回事。开源模型的推理优化需要深厚的工程技术：量化压缩、KV缓存优化、动态批处理、多卡并行策略……这些正是Baseten等公司的核心竞争力。

以DeepSeek-R1为例，这个中国团队开发的推理模型在发布后迅速成为开源社区的明星。但要在生产环境中以低成本、低延迟运行DeepSeek-R1，企业需要专业的推理优化——Baseten在这方面的技术积累使其成为首选合作伙伴。

资本与技术的融合

六、资本的疯狂与理性的回归

如此大规模的融资是否意味着泡沫？

支持者认为，AI推理是一个"赢家通吃"的市场。就像AWS定义了云计算时代，谁先建立起大规模、低成本的推理网络，谁就能在AI时代占据基础设施层的核心位置。

质疑者则指出，推理成本正在快速下降。NVIDIA每一代新芯片（从H100到B100到B200）都在大幅提升推理性能，同时价格也在下降。如果硬件进步的速度超过软件壁垒的建立速度，那么"推理优化"的价值可能会被快速稀释。

关键风险评估矩阵：
┌──────────────┬────────────────┬──────────────────┐
│   风险因素   │   发生概率     │   影响程度       │
├──────────────┼────────────────┼──────────────────┤
│ 硬件快速降价 │   高 (70%)     │   中等           │
│ 大厂自建推理 │   中 (50%)     │   高             │
│ 开源社区优化 │   高 (65%)     │   中等           │
│ 需求持续增长 │   极高 (90%)   │   正面高         │
└──────────────┴────────────────┴──────────────────┘

七、对创业者的启示

这场推理基础设施大战给创业者带来几个重要信号：

第一，"卖铲子"仍然是好生意。 不是每家公司都要做大模型，帮别人更好地使用大模型，同样是一个巨大的市场。

第二，开源生态创造了新的价值链。 开源模型的崛起并不意味着所有价值都流向了终端用户——中间层（推理优化、部署工具、监控系统）同样有巨大的商业机会。

第三，速度就是一切。 Baseten五个月估值翻2.6倍的故事告诉我们，在AI时代，窗口期极短。如果你找到了一个真实的市场需求，必须以最快的速度建立壁垒。

第四，关注中国市场。 DeepSeek等中国AI公司的崛起正在改变全球AI竞争格局，也为推理基础设施公司创造了新的市场机会。

八、展望：推理即新的云计算

回顾云计算的发展历程，AWS在2006年推出S3和EC2时，很少有人预见到它会成为一个年收入超过1000亿美元的业务。AI推理基础设施正在走一条类似的路径。

不同的是，AI推理的需求增长速度远快于当年的云计算。据行业估算，2026年全球AI推理市场的规模将达到300-400亿美元，到2030年可能突破2000亿美元。

Baseten、Modal Labs等公司能否成为"AI时代的AWS"，还需要时间验证。但有一点是确定的：推理层将成为AI产业链中最关键的基础设施之一，而围绕它的竞争才刚刚开始。

数据来源：TechCrunch、华尔街日报、Bloomberg、Pymnts、The Next Web、Awesome Agents等公开报道，截至2026年6月21日。

2026年AI推理基础设施大战：Baseten 15亿美元融资背后的产业逻辑

一、融资狂潮：五个月估值翻2.6倍的神话

二、推理成为AI的新战场

三、Cognition AI：当AI写出了90%的自身代码

四、Modal Labs：推理赛道的第三极

五、开源模型崛起：推理需求的底层驱动力

六、资本的疯狂与理性的回归

七、对创业者的启示

八、展望：推理即新的云计算

评论

相关推荐

免疫细胞追杀癌细胞要多久？随机游走理论给出精确答案

混合细胞群体趋化性前沿的非线性理论：从数学分析到免疫细胞共迁移的统一框架

混合细胞群体趋化性前沿的非线性理论：从数学分析到免疫细胞共迁移的统一框架

OCOO-T：用最简洁的架构预测细胞对扰动的转录响应

你的生理数据到底反映的是"你"还是"你的环境"？一份用基因组做锚点的贝叶斯推断框架