返回首页

2026年AI推理基础设施大战:Baseten 15亿美元融资背后的产业逻辑

2026年推理基础设施大战:Baseten 15亿美元融资背后的产业逻辑

AI推理数据中心

2026年6月,AI推理赛道正在经历一场前所未有的资本狂欢。从Baseten到,从Modal Labs到,一场围绕"推理层"的基础设施战争已经打响。

一、融资狂潮:五个月估值翻2.6倍的神话

2026年6月18日,AI推理基础设施公司Baseten宣布完成15亿美元融资,估值高达130亿美元。要知道,就在五个月前的2026年1月,这家公司刚以50亿美元的估值完成了3亿美元的Series E轮融资。五个月,估值从50亿飙升至130亿,涨幅达160%——这在科技融资史上极为罕见。

更值得关注的是,这轮融资采用了"双层估值"结构:部分投资者以110亿美元估值入场,另一部分则以130亿美元估值进入。这种结构在AI创业公司中越来越常见,反映了不同投资者对同一资产的判断分歧。

据《华尔街日报》报道,Baseten的核心业务是为开源AI模型提供推理软件层,帮助企业以更低成本、更高效率部署大语言模型。随着Llama、等开源模型的崛起,市场对"便宜又好用"的推理基础设施需求暴增。

时间 融资轮次 金额 估值
2026年1月 Series E 3亿美元 50亿美元
2026年6月 Series F 15亿美元 110-130亿美元

二、推理成为AI的新战场

过去两年,AI行业的焦点集中在"训练"——谁的模型更大、更强、更智能。但进入2026年,风向正在转变。推理()——即让训练好的模型实际工作——正在成为新的兵家必争之地。

原因很简单:训练是一次性成本,推理是持续成本。当一个大语言模型被数十亿用户每天调用时,推理成本会迅速超过训练成本。OpenAI、等头部公司每年在推理上的支出已经占到总运营成本的60%以上。

对Baseten这类公司而言,这是一个巨大的结构性机会。它们不需要自己训练模型,而是帮别人更便宜、更快地"跑"模型。这种"卖铲子"的商业模式,在淘金热中往往是最稳赚不赔的。

推理成本结构示意(每百万token,2026年Q2)
┌─────────────────────────────────────────┐
│  闭源模型(-4级别)  $15-30          │
│  开源模型+云推理        $3-8            │
│  开源模型+自建推理      $1-3            │
│  开源模型+Baseten优化   $0.5-2          │
└─────────────────────────────────────────┘

三、Cognition AI:当AI写出了90%的自身代码

如果说Baseten代表的是"推理基础设施"赛道,那么Cognition AI代表的则是""赛道的最高热度。

2026年5月27日,Cognition AI——Devin(全球首个AI软件工程师)的开发商——宣布完成10亿美元融资,估值达到250亿美元。而就在七个月前,其估值还"只有"102亿美元。

最令人震惊的数据不是估值,而是运营层面的:Cognition超过90%的代码现在由Devin自己编写。这意味着一个AI编程工具公司,已经实现了"用自己造的产品来造自己"的递归式增长。

据彭博社报道,Cognition在2025年10月收购了编程工具Windsurf后,ARR(年化经常性收入)在九个月内翻了一倍多,从100万美元增长到7300万美元。

四、Modal Labs:推理赛道的第三极

Baseten并非唯一享受资本盛宴的推理公司。同期,另一家AI推理创业公司Modal Labs也传出正在洽谈约25亿美元估值的新融资。

Modal Labs的定位略有不同——它更偏向于"无服务器推理平台",开发者无需管理GPU集群,只需上传模型代码,Modal自动处理弹性扩缩容。这种"推理即服务"的模式对中小型AI团队尤其有吸引力。

三家公司的竞争格局可以概括为:

公司 最新估值 核心定位 目标客户
Baseten 130亿美元 开源模型推理优化层 企业级AI团队
Modal Labs 25亿美元 无服务器推理平台 中小型开发者
Cognition AI 250亿美元 AI编程 软件开发团队

五、开源模型崛起:推理需求的底层驱动力

推理基础设施的爆发,根本原因是开源大模型的崛起。

2024-2026年间,的Llama系列、Mistral、DeepSeek等开源模型在多个基准测试上逐步逼近甚至超越闭源模型。企业不再需要为GPT-4级别的能力支付高昂的费用——他们可以下载开源模型,在自己的基础设施上运行。

但"能跑"和"跑得好"是两回事。开源模型的推理优化需要深厚的工程技术:量化压缩、KV缓存优化、动态批处理、多卡并行策略……这些正是Baseten等公司的核心竞争力。

以DeepSeek-R1为例,这个中国团队开发的推理模型在发布后迅速成为开源社区的明星。但要在生产环境中以低成本、低延迟运行DeepSeek-R1,企业需要专业的推理优化——Baseten在这方面的技术积累使其成为首选合作伙伴。

资本与技术的融合

六、资本的疯狂与理性的回归

如此大规模的融资是否意味着泡沫?

支持者认为,AI推理是一个"赢家通吃"的市场。就像AWS定义了云计算时代,谁先建立起大规模、低成本的推理网络,谁就能在AI时代占据基础设施层的核心位置。

质疑者则指出,推理成本正在快速下降。每一代新芯片(从H100到B100到B200)都在大幅提升推理性能,同时价格也在下降。如果硬件进步的速度超过软件壁垒的建立速度,那么"推理优化"的价值可能会被快速稀释。

关键风险评估矩阵:
┌──────────────┬────────────────┬──────────────────┐
│   风险因素   │   发生概率     │   影响程度       │
├──────────────┼────────────────┼──────────────────┤
│ 硬件快速降价 │   高 (70%)     │   中等           │
│ 大厂自建推理 │   中 (50%)     │   高             │
│ 开源社区优化 │   高 (65%)     │   中等           │
│ 需求持续增长 │   极高 (90%)   │   正面高         │
└──────────────┴────────────────┴──────────────────┘

七、对创业者的启示

这场推理基础设施大战给创业者带来几个重要信号:

第一,"卖铲子"仍然是好生意。 不是每家公司都要做大模型,帮别人更好地使用大模型,同样是一个巨大的市场。

第二,开源生态创造了新的价值链。 开源模型的崛起并不意味着所有价值都流向了终端用户——中间层(推理优化、部署工具、监控系统)同样有巨大的商业机会。

第三,速度就是一切。 Baseten五个月估值翻2.6倍的故事告诉我们,在AI时代,窗口期极短。如果你找到了一个真实的市场需求,必须以最快的速度建立壁垒。

第四,关注中国市场。 DeepSeek等中国AI公司的崛起正在改变全球AI竞争格局,也为推理基础设施公司创造了新的市场机会。

八、展望:推理即新的云计算

回顾云计算的发展历程,AWS在2006年推出S3和EC2时,很少有人预见到它会成为一个年收入超过1000亿美元的业务。AI推理基础设施正在走一条类似的路径。

不同的是,AI推理的需求增长速度远快于当年的云计算。据行业估算,2026年全球AI推理市场的规模将达到300-400亿美元,到2030年可能突破2000亿美元。

Baseten、Modal Labs等公司能否成为"AI时代的AWS",还需要时间验证。但有一点是确定的:推理层将成为AI产业链中最关键的基础设施之一,而围绕它的竞争才刚刚开始。


数据来源:TechCrunch、华尔街日报、Bloomberg、Pymnts、The Next Web、Awesome 等公开报道,截至2026年6月21日。

评论