世界论坛网 > 时事新闻 > 正文  
暴涨27倍 一群华人卖Token 年入22亿
www.wforum.com | 2026-05-28 19:17:55  铅笔道 | 0条评论 | 查看/发表评论

美国AI推理平台Fireworks AI正以150亿美元估值融资,不到两年估值暴涨约27倍。公司年化收入达3.15亿美元,日处理Token约15万亿,接近中国全社会AI调用量的15%。这家由华人团队创办的公司不训练大模型,而是帮企业运行开源模型、按Token收费,成为AI“卖水人”。

AI行业,又出现一家千亿公司。

5月27日,据彭博社报道,美国AI推理平台Fireworks AI正在洽谈新一轮融资,目标估值150亿美元(约1024亿元人民币)。

而7个月前,它的估值还是40亿美元。如果再往前看:2024年7月,它B轮估值仅5.52亿美元。也就是说,不到两年,Fireworks AI估值暴涨约27倍。

更猛的是收入。研究机构Sacra数据显示:2026年2月,Fireworks AI年化收入已经达到3.15亿美元(约22亿元人民币),同比增长416%,较2024年B轮时增长约3-4倍。

与此同时,它的平台每天处理约15万亿Token。

这个数字是什么概念?国家数据局此前披露:2025年12月,中国日均Token消耗量约100万亿。

也就是说,Fireworks AI一家公司的日Token处理量,已经接近中国全社会AI调用量的15%。而它成立才不到4年。

一帮华人,在AI行业卖Token

Fireworks AI成立于2022年,总部位于美国加州Redwood City。

公司共有7位联合创始人,其中3位是华人。CEO乔琳(Lin Qiao):复旦本科、硕士,UCSB博士,前Meta工程高级总监。

她曾主导PyTorch在数据中心、移动设备和AR/VR设备上的开发部署。

另外两位华人联合创始人:Benny Chen曾在Meta做到首席软件工程师;Chenyu Zhao则长期负责Google Cloud Vertex AI相关业务。

这家公司不训练大模型,也不直接做AI应用。它做的事情很简单:帮企业运行各种开源模型,然后按Token收费。

目前,其支持的模型包括DeepSeek、Kimi、MiniMax等多家开源或开放API模型。

开发者无需自己购买GPU、搭建推理集群或进行底层优化,即可通过兼容OpenAI格式的API直接调用。

而Fireworks AI则按调用量收费。AI应用跑得越猛,它赚得越多。目前,全球最火的AI编程工具之一Cursor,就是其客户。

据官方披露:Cursor在Fireworks AI平台上,已经实现1000 token/秒的生成速度。

钱从“训练”流向“调用”

过去两年,AI行业最烧钱的地方,是训练。

OpenAI、Google、Anthropic、xAI都在疯狂囤GPU,单轮大模型训练成本动辄数亿美元。

但现在,一个变化开始越来越明显:模型训练越来越像“一次性投入”,而推理调用开始变成“长期收费”。

算力结构已经彻底反转:2023年,全球AI算力中训练占2/3、推理仅1/3;到2026年,推理占比飙升至65%–70%,是训练算力的4.5倍。

在中国,这一趋势更极端 ——推理算力已是训练算力的8倍。英伟达黄仁勋甚至判断:未来推理规模将达到训练负载的十亿倍。

市场规模同样爆发:Lightspeed此前披露:过去3年,AI推理市场已经从0增长到超过50亿美元。

资本也开始疯狂涌入这一赛道。

除了Fireworks AI,Baseten最近被曝出正以110亿美元估值融资,Together AI估值达到75亿美元,Modal估值46.5亿美元,Fal估值45亿美元。

其中,Baseten在2026年1月刚完成一轮融资估值50亿美元,5个月后新一轮融资估值直接翻倍至110亿美元。

更夸张的是收入增速。

据The Information报道:Baseten年化收入已经从2026年初的2亿美元,增长到Q1末的6亿美元。3个月,增长200%。

这些公司有一个共同特点:它们都不直接做大模型,而是帮整个AI行业“跑模型”——做AI时代的“卖水人”,靠永续的Token调用收费,赚取长期、稳定的现金流。

NVIDIA等巨头进场投资

Fireworks AI背后的投资方越来越豪华。其股东包括Lightspeed、Index Ventures、红杉资本,以及NVIDIA和AMD。

原因很现实:AI应用爆发后,整个行业真正稀缺的东西开始变成GPU,而推理平台本质上是在帮助整个行业更高效率地使用GPU。

NVIDIA此前曾公开表示:基于Blackwell架构的新一代推理系统,已经将单Token成本降低约10倍。在部分大模型场景下,成本甚至可降至原来的1/35。

这意味着,DeepSeek、Llama 3、Kimi等开源模型,在推理成本上已接近甚至挑战GPT-4等闭源API,性价比拐点正式到来。

而谁能把Token成本压得更低,谁就更容易拿下AI应用公司。

目前,Fireworks AI估值对应约3.15亿美元ARR,市销率约47倍。放在2023年AI泡沫期,这个数字不算离谱。

横向对比同行:Together AI估值75亿美元、对应ARR约1.5亿美元,市销率约50倍;Baseten估值110亿美元、对应ARR约6亿美元,市销率约18倍。

放在2023年AI泡沫期,头部AI公司市销率普遍在80–150倍,这个数字不算离谱;在2026年,这种估值仍能成立,核心原因是AI调用量仍在爆炸式增长。

Fireworks AI的平台日Token处理量,已从2025年底的10万亿增长到2026年5月的15万亿,5个月增长50%。按此增速,2026年底有望突破25万亿 / 日,全年处理量将超7000万亿Token——相当于为全球AI应用提供了近1/5的推理算力支撑。

中国,何时出现千亿公司?

Fireworks AI最值得关注的,其实不只是150亿美元估值,而是“按Token收费”这件事已经真正形成商业规模。

过去很多人认为推理平台只是技术服务,但现在3.15亿美元年化收入、416%增速、15万亿日Token处理量,这些数字已经说明:AI调用本身,正在变成一门真正的大生意。

这也是为什么国内越来越多公司开始进入推理层,包括硅基流动、无问芯穹,以及越来越多AI Infra创业公司。仅2025–2026年,国内新增推理赛道创业项目就超过200家。

过去几年,AI行业拼的是谁能训练更大的模型。而现在,越来越多人开始盯上另一件事:谁能替整个AI行业,更低成本地“跑模型”。

(0)
当前新闻共有0条评论 分享到:
评论前需要先 登录 或者 注册
全部评论
暂无评论
查看更多
实用资讯
24小时新闻排行榜
确立“铁规矩” 中共中央军委发布26项措施
董军又悬了?!
中国“神秘库存”曝光,市场开始慌了
蔡奇密奏习 中南海收到死亡诊断书
被骂8年的国产“捞女”,已集体洗白
48小时新闻排行榜
确立“铁规矩” 中共中央军委发布26项措施
董军又悬了?!
中国“神秘库存”曝光,市场开始慌了
蔡奇密奏习 中南海收到死亡诊断书
被骂8年的国产“捞女”,已集体洗白
一个月两重大安全事故 三大员21大或提前出
异常!习接待巴铁总理 重要人物缺席
“你超越了最高领袖授予的权限” 伊朗议长
林志玲遭大陆抵制 综艺遭撤、新剧除名
突然,全线跳水!近9万人爆仓
热门专题
1中美对抗2以哈战争3乌克兰战争
4美国大选5李克强猝逝6新冠疫情
7香港局势8委内瑞拉9华为
10黑心疫苗11“低端人群”12美国税改
13红黄蓝幼儿园14中共19大15郭文贵
广告服务 | 联系我们 | 关于我们 | 网站导航 | 隐私保护
Jobs. Contact us. Privacy Policy. Copyright (C) 1998-2026. Wforum.COM. All Rights Reserved.