壁仞发布上市后首份年报，Token变硬通货，国产GPU厂商黄金窗口来了？|界面新闻

3月30日，壁仞科技（06082.HK）发布了其登陆港交所后的首份全年业绩公告。作为“港股国产GPU第一股”上市后的第一份财报，这份数据不仅呈现出单家企业商业化能力，也反映出全球AI算力需求的结构性变化。

财报数据显示，2025年壁仞科技实现营业收入10.35亿元人民币，同比增长207.2%。同期，公司毛利达到5.57亿元，同比增幅为210.8%，毛利率稳定在53.8%。

在研发端，壁仞科技持续保持高压投入，全年研发开支达14.76亿元，同比增长78.5%。经调整年内亏损约为8.74亿元，收入的大幅增长开始有效摊薄前期的庞大研发投入，经营杠杆效应初步显现。

截至2025年底，公司持有的现金及金融资产共28.96亿元，结合2026年初IPO净额56.31亿元，总资金储备超过85亿元，为后续的产能扩张与技术迭代构筑了资金壁垒。

这份成绩单之外，壁仞的业绩增长正值全球AI算力需求正经历从“训练”向“推理”转移的关键节点，当行业竞争焦点从单卡算力转向系统级全栈效率，率先完成“芯片+系统+生态”闭环的国产算力企业，已跨越技术验证期，正式步入商业化兑现的黄金窗口。

算力的重构：推理时代，Token为王

进入2026年，全球AI产业的底层逻辑正在经历一场结构性重塑。最显著的特征是，整个行业正从“训练主导”向“训推并重”的关键转型。

在3月中旬的英伟达GTC 2026大会上，英伟达创始人兼首席执行官黄仁勋明确指出，代理式（Agent）AI的拐点已经到来。

Token也变成了一种硬通货。

黄仁勋提出了“Token经济学”的概念，认为未来的数据中心不再是存储文件的电子仓库，而是不间断生产Token的巨型工厂。在固定的功率下，谁的每瓦Token吞吐量最高，生产成本就最低。

随着模型变大，Token的生成速率会降低，因此在这个Token工厂里，吞吐量和Token生成速度将直接转化为企业明年的精确收入。

黄仁勋预测，受推理端需求爆发的驱动，到2027年全球AI基础设施的市场规模将达到1万亿美元。

实际上，推理时代的核心特征，就是Token消耗量的指数级膨胀。随着Agent的加速渗透，模型不再仅仅是进行简单的单轮对话，而是需要自主规划、调用外部工具、访问数据库并执行多步复杂任务。单次Agent调用往往会触发数十次模型推理，使得后台的算力消耗呈几何级数上升。

这种从“人类调度模型”向“模型自主运行”的范式转移，构成了推理算力需求陡增的底层逻辑。

3月30日，全球最大AI模型API聚合平台OpenRouter数据显示，上周（指3月23日至29日）全球模型调用量排名榜中，国产大模型调用量连续一个月超过海外模型。

上周模型调用前九名中，国产模型占六席，总调用量为9.82T，较此前一周的7.359T增长33.4%。小米MiMo V2 Pro、阶跃星辰Step 3.5 Flash、MiniMax M2.5以及DeepSeek V3.2等国产大模型全面霸榜，海外模型上榜企业仍旧只有Anthropic与Google，总调用量为2.99T，较此前一周的3.536T降低15.4%。

这一庞大的调用量不仅是技术落地的体现，更是国内应用层生态繁荣的直接反映，意味着海量推理请求正在倒逼底层算力基础设施的快速扩容。

在这种结构性变化中，下游客户对算力的核心诉求发生了质的改变。在过去，市场不计成本地追求高精度浮点运算的单卡峰值算力；在如今的推理时代，核心考量指标转变为系统级全栈效率、能效比与长期运行的稳定性。

壁仞2025年的业绩爆发，正是建立在精准卡位这一需求重构的基础之上。

报告期内，壁仞完成了旗舰通用GPU产品BR106及BR166的全形态量产与规模交付。其中，BR166系列于2025年8月开始量产，在不到半年的销售周期内迅速落地。

同时，其也在2025年实现了多个千卡级智算集群的交付，包括2048卡光互连光交换GPU超节点集群和多个市场化的数千卡级智算集群，而且进一步拓展了高质量的客户群体。

旗舰通用GPU产品的规模化量产及交付、多个千卡智算集群的交付以及高质量客户群体的拓展等，直接驱动了公司智能计算解决方案收入高达205.1%的同比增长，达到10.27亿元。

算力通胀下的本土替代窗口

Token需求的爆发式增长，正向产业链上游传导，引发了全球范围内的算力通胀。

今年2月，国金证券发布的研报中预判，在供需双侧强逻辑的挤压下，2026年算力产业链将进入“全链通胀”周期。行业景气度将从核心芯片向AIDC、云与算力服务、配套电力设备及服务器等环节全面外溢。

这种通胀首先体现在云端算力服务的全面涨价。

2026年第一季度，全球头部云厂商相继启动价格调整策略。亚马逊云科技（AWS）将其EC2机器学习容量块（Capacity Blocks for ML）的价格上调了约15%。谷歌云也宣布自2026年5月1日起，对AI与计算基础设施服务、Cloud等进行全面提价，部分区域的数据传输价格涨幅甚至高达60%至100%。

在国内市场，多家服务商也对特定高耗能套餐进行了幅度超过30%的价格上调。

在硬件核心端，自25Q4起，部分CPU大厂已步入涨价周期。据国金证券研报援引外媒消息，英特尔与AMD等厂商已正式通知客户全面上调服务器CPU价格，平均涨幅达到10%至15%，且交货周期大幅拉长。

云服务与底层硬件提价的根本驱动力，在于高端AI芯片供应链的持续极度紧张。在SEMICON China 2026上，SEMI中国区总裁冯莉预测，2026年全球AI基础设施支出将达到4500亿美元，其中推理算力的占比将首次超过70%，由此将拉动对GPU、HBM及高速网络芯片的强劲需求。

然而，供给端的产能扩张却难以跟上需求的步伐。以HBM为例，2026年HBM市场规模预计增长58%至546亿美元，尽管三星、SK海力士及美光三大原厂已将70%的新增/可调配产能倾斜至HBM，但全球HBM产能缺口依然高达50%至60%。

先进封装与高端显存的物理产能瓶颈，使得全球高端算力呈现出长期的结构性短缺。

在这一大背景下，具备本土化交付能力与供应链韧性的国产算力企业，迎来了历史性的替代窗口期。当海外高端算力获取成本急剧上升且存在供应链不确定性时，国内大模型及智算中心等客户开始将目光大规模转向已经跨过“好用”拐点的国产算力底座。

壁仞科技在供应链的前瞻性布局，也成为了其承接这一波替代红利的护城河。

财报显示，截至2025年末，壁仞科技的存货余额达到9.49亿元，较上年同期的1.52亿元增长520.4%，以应对下游旺盛的需求并确保供应链韧性。

在半导体行业普遍面临产能争夺的当下，近10亿元的存货储备是企业通过战略合作与多元化布局锁定关键产能的直接体现。这种供应链的韧性，为下游客户持续、规模化的算力需求提供了强劲的交付确定性保障。

与此同时，充裕的资金流也为国产算力企业在通胀周期中的规模化扩张提供了底气。壁仞科技超过85亿元的资金储备，不仅支撑了其庞大的日常研发开支，也为维持技术迭代速度与抢占市场份额形成了核心资本壁垒。

这种在资金与供应链上的双重保障，是在算力通胀窗口期不可或缺的先决条件。

闭环加速商业变现

然而，在算力通胀的抢位战中，充足的产能与存货仅仅是拿到了入场券。

在AI应用步入推理阶段、Agent处理海量数据时，单卡算力已无法决定全局。相反，集群互连带宽、节点通信效率与底层软件栈的成熟度，决定了算力系统的整体输出效能。

算力竞争，已从早期的单点性能比拼转变为系统级工程能力的较量。面对数千乃至上万张计算卡组成的智算集群，如何解决数据在智能体流程协调中的传输瓶颈，是所有算力厂商面临的严峻挑战。

在这一系统级工程领域，壁仞科技2025年的交付数据提供了技术验证。

报告期内，壁仞科技交付了多个大规模智算集群项目，包括2048卡光互连光交换GPU超节点集群和多个市场化的数千卡级智算集群。该集群采用了公司与生态伙伴联合发布的“光跃 LightSphere X”超节点方案，基于光互连与分布式光交换（dOCS）技术，从物理底层大幅降低了通信延迟并提升了互联带宽。

更为关键的是，在实际的高强度商业部署中，壁仞科技交付的千卡集群实现了30天无故障运行，且线性加速比超过95%，这一系列硬核指标，验证了其在支撑大规模并行计算时的高可用性与系统稳定性。

根据财报，其客户群体已覆盖国家级算力平台、电信运营商、商业AIDC、AI/大模型公司及垂直领域企业客户。

硬件架构与集群互连之外，软件生态与模型适配效率同样是算力商业化的核心壁垒。

软件生态建设上，壁仞科技不断优化对Pytorch、vLLM、SGLang等开源框架和Triton、TileLang等开源生态的支持，降低客户迁移成本。同时，持续推动软件开源战略，构建自有软件栈BIRENSUPA™更加广泛的生态。

目前，壁仞已全面支持DeepSeek V3/R1系列、MiniMax M2系列、智谱GLM系列以及阿里千问Qwen、阶跃星辰Step系列、腾讯混元系列等头部大模型，并在多个顶尖模型上实现了发布当天的“Day 0”级别全栈适配。

壁仞还与大模型企业、国家级智算服务企业达成战略合作，组建“国产AI联合实验室”，通过“芯-模-云”一体化的协同创新，共同攻坚降低AI应用单位Token成本的难题。

在这样一个算力基建加速向商业化兑现的窗口，壁仞也明确了下一阶段的技术演进路径。

根据财报，壁仞计划于2026年正式推出下一代BR20X芯片及全系列产品。该系列产品专为精准卡位推理时代的指数级算力增长需求而优化，不仅在算力密度、内存容量和带宽、以及互连能力全面升级，还将原生支持FP8与FP4等低精度计算，以期在性能与能效上实现双重突破。

在集群扩展性层面，BR20X系列将基于自研互连协议Blink 2.0推出超节点方案，最大可支持千卡规模集群的Scale-up，为应对未来更大规模的并行计算提前铺路。

此外，壁仞科技还将在先进封装、光互连等技术上持续投入，布局突破扩展性路径的关键路径。

从底层的自研芯片，到中层的超节点与光互连集群架构，再到上层的BIRENSUPA™软件栈等，壁仞科技“芯片+系统+生态”的三位一体商业模式已经完成严密的逻辑闭环。

叠加其在AI Agent/AI Coding、生成式AI、金融科技、智能制造、智能教育及智能政务等垂直领域的端到端场景交付能力，壁仞正以“算力底座”的姿态深度嵌入各类数字化转型的真实业务中。

当底层算力基建真正进入规模化的商业正循环，率先完成全栈闭环的国产算力企业，正成为托举国产AI产业发展的核心底座。

壁仞发布上市后首份年报，Token变硬通货，国产GPU厂商黄金窗口来了？|界面新闻

算力的重构：推理时代，Token为王

算力通胀下的本土替代窗口

闭环加速商业变现

三方面出拳！税务总局将加力纠治“开票经济”|界面新闻

IPO雷达｜低空经济红利下，酷芯微电子受困于对赌负债与行业竞争加剧|界面新闻 · 证券

发表评论取消回复

壁仞发布上市后首份年报，Token变硬通货，国产GPU厂商黄金窗口来了？|界面新闻

算力的重构：推理时代，Token为王

算力通胀下的本土替代窗口

闭环加速商业变现

三方面出拳！税务总局将加力纠治“开票经济”|界面新闻

IPO雷达｜低空经济红利下，酷芯微电子受困于对赌负债与行业竞争加剧|界面新闻 · 证券

相关文章

发表评论取消回复