一、算力的极致增速与代价
英伟达于本月发布了4季度业绩:收入同比增长73%至681亿,增速从2季度的55%触底后,已经连续两个季度在提速。净利率也从过去平均的55%提升至63%,净利润增速高达94.5%。按照26年一季度的业绩指引,结合英伟达财报的惯例,大概率26年Q1的收入同比增速会再度加速至80%以上。这是一家4万亿美元全球最大市值企业的“大象狂奔”。
英伟达在用快速迭代且持续领先的软硬件生态,加速着整个AI行业的发展。当下最先进的GB300 NVL72机柜,其单位成本能生产的Token数比上一代H200系统高出了整整35倍,而单位能耗下生产的Token数更是比H200系统高出了50倍。正是新一代Blackwell芯片的交付部署,模型的能力在25年底才普遍有了实质性的飞跃。
这种高速的增长,除了公司近乎疯狂的产品代际升级速度外,还来源于对上游产业链和下游客户资金的极致压榨。这两年,从上游的先进封装、光模块、存储,到配套的小型核电站、储能电池、燃气发电轮机,再到各种大宗商品,都被这股增速拉扯着往前走。激进的产业环节像PCB、光模块都在积极地配合扩产。而经历过一轮轮周期的HBM存储巨头,则在用提价和“产能置换”的方式,收割这种强劲需求,不太愿意增加产能投资。这逼着英伟达用“承诺采购”和“股权投资”的方式,去推动上游产业链的扩产,同时锁住市场份额,形成了强劲的排他竞争力。其财报披露的“采购义务”金额,2023年为161亿美元,2024年增至308亿美元(同比增91.3%),2025年更是飙升至952亿美元(同比增209.1%),两年扩张近6倍,且速度不断加快。这便加剧了市场的担忧情绪,担心原属于上游的“周期性”风险,转移到了英伟达,在AI需求降温后会形成库存和折价,使其估值承压(也带来了上游企业估值的提升)。
另一方面,下游客户在这种极致增长背后,在疯狂燃烧着他们的自由现金流。刚刚过去的2025年,亚马逊、Meta、谷歌和微软这四大互联网企业,总资本开支高达3725亿美元,而其经营活动产生的现金流总额为5805亿美元,挣的钱大部分(64%)被用于支持AI事业的发展。但2026年,这四大企业的总资本开支预告为6500亿美元,同比高速增长74%,但凡2026年这四家企业的经营现金流增速低于12%,投资的现金流就面临枯竭和短缺。好在25年四家企业的总经营现金流增长了27%,如果经营现金流增速得以延续,甚至在AI投资下能加速增长,资金短缺的状况会有所缓解。所以巨头们都在纷纷下场发行债券和私募信贷,以及通过场外经营租赁来转移资金的压力。于是,市场担心下游客户资金无以为继的压力,会逐渐成为英伟达增长放缓的源头之一。
二、时代的核心矛盾在于“需求”
这两个与极致增长并存的风险,把英伟达26年动态的PE估值压缩到了20倍以内(过去历史均值在30倍以上)。未来极致的高增长一定会放缓,上下游的资源约束问题也必然存在,但核心矛盾不在这里。历次伟大的技术周期中,资金紧绷和资源物理约束往往只是“发展中的摩擦力”。核心矛盾在于,未来几年,AI能力能否持续不断进步,AI Token的成本能否持续不断地下降,AI应用能否赋能每个行业和个体,以及AI所创造的价值是否远大于当前产值。这些都是AI发展的需求层面的问题。英伟达的极致创新速度,这一供给侧的驱动力,只是这个核心需求矛盾的催化剂之一而已。
我们在过往的几期观点中,描绘过当前及今年AI的能力进化、成本下降和应用普及所带来的需求喷发的图景。开年以来,这份图景也在迅速展开:在本月财报中,我们看到谷歌Q4云计算收入增速超过50%,Meta Q1广告收入增长超过34%,Anthropic的ARR收入从2025年初的10亿美元到本月的200亿美元疯狂飙升;在互联网上,我们也可以看到AI漫剧和短视频的病毒式生成,AI电影大制作箭在弦上,中国农历新年的春晚几乎成了AI和机器人的宣传片,Openclaw“龙虾养殖”人群在悄然扩张和破圈,模型的前沿能力进步和蒸馏降本几乎是每周一次的更新,而5年前的芯片A100的租赁价格还在不断上涨。这份AI需求图景才是核心矛盾的具象化,英伟达只是其中的加速器和受益者。
除此以外,AI需求的井喷,还有另一个更直接的表现,就是各个产业环节都在出现“供不应求”:各种AI原生应用因算力不足而限制账号的使用量;微软的Azure云因算力投资不足,收入增速持平,而拖累股价;谷歌的TPU因代工产能受限而拒绝了苹果等的订单需求;存储芯片因供不应求而每个季度环比不停涨价;数据中心因发电硬件供应延迟,GPU被迫在仓库中“等电”;AI用尽了互联网数据后,演化出为强化学习提供“数据饲料”的专业分工;以及头部公司为争抢稀缺的头部人才,开出了天价相互挖角,团队收购也成为绕过反垄断的一种主流玩法。
接下来,随着视频技术的广泛应用,以及“龙虾模式”的Agent框架易用性的提升和在消费侧的普及,还会有许多环节出现供不应求和高增长的情况。比如其中一个重点领域和方向,可能会发生在快要被人遗忘的CPU上。
三、CPU逻辑算力也可能“供不应求”
在早期的AI聊天应用中,模型工作的本质是“直觉预测”,根据模型参数去预测问题答案里的下一个Token。这涉及海量的矩阵乘加运算,是GPU的主战场。CPU主要发挥的功能,包括数据的预处理(例如文字的“Token化”、数据检索、图像的裁剪预处理等),为模型在GPU上的并行计算做任务编排管理,在实际Decoding阶段给GPU精准投喂数据,最后在GPU给出概率分布后选出具体token并输出文字。GPU负责了大量重复的“简单加法乘法运算”,而CPU则辅助完成数量有限但复杂的逻辑判断任务。为了克服CPU投喂数据时的带宽和内存问题,英伟达引入了Grace CPU配合NVLink-C2C片间互联技术,以替代通用的X86 CPU和PCIe互联技术。
2025年,AI进入了“推理任务”聊天时代,模型不再只是进行脱口而出的直觉“快思考”,而是引入了逻辑搜索的慢思考——增加了方案规划、多路线探索、反思纠错等迭代思考循环。在这种模式下,CPU的职能也发生了质的飞跃,新增了搜索树(Search Tree)的规划和维护、对思考的中间结果进行逻辑验证和反思、在思考路径走不通时对新的路径决策进行精准控制等复杂逻辑任务。因为逻辑推理任务的引入,CPU的工作量因此又提升了1—2个数量级。
2026年,AI全面进入“Agent时代”。模型不再只是聊天,而是拥有长期记忆,能够使用工具,懂得与不同模型合作,通过累积经验独立完成多步骤的任务,走向真正的工程智能。在Agent时代,CPU不再只是默默给GPU喂数据的“搬运工”,而是重新找回了作为Agent操作系统“总线管家”与“神经中枢”的核心地位。在统一内存架构等技术的加持下,CPU与作为“认知大脑”的GPU形成深度协同的“双核共治”,而非谁取代谁。
在Agent智能体的定义中,最核心的跃升是“与环境产生真实互动”。AI不止步于让模型生成一段话、一张图片或一个指令,而是要使用工具干预环境,并根据反馈不断修正动作,以对任务状态进行有效改造。举个通俗的例子,自动驾驶模型根据当前路口视频,输出了右转方向和起步加速的指令,但重要的是要通过操控汽车右转行驶,与来往车辆和路口行人互动,反复修改指令,最终完成“右转”的状态变更,才算完成一个子任务。因此,Agent 的工作流可以被抽象为“智能计算(意图推理)”与“环境计算(系统调度与执行)”的动态闭环。其中,GPU主导高并发的“智能计算”,而以CPU为核心(协同DPU/NPU)的异构阵列则全面接管庞杂的“环境计算”,其工程底座的不可替代性被大幅放大。
CPU主导的环境计算,具体包括以下几类核心工作流:
1)沙盒环境模拟与安全隔离:Agent 的动作绝不会直接在宿主机上“裸奔”,而是利用虚拟化技术,动态圈出一块隔离的安全、独立、用完即焚的“实验室”,在其中拉起进程、分配内存、挂载文件系统、配置网络与权限管控。这种对系统底层硬件虚拟化、容器化等技术的应用,正是 CPU 复杂指令集的绝对强项。
2)调用工具落地系统动作:当 GPU 端的大模型输出“买入某只股票”或“查询历史订单”的决策意图时,这往往只是一串Token的语义信号。CPU 需要将这个信号解析并转化为真实的系统级调用——建立数据库连接、运行 Python 脚本、调用外部 API、驱动浏览器界面以及处理接口鉴权与网络容错。这些充满分支预测和逻辑判断的任务,依然是 CPU 的主场。
3)多Agent协作的通信总线:当一个“经理 Agent”调度多个“专家 Agent”时,模型(GPU)负责处理它们之间的专业探讨、观点争论与逻辑共识,而 CPU 则是这个协作网络的物理基础设施。它负责维护不同 Agent 进程的生命周期,分配与监控 Token 预算配额,处理复杂的异步消息队列和内存上下文路由,确保协作状态机运转流畅、防止死锁或系统崩溃。
4)逻辑环境验证:Agent执行动作后,环境必须给出反馈与打分。在软件与逻辑工程领域,这种闭环高度依赖CPU——例如,在AI编程过程中,AI代码生成使产出速度提升10-100倍,生成代码需大量CPU资源来做CI检测(试运行检测),代码量指数级增长会导致CPU算力危机。同时,AI生成代码的问题率是人类的1.7倍,形成“测试-修复-测试”恶性循环,CI运行次数暴增超10倍。过去CI系统多闲置,现在需24小时不间断运行。
以上的投资判断,在1月的市场中被广为流传,我们认为从定性的角度讲得通。CPU的产业地位在不断提升:3月份英伟达GTC大会上,以Vera CPU为核心的异构计算可能会成为大会非常重要的主题。2026年,ARM也在逐步打破专利授权的单一业务模式,亲自下场做CPU,并锁定了Meta等互联网巨头客户。3月即将发布的Deepseek V4,也被预期将采用Engram的新算法,将“背诵知识”和“逻辑思考”的任务进行分离,让CPU负责更多模型的主流工作。
四、局部战争改变不了时代轨迹
AI时代的主要矛盾非常清晰——产业链不断冒头的“供不应求”局势,都在显示着对AI部署强劲的需求。而此刻正在发生的许多宏观的阶段性事件,如伊朗战争,特别吸引眼球,左右着市场情绪;但于投资而言,都是次要矛盾,这些事件可以造成短期中小幅度的波动,但改变不了年内市场的大趋势。
我们不认为伊朗战事对全球经济的影响,能比肩2022年。彼时俄乌战事发生在全球两大核军事集团——北约与俄罗斯之间,影响更大;更重要的是当年疫情给全球生产和贸易都造成了阻断,导致大宗商品和许多贸易商品的无差别涨价,最终酿成了全球通胀,带来了美联储的加息和美股超过30%的指数下跌。而当下美以伊不对等的军事实力,石油对于PPI与CPI的影响力,美联储的降息周期,以及AI带来的生产效率的飞速提升,在此环境里,出现高通胀与加息的概率很低。
无论战争最终以何种形式收场,从过往百年美股的历史来看,我们明白市场走势的主导力量会很快会从战争的焦点中退出,回到生产力的最终决定因素上。
风险提示及免责声明:市场有风险,投资需谨慎。在任何情况下,文章中的资讯仅供读者参考之用,文中提到的公司亦仅为阐述产业逻辑,所有内容均不带任何投资建议,读者不应单纯依靠本文而取代个人的独立判断。对于因使用、引用、参考本文内容而导致的投资损失、风险及纠纷的,东方港湾不负任何责任。