中国云厂商的第五战役,打响了

亿欧网   |   刘娟,编辑:刘欢
2026-05-22 15:19:08  分钟 12    阅读需  3495 字数 

阿里、字节、腾讯、华为、百度,都没有退路。

自2007年那声发令枪响,一晃,中国云计算已狂奔十九年。

倏忽岁月,云已漫天。

如今,第五次变局的号角,再次吹响。

19年来, 从硬件虚拟化、平台化、云原生,再到AI融合,不夸张的讲,云计算是中国互联网搭建全域统一算力底座、完成数字底层技术架构定型的核心根基。

同时,云计算也重塑了中国互联网数字资源的存在形态与价值流转底层逻辑,推动中国互联网从消费流量时代全面迈入产业数字化时代。

从成本节约到效率提升,从应用创新到业务赋能,在大模型如火如荼发展的今天,云计算的身份又完成了一次价值跃迁——走向价值创造。

从IaaS到PaaS,从XaaS到MaaS/AIaaS,在2026年中国云计算厂商集体又一次默契的找到了产业共识——Agent Infra成为核心战略定位。

Q2以来,云厂商“第五战役”的号角此起彼伏。

5月13日,百度集团创始人李彦宏提出DAA成为AI时代的度量衡,而非DAU。智能体作为第二代入口,其价值天花板远高于聊天机器人。同时他还提出了AI时代“自我进化”的三个层次,Agent的自进化是其中一个关键层面。

一周后,刚刚结束的2026阿里云峰会上,阿里云智能集团资深副总裁、公共云事业部总裁刘伟光更是直言“云基础设施是Agentic时代重要的技术基石。”只有全新的云基础设施才能满足Agent运行的稳定、安全、及时调度等多种需求。而其新发布的“千问云”,更被称为是“为Agent而生的全新服务方式。”

事实上,在接下来的6月份,腾讯云、火山引擎等云厂商也都按捺不住,腾讯云的 AI产业应用大会、火山引擎Force原动力大会举办在即。Agent成为AI另一个增长点,与之紧密相关的基础设施服务转型,成为新的“故事”。

从AI Infra到“Agent新基建”

过去三年,云计算的核心是AI Native Cloud,本质是“算力优化”,是围绕大模型训练、推理,提供高并发、大吞吐、低延迟的算力集群,核心指标是集群规模、算力密度、网络带宽。

但随着智能体向更多场景渗入,传统AI基建已无法适配Agent的原生需求,行业共识认为云必须从“服务模型”转向“服务智能体”。“算力利用率”不再是唯一的核心,“智能体任务成功率、执行效率、治理可控性”成为衡量因素。

亿欧在此次阿里云峰会上了解到,目前阿里云将其拆解为两层。一是AI native cloud,继续深耕模型训练、推理的算力支撑。二是agent native cloud,专为智能体的编排、运行、治理打造基础设施。

与之相对应的,百度此前是以Agent Infra为核心,提出“芯云模体”全栈架构,将MaaS升级为Token Factory,核心是让每一个Token都能高效转化为可执行的智能动作。

这场转向的本质,是云计算服务对象的根本变化:从“为人编写的软件”服务,转向“为自主决策、自动执行的智能体”服务。

传统云面向确定性任务,资源长期占用、负载平稳。而Agent任务具有短生命周期、无规律突发、动态依赖、任务级安全四大特征——一个智能体可能一秒发起任务、一秒销毁,也可能7×24小时持续运行,还需频繁调用数据库、浏览器、第三方工具,这要求云基建从“资源调度”转向“任务调度”。

百度创始人李彦宏在2026年Create大会上直言:“Token不一定代表终局,DAA(日活智能体数)才是AI时代的新度量衡”。过去行业比拼谁烧的Token多、谁的集群大,现在转向比拼谁能支撑更多智能体稳定干活、交付结果。

阿里云也提出类似判断:“我们第一次从规模化管理算力,进入规模化管理智力”。两大巨头的共识,宣告了云计算底层逻辑的彻底重构。

传统基建的“水土不服”

AI Infra的转向并非偶然,传统云计算架构,与Agent的原生需求存在根本性错配。因此,AI Infra的转向是智能体走向场景的必须需求。

一方面,“算力时代”传统资源调度“失效”。智能体工作负载与传统AI任务、互联网任务完全不同。其短生命周期,多数Agent任务耗时秒级至分钟级,用完即销毁;突发无规律,流量可能瞬间爆发万倍,也可能长期休眠。且状态依赖强,需持续记忆上下文、工具调用历史。多模态交互,频繁调用文本、图像、视频、数据库等多元工具。

传统云基于“长周期部署、平稳负载”设计,无法适配这种“脉冲式、状态化”负载。比如传统容器需分钟级启动,无法支撑Agent秒级启停。资源按实例长期计费,无法匹配Agent“短时高负载、长时休眠”的成本需求。阿里云调研发现,企业自建Agent平台时,仅容器成本一项就远超预期。

另一方面是成本与效率的矛盾。大模型推理成本高企,而Agent的多轮调用、上下文重复计算,进一步加剧成本压力。百度数据显示,传统MaaS服务中,约30%的Token用于重复计算,推理效率低下。阿里云也提到,KVCache命中率不足70%时,推理的内存瓶颈会导致效率暴跌。

同时,企业Agent落地面临“95%的任务是重复劳动,5%的核心决策”的现状,传统基建无法复用历史计算结果,导致“每一次调用都从头算”,成本居高不下。百度执行副总裁沈抖指出:“Agent时代,成本不是算力成本,而是Token效率成本”。

此外,安全治理也是绕不过的原因之一,智能体可自主访问企业核心数据、调用业务系统、执行操作,传统云的安全体系(账号权限、网络隔离)是“人用软件”的逻辑,无法适配Agent的身份认证、权限精细化、行为审计、数据泄露防护需求。

比如一个Agent误删数据库、泄露客户数据,传统安全体系无法追溯责任、实时拦截。此外,多Agent协作时,记忆共享、权限隔离、任务冲突等问题,传统治理工具完全空白。阿里云总结企业Agent落地六大核心挑战,安全与治理占其三,这也是多数企业“敢Demo、不敢量产”的核心原因。

智能体将重构产业,新基建是入场券。李彦宏此前在百度AI开发者大会上曾预测,未来全球DAA将超100亿,每个岗位、每个场景都将有多个Agent承接工作。阿里云判断,未来2-3年,Agent将迎来爆发式增长,企业工作流从“以人为中心”全面转向“以Agent为中心”。

普华永道数据显示,美国79%的企业已在业务中使用Agent,88%计划增加投入。Gartner预测,2028年33%的企业软件将原生集成Agent能力。面对确定性趋势,云厂商必须抢先布局Agent-Native基建,否则将失去下一轮产业竞争的入场券。

全栈重构,从芯片到产品的系统性革命

阿里云与百度的转向路径高度相似,基于“芯云模体”的AI全栈能力成为重要方向。

其中,最关键的硬件是芯片。智能体对芯片的需求是“高推理性能、低延迟、高并发、低成本”,传统GPU无法适配,两大巨头均发力自研芯片。

阿里云推出真武M800训推一体AI芯片,配套ICSwitch互联芯片,搭载于磐久AL128超节点服务器。据了解,该芯片专为Agent推理优化,支持800Gbps高速网络,单集群可支撑10万卡规模,万卡线性扩展效率超96%,重点解决Agent高并发推理、短时高负载的算力需求。

与之相对应的是,百度自研昆仑芯,已迭代至P800,持续交付万卡级集群,256卡天池超节点将于6月上市,推理效率提升50%。昆仑芯深度适配文心大模型,同时支持DeepSeek、GLM等主流模型,核心是提升Token生产效率,降低Agent调用成本。

除此之外,架构层、产品层以及整体的生态能力都将因为Agent进入更多场景和工作流而产生调整和变化。

值得注意的是,云厂商的Agent基建转向,不仅是技术变革,更是产业变革。

其一体现是“成本的下降”。尽管成本的下降还不是当下的直接结果。阿里云智能集团终端智能计算事业部总裁旭卿在介绍JVSClaw接受媒体采访时表示:“JVSClaw的上线带来了B端客户的一些需求,技术团队能从客户需求中抽象出来一些Agent Infra所需要的能力。因此即使当下‘亏本’做这件事情也是值得的。”

除了成本之外,安全治理可控成为一大优点。Agent身份认证、权限精细化、行为审计、数据隔离等能力,解决企业核心顾虑。阿里云Agent安全中心可追溯每一个Agent操作,百度AI安全护栏可实时拦截异常行为。

但是当Agent成为市场和行业捕捉到的下一个“爆点”,行业的竞争与“洗牌加速”趋势显化。云厂商从卖算力,转向卖“智力服务”——Agent编排、记忆管理、任务执行等将成为新的营收增长点。具备全栈能力的巨头(阿里、百度)抢占先机,中小云厂商若无法快速跟进,将被边缘化。垂直领域解决方案商将崛起,聚焦金融、制造、医疗等行业Agent场景。

云计算的Agent化转向,本质是技术、产业、资本的三重共振。李彦宏说:“未来比拼的不是算力,而是智力”。而阿里云认为:“Token要变成智能,智能要变成行动”。

这场变革才刚刚开始。阿里云的Agentic Cloud、百度的Agent Infra,只是起点,而非终点。未来,云厂商的核心竞争力,将不再是集群规模、算力密度,而是支撑海量智能体高效、安全、稳定运行的智力运营能力。

对企业而言,拥抱Agent时代,就是拥抱新的生产力。对云厂商而言,打赢Agent基建战争,才能抢占下一个十年的产业制高点。从算力到智力,云计算的下半场,才刚刚启幕。


网站编辑: 郭靖
0

全部评论

—— 没有更多评论了 ——
—— 没有更多评论了 ——