通信:华为发布CLOUDMATRIX384超节点 革新算力集群
4 月10 日,华为云在安徽芜湖召开生态大会,推出CloudMatrix 384 超节点,并宣布已在芜湖数据中心规模上线。
事件评论
创新算力架构,推出最大规模超节点。基于“一切可池化、一切皆对等、一切可组合”的新型高速互联总线,华为云推出CloudMatrix 384 超节点,重构AI 基础设施,实现从服务器级到矩阵级的资源供给模式转变。384 节点集群突破传统服务器级算力上限,其高密高速特性不仅再次提高互联带宽,更实现内存带宽的跨越式突破。华为云致力于做好行业数字化的“云底座”和“使能器”,为百模千态提供"黑土地"支撑。昇腾云服务已适配160+第三方大模型,开放与兼容的设计为大模型训推提供可靠保障,支撑行业应用快速落地。
硅基流动创始人袁进辉在华为云生态大会上宣布,硅基流动联合华为云基于CloudMatrix384 超节点昇腾云服务和高性能推理框架 SiliconLLM ,用大规模专家并行最佳实践正式上线 DeepSeek-R1。该服务可以在保证单用户 20 TPS 水平前提下,单卡 Decode吞吐突破 1920 Tokens/s,可比肩 H100 部署性能。同时,经过主流测试集验证及大规模线上盲测,在昇腾算力部署 DeepSeek-R1 的模型精度与 DeepSeek 官方保持一致。
华为云CloudMatrix384 超节点今年上半年或有数万规模的上线,或将终结算力焦虑,CloudMatrix 超节点有望构建超过万片的大集群来提供算力。华为CloudMatrix 384 在规模、性能和可靠性上对标英伟达NVL72,基于CloudMatrix 的昇腾AI 云服务,大模型训练作业可稳定运行40 天,互联带宽断点恢复在10 秒级别。在互联带宽上,超节点网络交换机采用6812 个400G 光模块,实现2.8Tbps 卡间互联带宽。国产芯片与英伟达芯片在单卡性能方面仍存在一定的差距,但通过多卡集群后差距就会缩小。华为数据显示,CloudMatrix 384 实现算力规模达300 PFlops,相比NVL72 的180 PFlops 提升67%。
技术开放+生态共荣,打造AI 时代智能共同体。数字世界的话语权由生态的繁荣决定。华为云通过构建“技术底座+开发者生态+产业协同”三位一体的开放体系,加速了千行万业的智能化进程。当前其生态规模已突破1200 万开发者、4.5 万合作伙伴及1.2 万云商店应用,形成覆盖全产业链的数字生态网络。基于鲲鹏、昇腾、鸿蒙等根技术构建的统一开发者平台,为生态伙伴提供高效工具与技术支持。华为云与客户、伙伴及开发者携手共进、加速成长。协同硅基流动等拓展AI 原生场景,印证“技术赋能-商业共赢”生态价值。
华为发布CloudMatrix 384 超节点,国产算力产业链各环节均有望受益:AI 服务器及交换机,重点关注烽火通信,关注中兴通讯、紫光股份;“铜连接”高速线模组,重点关注华丰科技、沃尔核材;IDC 厂商,重点关注润泽科技,关注奥飞数据、数据港;光模块,重点关注光迅科技、中际旭创、新易盛、天孚通信,关注源杰科技;液冷温控设备,重点关注英维克,关注曙光数创、高澜股份、申菱环境;UPS 电源产品,重点关注科华数据。
风险提示
1、AI 大模型进展可能不及预期;
2、算力芯片供应可能不及预期。