华为云北方首批超节点AI智算中心开服
- 2025-07-17 09:33:21
- 430
和林格尔数据中心服务器装机能力超过300万台。
7月12日,华为云华北(和林格尔)数据中心正式开服,同时北方首个基于CloudMatrix384超节点的新一代昇腾AI云服务发布。
和林格尔新区作为绿色算力与人工智能产业发展的前沿阵地,国家“东数西算”工程八大枢纽十大数据中心集群之一,新区46个数据中心项目总算力规模达9.1万P,其中智能算力规模达8.8万P,数据中心“绿电”使用率已达80%以上。
据介绍,和林格尔是华为北方区域规模最大的基础设施,数据中心服务器装机能力超过300万台,是华为云北方首批超节点AI智算中心。该中心面向华北以至全国提供极致体验,凭借极低时延、稳定可靠的AI算力服务,加速助力政务、工业、汽车、金融、互联网等各行业智能升级。
和林格尔数据中心充分利用当地优势打造节能型数据中心,得益于年平均气温7℃,全年可实现近300天的完全自然冷却,并充分应用风冷+液冷+AI调优技术,实现高效散热与节能。
随着和林格尔数据中心点亮投运,华为云已实现了在内蒙古、贵阳、安徽三大AI算力核心枢纽网布局。每个核心枢纽都是百万台服务器规模,采用3AZ部署,液冷年均PUE低于1.1。
CloudMatrix384是一个AI超级节点,在实际部署中可以通过多个CloudMatrix384超级节点互联,构建更大规模的人工智能数据中心。CloudMatrix384 集成了384块昇腾910C NPU和192块鲲鹏CPU,每块NPU、CPU都通过UB网络互联,使得节点间的通信性能接近同一节点内部的水平。
CloudMatrix384中的每个计算节点集成了8个昇腾910C NPU、4个鲲鹏CPU以及 7 个板载UB交换芯片。这12个处理器(8个NPU和4个CPU)通过UB连接到板载交换芯片,在节点内部构建出一个单层的UB平面。每个NPU配置超过392GB/s的单向UB带宽,而每个鲲鹏CPU插槽可提供约160GB/s的单向UB带宽。板载的单个UB交换芯片为超级节点网络中的下一级交换层提供448GB/s的带宽容量。
在CPU复合体内部,4个鲲鹏CPU插槽通过全互连的NUMA拓扑结构相互连接,每个CPU都可以直接访问其他CPU所连接的DRAM。其中一块CPU上安装了Qingtian网卡,这是一个专用的数据处理单元(DPU)。这个DPU不仅仅提供了高速网络接口,还承担了一些重要的节点级资源管理功能。
华为给昇腾NPU开发了一个全面的软件生态系统CANN(Compute Architecture for Neural Networks)。CANN 作为一个中间件软件层,能够实现高级AI框架(如PyTorch和TensorFlow )与昇腾NPU的底层硬件接口间的高效集成。
CloudMatrix-Infer是为CloudMatrix384量身定制的LLM服务系统,为部署大规模MoE模型提供了最佳实践。CloudMatrix-Infer的架构设计遵循解耦与对等通信(peer-to-peer communication)两大核心原则,将LLM的推理流程拆分为可独立扩展的组件,同时充分利用 CloudMatrix384的高带宽互联能力实现高效的系统协作。
据华为中国地区部副总裁陈旻介绍,基于CloudMatrix384 超节点的新一代昇腾AI云服务,也收获了来自客户、伙伴和开发者的高度认可,进一步稳固市场地位。目前,中国移动集团CloudMatrix384 已落地内蒙古移动和林格尔数据中心;中国联通集团CloudMatrix384 落地呼和浩特智慧基地,双方均将其作为支撑智慧业务创新的关键基础设施。
截至目前,华为云全球算力布局已覆盖33个地理区域和96个可用区,并通过2800多个CDN节点,实现了国内30ms、海外50ms时延圈,构建起全球“存算一张网”。
*声明:本文系原作者创作。文章内容系其个人观点,我方转载仅为分享与讨论,不代表我方赞成或认同,如有异议,请联系后台。
想要获取半导体产业的前沿洞见、技术速递、趋势解析,关注我们!
- 上一篇:那尔那茜本科毕业后留学年
- 下一篇:全球爆火一娃难求