关注2025智博会|“AI计算开放架构联合实验室”建设在渝启动

  • 2025-09-07 04:43:31
  • 370

第1眼TV-华龙网讯(首席记者董进)9月5日,2025世界智能产业博览会在重庆开幕。9月5日,在2025世界智能产业博览会上,中科曙光共同发布了国内首个AI计算开放架构,并宣布依托国家先进计算产业创新中心启动“AI计算开放架构联合实验室”建设。

据中科曙光高级副总裁李斌介绍,AI计算开放架构,是面向大规模智能计算场景,以GPU为核心进行高效紧耦合系统设计的协同创新体系,旨在联动AI产业链企业,从“算、存、网、电、冷、管、软”单点突破走向集群创新,突破算力瓶颈,促进算力普惠。

基于AI计算开放架构设计的曙光AI超集群系统也同期发布。中科曙光总裁助理、智能计算产品事业部总经理杜夏威表示,曙光AI超集群系统拥有“超高性能、超高效率、超高可靠、全面开放”四大特征,可为万亿参数大模型训练推理、行业大模型微调、高通量推理、多模态大模型开发、AI4S等场景打造更大更高效算力底座。

曙光AI超集群单机柜支持96加速卡、百P级AI算力,最大可实现百万卡大规模扩展。通过“超级隧道”AI存储优化、软硬协同设计、智能调度大模型等技术创新,实现千卡集群大模型训推性能达到业界主流水平2.3倍,模型开发效率提升高达4倍,GPU算效增加55%,平均无故障时间(MTBF)提高2.1倍,平均故障修复时间(MTTR)降低47%等领先水平。而与专有封闭系统相比,曙光AI超集群可适配支持多品牌GPU加速卡,兼容CUDA等主流软件生态,为用户提供更多选择,并大幅降低硬件成本和软件开发适配成本,保护前期投资。

为促进行业生态创新,中科曙光还联合芯片、整机等多家知名企业宣布开放一批关键技术能力,覆盖部件级、系统层、基础设施层、软件层和数据集等五个层面,以减少重复造轮子,降低中小企业研发门槛。其中,中科曙光首批宣布开放AI存储优化能力、液冷基础设施设计规范、DeepAI基础软件栈等三项技术能力,助力合作伙伴、重点用户在AI应用存储性能加速、液冷超节点系统设计、GPU统一开发框架等方面获得高级别技术共享、深度定制优化与专业技术支持。

相比封闭生态,开放的产业生态系统更加复杂。针对跨厂商技术对齐难等问题,中科曙光携手20多家智算上下游企业,依托国家先进计算产业中心共同建设“AI计算开放架构联合实验室”,以推进产业链开放与协作,共建开放、普惠的中国智能计算产业生态。