摩尔线程发布“花港”GPU新架构,万卡AI磨练与推理才能,剑指英伟达

 115    |      2025-12-23 14:06

凤凰网科技讯 12月20日,摩尔线程在北京首届MUSA征战者大会(MDC2025)上公布了新一代全功能GPU架构“花港”,并展示了其万卡领域AI磨练集群及多项技艺证明。

这次发布的中枢本体涵盖架构升级、集群才能与推感性能等方面。新架构“花港”因循从FP4到FP64的全精度狡计,算力密度进步50%,能效杀青10倍进步。基于该架构,公司筹算推出专注于AI磨练与推理的“华山”芯片,以及面向图形渲染的“庐山”芯片。

在磨练集群方面,摩尔线程推出“夸娥”万卡智算集群,称其具备全精度通用狡计才能,磨练算力行使率在浩荡模子上达到60%,在混杂巨匠模子上达40%,磨练线性膨胀后果为95%。在推理侧,公司与硅基流动谐和,在DeepSeek R1 671B模子上杀青单卡Prefill隐约量跨越4000 tokens/s,Decode隐约量跨越1000 tokens/s。

软件生态方面,MUSA 5.0版块对编程模子、狡计库和编译器进行了优化,中枢狡计库muDNN的GEMM与FlashAttention后果跨越98%,通讯后果达97%。公司还筹算缓缓开源部分中枢组件,包括狡计加快库与系统处罚框架。

在图形领域,新架构集成硬件清朗跟踪加快引擎,并因循自研的AI生成式渲染技艺。摩尔线程还展示了在具身智能、AI for Science等前沿领域的布局,推出仿真磨练平台MTLambda以及基于“长江”SoC的AI算力本MTT AIBOOK。

此外,公司公布了面向下一代超大领域智算中心的MTTC256超节点架构联想,着眼于高密度硬件与能效优化。

这次大会,摩尔线程系统展示了从芯片架构、集群基础挨次到端侧缔造的全栈技艺布局,策划是为国内AI狡计生态的发展提供硬件与软件因循。 因此行业东说念主士巨额合计,摩尔线程正全濒临标英伟达,提前发布架构,以便进步软件生态信心。