摩尔线程发布“花港”GPU新架构，万卡AI磨练与推理才能，剑指英伟达

115 | 2025-12-23 14:06

凤凰网科技讯 12月20日，摩尔线程在北京首届MUSA征战者大会（MDC2025）上公布了新一代全功能GPU架构“花港”，并展示了其万卡领域AI磨练集群及多项技艺证明。

这次发布的中枢本体涵盖架构升级、集群才能与推感性能等方面。新架构“花港”因循从FP4到FP64的全精度狡计，算力密度进步50%，能效杀青10倍进步。基于该架构，公司筹算推出专注于AI磨练与推理的“华山”芯片，以及面向图形渲染的“庐山”芯片。

在磨练集群方面，摩尔线程推出“夸娥”万卡智算集群，称其具备全精度通用狡计才能，磨练算力行使率在浩荡模子上达到60%，在混杂巨匠模子上达40%，磨练线性膨胀后果为95%。在推理侧，公司与硅基流动谐和，在DeepSeek R1 671B模子上杀青单卡Prefill隐约量跨越4000 tokens/s，Decode隐约量跨越1000 tokens/s。

软件生态方面，MUSA 5.0版块对编程模子、狡计库和编译器进行了优化，中枢狡计库muDNN的GEMM与FlashAttention后果跨越98%，通讯后果达97%。公司还筹算缓缓开源部分中枢组件，包括狡计加快库与系统处罚框架。

在图形领域，新架构集成硬件清朗跟踪加快引擎，并因循自研的AI生成式渲染技艺。摩尔线程还展示了在具身智能、AI for Science等前沿领域的布局，推出仿真磨练平台MTLambda以及基于“长江”SoC的AI算力本MTT AIBOOK。

此外，公司公布了面向下一代超大领域智算中心的MTTC256超节点架构联想，着眼于高密度硬件与能效优化。

这次大会，摩尔线程系统展示了从芯片架构、集群基础挨次到端侧缔造的全栈技艺布局，策划是为国内AI狡计生态的发展提供硬件与软件因循。因此行业东说念主士巨额合计，摩尔线程正全濒临标英伟达，提前发布架构，以便进步软件生态信心。