消息称华为即将发布AI推理领域突破性成果:降低对HBM依赖,提升中国大模型性能

IT之家 8 月 10 日消息,制作醋酸的原理据《科创板日报》报道,华为将于 8 月 12 日在 2025 金融 AI 推理应用落地与发展论坛上,发布 AI 推理领域的突破性技术成果。据透露,这项成果或能降低中国 AI 推理对 HBM(高带宽内存)技术的依赖,提升国内 AI 大模型推理性能,种子水分测定的原理和方法完善中国 AI 推理生态的关键部分。

IT之家注意到,华为在 AI 推理领域的技术突破已有先例。2025 年 3 月,北京大学联合华为发布了 DeepSeek 全栈开源推理方案,该方案基于北大自研 SCOW 算力平台系统和鹤思调度系统,整合了 DeepSeek、openEuler、MindSpore 与 vLLM / RAY 等社区开源组件,实现了华为昇腾上的 DeepSeek 高效推理。

在性能方面,华为昇腾已实现多项突破。例如 CloudMatrix 384 超节点部署 DeepSeek V3 / R1 时,在 50ms 时延约束下单卡 Decode 吞吐突破 1920 Tokens / s;Atlas 800I A2 推理服务器在 100ms 时延约束下单卡吞吐达到 808 Tokens / s。

科大讯飞与华为的合作也取得了显著成果,双方率先实现了国产算力上 MoE 模型的大规模跨节点专家并行集群推理,使推理吞吐提升 3.2 倍,端到端时延降低 50%。

avatar

新程序已上线 管理员

刚刚发布了:1篇 新内容
查阅文章

三月七日,沙湖道中遇雨。雨具先去,同行皆狼狈,余独不觉。已而遂晴,故作此词。莫听穿林打叶声,何妨吟啸且徐行。竹杖芒鞋轻胜马,谁怕?一蓑烟雨任平生。料峭春风吹酒醒,微冷,山头斜照却相迎。回首向来萧瑟处,归去,也无风雨也无晴。

发布评论

验证码
评论列表 (有 4 条评论)
222 2019-07-18 1# 回复
测试

QQ交谈

在线咨询:QQ交谈

工作时间:每天9:00 - 18:00
若无特殊,节假日休息

电话联系

400-800-000

工作时间:每天9:00 - 18:00
若无特殊,节假日休息

我的微信