腾讯技术团队优化DeepEP通信框架 提升性能

5月7日晚间消息,串联谐振变原理腾讯技术团队对DeepSeek开源的DeepEP通信框架进行深度优化,在RoCE网络环境性能提升100%,IB网络环境提升30%。该优化方案受到DeepSeek公开致谢,电磁谐振疲劳试验机工作原理称之为“huge speedup”代码贡献。

自今年2月以来,DeepSeek展示了如何利用有限硬件资源实现接近万卡集群性能,并解决MoE架构大模型对NCCL依赖问题。但在RoCE网络中表现不佳。

腾讯星脉网络团队发现并解决了双端口网卡带宽和CPU控制面交互两大关键瓶颈,使得DeepEP在RoCE网络中性能翻倍,在IB网络中再提高30%效率。该技术已全面开源并应用于腾讯混元大模型等项目的训练推理,在高性能服务器构建的环境中展现出良好通用性。

avatar

新程序已上线 管理员

刚刚发布了:1篇 新内容
查阅文章

三月七日,沙湖道中遇雨。雨具先去,同行皆狼狈,余独不觉。已而遂晴,故作此词。莫听穿林打叶声,何妨吟啸且徐行。竹杖芒鞋轻胜马,谁怕?一蓑烟雨任平生。料峭春风吹酒醒,微冷,山头斜照却相迎。回首向来萧瑟处,归去,也无风雨也无晴。

发布评论

验证码
评论列表 (有 4 条评论)
222 2019-07-18 1# 回复
测试

QQ交谈

在线咨询:QQ交谈

工作时间:每天9:00 - 18:00
若无特殊,节假日休息

电话联系

400-800-000

工作时间:每天9:00 - 18:00
若无特殊,节假日休息

我的微信