腾讯技术团队优化DeepEP通信框架 提升性能
5月7日晚间消息,串联谐振变原理腾讯技术团队对DeepSeek开源的DeepEP通信框架进行深度优化,在RoCE网络环境性能提升100%,IB网络环境提升30%。该优化方案受到DeepSeek公开致谢,电磁谐振疲劳试验机工作原理称之为“huge speedup”代码贡献。
自今年2月以来,DeepSeek展示了如何利用有限硬件资源实现接近万卡集群性能,并解决MoE架构大模型对NCCL依赖问题。但在RoCE网络中表现不佳。
腾讯星脉网络团队发现并解决了双端口网卡带宽和CPU控制面交互两大关键瓶颈,使得DeepEP在RoCE网络中性能翻倍,在IB网络中再提高30%效率。该技术已全面开源并应用于腾讯混元大模型等项目的训练推理,在高性能服务器构建的环境中展现出良好通用性。

- 上一篇:深度解析:云服务为何离不开底层硬件衬托
- 下一篇:电脑怎么测ping和丢包率
上一篇
上一篇:深度解析:云服务为何离不开底层硬件衬托
下一篇
发布评论