腾讯优化DeepSeek的DeepEP通信框架:开启AI大模型训练新时代


腾讯星脉网络团队优化了DeepSeek的DeepEP通信框架,显著提升了AI大模型训练的效率。DeepEP是全球首个专为混合专家模型设计的开源通信库,解决了MoE架构对NCCL的依赖问题。腾讯通过智能化带宽分配、绕过CPU控制面及原子化信令协同等关键技术,使DeepEP在RoCE网络环境性能提升100%,IB网络环境提升30%。这一合作推动了技术创新,为企业提供了高效解决方案,并加速了AI应用的普及。

AI前沿每周关键词Top50(250324-250328)


本报告总结了2024年3月24日至28日AI领域的关键进展,涵盖算力、模型、应用、科技、观点、资本等多个维度。在算力方面,AMD的MI300X性能表现突出;模型领域,谷歌的Gemini 2.5 Pro、腾讯的混元T1、阿里的Qwen2.5-Omni等大模型持续迭代;应用层面,OpenAI、Anthropic等公司推出新功能,如语音模型、网络搜索等。科技领域涉及机器人、3D打印等创新,资本动态包括英伟达收购Lepton AI等。报告还收录了OpenAI、哈佛等机构的行业观点,探讨AI的未来发展方向与挑战。