首页
分类
java
python
脚本
docker
生活
数据库
我的瞬间
文章归档
枫夜求索阁
累计撰写
438
篇文章
累计创建
13
个分类
累计收到
1
条评论
导航
首页
分类
java
python
脚本
docker
生活
数据库
我的瞬间
文章归档
目录
标签
DeepSeek开源周
DeepSeek开源的3FS:AI数据处理的“高铁”来了,但能飙多快?
2025-03-01 12:46
24
0
0
26.4℃
AI 学习系列
引言:当数据堵车遇上“高铁” 想象一下,你正在训练一个千亿参数的AI大模型,结果数据加载比蜗牛还慢,GPU算力只能干瞪眼——这就像开着法拉利却堵在早高峰的二环路上。DeepSeek开源的3FS文件系统,就是来解决这场“数据堵车”的。 它号称能让数据处理从“自行车升级到高铁”,6.6 TiB/s的吞吐
DeepSeek开源周第四弹!DeepSeek开源三剑客:训练效率的“时空魔术师”与“资源管家”全解析
2025-02-27 21:11
26
0
0
26.6℃
AI 学习系列
DeepSeek开源周!今天一口气开源3个重磅项目!
DeepSeek开源周第三弹!揭秘AI计算新神器DeepGEMM:300行代码如何吊打专家优化?
2025-02-26 22:45
23
0
0
26.3℃
AI 学习系列
DeepGEMM是DeepSeek团队在2025年开源周推出的“AI计算黑魔法”——一个专为**FP8低精度矩阵乘法(GEMM)**设计的轻量级库,专治NVIDIA Hopper架构GPU的“性能焦虑症”。
DeepSeek开源周第二弹!DeepEP:解锁混合专家模型的高效通信之钥
2025-02-25 19:07
19
0
0
25.9℃
AI 学习系列
随着AI模型规模持续膨胀,混合专家模型(MoE)凭借其灵活性成为研究热点。然而,分布式训练中的通信瓶颈和负载不均衡问题却成为制约其落地的“拦路虎”。今天,我们揭秘DeepEP——DeepSeek开源的专家并行通信库,如何为MoE模型训练和推理带来质的飞跃。
弹