首页
分类
java
python
脚本
docker
生活
数据库
我的瞬间
文章归档
枫夜求索阁
累计撰写
438
篇文章
累计创建
13
个分类
累计收到
1
条评论
导航
首页
分类
java
python
脚本
docker
生活
数据库
我的瞬间
文章归档
目录
分类
AI 学习系列
中国AI逆天操作!阿里32B小模型暴打671B巨兽,成本直降90%!
2025-03-06 12:56
4
0
0
24.4℃
AI 学习系列
320亿参数硬刚6700亿大模型,成本只要1/10!阿里刚刚发布的QwQ-32B,正在用一套'小快灵'拳法,把全球AI竞赛带进新次元
0元狂薅3000万Token!火山引擎新人福利大放送,手慢无!
2025-03-05 18:04
7
0
0
24.7℃
AI 学习系列
🔥重磅福利速递🔥 即日起,通过我的专属链接注册火山引擎,立享三重暴击福利! 1️⃣ 新人秒到账15元代金券,直接抵扣375万DeepSeek R1模型tokens,体验媲美GPT-4的国产大模型推理能力; 2️⃣ 邀请好友狂赚130元/人,每成功邀请1位好友,双方各得45元代金券,多邀多得上不封
DeepSeek开源的3FS:AI数据处理的“高铁”来了,但能飙多快?
2025-03-01 12:46
24
0
0
26.4℃
AI 学习系列
引言:当数据堵车遇上“高铁” 想象一下,你正在训练一个千亿参数的AI大模型,结果数据加载比蜗牛还慢,GPU算力只能干瞪眼——这就像开着法拉利却堵在早高峰的二环路上。DeepSeek开源的3FS文件系统,就是来解决这场“数据堵车”的。 它号称能让数据处理从“自行车升级到高铁”,6.6 TiB/s的吞吐
DeepSeek开源周第四弹!DeepSeek开源三剑客:训练效率的“时空魔术师”与“资源管家”全解析
2025-02-27 21:11
26
0
0
26.6℃
AI 学习系列
DeepSeek开源周!今天一口气开源3个重磅项目!
DeepSeek开源周第三弹!揭秘AI计算新神器DeepGEMM:300行代码如何吊打专家优化?
2025-02-26 22:45
23
0
0
26.3℃
AI 学习系列
DeepGEMM是DeepSeek团队在2025年开源周推出的“AI计算黑魔法”——一个专为**FP8低精度矩阵乘法(GEMM)**设计的轻量级库,专治NVIDIA Hopper架构GPU的“性能焦虑症”。
DeepSeek开源周第二弹!DeepEP:解锁混合专家模型的高效通信之钥
2025-02-25 19:07
19
0
0
25.9℃
AI 学习系列
随着AI模型规模持续膨胀,混合专家模型(MoE)凭借其灵活性成为研究热点。然而,分布式训练中的通信瓶颈和负载不均衡问题却成为制约其落地的“拦路虎”。今天,我们揭秘DeepEP——DeepSeek开源的专家并行通信库,如何为MoE模型训练和推理带来质的飞跃。
DeepSeek开源周首弹!FlashMLA如何榨干H800性能?——大模型推理的“涡轮增压器”来了
2025-02-24 16:21
32
0
0
27.2℃
AI 学习系列
2025年2月24日,DeepSeek在“开源周”首日抛出技术王炸——FlashMLA,专为英伟达Hopper架构GPU(如H800/H100)优化的高效MLA解码内核。短短数小时,GitHub Star突破4000,海外开发者直呼“这才是真OpenAI”。究竟是什么技术让全球AI圈如此疯狂?
清华大学五份DeepSeek手册重磅发布!免费资源+实战指南,普通人也能抓住AI红利
2025-02-23 22:13
655
0
0
89.5℃
AI 学习系列
在AI技术席卷全球的今天,清华大学团队近期推出的五份免费电子书,堪称“AI时代生存指南”。从基础入门到职场进阶,从科研辅助到风险规避,这五份手册覆盖了AI应用的方方面面,让普通人也能快速掌握与AI协作的能力。
AI时代打工人的"十倍暴击"生存指南:你的工位正在被GPT化!
2025-02-21 22:10
36
0
0
27.6℃
AI 学习系列
当ChatGPT开始撰写周报、Midjourney接管设计需求,职场人如何避免被AI浪潮淘汰?本文深度解析吴恩达提出的「10倍专业人士」理论,揭秘电商、医疗、营销等领域的AI增效实战案例。从「AI炼丹术」到「人机合体技」,教你用GPT化工作流实现生产力十倍暴增,打造不可替代的职场竞争优势。拒绝躺平,掌握与AI共舞的生存法则!
从青铜到王者:30组魔法公式解锁DeepSeek隐藏潜能
2025-02-18 23:12
43
0
0
28.3℃
AI 学习系列
本书为你呈现30组精心设计的"魔法公式",助你从AI新手蜕变为DeepSeek驾驭高手。
上一页
下一页
1
2
弹