首页
分类
java
python
脚本
docker
生活
数据库
我的瞬间
文章归档
枫夜求索阁
累计撰写
438
篇文章
累计创建
13
个分类
累计收到
1
条评论
导航
首页
分类
java
python
脚本
docker
生活
数据库
我的瞬间
文章归档
目录
分类
分类
从青铜到王者:30组魔法公式解锁DeepSeek隐藏潜能
2025-02-18 23:12
43
0
0
28.3℃
AI 学习系列
本书为你呈现30组精心设计的"魔法公式",助你从AI新手蜕变为DeepSeek驾驭高手。
从入门到精通:用Cherry-Studio玩转本地知识库,这个职场神器你值得拥有
2025-02-18 21:00
37
0
0
27.7℃
AI 学习系列
从入门到精通:用Cherry-Studio玩转本地知识库,这个职场神器你值得拥有
打破信息茧房!RAG技术如何让AI拥有“实时外挂大脑“?
2025-02-18 20:59
15
0
0
25.5℃
AI 学习系列
今天要聊一个让AI从"嘴炮王者"变身"学术裁缝"的黑科技——RAG(检索增强生成)。这货堪称人工智能界的"人形自走图书馆",专治模型胡编乱造的老毛病!
薅百度羊毛指南:白嫖Deepseek-R1的「满血版」正确姿势
2025-02-18 20:56
19
0
0
25.9℃
AI 学习系列
听说百度云千帆平台最近把Deepseek-R1模型当「赛博菩萨」供着,免费开放期间连算力费用都替你充功德? 与其在官网挤成沙丁鱼罐头,时不时就碰见“服务器繁忙”的报错,不如跟我玩转这套「白嫖经济学」。
用Ollama三分钟部署DeepSeek!零配置+小白友好,让你的电脑秒变AI神器
2025-02-18 20:53
21
0
0
26.1℃
AI 学习系列
如果你曾因配环境、装CUDA、解决依赖冲突而头秃——Ollama来了! 它像“AI模型的全自动管家”,一句命令拉取模型、零配置启动,甚至内置API,连你家的猫都能学会(夸张了,但真的简单)。
Spring容器的本质
2025-02-08 20:13
25
0
0
26.5℃
转载
文章详细讨论了Spring框架中IoC容器的核心机制,包括BeanFactory和ApplicationContext的实现。通过分析Spring源码,解释了依赖注入、工厂模式、单例模式等设计模式在Spring中的应用。
微调碾压RAG?大模型意图识别工程化实践
2025-02-08 09:24
13
0
0
25.3℃
转载
本文介绍了大模型意图识别能力在智能电视AI OS中的落地过程和思考。文章详细探讨了传统NLP算法的不足,并提出了基于大模型的解决方案,包括RAG和SFT方法。还讨论了意图识别在智能电视中的具体应用场景、挑战及优化策略。
漫谈DeepSeek及其背后的核心技术
2025-02-07 09:45
38
0
0
27.8℃
转载
文章介绍了DeepSeek公司的大模型技术,特别是其V3版本的核心技术。讨论了模型的架构、训练和推理成本以及创新的MLA注意力机制和无辅助损失负载均衡策略。还探讨了用于FP8训练的混合精度框架和多Token预测的训练目标,展示了DeepSeek在AI领域的创新和低成本优势。
提示词工程的十大认知误区
2025-02-05 11:18
14
0
0
25.4℃
转载
本文列举了提示词工程的十大认知误区,并分享了作者的见解。文章指出,提示词工程并非简单易学,需要深入理解设计模式和框架;它不能解决一切问题,效果受模型能力和编写水平限制;不同的场景和模型需要灵活调整提示词;复杂的提示词不一定效果好;示例数量要适中;提示词需根据需求不断调优;测试效果与线上表现可能不同;用户输入同样重要。掌握这些技巧有助于更好地利用大模型的潜力。
一文搞懂DeepSeek - DeepSeek“知识蒸馏”OpenAI?
2025-01-31 01:27
82
0
0
32.2℃
转载
DeepSeek是一家新兴的AI模型开发者,近期被OpenAI和Anthropic质疑利用其模型进行训练。文章详细解释了知识蒸馏的概念,并介绍了DeepSeek在模型架构与算法上的创新,包括混合专家架构(MoE)和多头潜在注意力机制(MLA)。这些技术旨在降低成本并提高效率。
上一页
下一页
1
2
3
4
5
6
7
…
44
弹