首页
分类
java
python
脚本
docker
生活
数据库
我的瞬间
文章归档
枫夜求索阁
累计撰写
438
篇文章
累计创建
13
个分类
累计收到
1
条评论
导航
首页
分类
java
python
脚本
docker
生活
数据库
我的瞬间
文章归档
目录
分类
转载
Spring容器的本质
2025-02-08 20:13
25
0
0
26.5℃
转载
文章详细讨论了Spring框架中IoC容器的核心机制,包括BeanFactory和ApplicationContext的实现。通过分析Spring源码,解释了依赖注入、工厂模式、单例模式等设计模式在Spring中的应用。
微调碾压RAG?大模型意图识别工程化实践
2025-02-08 09:24
13
0
0
25.3℃
转载
本文介绍了大模型意图识别能力在智能电视AI OS中的落地过程和思考。文章详细探讨了传统NLP算法的不足,并提出了基于大模型的解决方案,包括RAG和SFT方法。还讨论了意图识别在智能电视中的具体应用场景、挑战及优化策略。
漫谈DeepSeek及其背后的核心技术
2025-02-07 09:45
38
0
0
27.8℃
转载
文章介绍了DeepSeek公司的大模型技术,特别是其V3版本的核心技术。讨论了模型的架构、训练和推理成本以及创新的MLA注意力机制和无辅助损失负载均衡策略。还探讨了用于FP8训练的混合精度框架和多Token预测的训练目标,展示了DeepSeek在AI领域的创新和低成本优势。
提示词工程的十大认知误区
2025-02-05 11:18
14
0
0
25.4℃
转载
本文列举了提示词工程的十大认知误区,并分享了作者的见解。文章指出,提示词工程并非简单易学,需要深入理解设计模式和框架;它不能解决一切问题,效果受模型能力和编写水平限制;不同的场景和模型需要灵活调整提示词;复杂的提示词不一定效果好;示例数量要适中;提示词需根据需求不断调优;测试效果与线上表现可能不同;用户输入同样重要。掌握这些技巧有助于更好地利用大模型的潜力。
一文搞懂DeepSeek - DeepSeek“知识蒸馏”OpenAI?
2025-01-31 01:27
82
0
0
32.2℃
转载
DeepSeek是一家新兴的AI模型开发者,近期被OpenAI和Anthropic质疑利用其模型进行训练。文章详细解释了知识蒸馏的概念,并介绍了DeepSeek在模型架构与算法上的创新,包括混合专家架构(MoE)和多头潜在注意力机制(MLA)。这些技术旨在降低成本并提高效率。
社区精选|每天想做的事很多,但下班一回到家就感到身心俱疲?
2025-01-24 19:33
10
0
0
25.0℃
转载
这篇文章通过作者的个人经历,探讨了下班后感到身心俱疲、缺乏动力的现象。文章分析了背后的原因,如大目标不聚焦和小目标不清晰等,并提出了具体的改善方法,包括设定明确的目标和找到个人的动力源泉。同时,还提供了一些实用的小技巧来帮助恢复体力。
技术人核心竞争力:超越代码的思考
2025-01-24 16:35
10
0
0
25.0℃
转载
文章探讨了在软件开发过程中,如何超越单纯的编码工作,通过理解需求、优化流程、强化协作和管理来提升产品质量和团队效率。强调了敬畏用户、关注个体贡献和合理评估工时的重要性。
文末新春福利丨视频 CDN 融合资源的调度策略探索落地
2025-01-24 14:50
15
0
0
25.5℃
转载
本文探讨了B站如何通过创新的CDN融合资源调度策略,解决直播带宽需求增长带来的挑战。文章详细介绍了成本调度层和资源调度层的设计理念及实施方法,包括不同计费方式的介绍、资源规划模型以及业务调度策略。通过分治思想和智能调度网关的应用,实现了在保障服务质量的同时,提高资源利用率和成本效益的目标。此外,文章还分享了该策略在实际直播场景中的落地效果,展示了显著的性能提升和新策略的优势。
终于有人说清楚AI开发的全流程了!
2025-01-24 09:26
17
0
0
25.7℃
转载
本文详细介绍了AI需求开发的全流程,包括需求分析、开发、测试及发布等阶段。文章重点讨论了如何通过AI OPS提升团队协作效率,优化模型选择和提示词设计,并利用链路分析和实时监控来提高系统性能和用户体验。
重磅发布的「AI视频通话」如何10分钟就实现?
2025-01-23 18:10
32
0
0
27.2℃
转载
本文介绍了如何通过OpenAI的GPT-4o模型快速实现AI视频通话。文章详细描述了创建实时音视频通信应用、创建AI智能体以及实际应用部署的步骤。通过这些技术,用户可以实现高质量的视听同步和自然交互体验。
上一页
下一页
1
2
3
4
5
6
7
…
41
弹