大模型推理加速的研究与分析

转载 

本文探讨了大模型推理加速的技术,分析了大模型在实际应用中的计算开销和性能瓶颈。文章详细讨论了从算法、硬件到系统框架等多层次的优化策略,包括算子层、算法层和框架层的优化方法。通过具体案例分析,展示了MindIE-LLM框架在提升推理速度和效率方面的应用效果。

分布式架构知识体系

转载 

本文详细介绍了分布式架构的知识体系,包括基础理论、设计模式、工程应用和运维管理等多个方面。文章首先从问题引入,探讨了分布式与微服务的概念及其必要性,并深入讨论了节点、网络、时间和顺序等核心理论基础。接着,作者比较了不同一致性模型的优缺点,并分析了多种一致性算法。此外,文章还涵盖了场景分类、设计模式、工程应用及性能调优等内容,为读者提供了一套完整的分布式系统构建和优化的指导。

微服务常见限流方案及TSF限流原理

转载 

转载自: 微服务常见限流方案及TSF限流原理 👉目录 1 限流前考虑什么 2 如何进行限流 3 关于 TSF 的限流 在微服务高并发的一些场景下,微服务之间的调用量不断增加,大流量因素很可能会引起服务雪崩,微服务的稳定性对业务系统的影响也比较大。一般微服务容错组件都提供了限流的方式来保护我们的系统

网页疯狂自动刷新,发生了什么?业务:我传了一张两亿像素的图片而已

转载 

转载自: 网页疯狂自动刷新,发生了什么?业务:我传了一张两亿像素的图片而已 作者:杨鹏 一、背景 在一个普通的工作日,BUG反馈群突然发来一个视频。视频中显示,我们的H5应用在打开某个下发的资料时,加载图片的过程中陷入了不断刷新的死循环。这个问题直接影响了用户体验,也引发了我们的深入调查。 二、问题

“日志=数据库”?聊一聊日志背后的抽象

转载 

转载自: “日志=数据库”?聊一聊日志背后的抽象 阿里妹导读 本文从思考日志的本质开始,一览业界对日志使用的最佳实践,然后尝试给出分布式存储场景下对日志模块的需求抽象,最后是技术探索路上个人的一点点感悟。 一、前言 这年头,但凡是大佬总是要有一言两语的金句,否则就称不上大佬,技术圈亦如是。遥想 re

win11 系统打开 IE 浏览器及F12开发工具的两种方式(超简洁)

转载 

转载自: win11 系统打开 IE 浏览器及F12开发工具的两种方式(超简洁) 一、 在EDGE 中打开IE 模式 在EDGE 中打开设置,在右上角三个点,选择默认浏览器,勾选如下两个选项。 这个时候右边会出现IE 的标签,点击即可进入IE 模式。 如何打开F12开发者工具?

分库分表 带来了哪些问题?

转载 

转载自: 分库分表 带来了哪些问题? 八股文刷题网站: https://golangguide.top 分库分表是解决单库单表性能瓶颈的有效手段,但也会引入新的复杂性和技术挑战。 这篇文章跟大家一起聊聊,分库分表后带来的7个问题,以及相关的解决方案,希望对你会有所帮助。 1. 全局唯一 ID 问

模型Prompt调优的实用技巧与经验分享

转载 

转载自: 模型Prompt调优的实用技巧与经验分享 阿里妹导读 本文详细阐述了prompt的设计要素,包括引导语、上下文信息等,还介绍了多种prompt编写策略,如复杂规则拆分、关键信息冗余、使用分隔符等,旨在提高模型输出的质量和准确性。通过不断尝试、调整和优化,可逐步实现更优的prompt设计。

Ubuntu的apt-get代理设置

转载 

转载自: Ubuntu的apt-get代理设置 1. 环境变量方法 设置环境变量,下面是临时设置 export http_proxy=http://127.0.0.1:8000 sudo apt-get update 2.设置apt-get的配置 修改/etc/apt/apt.conf(或者/et

71.7万/秒到1.4万/秒!数据库查询优化实战

转载 

转载自: 71.7万/秒到1.4万/秒!数据库查询优化实战 阿里妹导读 在现代计算机系统中,程序的局部性原理是优化性能的关键。通过利用时间局部性和空间局部性,可以显著提升数据访问效率,减少高开销的操作如内存访问和网络 I/O。本文将探讨如何利用空间局部性原理,在实际案例中减少数据库查询量,并通过详细