枫夜求索阁

突破性LLM压缩技术DFloat11：零精度损失，推理速度飙升39倍，显存需求骤降至70%

莱斯大学提出的DFloat11无损压缩框架通过动态长度浮点编码技术，将大型语言模型（LLM）压缩至70%大小，推理速度提升最高39倍，且完全保留原始模型精度。该技术支持单节点运行405B参数大模型，显存占用降低70%，上下文长度延长5倍以上，显著降低硬件成本与部署门槛。