莱斯大学提出的DFloat11无损压缩框架通过动态长度浮点编码技术,将大型语言模型(LLM)压缩至70%大小,推理速度提升最高39倍,且完全保留原始模型精度。该技术支持单节点运行405B参数大模型,显存占用降低70%,上下文长度延长5倍以上,显著降低硬件成本与部署门槛。