阿里通义千问团队推出全球首个端到端开源全模态大模型Qwen2.5-Omni,支持文本、图像、音频、视频的实时交互与流式响应,仅7B参数即超越千亿级闭源模型性能。其创新Thinker-Talker架构和TMRoPE位置嵌入技术实现多模态同步处理,在语音生成、视频理解等任务中表现优异,并在OmniBench等评测中达到SOTA水平。