首页
m3u8视频在线提取工具
分类
java
python
脚本
docker
生活
数据库
我的瞬间
文章归档
枫夜求索阁
累计撰写
318
篇文章
累计创建
24
个分类
累计收到
1
条评论
导航
首页
m3u8视频在线提取工具
分类
java
python
脚本
docker
生活
数据库
我的瞬间
文章归档
目录
标签
多模态大模型
智谱AutoGLM:从对话到自主操作的AI智能体革新
2025-03-31 12:24
24
0
0
26.4℃
AI 学习系列
AI前沿
工具使用
智谱AI与清华大学团队联合研发的AutoGLM智能体实现了从对话交互到自主操作的技术跨越,能够通过自然语言指令自主控制手机、电脑等设备的图形用户界面(GUI)。其核心技术包括任务规划与执行解耦、自进化强化学习框架和多模态大模型应用,覆盖社交互动、电商购物、出行服务等场景。AutoGLM在多项基准测试中表现优异,但仍有应用范围有限、复杂任务处理能力待提升等局限性。该技术标志着AI向'智能伙伴'的转变,为通用人工智能(AGI)落地提供了新范式。
阿里开源Qwen2.5-Omni,7B参数完成看、听、说、写
2025-03-27 12:48
12
0
0
25.2℃
工具使用
AI小课堂:给好奇者的极简人工智能课
AI学习之路
阿里通义千问团队推出全球首个端到端开源全模态大模型Qwen2.5-Omni,支持文本、图像、音频、视频的实时交互与流式响应,仅7B参数即超越千亿级闭源模型性能。其创新Thinker-Talker架构和TMRoPE位置嵌入技术实现多模态同步处理,在语音生成、视频理解等任务中表现优异,并在OmniBench等评测中达到SOTA水平。
弹