智能日报
业界资讯 智能手机 电脑硬件 平板电脑 智能手表 智能家电 耳机音频 笔记本 热点资讯

阿里发布首个原生语言世界模型Qwen-AgentWorld,开启智能体环境模拟新篇章

2026-06-25来源:快讯编辑:瑞雪

阿里近日在人工智能领域取得重要进展,正式推出首个原生语言世界模型(LWM)Qwen-AgentWorld。该模型专为AI智能体研发设计,提供35B-A3B与397B-A17B两种参数规模版本,旨在通过内部环境模拟增强智能体的决策能力,而非替代真实交互场景。

与传统训练方式不同,Qwen-AgentWorld在预训练阶段即引入环境建模目标,贯穿CPT→SFT→RL全流程。此前通用模型通常在训练后期才加入环境理解模块,而新模型通过早期整合实现更高效的能力迁移。其核心突破在于单模型覆盖文本类(MCP、Search、Terminal、SWE)与GUI类(Web、OS、Android)共七大交互环境,支持跨领域知识共享。例如在模拟手机系统时,模型能准确预测点击删除图标后的界面变化;在电脑系统模拟中,可完整呈现从菜单栏选择"文件-打印"的操作路径。

研究团队同步发布配套评测基准AgentWorldBench,该基准基于5个前沿模型在9个成熟评测集上的真实交互数据构建,采用开放式评分体系从格式、事实性、一致性等五个维度评估模型表现。测试结果显示,397B-A17B版本以58.71分的综合得分超越GPT-5.4(58.25分)、Claude Opus 4.8及Gemini 3.1 Pro,在代码执行(Terminal)和工具调用(SWE)领域优势尤为显著。35B-A3B版本通过三阶段训练流水线提升8.66分,性能超越Claude Sonnet 4.6。

深入分析129条文本类交互数据后,研究人员发现模型涌现出三种独特推理模式:在自我修正方面,模型通过"Wait!"信号触发中止,平均每轮交互修正10.4次错误;信息防护机制可防止搜索场景中的答案泄露,当查询与预设答案无关时自动屏蔽敏感信息;多步因果推理能力体现在复杂命令模拟中,如预测"curl -s localhost:3000 | python3 -m json.tool"需构建包含服务器状态、端口监听等6个环节的推理链。

该模型已通过GitHub、ModelScope和Hugging Face平台开源,包含模型权重与评估基准。研究团队强调,语言世界建模并非要取代真实环境交互,而是通过可控性、可扩展性及内化预测能力,为智能体训练提供互补路径。这种技术路线有望突破现有智能体在复杂场景中的能力边界,为构建更强大的通用AI系统奠定基础。

芯联集成携产业基金26.66亿增资 12英寸车规芯片项目月产能将达5万片
快科技6月24日消息,芯联集成近日发布对外投资进展公告,公司与芯联先进集成电路制造(绍兴)有限公司(简称“芯联先进”)、绍兴柯桥芯合先进集成创业投资基金合伙企业(有限合伙)(简称“产业基金”)共同签署《增资及…

2026-06-25

联想算力生态大会:英伟达等巨头齐聚,问天超节点方案引领AI算力新突破
智东西6月24日报道,今天下午,联想集团在自家算力生态大会上正式发布了联想问天超节点解决方案,联想万全异构智算方案升级至5.0大版本,其重点通过集群训推加速、芯模编译优化两个关键技术升级,提升了方案的场景自…

2026-06-25

红魔游戏平板5 Pro超前开箱揭秘,高刷屏电竞风设计,6月30日即将发布
IT之家 6 月 24 日消息,红魔游戏手机产品总经理姜超今日开箱了红魔游戏平板 5 Pro。 据介绍,红魔游戏平板 5 Pro 正面配备一块9.06 英寸 OLED 屏幕,采用 4.9mm 极窄四等边设计…

2026-06-25

荣耀方飞官宣:以人为核心的AgenticOS下月登场,开启智能交互新篇章
按照方飞在演讲中公开透露的最新信息,荣耀完全以人为核心打造的下一代终端操作系统AgenticOS,确定将会在下个月正式和公众见面。 系统以AI Agent作为原生内核支撑,具备全场景主动智能能力,可以主动预…

2026-06-25

Questyle旷世之声维也纳发布E5,以easyHiFi理念开启家庭高保真新体验
2026年6月5日,奥地利维也纳 —— 在全球高端音响行业盛会 HIGH END Vienna 现场,Questyle(旷世之声)正式发布全新easyHiFi 无线一体化高保真音响系统 E5,并宣布与全球…

2026-06-24

小米智能存储上架众筹,多版本可选价格亲民,NAS小白也心动
从目前的情况来看,Xiaomi智能存储可能是这两年最生不逢时的产品,几乎没有之一。作为苹果用户,随着照片和视频的不断增加,iCloud的使用费用越来越高,这也是小编期待小米智能存储的主要原因之一,毕竟目前家…

2026-06-24