智能日报
业界资讯 智能手机 电脑硬件 平板电脑 智能手表 智能家电 耳机音频 笔记本 游戏机

编程与智能体开发新突破:Claude Sonnet 4.5携多项升级登场

2025-10-01来源:快讯编辑:瑞雪

人工智能领域迎来重要进展,Anthropic公司正式推出新一代AI模型Claude Sonnet 4.5。该模型在编程能力、计算机操作效率等关键指标上表现突出,特别是在处理复杂多步骤任务时展现出持续专注能力,可连续工作超过30小时。

在编程能力评测中,Claude Sonnet 4.5在SWE-bench Verified测试中位居榜首,其真实编程表现获得专业认可。计算机操作能力评估方面,该模型在OSWorld基准测试中取得61.4%的得分率,较四个月前的版本提升近20个百分点。实际演示显示,模型可直接在浏览器环境中完成网站导航、表单填写等全流程自动化操作。

定价策略方面,新模型保持与前代相同的收费标准:每百万输入token收费3美元(约21.4元人民币),输出token收费15美元(约106.8元人民币)。这一稳定的价格体系为开发者提供了可预期的成本控制。

开发工具链迎来重大升级。Claude Code新增检查点功能,支持自动保存工作进度和即时回滚操作。用户通过双击Esc键或输入/rewind命令,即可快速恢复至历史版本。该功能特别适用于复杂代码修改场景,可单独恢复代码、对话记录或两者组合。

终端界面优化带来更好的可视化体验,新增可搜索的指令历史功能。原生VS Code扩展插件的推出,使开发者能在集成开发环境中直接调用Claude Code,通过专属侧边栏和行内差异对比功能,实时监控代码变更过程。

针对企业级开发需求,Claude Agent SDK(原Claude Code SDK)正式开放。该工具包提供核心架构支持,包含情境管理系统和权限框架,新增子智能体与钩子函数支持。开发者可基于这些组件构建定制化智能体流程,适配特定业务场景。

情境管理能力实现突破性进展。新推出的情境编辑功能可自动清理过期工具调用记录,在保持对话连贯性的同时优化token使用效率。记忆工具则构建了基于文件的外部存储系统,允许智能体在多次对话间持续积累知识库,支持跨会话状态维护。

性能测试数据显示,情境管理与记忆工具的协同使用可使复杂任务处理效率提升39%,token消耗降低84%。在100轮网络搜索测试中,情境编辑功能成功完成原本因情境耗尽而失败的任务,展现出显著的技术优势。

专业领域评估证实,新模型在法律、金融、医学等垂直领域的知识掌握和推理能力均有显著提升。安全训练的强化使模型行为模式得到改善,有效减少了谄媚、欺骗等不良倾向。自动化行为审计显示,其总体行为失当评分较前代明显降低。

余承东履新华为IRB主任:聚焦AI战略,引领资源向核心目标倾斜
9月29日,据网易科技今日报道,华为公司今天任命余承东正式增任公司产品投资评审委员会(IRB)主任,该任命由任正非签发。此次履新后,余承东将同时执掌常务董事、终端BG董事长与IRB主任三大职务。目前余承东的微…

2025-09-30

TCL华星与小米强强联合:共筑全场景显示生态,开启科技体验新篇
作为本次发布会的重头,小米17旗舰系列新品在显示体验上焕新升级,不仅全系搭载有TCL华星最新一代屏幕发光材料,小米17 ProMax更凭借独家的Real RGB(超级像素排列)技术,将色准还原、续航表现与…

2025-09-30

小米五年探索对标苹果:价格上探,估值逻辑转向汽车新赛道
财报显示,小米手机业务的毛利率已从早期的2%左右提升至近年来的两位数水平,2016年小米手机业务毛利率为3.45%,高端化后,2021年该数据突破了10%,近三年维持在12%左右。但随着近年苹果在中国市场份…

2025-09-30

马斯克透露特斯拉加速“擎天柱”人形机器人量产,称其将成公司未来价值核心
外媒称,特斯拉 Optimus 是该公司的人形机器人项目,该项目于几年前首次公布,在过去一年中,其重要性日益凸显,并成为人们关注的焦点。 马斯克表示,特斯拉正在努力扩大Optimus的规模,这是一个至关重要…

2025-09-29

OPPOvivo布局手持智能影像赛道,或借影像市场开拓业务新增长点
作为参考,目前手持智能影像设备主要细分为运动相机和全景相机,其中运动相机由 GoPro 和大疆主导,而全景相机市场则主要被影石Insta360 占领,两家公司在相关领域的成长历程如下: 某 OPPO 前员…

2025-09-29

DeepSeek发布V3.2-Exp实验模型 引入稀疏注意力机制且API调用成本降超五成
IT之家 9 月 29 日消息,DeepSeek 今日正式发布 DeepSeek-V3.2-Exp模型,这是一个实验性(Experimental)的版本。 作为迈向新一代架构的中间步骤,V3.2-Exp 在…

2025-09-29

优必选再揽3000万元大单,Walker S系列机器人订单总额直逼4.3亿元
IT之家 9 月 29 日消息,优必选科技官方宣布,日前,优必选智慧物流子公司 UQI优奇与天奇自动化工程股份有限公司(下称“天奇股份”)正式签订采购合同。天奇股份将采购总价 3000 万元的优必选工业人形…

2025-09-29

苹果iPhone 17搭载A19芯片:单核性能登顶,能效优势显著超越PC处理器
苹果最新一代 iPhone 17 系列机型搭载了 A19 及 A19 Pro 芯片,这也是苹果目前最强的手机芯片。PassMark 估算,A19 单核功耗可能仅有 4W 左右,而 Ultra 9 285K …

2025-09-29

科沃斯携手阿里云推进全栈AI合作,扫地机器人语音交互迈入新阶段
IT之家 9 月 28 日消息,据阿里云官方消息,近日,科沃斯与阿里云达成全栈 AI 战略合作,双方将面向具身智能在 AI算力、端侧模型部署、VLM 等领域共同研发,科沃斯还将基于通义千问打造垂直领域专业大…

2025-09-28

TCL华星携手小米:以显示技术革新,共筑全场景生态旗舰新体验
作为本次发布会的重头,小米17旗舰系列新品在显示体验上焕新升级,不仅全系搭载有TCL华星最新一代屏幕发光材料,小米17 ProMax更凭借独家的Real RGB(超级像素排列)技术,将色准还原、续航表现与…

2025-09-28