智能日报
业界资讯 智能手机 电脑硬件 平板电脑 智能手表 智能家电 耳机音频 笔记本 热点资讯

京东JoyAI-Image-Edit图像模型开源

2026-04-08来源:快讯编辑:瑞雪

在AI图像处理领域,传统模型长期面临空间逻辑混乱的瓶颈:当用户尝试移动画面中的杯子时,物体可能发生扭曲变形;调整视角时透视关系完全失真;改变物体前后位置时出现遮挡错乱。这些问题的根源在于,现有模型本质上是在二维平面上进行图像编辑,无法理解三维空间中的几何规律与物理关系。近日,京东探索研究院推出的JoyAI-Image-Edit开源模型,通过将空间智能深度融入图像生成流程,为行业带来了突破性解决方案。

该模型创新性地构建了完整的空间理解体系,从相机坐标系变换、物体空间位移到几何结构控制,实现了12项核心空间编辑技术的突破。通过深度建模真实世界的空间规律,模型能够精准解析物体间的位置关系、多视角一致性以及场景光照条件。实验数据显示,在物体移动精度和空间一致性等关键指标上,该模型已达到国际领先水平,彻底解决了传统模型在三维空间编辑中的几何失真问题。

三大核心能力构成了模型的技术壁垒:视角变换功能支持用户通过自然语言精确控制相机参数,在保持场景几何结构的前提下生成新视角图像;空间漫游技术可实现连续视角移动,生成逻辑连贯的多视角序列;物体空间关系操控能在保持场景整体稳定的前提下,对特定物体进行位移、旋转等操作,同时自动调整遮挡关系与光影效果。这些能力使模型能够稳定处理物体移动、视角切换等复杂操作,确保编辑后的图像符合物理世界的空间逻辑。

在通用编辑能力方面,模型兼容15类高频创作需求,包括物体替换、风格迁移、细节精修等。通过将空间智能与内容生成深度融合,模型在长文本渲染、多视角一致性等高难度任务中表现出色。例如在电商场景中,商家可快速调整商品展示角度而无需重新拍摄;在创意设计领域,设计师能自由重构三维场景而不破坏空间关系;在3D重建领域,模型可为机器人视觉系统提供精准的空间感知能力。

作为业内首个开源的空间智能图像模型,JoyAI-Image-Edit的推理代码已完全开放,开发者可直接调用其核心功能进行二次开发。这一举措不仅降低了空间编辑技术的应用门槛,更为AI与产业融合提供了新的可能性。在具身智能领域,该模型的空间理解能力可为机器人环境感知提供关键技术支持;在智能图像处理领域,其三维编辑能力将推动自动化内容生产进入新阶段。

京东近期在AI领域持续发力:基础大模型JoyAI-LLM Flash的开源打破了参数竞赛困局;云服务"龙虾"系列产品上线后token调用量周环比增长455%;全球最大具身数据采集中心的建设正在推进。这些布局彰显了京东以技术驱动产业升级的战略方向,通过将空间智能等前沿能力与供应链场景深度结合,正在重塑AI技术的商业价值实现路径。

微星发布多款电源新品:GPU Safeguard技术加持,护航高功耗显卡稳定运行
对于搭载RTX 5090/4090等旗舰显卡、追求稳定与安全的高端用户,MPG Ai1300TSPCIE5月神电源凭借钛金效率、碳化硅元件及GPU Safeguard+的软件监控能力,是更具前瞻性的选择;…

2026-04-08

4月换机别花冤枉钱,这三款2500元档大内存手机闭眼入不踩雷
下面这三款手机的价格都在2500元左右,还是16GB+512GB大内存版本,配置高,性能强,轻松用5年。 同时,红米K80至尊版还是销量最高的天玑9400手机,OPPO和vivo发布了那么多款搭载天玑940…

2026-04-08

苹果阔折叠或命名iPhone Ultra,国内厂商新折叠机也欲跟进 Ultra 命名潮?
IT之家 4 月 7 日消息,博主 @数码闲聊站 今日发文称,传闻苹果阔折叠命名是 iPhoneUltra。他透露,国内厂商的阔折叠手机也在考虑跟进,新折叠暂命名 Ultra,屏幕形态、芯片硬件、价格全面对…

2026-04-08

联想ThinkPad 4月22日将办发布活动 2026新品与天禧AI生态齐亮相
IT之家 4 月 7 日消息,联想 ThinkPad 官方社交媒体平台账户今日确认,ThinkPad 2026 新品暨天禧 AI生态发布活动将于 4 月 22 日举行,宣传口号为“我 · 即我们”。 联想 …

2026-04-08

苹果AirPods太空显身手:伴宇航员绕地飞行时速2.8万公里健身无阻
IT之家 4 月 7 日消息,科技媒体 9to5Mac 今天(4 月 7 日)发布博文,报道称继 iPhone 17 Pro Max被用于美国宇航局 Artemis II 绕月任务拍摄地球画面后,苹果产品在…

2026-04-08