智能日报
业界资讯 智能手机 电脑硬件 平板电脑 智能手表 智能家电 耳机音频 笔记本 热点资讯

京东JoyAI-Image-Edit图像模型开源,引领AI图像编辑进入三维空间重塑新时代

2026-04-08来源:天脉网编辑:瑞雪

在AI图像编辑领域,传统模型长期面临空间逻辑混乱的瓶颈——移动物体时出现变形、切换视角时透视错乱、调整物体层级时遮挡关系失衡。这些难题源于模型对三维空间结构的理解缺失,导致编辑操作仅停留在像素层面。京东探索研究院近日推出的开源模型JoyAI-Image-Edit,通过构建完整的空间智能体系,实现了从平面修图到三维空间重塑的技术跨越。

该模型创新性地将空间认知能力深度融入图像生成流程,通过建立相机坐标系变换、物体空间位移旋转、几何结构精准控制等核心技术模块,构建起覆盖空间位置关系、多视角一致性、场景推理等维度的完整体系。实验数据显示,在物体移动精度、空间布局合理性等关键指标上,该模型已达到国际领先水平。其突破性在于打破了"生成图像"与"理解空间"的界限,使AI既能生成逼真视觉效果,又能精准维护场景的几何规律与物理合理性。

三大核心编辑范式构成技术护城河:视角变换功能支持通过自然语言指令调整相机参数,在保持场景几何一致性的前提下生成新视角图像;空间漫游能力可连续生成逻辑连贯的多视角序列,实现三维场景中的"虚拟漫游";物体空间关系操控技术能在保持整体结构稳定的前提下,对特定物体进行位移、缩放等操作,并自动修正遮挡与光影关系。这些能力与15类通用编辑功能深度融合,覆盖物体替换、风格迁移、细节精修等高频需求,形成全场景创作解决方案。

在具身智能等前沿领域,该模型展现出独特价值。其空间理解能力为机器人感知环境提供了关键技术支撑,使机械臂操作、自主导航等任务获得更精准的空间坐标参考。在电商内容生产场景中,模型可自动生成多角度商品展示图;创意设计领域支持三维场景的快速构建与修改;智能图像处理方面能高效完成复杂场景的修复与重构。技术团队透露,模型已实现推理代码全开源,开发者可直接调用核心功能开发应用。

这项突破是京东AI技术矩阵的重要拼图。就在上月,该集团刚开源了基础大模型JoyAI-LLM Flash,通过架构创新突破参数规模限制;京东云"龙虾"系列产品上线后,token调用量周环比增长达455%;全球最大具身数据采集中心的建设也在稳步推进。依托实体产业场景优势,京东正持续推动AI技术从实验室走向规模化应用,构建起覆盖基础研究、技术开发、产业落地的完整生态。

Anthropic年化收入破300亿美元 与博通谷歌合作部署约3.5吉瓦AI算力
Anthropic首席财务官指出,与博通和谷歌的合作将帮助公司建立足以支撑客户群惊人增长所需的算力。这一合作将于2027年启动。此外,博通在文件中表示:“Anthropic对上述扩展AI算力的使用取决于其持续…

2026-04-08

苹果iPhone Fold试生产开启 发布或晚于iPhone 18 Pro 9月发布存变数
【环球网科技综合报道】4月7日消息,据9to5mac报道,苹果合作伙伴富士康已开启iPhoneFold的试生产工作。试生产作为量产前的重要环节,旨在全面检测生产流程与产品质量,为后续大规模量产做准备。 近…

2026-04-08

苹果折叠屏新进展:iPhone Fold试产中 书本式设计或秋季亮相
快科技4月7日消息,日前,有媒体报道称,苹果首款折叠屏手机iPhone Fold正在富士康试产。据证券时报报道,苹果产业链人士对此表示,苹果首款折叠屏手机项目方案早已确定,目前该项目正在正常推进中。 试产是…

2026-04-08

社区技术达人突破限制,12核Intel Bartlett Lake处理器成功适配Z790主板
社区技术爱好者已成功将英特尔面向OEM渠道推出的Bartlett Lake处理器(型号Core 9273PQE)适配至标准消费级Z790主板平台。该处理器基于Bartlett Lake-S架构,采用纯高性能…

2026-04-08

2026年3月安卓次旗舰性能榜揭晓:多款机型上榜,配置亮点纷呈
在iQOO Z11和荣耀Power2之后,OPPO Reno15 Pro和OPPO Reno15分列第三名和第四名。 在相机配置上,OPPOReno15 Pro这款智能手机的主摄是一颗2亿像素的三星HP5…

2026-04-08