智能日报
业界资讯 智能手机 电脑硬件 平板电脑 智能手表 智能家电 耳机音频 笔记本 热点资讯

小红书联合复旦推出InstanceAssemble:AI绘画实现复杂布局精准生成新突破

2025-12-27来源:快讯编辑:瑞雪

AI绘画领域迎来重要突破,复旦大学与小红书联合研发的InstanceAssemble技术,在布局控制生成(Layout-to-Image)方向实现关键性进展。这项基于扩散变换器架构的创新方案,通过引入"实例拼装注意力"机制,成功解决了复杂场景下物体布局对齐与语义匹配的难题,相关研究成果已被国际顶级学术会议NeurIPS 2025收录。

传统AI绘画技术主要依赖文字描述生成图像(Text-to-Image),而新一代布局控制生成技术则要求系统根据用户指定的空间约束条件进行创作。这些约束条件包括物体边界框、分割掩码或骨架图等空间定位信息,技术难点在于如何确保生成图像中的每个物体都严格符合预设位置,同时保持语义逻辑的连贯性。现有方案普遍存在布局偏移、语义脱节或计算资源消耗过大等问题。

研究团队提出的InstanceAssemble技术通过创新机制实现了精准控制。该系统采用轻量化设计,仅需在现有模型基础上增加约7100万个参数(相当于Stable Diffusion3-Medium模型容量的3.46%),即可完成模型适配。特别值得注意的是,当适配Flux.1模型时,额外参数需求更低至0.84%,显著降低了技术落地门槛。

实验数据显示,在包含90万个实例的密集布局数据集测试中,新技术展现出卓越性能。研究团队专门构建的"Denselayout"基准测试集包含5000张图像和9万个实例,配合全新设计的"Layout Grounding Score"评估指标,能够精确量化生成图像与布局指令的匹配程度。测试结果表明,即使训练数据仅包含稀疏布局(≤10个实例),系统在处理密集场景(≥10个实例)时仍能保持稳定输出。

这项突破性成果标志着AI绘画技术进入精准构图时代。用户只需提供物体位置框和内容描述,系统即可在指定区域生成符合语义的图像元素,无论是简单场景还是复杂构图都能保持高度一致性。研究团队表示,该技术已具备实际应用条件,未来可广泛应用于数字内容创作、虚拟场景构建等领域,为创意产业提供新的技术支撑。

2025年人像拍摄手机大比拼:五款旗舰机型谁才是人像摄影王者?
纵观2025年人像摄影手机市场,荣耀500以2亿像素主摄和哈苏调校树立了新标杆,vivo X200的蔡司光学带来德系质感,RedmiK80展现性价比优势,realme GT Neo6擅长运动捕捉,iQOO…

2025-12-27

荣耀官宣全新游戏本明年登场,成职业联赛指定用本并启动玩家共创计划
IT之家 12 月 26 日消息,荣耀今天举行新品发布会,正式推出 WIN / WIN RT 手机,新机搭载 10000毫安时电池,拥有东风涡轮散热风扇,分别搭载骁龙 8 Elite Gen 5/8 Eli…

2025-12-27

荣耀WIN系列电竞旗舰登场:性能续航散热全突破,开启电竞新体验
据相关报道,定位为“年度电竞夯机”的荣耀WIN搭载了第五代骁龙8至尊芯片,与LPDDR5X至尊版、UFS4.1组成了“顶配铁三角”,安兔兔跑分超过440万,为用户带来了超高速、超丝滑的性能体验。 荣耀WIN…

2025-12-27