智能日报
业界资讯 智能手机 电脑硬件 平板电脑 智能手表 智能家电 耳机音频 笔记本 热点资讯

商汤科技携手南洋理工发布NEO架构 开启原生多模态模型新篇章

2025-12-03来源:快讯编辑:瑞雪

商汤科技与南洋理工大学S-Lab联合研发的多模态模型架构NEO正式发布,并同步开源2B与9B两种参数规模的模型。这一突破性成果为多模态大模型领域带来全新范式,其核心架构通过底层创新实现了视觉与语言模态的深度融合,在数据效率、性能表现及部署成本等关键指标上达到行业领先水平。

传统多模态模型普遍采用"视觉编码器+投影器+语言模型"的模块化设计,这种基于大语言模型扩展的方案虽能处理图像输入,但本质仍以语言为中心。商汤科技指出,此类架构存在三大缺陷:数据层面浅层融合导致学习效率低下,图像细节捕捉能力受限,复杂空间结构理解困难。例如在需要精准识别物体位置关系或动态场景的场景中,传统模型往往表现乏力。

NEO架构通过三项底层创新实现模态融合的质变。其独创的原生图块嵌入技术(Native Patch Embedding)摒弃离散图像分词器,通过连续映射机制从像素级构建视觉表征,使模型能捕捉到比传统方法精细4倍的图像细节。在位置编码方面,原生三维旋转位置编码(Native-RoPE)创新性地解耦时空频率分配,为视觉模态分配高频信号、语言模态分配低频信号,这种设计使模型天然具备处理视频流和跨帧信息的能力。

注意力机制层面,原生多头注意力(Native Multi-Head Attention)突破传统框架,在统一架构中同时实现文本的自回归注意力与视觉的双向注意力。这种设计使模型在处理图文混合任务时,空间关联利用率提升37%,特别在需要理解物体遮挡关系或动态轨迹的场景中表现突出。配合Pre-Buffer&Post-LLM双阶段训练策略,模型在保持语言推理能力完整性的同时,视觉感知能力实现指数级增长。

实测数据显示,NEO架构展现出显著优势:在数据效率方面,仅需3.9亿图像文本样本即可达到顶尖视觉理解水平,数据需求量仅为同类模型的1/10;性能测试中,在MMMU、MMB等五大权威基准测试中均取得最优成绩;部署成本方面,0.6B-8B参数规模的模型在边缘设备上的推理速度提升2.3倍,特别适合移动端和物联网设备部署。商汤已开放基于NEO架构的模型下载,开发者可通过开源社区获取完整代码与训练框架。

威刚XPG ARMAX (RGB) DDR5内存条亮相,硬派散热设计融合战斗机元素
IT之家 12 月 2 日消息,威刚 XPG 昨日推出了 ARMAX (RGB) DDR5系列内存模组。其采用硬派的散热片设计,灵感源自战斗机的肌肉线条,搭载 XPG 首创的 V 字形曲线顶部设计。 威刚 …

2025-12-03

特斯拉擎天柱机器人新动态:跑步流畅,火星探索计划同步推进
视频中展示了其人形机器人流畅跑步的场景,该团队配文称:刚在实验室刷新了个人纪录。 值得一提的是,今年10月,马斯克曾发布视频,展示第二代擎天柱人形机器人与专业武术教练对练中国功夫的场景。2025年3月,马斯克…

2025-12-03

iPhone 17e或明年初登场 三大升级亮点曝光 性价比之选来袭
iPhone 17e 预计将配备苹果新一代 A19芯片。 iPhone 16e曾沿用类似iPhone14的“刘海”屏设计,而新款的iPhone 17e据传将全面升级为“灵动岛”。 值得一提的是,分析师郭明…

2025-12-03

富光、宫菱、小米保温杯大比拼!多维度实测助你挑到心仪款
它之所以能拥有如此出色的保鲜成效,核心原因一方面这款保温杯的密封构造设计格外精良,即便施加力度摇晃,杯盖与杯身依旧能保持紧密贴合状态,可有效阻挡外界空气与湿气进入,另一方面该产品创新研发的三重保温锁鲜技术可与…

2025-12-03

手机补光灯怎么选?优洋科技凭实力与口碑成靠谱优选
在手机补光灯的研发过程中,优洋科技凭借其强大的技术实力,不断优化产品的性能,确保产品在亮度、色温、光衰等方面都达到水平。公司在保证产品质量和性能的前提下,通过优化生产流程、降低生产成本等方式,为用户提供价格实…

2025-12-03

摄影直播好帮手!优洋科技手机补光灯,以实力铸就行业新标杆
今天,我们就来为大家推荐一家的企业——深圳市优洋科技有限公司。该公司的手机补光灯不仅具有出色的性能和可靠的质量,还提供了灵活的合作模式和来图定制服务,能够满足不同客户的需求。今天,我们就来为大家推荐一家的企业…

2025-12-03