智能日报
业界资讯 智能手机 电脑硬件 平板电脑 智能手表 智能家电 耳机音频 笔记本 热点资讯

多模态视觉语言测评:Gemini-3-pro登顶 国内多款大模型表现亮眼

2025-12-31来源:互联网编辑:瑞雪

近日,SuperCLUE-VLM多模态视觉语言基准测评12月总榜正式揭晓,全球多款主流大模型在基础认知、视觉推理、视觉应用三大核心维度展开激烈角逐,最终谷歌Gemini-3-pro以绝对优势登顶榜首,国内多款模型凭借技术突破跻身前列,展现出中国人工智能领域的强劲实力。

谷歌Gemini-3-pro以83.64分的总成绩领跑全场,其在三项细分指标中均表现卓越:基础认知得分89.01分,视觉推理82.82分,视觉应用79.09分,三项数据均远超其他竞品。这一成绩不仅巩固了谷歌在多模态领域的领先地位,也为行业树立了新的技术标杆。

国内阵营中,商汤科技SenseNova V6.5 Pro以75.35分位居第二,成为榜单中排名最高的国产模型。字节跳动旗下两款模型表现亮眼:豆包大模型以73.15分跻身前三,其视觉版在基础认知环节得分82.70分,甚至超越部分国际竞品,仅在视觉推理环节稍显不足;另一款模型则凭借均衡表现稳居前列。百度ERNIE-5.0-Preview、阿里巴巴Qwen3-vl等模型也成功进入前五,其中Qwen3-vl作为榜单中首个开源且总分超70分的模型,为开源社区贡献了重要技术资产。

国际头部模型在此次测评中表现分化。Anthropic的Claude-opus-4-5以71.44分位列第六,而OpenAI的GPT-5.2(high)仅获69.16分,排名相对靠后。这一结果反映出,尽管国际巨头在通用人工智能领域占据先发优势,但国内模型通过针对性优化和垂直场景深耕,正在逐步缩小技术差距。

据测评机构介绍,本次评估从基础认知能力、复杂视觉推理、实际应用场景适配性三个维度展开,覆盖图像理解、逻辑推断、跨模态交互等关键技术指标。评测数据显示,国内模型在中文语境下的语义理解、文化相关视觉内容处理等方面表现突出,而国际模型则在多语言支持、通用场景泛化能力上保持优势。随着技术迭代加速,多模态大模型正从实验室走向实际应用,在医疗、教育、工业检测等领域展现出巨大潜力。

苹果iOS 27前瞻:性能提升与AI赋能,七大功能亮点抢先看
科技媒体 9to5Mac 昨日(12 月 30 日)发布博文,基于目前多家媒体和泄露的代码信息,汇总和梳理了 iOS 27 系统将引入的 7 项功能,将重点放在性能提升和漏洞修复上,力求打造一次“雪豹”级别的…

2025-12-31

续航焦虑终结者来袭!三款热门长续航手机深度测评,这款国产机稳坐榜首
作为长续航手机中的热门机型,OPPO A6 Pro以7000mAh电池为核心卖点,主打基础长续航与轻薄手感的平衡,可满足普通用户的日常续航需求。综合目前续航能力最好的手机榜单表现与实际使用需求,荣耀Powe…

2025-12-31

iQOO Z11 Turbo 1月登场:金属中框搭配2亿主摄,中端机市场再添劲旅
原因也非常的简单,那就是iQOO Z11 Turbo的很多细节都很清晰了,并且会在1月份进行发布,让期待值大幅度提升。 然后性能是iQOOTurbo系列的核心竞争力,而iQOO Z11 Turbo直接将硬…

2025-12-31

新年焕新机:华为MateBook系列助力高效学习与办公新体验
而对于希望在新一年显著提升效率的人来说,华为MateBook 14的智慧互联与AI能力,往往能带来越用越顺的体验。14英寸护眼全面屏拥有100%sRGB广色域和90%高屏占比,学习、追剧、日常办公都足够舒适…

2025-12-31

砺算科技7G100系列GPU交付,6nm自研芯开启云游戏等商业应用新篇
【太平洋科技】12 月 29 日消息,据界面新闻报道,东芯股份控股的 GPU(图形处理器)厂商砺算科技已完成其自研 GPU芯片的首批订单交付,客户为数字孪生领域相关企业。 砺算科技此次交付的 7G100…

2025-12-30

三星Galaxy S26 Ultra影像配置微调:新镀膜控炫光 色彩调校更精准
12 月 30 日消息,据科技媒体 SammyGuru 今天报道,三星似乎正在微调 Galaxy S26 Ultra手机的影像配置,有望在炫光控制、肤色还原准确度等方面带来明显提升。 据报道,Galaxy …

2025-12-30