智能日报
业界资讯 智能手机 电脑硬件 平板电脑 智能手表 智能家电 耳机音频 笔记本 热点资讯

谷歌新推Gemini 2.0 Flash Thinking:能否成为AI推理新标杆?

2024-12-20来源:ITBEAR编辑:瑞雪

谷歌近期发布了一款名为Gemini 2.0 Flash Thinking Experimental的新型人工智能推理模型,但该模型仍处于实验阶段,根据初步测试,其性能仍有待提升。

这款新模型在谷歌的AI原型平台AI Studio中可供使用,其全称略显冗长,但功能定位明确:专注于多模态理解、推理及编码,尤其擅长解决编程、数学和物理等领域的复杂问题。AI Studio的产品负责人Logan Kilpatrick在平台上的一篇帖子中,将Gemini 2.0 Flash Thinking Experimental描述为谷歌在推理技术探索上的初步尝试。

谷歌DeepMind的首席科学家Jeff Dean也在个人帖子中透露,这款模型经过特殊训练,能够通过思维强化其推理能力。他表示,当增加推理时间计算时,模型展现出了令人鼓舞的成果。这里的推理时间计算,指的是模型在解决问题时所需的计算资源。

Gemini 2.0 Flash Thinking Experimental是基于谷歌之前发布的Gemini 2.0 Flash模型构建的,其设计理念与OpenAI的o1等推理模型相似。这类推理模型与其他人工智能的一大区别在于,它们能够进行有效的自我事实核查,从而避免陷入一些常见的人工智能陷阱。然而,推理模型通常需要更长的时间(几秒到几分钟不等)来得出解决方案。

在使用时,Gemini 2.0 Flash Thinking Experimental会在接收到提示后暂停片刻,然后考虑一系列相关提示,并在此过程中解释其推理过程。经过一段时间后,模型会给出它认为最准确的答案。但在实际测试中,这款模型也并非无懈可击。例如,当被问及单词“strawberry”中有多少个R时,它错误地回答了两个。

自OpenAI发布o1以来,谷歌并非唯一一家在推理模型领域发力的公司。许多竞争对手的人工智能实验室也纷纷推出了自己的推理模型。例如,由量化交易员资助的人工智能研究公司DeepSeek在11月初发布了其首个推理模型DeepSeek-R1的预览版。同月,阿里巴巴的Qwen团队也宣布了他们所谓的首个o1公开挑战者。

据彭博社10月份的报道,谷歌内部有多个团队正在致力于推理模型的开发。而The Information在11月份的报道中进一步透露,谷歌至少有200名研究人员专注于这项技术。这一趋势反映出业界对于改进生成式人工智能技术的迫切需求。然而,传统的扩展模型技术已经逐渐失效,难以再带来显著的改进效果。

尽管推理模型在基准测试中表现出色,但并非所有人都认为这是最佳的发展方向。一方面,推理模型的价格昂贵,因为它们需要大量的计算能力来运行。另一方面,尽管这些模型在基准测试中取得了不错的成绩,但它们能否保持这种进步速度仍然是一个未知数。

业界对于推理模型的探索仍在继续。谷歌的Gemini 2.0 Flash Thinking Experimental只是众多尝试中的一次。随着技术的不断进步和竞争的加剧,我们有理由期待未来会有更多创新性的推理模型涌现。

然而,对于当前的推理模型而言,它们仍然面临着诸多挑战和未知。如何在保证性能的同时降低成本,如何保持持续的进步速度,以及如何更好地应用于实际场景中,都是未来需要解决的问题。

小米再拓欧洲版图:巴黎首家直营门店即将开业 开启法国市场新篇章
近日,小米法国副国家经理“产品逸飞”发文官宣,小米将在巴黎开设首家直营门店。针对网友提问“之前不是在香街有一个吗?”,他进一步回应称,该店为客户运营的授权店,后因疫情因素暂时退出市场。 此前,小米集团总裁卢…

2025-11-15

TCL华星全球显示生态大会:四款新品亮相,AI赋能制造,印刷OLED节能显著
智东西11月14日苏州现场报道,今天上午,国内显示产业头部玩家TCL华星召开了自家一年一度的全球显示生态大会(DTC2025),发布了覆盖LCD、OLED和MLED等技术领域的多款旗舰新品,以及《视觉健康白…

2025-11-15

苹果联名iPhone Pocket:争议中售罄,高价能否续写品牌忠诚传奇?
苹果与日本时尚品牌三宅一生日前联名推出的iPhone Pocket(iPhone 口袋)11月14日正式开售,1299元至1899元的定价引发全网热议,成为科技圈与时尚圈跨界合作的又一争议焦点。尽管争议不断,…

2025-11-14

小米潘九堂发声:雷军遭误解成“机会主义者” 真实形象亲民又勤奋
潘九堂在发文的同时,还转发了一位博主的相关消息。据CNMO了解,今年3月,雷军在个人社交媒体发布动态,晒出一张此前小米发布会上的照片,并配文:“当我站在舞台上,听到掌声响起来,都会想起那首熟悉的旋律……”此动…

2025-11-14

百度文库网盘GenFlow3.0焕新升级,推出两大智能体,助力用户成“超级个体”且加速出海
基于GenFlow3.0,文库网盘在多产品矩阵中升级AI能力,帮助用户在工作、生活、学习上成为“超级个体”。基于百度文库全新能力,Oreate采用多智能体架构,能够端到端完成全场景、全模态创作,涵盖文档、P…

2025-11-14

华为PC业务双线并行:鸿蒙PC加速突破,智选PC延续Windows生态
11月13日消息,虽然有了鸿蒙PC,但华为似乎短期并不想放弃Windows系统。 有博主给出的消息显示,华为在PC业务上仍将维持“鸿蒙PC”与“智选PC”双线并行的策略,短期内不会放弃基于Windows系统的…

2025-11-13

​小米巴黎再拓版图!首家直营小米之家即将盛大开业​
11月13日消息,日前,小米法国副国家经理“产品逸飞”微博发文称,“巴黎米家首店,即将见面。” 据了解,这家即将开业的小米之家为直营门店。 快科技注:2019年1月18日,小米法国旗舰店在香榭丽舍大街开业,这…

2025-11-13

荣耀500系列全渠道预约开启
荣耀手机官方近日正式对外宣布,其全新打造的500系列手机已开启全渠道预约通道。这款新机凭借“超美水晶小直屏”和“2亿人像全能实况”两大核心卖点,迅速成为下半年中端手机市场的焦点之一,吸引了众多消费者的目光。

2025-11-13

大疆新品亮点频现:Avata 360无人机配旋转云台,Osmo Action 6相机可变光圈
在镜头和视频规格方面,Action 6 将配备全新的 F2.0-F4.0 可变光圈镜头,等效焦距为 16mm;支持录制带有 HDR 和ProRes 编码的 8K / 30fps 视频,还支持 5.3K /…

2025-11-13

2025年Q3中国平板市场双高峰助力增长 苹果线上销量份额居首
11月10号消息,根据洛图科技发布的《中国智能平板零售市场月度追踪》报告数据显示,2025年第三季度,中国消费级智能平板(平板电脑)市场的全渠道销量为796万台,同比增长11.6%。暑期消费旺季与开学季形成了…

2025-11-12