智能日报
业界资讯 智能手机 电脑硬件 平板电脑 智能手表 智能家电 耳机音频 笔记本 热点资讯

智谱AI推出数学模型MathGLM,阿里云魔搭社区全球首发

2023-09-24来源:智能日报编辑:汪淼

9月24日消息,智谱AI推出数学模型MathGLM,以提升大语言模型的数学推理能力。它可以在不使用计算器工具的情况下,高效执行复杂算术运算,解答中文数学应用题,部分表现超过GPT4和ChatGPT,目前已在魔搭社区ModelScope全球首发上架。

过往研究认为,大语言模型并不能精确执行高位数的算数运算,尤其是涉及超过8位数的乘法运算以及涉及小数、分数的运算。但MathGLM的出现,足以打破这些偏见。

MathGLM包含10M、100M、500M、2B等多个参数版本,具备处理最多12位数字的运算能力。而且有测评结果显示,通过充分的数据训练,MathGLM-2B可以准确执行多位数的算术运算,准确率高达93.03%(接近100%),显著超越GPT-4在相同测试数据上18.84%的准确率。10亿参数版本的MathGLM-10B则在5000条中文数学应用题的测试数据集上实现了接近GPT-4的性能。

MathGLM出色的表现,离不开其在模型架构、数据集等方面的一系列创新。

针对算术任务,研发团队采用Transformer的decoder架构,并使用自回归目标在生成的算术数据集上从头训练。算术训练数据集包含各类算术任务、各种运算符(含加法、减法、乘法、除法和求幂)、多种数字格式(含整数、小数、百分比、分数和负数)。研发团队还采用分步计算策略对该数据集进行了重构,并且让单个算术表达式由 2 到 10 个运算步骤组成,以方便MathGLM对每个中间结果进行准确计算,从而得到每个算术表达式的正确答案。

评测结果显示,MathGLM在一个包含9592条测试用例、专门为算术任务量身定制的数据集上的表现,显著优于GPT4和ChatGPT。

针对更复杂的数学问题——中文应用题,研发团队微调了一系列以GLM为基座模型、用于解决数学应用题的MathGLM。

训练过程中使用了一个包含21万道中文小学数学题的高质量数据集Ape210K,但其不足之处在于每个题的答案都是直接计算得出,缺乏相应的计算过程。因此,研发团队采用分步策略对Ape210K数据集进行了重构,方便MathGLM深入理解和学习潜在的计算逻辑和规则,逐步计算出每个数学问题的答案,提升最终答案的准确性。

此外,研发团队还使用 ChatGLM-6B 和 ChatGLM2-6B 作为基座模型来训练 MathGLM,赋予 MathGLM 基本的语言理解能力,使其能够有效理解数学应用题中包含的语言信息。

在Ape210K数据集上进行测试的结果显示,MathGLM模型在答案准确性方面已接近GPT-4。在一个包含1-6年级数学应用题的数据集K6上进行评测的结果显示,MathGLM相比于其他中文模型(GPT-4、ChatGPT、Chinese-Alpaca-13B、MOSS-16B、Ziya-LLaMA-13B、Baichuan-7B等),呈现出了更强的数学推理能力。

图片

为方便开发者快速上手体验MathGLM,魔搭社区第一时间推出了模型体验、推理实践教程。

阿里云魔搭社区是国内规模最大、开发者最活跃的AI模型社区,拥有200多万开发者,聚集了20多家头部人工智能机构贡献的1000多款优质AI模型,为开发者提供一站式的模型体验、下载、推理、调优、定制等服务,社区模型累计下载量已突破7500万次。“找大模型,上魔搭”正在成为开发者的共识。

附:

MathGLM模型地址:

https://modelscope.cn/models/ZhipuAI/MathGLM/summary

魔搭创空间MathGLM模型体验链接:

https://www.modelscope.cn/studios/ZhipuAI/MathGLM-demo/summary

魔搭教程链接:

https://mp.weixin.qq.com/s?__biz=MzkxNTM5NTg2OA==&mid=2247486650&idx=1&sn=b1a729a720947a56a27d64dac1182519&chksm=c15e88c9f62901df978105f8ad084a72e651fbb97a7768b4159ecec751120c9772b795a41524#rd


苹果库乐队2.3.18版本更新:图标大改,写实吉他亮相,多款应用图标同步优化
11 月 4 日消息,科技媒体 Appleinsider 昨日(11 月 3日)发布博文,报道称苹果公司更新其库乐队(GarageBand)应用,在最新 2.3.18 版本中,主要重新设计了应用图标,融合了…

2025-11-05

三星Galaxy Z TriFold现身蓝牙认证库,五款机型或覆盖全球市场,2026年将上市
【环球网科技综合报道】11月4日消息,据跟踪三星消息的外媒报道,三星即将推出的三折叠智能手机Galaxy ZTriFold已现身Bluetooth SIG(蓝牙技术联盟)认证数据库,型号列表显示该机将推出S…

2025-11-04

苹果2026年动作频频:AI国行版将随iOS 26.4亮相 多款新品蓄势待发
记者Mark Gurman预测,苹果AI国行版将在iOS 26.4推出,新版Siri也将同步亮相。在3-4月,苹果将启动智能家居战略,首款智能显示屏产品将发布,分为带音箱底座和壁挂式两个版本;同时还将公布全新…

2025-11-04

苹果本月或迎新品:Apple TV与HomePod mini有望登场,市场期待值拉满
2025年11月3日,进入下半年以来,苹果公司已陆续推出多款新产品。 随着9月和10月发布的产品陆续上市,外界预计苹果在今年仍有新硬件将面世。 尽管目前尚无官方确认,但市场普遍关注本月是否将迎来这两款产品的…

2025-11-04

英特尔欲收购SambaNova,CEO陈立武双重身份或成交易关键
陈立武通过风投公司WaldenInternational,早期投资了SambaNova——2018年和谷歌共同领投了5600万美元的A轮融资。 面对Nvidia在AI训练芯片领域的绝对领先,SambaNo…

2025-11-04

2025年Q3中国智能音箱市场:全渠道销量下滑,大模型新品成新亮点
洛图科技(RUNTO)方面表示,第三季度百度和小米均发布了搭载大模型技术的带屏智能音箱新品。 洛图科技(RUNTO)方面认为,接下来,由AI大模型技术驱动的陪伴、看护等定制化场景将是智能音箱产品的发展方向之一…

2025-11-04

古尔曼爆料:Apple Intelligence中国发布日期未定 新版Siri明年亮相
11月3日消息,彭博社记者马克·古尔曼近日透露了苹果Apple Intelligence 2026年的最新计划。古尔曼表示,该公司显然仍在努力解决Apple Intelligence在中国的发布问题,但目前…

2025-11-04

华为11月新品来袭!Mate80系列、Mate X7及Mate70 Air齐亮相
【CNMO科技消息】近日,有多家科技媒体报道,华为将在11月发布多款旗舰新机,包括备受期待的Mate 80系列、大折叠旗舰MateX7以及主打轻薄设计的Mate 70 Air。Mate 70 Air主打轻薄…

2025-11-04

“京东家电家居采销比价值班间”开播 单日吸引600万人在线围观
10月30日,“京东家电家居采销比价值班间”正式开播。当天共吸引超过600万人在线围观,连续霸榜京东直播热度TOP1。直播过程中,不仅有京东家电和家居各品类采销负责人亲自坐镇现场比价,更有美的、芝华仕等品牌负责

2025-11-03

苹果推进iPhone无孔化进程:固态按键将至,屏幕设计迎新突破
在过去的几年中,关于苹果将为iPhone采用固态按键的消息曾多次出现。 参考这位博主以往的消息来看,bongo项目是指苹果计划为设备砍掉一切物理按钮。 也就是说,明年的iPhone 18系列将会在屏幕和按键…

2025-11-03