中国商务新闻网在AI浪潮的推动下,今年以来多家科技公司宣布推出通用大语言模型产品,而好未来选择了另一个方向,不基于将现有大语言模型做微调和接口调用、不做通用大语言模型,而是深入数学的垂直领域研发大模型,致力于打造自主、稳定、可持续、高质量的数学解决方案。8月24日,在好未来20周年直播活动中,CTO田密宣布好未来自研的数学领域千亿级大模型MathGPT正式上线并开启公测。
【资料图】
用户使用MathGPT时,用文字或图片方式上传数学题,即可得到对话式的解答反馈,也可以通过“随机来一题”的按钮,随机生成数学题目并由系统给出解答。目前,MathGPT支持中文、英文版本的PC端和移动端体验。
先进的数学解题能力
田密介绍,MathGPT汇集了好未来多年教育教研数据积累,专注于数学领域。千亿级大模型的训练、推理、部署框架,为模型赋予了强大能力。通过优质教育数据,实现题目计算、讲解、问答等多任务持续训练和有监督微调,呈现出卓越表现。此外,借助人类反馈对齐,还将进一步提升模型综合素养。MathGPT在解题准确率、稳定性及用户体验方面均有明显的优势。
MathGPT官网显示,MathGPT的数学计算能力已覆盖小学、初中、高中的数学题,题目类型涵盖计算题、应用题、代数题等多个类型,还可以针对题目进行追问,暂未开放数学之外的问答互动。
MathGPT技术报告显示,在CEval-Math、AGIEval-Math、APE5K、CMMLU-Math、高考数学和Math401等6个公开数学评测集合的测试结果中,好未来的MathGPT取得了多项测试的最高分数。同时,MathGPT在C-Eval的初高中的全科测试集合上也均有不错的表现。
在解题稳定性、讲解友好度方面,MathGPT基于海量名师解题过程的数据进行模型训练,模型的解题步骤专业清晰。
以一道数列题为例,MathGPT给出的答案包含“分析”、“详解”、“点睛”三个部分,比通用大模型的粗略讲解方式更为细致,“分析”提供了题目的解题思路、思考方式,帮助用户更好地理解题目,“详解”则给出具体的计算方式和答案,最后“点睛”的环节,对题目的考点、难点、关键点进行提示,帮助用户回顾反思出题意图、举一反三。
对于使用者而言,研究数学问题不仅在于得到答案本身,更在于答案背后的解题原理、思路逻辑。与其他通用大模型相比,MathGPT能实现更高准确度的解题,也能把答案解析得更清楚、讲解得更明白,更好地满足用户使用AI产品解答数学问题的核心需求。
在MathGPT发布同时,好未来也在官网更新了一个具有代表性和挑战性的数学任务评测集,供全球人工智能专家、数学爱好者体验和测评。田密介绍,希望让MathGPT在数学教育领域发挥更大作用,好未来愿意把基于大规模、高质量的内容的千亿级大模型研发经验方法和业内分享,和行业共同进步。
好未来AI的厚积薄发
通用大模型“重文轻理”,在数学问题的解决、讲解、问答和推荐方面则存在明显的短板。而在另一个层面,在通往通用人工智能的路上,数学推理能力很重要,全球有很多大型公司在做这方面的研究。
“好未来在数学的数据和业务上有20年的积累,有大量的教育数据的积累和持续生产教育数据的能力,所以选择做这个难而正确的事情。”田密称,好未来希望用自己在数学和AI上的多年积累,做好AI大模型时代的数学基础工作。
好未来也在积极参与推动大模型标准体系建设,先后作为核心单位参与了由国家人工智能标准化总体组组织的大模型系列国家标准、中国信通院牵头编制的“大模型预训练模型技术和应用评估方法”系列团体标准,以及教育部教育信息化技术标准委员会暨全国信息技术标准化技术委员会主导的“教育通用大模型”系列标准编制工作。
近期,好未来正作为牵头单位与中国信通院、复旦大学、科大讯飞、百度等行业领先科研机构、高校、企业一同编制教育大模型团体标准,从覆盖场景、应用成效、服务可靠等维度全面评估教育大模型能力,为教育大模型应用落地提供参考与指导。
中国商务新闻网是商务部国际商报社主办,国家互联网信息办公室批准的国
中国商务新闻网是商务部国际商报社主办,国家互联网信息办公室批准的国
企业产能生产情况兖矿国泰120万吨 年日产3000吨华鲁恒升60万吨 年日产1
华南地区醋酸行情观望运行,出厂价报3950元 吨左右自提,国内醋酸市场
国内TDI市场观望运行,场内TDI供应偏紧,工厂挺市心态为主,下游对高价
8月24日,郑州天之瑞新材料有限公司,冰晶石含税出厂报价为7800元 吨,
金属库存总量注册仓单变动注销仓单变动注销占百比(%)上日注销占比(%)铜
今天来聊聊人节的传说,老人节的由来的文章,现在就为大家来简单介绍下
【8月24日涨停复盘:正和生态5连板紫光国微涨停】涨停家数方面,今日合
【英伟达美股盘前涨超8%第二财季业绩全线远超预期】英伟达美股盘前涨超
中国商务新闻网是商务部国际商报社主办,国家互联网信息办公室批准的国
8月23日,中国石化发布消息,我国首台27万立方米液化天然气储罐在青岛
“牛市旗手”盘中加速上攻,券商ETF(512000)场内价格涨2 99%,成交额
中银证券08月24日发布研报称,给予文灿股份(,最新价:元)买入评级。
在深圳知名的华侨城商圈,豪掷超过6700万元,一次性购买1200平方米的写
新京报讯(记者刘旭)8月24日,迪哲医药发布公告宣布,国家药监局附条
国元证券股份有限公司许元琨近期对江苏神通进行研究并发布了研究报告《
8月24日13点33分,海洋经济板块指数报点,涨幅达2%,成交亿元,换手率%
hello大家好,我是城乡经济网小晟来为大家解答以上问题,烯烃的通式是
中国运营商在行动:促进人与自然和谐共生,引言:全球知名智库布鲁斯金
8月23日,澧县纪检监察系统半年度工作调度会召开,会议客观全面总结了
中国商务新闻网是商务部国际商报社主办,国家互联网信息办公室批准的国
中国商务新闻网是商务部国际商报社主办,国家互联网信息办公室批准的国
中国商务新闻网是商务部国际商报社主办,国家互联网信息办公室批准的国
中国商务新闻网是商务部国际商报社主办,国家互联网信息办公室批准的国
如何抓好今冬明春市场监管领域安全生
12月16日,达州市达川区市场监督管理局下发《市场监管领域今冬明春安全生产隐患大排查大整治行动工作方案》,要求下属各部门从2022年12月16日起至2023年3月15日,全面聚焦城镇燃气、特种设备、危险化学品、烟花爆
《2021年度中国对外直接投资统计公报
金港高速公路连接柬埔寨首都金边和该国最大深水海港西哈努克港,是中国路桥按建造—运营—移交模式投资的项目,采用中国设计及质量标准,横跨5个省份,全长187 05公里,双向四车道。金港高速公路通车后,从金边到
总体保持稳定恢复态势 工业经济展现
2022年1至10月,浙江省宁波市811家汽车制造业规上工业总产值2646 8亿元,同比增长14 2%。图为11月19日,工人在领克汽车宁波梅山工厂的总装车间作业。今年以来,受疫情多发散发、市场需求不振等因素影响,国内工业
14家券商获首批个人养老金代销展业资
11月18日晚间,证监会发布《个人养老金基金销售机构名录》,共37家机构入围,其中券商14家,银行16家,独立基金销售机构7家。14家券商包括华泰证券、中信证券、海通证券、国泰君安、申万宏源、中金财富和长江证券
北京再担保承保规模超6000亿 覆盖中
北京中小企业融资再担保有限公司(简称北京再担保)发布的最新数据显示,成立14年来已累计承保规模超过6000亿元,覆盖中小微企业(农户)超过16万户次,积极推动北京市中小微企业融资规模不断扩大。北京再担保2008年
Copyright @ 2001-2023 www.u74.cn All Rights Reserved 商业时报网 版权所有 关于我们
网站信息内容, 均为相关单位具有著作权,未经书面授权,转载注明出处
未经商业时报网书面授权,请勿建立镜像,转载请注明来源,违者依法必究