据了解, 目前学而思正在进行自研数学大模型的研发,并命名为MathGPT,面向全球数学爱好者和科研机构,以数学领域的解题和讲题算法为核心,当前已经取得阶段性成果,将于年内推出基于该自研大模型的产品级应用。
据悉,学而思已将MathGPT作为公司核心项目,由CTO田密负责,今年春节前,该项目已经启动相应的团队建设、数据、算力准备和技术研发。此外,学而思已经启动在美国硅谷的团队建设,将成立一支海外算法和工程团队,在全球范围内招募优秀的人工智能专家加入。
MathGPT与大语言模型(LLM)的差异
(资料图片)
美国OpenAI公司在今年三月份发布了大语言模型GPT-4,国内百度、阿里也发布了各自的大模型产品,但通用语言模型更像一个“文科生”,在语言翻译、摘要、理解和生成等任务上有出色表现,在数学问题的解决、讲解、问答和推荐方面则存在不足:解答数学问题经常出错,有些数学问题虽然能够解决,但方法更偏成年人,无法针对适龄孩子的知识结构和认知水平做适配。
“这种不足是由LLM模型的自身特点决定的。”学而思AI团队负责人介绍,LLM大模型来自对海量语言文本的训练,因此最擅长语言处理。行业内偏向基于LLM大模型做阅读、写作类应用,但如果想要在数学能力上有突破,就需要研发新的大模型。因此, 学而思决心组建团队专研MathGPT——数学领域大模型,用自己在数学和AI上的多年积累,面向全球范围内的数学爱好者和科研机构,做好AI大模型时代的数学基础工作。
学而思希望通过MathGPT弥补和攻克大语言模型的三个问题:第一,题目要解对,目前市面上一些语言模型计算结果尚不完善,错误较多;第二,解题步骤要稳定、清晰,目前市面上一些语言模型解题步骤每次都不一样,而且生成内容经常冗余;第三,解题要讲得有趣、个性化,同样目前市面上一些语言模型,存在解释过于学术化与机械化等问题,体验不友好。
做MathGPT,学而思凭什么
学而思作为获科技部批准的“智慧教育国家新一代人工智能开放创新平台”建设单位,在人工智能领域有着多年的深入研究,早在2017年,学而思便成立了AI lab人工智能实验室。
据公开信息显示,基于智慧教育人工智能开放创新平台的助力, 学而思AI lab获得各类学术会议比赛冠军16项,亚军6项;发表国际期刊和会议高水平学术论文31篇,包含光学字符识别、图像、自然语言处理、语音以及多模态等多领域的学术研究,在计算机视觉领域以及自然语言方面均有多篇论文发表; 申请专利220余项,授权专利150余项,软件著作权60余项。
学而思AI lab在各类学术会议比赛的获奖情况
“以数学起家”的学而思至今已有20年的数学教学经验,积累了庞大的数学相关数据,这些数据是进行MathGPT训练的必备物料。另外,学而思的海外业务Think Academy在全球若干国家和地区深受数学爱好者喜欢,学而思的学生在每年的IMO和AMC等国际数学竞赛中表现优异,每年都有多位学生在国际奥林匹克数学竞赛中拿到金牌。所以,学而思选择在MathGPT方向发力也顺理成章。
另据了解, 学而思学习机近期将会上线一款“AI助手”,涵盖作文助手、口语助手、阅读助手、数学助手等相关功能,该AI产品将于5月11日开启内测。
MathGPT的挑战和技术难题
如何利用大语言模型服务各行各业是当下社会的焦点问题。比如在教育领域,Duolingo、Quizlet、可汗学院等产品主要和OpenAI合作,在GPT大模型上做微调和接口调用,增强原有的产品体验。但也有一些领域如数学、医学等,对AI的需求是准确、清晰、具备强大的逻辑推理能力,且容错率低,通用LLM目前的性能表现还无法在上述领域取得突破,未来是否能取得突破尚不清晰。
以数学领域为例,目前市场上有几个主要流派。比如Google收购的Photomath、微软数学、Mathway、专注数学计算的WolframAlpha等产品,主要利用非LLM的传统AI技术加上数据库的方式解决数学问题。走AGI路线的公司则尝试让通用LLM“更懂数学”,比如GPT4在数学任务上比之前的3.5版本性能更好,谷歌旗下的Minerva模型也专门针对数学问题进行调优。学而思则选择了另一条少有人走的路,不基于现有LLM做微调和接口调用、不做通用LLM, 而是自研基于专业领域的“数学大模型”MathGPT,致力于打造自主、稳定、可持续、高质量的学习解决方案。
在大语言模型不断进化的浪潮下,不同的技术路线选择孰优孰劣,仍有待讨论和验证。学而思自研独立的MathGPT大模型是否成立,是否能够超越通用模型在数学任务上的表现,是否更匹配不同人群的数学学习场景,这个问题还需要在创新实践中寻找答案。随着整个行业的深化发展和越来越多人才参与到这个领域,相信不久的将来就能看到更为成熟的解决方案。
文/李梅
责任编辑:
标签:
美国OpenAI公司在今年三月份发布了大语言模型GPT-4,国内百度、阿里...
1、恢复关联的方法一:右键单击MP3选择“打开方式”-“选择程序”。...
挑战奋进不拘一格他们的青年和我们一样吗?我们的青春又该是什么样...
白加克哈子是乌苏市天成驾校的一名教练,他现在有150多名学员。教学...
2022年,金新农实现营业收入397393 62万元,同比下降18 35%;归属...
2023年上半年新疆初级银行从业资格考试时间为6月3日-6月4日,采用闭...
国际油价出现大暴跌3天跌幅超过11%五一假期国内油价休市,期间国际...
今天来聊聊关于四平青年之狂暴之路完整版在线观看,四平青年之狂暴...
5月5日,A股三大指数全天走低,截至收盘,上证指数跌0 48%,报收33...
第一季度成绩单出炉!宿州全省第七!,皖北,阜阳,亳州,皖南,安徽省,...
新团员面向团旗庄严宣誓。眉山市彭山区委宣传部供图“青年如初春,...
1、宋朝司马光出生于官宦世家。2、从小机智过人,勤奋好学。3、刚满...
金投白银网提供浙江省造老银元价格(2023年05月05日),浙江银元最...
颈动脉狭窄号称人类健康的“头号杀手”。近日,扬大附院神经外科主...
北京时间5月6日,迎来二十四节气第七个节气立夏。古诗云:春深百卉...
以下是淳中科技在北京时间4月14日14:03分盘口异动快照:4月14日,淳...
5月5日是世界肺动脉高压日,肺动脉高压指肺动脉压力升高超过一定界...
富途资讯5月5日消息,港股上午盘三大指数高开上攻后涨幅收窄。截至...
证券时报e公司讯,企查查APP显示,近日,广州欧讯光电有限公司成立...
晶合集成(688249)今日新股上市,首日开盘价22 98元,晶合集成于今...
4月30日,中国石油实施的首个配套储能光伏发电项目——喀什地区110...
2023年6月证券行业专业人员水平评价(新疆、西藏、青海)专场测试公...
以下是天禄科技在北京时间5月5日10:19分盘口异动快照:5月5日,天禄...
三花智控:已对机器人机电执行器领域展开持续研究和产品开发工作
央视网消息:农业农村部发布最新数据,4月份,全国菜篮子价格指数为...
i恋综的友友们请举手!小剧最近追《喜欢你我也是4》上头了!!谁说...
厂通路潮白河大桥主桥建设现场。赵永辉摄5月1日,连接京冀的厂通路...
1、武汉唯牛有道食品有限公司于2019年03月11日成立。2、法定代表人...
中欧基金管理有限公司(以下简称“基金管理人”或“本公司”)管理...
“五一”假期,扬州的小龙虾馆成为餐饮排队主力军之一。昨天,记者...