正在閱讀:

好未來推出千億級(jí)數(shù)學(xué)大模型MathGPT,即日開啟內(nèi)測(cè)

掃一掃下載界面新聞APP

好未來推出千億級(jí)數(shù)學(xué)大模型MathGPT,即日開啟內(nèi)測(cè)

MathGPT覆蓋中小學(xué)數(shù)學(xué)題,涵蓋計(jì)算題、應(yīng)用題、代數(shù)題等多個(gè)類型。

圖片來源:界面新聞 匡達(dá)

界面新聞?dòng)浾?| 查沁君

首個(gè)數(shù)學(xué)領(lǐng)域的教育垂直大模型上線。

8月24日,時(shí)值好未來NYSE:TAL)成立20周年,好未來CTO田密在直播活動(dòng)中宣布該公司自研的數(shù)學(xué)領(lǐng)域千億級(jí)大模型Math GPT開啟內(nèi)測(cè)。

今年5月,好未來曾公布正在進(jìn)行自研數(shù)學(xué)大模型的研發(fā),由CTO田密牽頭,命名為MathGPT。主要面向全球數(shù)學(xué)愛好者和科研機(jī)構(gòu),以解題和講題算法為核心。

MathGPT官網(wǎng)顯示,MathGPT的數(shù)學(xué)計(jì)算能力已覆蓋小學(xué)、初中、高中的數(shù)學(xué)題,題型涵蓋計(jì)算題、應(yīng)用題、代數(shù)題等多個(gè)類型,還可以針對(duì)題目進(jìn)行追問,暫未開放數(shù)學(xué)之外的問答互動(dòng)。

用戶使用MathGPT時(shí),用文字或圖片方式上傳數(shù)學(xué)題,即可得到對(duì)話式的解答反饋,答案包含“分析”、“詳解”、“點(diǎn)睛”三個(gè)部分;也可以通過“隨機(jī)來一題”的按鈕,隨機(jī)生成數(shù)學(xué)題目并由系統(tǒng)給出解答。目前,MathGPT支持中文、英文版本的PC端和移動(dòng)端。

據(jù)好未來提供的MathGPT技術(shù)報(bào)告顯示,在個(gè)公開數(shù)學(xué)評(píng)測(cè)集合CEval-Math、AGIEval-Math、APE5K、CMMLU-Math、高考數(shù)學(xué)、Math401的測(cè)試結(jié)果中,MathGPT的表現(xiàn)不差。

多個(gè)大模型在六個(gè)公開數(shù)學(xué)評(píng)測(cè)集合的正確率表現(xiàn)。 圖源:好未來

其中,以微軟華人研究團(tuán)隊(duì)發(fā)布的基準(zhǔn)測(cè)試AGIEval為例,Open AI推出的GPT-4、好未來的MathGPT的正確率分別為39.2%、60.34%;但在Math401評(píng)測(cè)中,GPT-4略勝一籌,正確率高出MathGPT1.5個(gè)百分點(diǎn)。

ChatGLM2、GPT-4、MathGPT在C-Eval的初高中的全科測(cè)試表現(xiàn)。 圖源:好未來

同時(shí),在C-Eval的初高中的全科測(cè)試集合上,MathGPT的表現(xiàn)成績(jī)也普遍高于GPT-4和清華團(tuán)隊(duì)推出的第二代中英雙語對(duì)話模型ChatGLM2。

一個(gè)普遍共識(shí)是,通用大模型“重文輕理”,在數(shù)學(xué)問題的解決、講解、問答和推薦方面則存在明顯的短板。即使是表現(xiàn)優(yōu)異的GPT-4也曾在雞兔同籠的基本數(shù)學(xué)問題上“栽跟頭”。相比大模型更擅長(zhǎng)的語文、英語,數(shù)學(xué)更偏邏輯思維、推理能力,大模型研發(fā)難度也更高。

數(shù)學(xué)光喂內(nèi)容沒用,因?yàn)樗窃韱栴},現(xiàn)有技術(shù)沒法做到套一下就能使用(的地步)。”網(wǎng)易有道(NYSE:DAO)CEO近期在媒體交流時(shí)表示,相反,如果是文字語言型的應(yīng)用,不需要特別強(qiáng)的推理。從現(xiàn)有時(shí)間經(jīng)驗(yàn)來說,英語、語文比數(shù)學(xué)的評(píng)測(cè)結(jié)果更理想,速度也更快。

作為曾經(jīng)數(shù)學(xué)培訓(xùn)的頭部公司,好未來積累了大量的數(shù)學(xué)數(shù)據(jù)和生產(chǎn)能力。2017年,成立AI lab開啟人工智能研究。之所以研發(fā)數(shù)學(xué)垂直大模型,該公司稱“在通往通用人工智能的路上,數(shù)學(xué)推理能力很重要,全球有很多大型公司在做相關(guān)研究?!?/span>

AI帶來了重新定義教育行業(yè)的機(jī)會(huì),大模型技術(shù)使得大規(guī)模的因材施教真正有了實(shí)現(xiàn)的可能。田密認(rèn)為,大模型的本質(zhì),是一種更高效的、從數(shù)據(jù)中學(xué)習(xí)知識(shí)并加以應(yīng)用的方式。

在AI能力的加持下,學(xué)生自學(xué)+AI答疑的新型學(xué)習(xí)方式成為廣泛的可能。學(xué)習(xí)者獲得優(yōu)質(zhì)教學(xué)內(nèi)容的門檻、成本降低,獲得的教學(xué)內(nèi)容個(gè)性化、精細(xì)化程度持續(xù)升高,可以實(shí)現(xiàn)千人千面的AI教學(xué)和答疑輔導(dǎo)。

好未來正與中國信通院、復(fù)旦大學(xué)、科大訊飛(002230.SZ)、百度(BIDU.US)等科研機(jī)構(gòu)、高校、企業(yè)一同編制教育大模型團(tuán)體標(biāo)準(zhǔn),從覆蓋場(chǎng)景、應(yīng)用成效、服務(wù)可靠等維度全面評(píng)估教育大模型能力,為教育大模型應(yīng)用落地提供參考與指導(dǎo)。

大模型訓(xùn)練、運(yùn)營(yíng)及維護(hù)需要大量專業(yè)人才,好未來目前還在招兵買馬。

MathGPT官網(wǎng)顯示,其招聘崗位包括大模NLP算法工程師、大模型訓(xùn)練&推理加速工程師、MathGPT產(chǎn)品經(jīng)理、AI后臺(tái)Golang開發(fā)工程師、資深UI設(shè)計(jì)師(AI方向),以及用戶研究。其中,前兩個(gè)崗位的工作地點(diǎn)不局限于國內(nèi),還包括美國舊金山灣區(qū)的庫比蒂諾(Cupertino),被稱為“硅谷的心臟”,蘋果公司總部也位于此。

在MathGPT發(fā)布同時(shí),好未來也在官網(wǎng)更新了一個(gè)具有代表性和挑戰(zhàn)性的數(shù)學(xué)任務(wù)評(píng)測(cè)集,供全球人工智能專家、數(shù)學(xué)愛好者體驗(yàn)和測(cè)評(píng)。

據(jù)田密透露,隨著內(nèi)測(cè)的順利進(jìn)行,MathGPT的解題能力將得到持續(xù)提升,基于MathGPT的產(chǎn)品級(jí)應(yīng)用也正在加速研發(fā)中,將于近期發(fā)布。

未經(jīng)正式授權(quán)嚴(yán)禁轉(zhuǎn)載本文,侵權(quán)必究。

好未來

2.7k
  • 明泰鋁業(yè)(601677.SH):2024年年報(bào)凈利潤(rùn)為17.48億元
  • 明泰鋁業(yè)(601677.SH):2025年一季報(bào)凈利潤(rùn)為4.40億元

評(píng)論

暫無評(píng)論哦,快來評(píng)價(jià)一下吧!

下載界面新聞

微信公眾號(hào)

微博

好未來推出千億級(jí)數(shù)學(xué)大模型MathGPT,即日開啟內(nèi)測(cè)

MathGPT覆蓋中小學(xué)數(shù)學(xué)題,涵蓋計(jì)算題、應(yīng)用題、代數(shù)題等多個(gè)類型。

圖片來源:界面新聞 匡達(dá)

界面新聞?dòng)浾?| 查沁君

首個(gè)數(shù)學(xué)領(lǐng)域的教育垂直大模型上線。

8月24日,時(shí)值好未來NYSE:TAL)成立20周年,好未來CTO田密在直播活動(dòng)中宣布該公司自研的數(shù)學(xué)領(lǐng)域千億級(jí)大模型Math GPT開啟內(nèi)測(cè)。

今年5月,好未來曾公布正在進(jìn)行自研數(shù)學(xué)大模型的研發(fā),由CTO田密牽頭,命名為MathGPT。主要面向全球數(shù)學(xué)愛好者和科研機(jī)構(gòu),以解題和講題算法為核心。

MathGPT官網(wǎng)顯示,MathGPT的數(shù)學(xué)計(jì)算能力已覆蓋小學(xué)、初中、高中的數(shù)學(xué)題,題型涵蓋計(jì)算題、應(yīng)用題、代數(shù)題等多個(gè)類型,還可以針對(duì)題目進(jìn)行追問,暫未開放數(shù)學(xué)之外的問答互動(dòng)。

用戶使用MathGPT時(shí),用文字或圖片方式上傳數(shù)學(xué)題,即可得到對(duì)話式的解答反饋,答案包含“分析”、“詳解”、“點(diǎn)睛”三個(gè)部分;也可以通過“隨機(jī)來一題”的按鈕,隨機(jī)生成數(shù)學(xué)題目并由系統(tǒng)給出解答。目前,MathGPT支持中文、英文版本的PC端和移動(dòng)端。

據(jù)好未來提供的MathGPT技術(shù)報(bào)告顯示,在個(gè)公開數(shù)學(xué)評(píng)測(cè)集合CEval-Math、AGIEval-Math、APE5K、CMMLU-Math、高考數(shù)學(xué)、Math401的測(cè)試結(jié)果中,MathGPT的表現(xiàn)不差。

多個(gè)大模型在六個(gè)公開數(shù)學(xué)評(píng)測(cè)集合的正確率表現(xiàn)。 圖源:好未來

其中,以微軟華人研究團(tuán)隊(duì)發(fā)布的基準(zhǔn)測(cè)試AGIEval為例,Open AI推出的GPT-4、好未來的MathGPT的正確率分別為39.2%、60.34%;但在Math401評(píng)測(cè)中,GPT-4略勝一籌,正確率高出MathGPT1.5個(gè)百分點(diǎn)。

ChatGLM2、GPT-4、MathGPT在C-Eval的初高中的全科測(cè)試表現(xiàn)。 圖源:好未來

同時(shí),在C-Eval的初高中的全科測(cè)試集合上,MathGPT的表現(xiàn)成績(jī)也普遍高于GPT-4和清華團(tuán)隊(duì)推出的第二代中英雙語對(duì)話模型ChatGLM2。

一個(gè)普遍共識(shí)是,通用大模型“重文輕理”,在數(shù)學(xué)問題的解決、講解、問答和推薦方面則存在明顯的短板。即使是表現(xiàn)優(yōu)異的GPT-4也曾在雞兔同籠的基本數(shù)學(xué)問題上“栽跟頭”。相比大模型更擅長(zhǎng)的語文、英語,數(shù)學(xué)更偏邏輯思維、推理能力,大模型研發(fā)難度也更高。

數(shù)學(xué)光喂內(nèi)容沒用,因?yàn)樗窃韱栴},現(xiàn)有技術(shù)沒法做到套一下就能使用(的地步)。”網(wǎng)易有道(NYSE:DAO)CEO近期在媒體交流時(shí)表示,相反,如果是文字語言型的應(yīng)用,不需要特別強(qiáng)的推理。從現(xiàn)有時(shí)間經(jīng)驗(yàn)來說,英語、語文比數(shù)學(xué)的評(píng)測(cè)結(jié)果更理想,速度也更快。

作為曾經(jīng)數(shù)學(xué)培訓(xùn)的頭部公司,好未來積累了大量的數(shù)學(xué)數(shù)據(jù)和生產(chǎn)能力。2017年,成立AI lab開啟人工智能研究。之所以研發(fā)數(shù)學(xué)垂直大模型,該公司稱“在通往通用人工智能的路上,數(shù)學(xué)推理能力很重要,全球有很多大型公司在做相關(guān)研究?!?/span>

AI帶來了重新定義教育行業(yè)的機(jī)會(huì),大模型技術(shù)使得大規(guī)模的因材施教真正有了實(shí)現(xiàn)的可能。田密認(rèn)為,大模型的本質(zhì),是一種更高效的、從數(shù)據(jù)中學(xué)習(xí)知識(shí)并加以應(yīng)用的方式。

在AI能力的加持下,學(xué)生自學(xué)+AI答疑的新型學(xué)習(xí)方式成為廣泛的可能。學(xué)習(xí)者獲得優(yōu)質(zhì)教學(xué)內(nèi)容的門檻、成本降低,獲得的教學(xué)內(nèi)容個(gè)性化、精細(xì)化程度持續(xù)升高,可以實(shí)現(xiàn)千人千面的AI教學(xué)和答疑輔導(dǎo)。

好未來正與中國信通院、復(fù)旦大學(xué)、科大訊飛(002230.SZ)、百度(BIDU.US)等科研機(jī)構(gòu)、高校、企業(yè)一同編制教育大模型團(tuán)體標(biāo)準(zhǔn),從覆蓋場(chǎng)景、應(yīng)用成效、服務(wù)可靠等維度全面評(píng)估教育大模型能力,為教育大模型應(yīng)用落地提供參考與指導(dǎo)。

大模型訓(xùn)練、運(yùn)營(yíng)及維護(hù)需要大量專業(yè)人才,好未來目前還在招兵買馬。

MathGPT官網(wǎng)顯示,其招聘崗位包括大模NLP算法工程師、大模型訓(xùn)練&推理加速工程師、MathGPT產(chǎn)品經(jīng)理、AI后臺(tái)Golang開發(fā)工程師、資深UI設(shè)計(jì)師(AI方向),以及用戶研究。其中,前兩個(gè)崗位的工作地點(diǎn)不局限于國內(nèi),還包括美國舊金山灣區(qū)的庫比蒂諾(Cupertino),被稱為“硅谷的心臟”,蘋果公司總部也位于此。

在MathGPT發(fā)布同時(shí),好未來也在官網(wǎng)更新了一個(gè)具有代表性和挑戰(zhàn)性的數(shù)學(xué)任務(wù)評(píng)測(cè)集,供全球人工智能專家、數(shù)學(xué)愛好者體驗(yàn)和測(cè)評(píng)。

據(jù)田密透露,隨著內(nèi)測(cè)的順利進(jìn)行,MathGPT的解題能力將得到持續(xù)提升,基于MathGPT的產(chǎn)品級(jí)應(yīng)用也正在加速研發(fā)中,將于近期發(fā)布。

未經(jīng)正式授權(quán)嚴(yán)禁轉(zhuǎn)載本文,侵權(quán)必究。