正在閱讀:

大模型進(jìn)入公考行業(yè)

掃一掃下載界面新聞APP

大模型進(jìn)入公考行業(yè)

對于準(zhǔn)確性要求較高的教育場景,大模型在C端應(yīng)用落地最大的挑戰(zhàn)是“幻覺”問題。

圖片來源:圖蟲

界面新聞記者 | 查沁君

界面新聞編輯 | 文姝琪

大模型正在教育領(lǐng)域加速落地。

7月12日,職教巨頭粉筆(02469.HK)推出公考行業(yè)內(nèi)首個自研的垂直大模型,并宣布將于8月1日上線粉筆AI老師“粉筆頭”。

在此之前,網(wǎng)易有道(NYSE:DAO)、好未來(NYSE:TAL)、作業(yè)幫、猿輔導(dǎo)等教企均已推出各自訓(xùn)練的教育大模型,并結(jié)合口語陪練、作文批改、個性化學(xué)習(xí)等場景,在學(xué)習(xí)機(jī)、詞典筆等硬件中落地。

此前業(yè)內(nèi)有觀點認(rèn)為,隨著通用大模型能力的普遍增強(qiáng),垂直領(lǐng)域的模型沒有存在的必要。對此,粉筆CTO陳建華有不同的看法。

據(jù)其介紹,粉筆從2023年一季度開始探索大模型和教育的結(jié)合。發(fā)現(xiàn),某些場景里,通用大模型的表現(xiàn)不預(yù)期,比如在回答行測這類客觀題時,正確率非常低。在命題方面,通用大模型只能做到模仿題目的形態(tài),在題目的難度、內(nèi)容和考點設(shè)置上法滿足需求。

但通用大模型在面試點評環(huán)節(jié)這類受限的小場景下,效果非常且可控。面試點評是學(xué)生備考的剛需,之前主要由老師人工完成,工作量大、效率低、單價高,如果借助于AI輔助老師進(jìn)行面試點評,老師的點評時間可以從20分鐘縮短到5分鐘之內(nèi)。AI面試點評的可用率也可在90%以上。

面對通用大模型和垂直大模型之間的“紛爭”,好未來CTO田密也曾公開表示,現(xiàn)在通用大模型可以來解決很多尋常的通用問題,但在某個專項任務(wù)上只能解決到六七分的水平,如果想取得更好的結(jié)果,必須在垂直領(lǐng)域上做更專項的訓(xùn)練。

“大模型在B端(企業(yè))內(nèi)部提效方面會更容易落地?!?/span>陳建華稱,例如上述提到的面試點評場景,通過大模型給出點評的內(nèi)容,再輔導(dǎo)老師把關(guān),輸出到學(xué)生端,可提高效率

在他看來,對于準(zhǔn)確性要求比較高的教育場景,C端(用戶)應(yīng)用的落地會面臨著非常大的挑戰(zhàn),其中最大的挑戰(zhàn)就是大模型的“幻覺”問題,例如在一些歷史人物類的嘗試問題中,可能會存在張冠李戴的效果,“這一點對教育行業(yè)來說是非常致命的”。

目前,粉筆的做法是借助于RAG(Retrieval-Augmented Generation)檢索增強(qiáng)生成輔助來克服幻覺,同時利用CoT(思維鏈)讓大模型按照步驟一步步進(jìn)行推理。

另一方面,采用分治法,嘗試將復(fù)雜的問題拆分成足夠簡單的任務(wù)再讓模型處理,陳建華稱,效果會遠(yuǎn)遠(yuǎn)好過于直接將整個復(fù)雜的任務(wù)交給模型處理。

“每個產(chǎn)品都值得用大模型技術(shù)重做一遍。”陳建華認(rèn)為,這里的重做不是要推倒過去已有的成果,而是要借助于大模型從效率、過程和結(jié)果上重塑整個流程,以提供更多可能性。

在應(yīng)用場景上,粉筆AI老師已覆蓋學(xué)員的入班測試理論學(xué)習(xí)、強(qiáng)化練習(xí)、模擬套卷,直到最后的沖刺階段。陳建華預(yù)計今年上線申論AI老師。此外,面試AI老師、事業(yè)單位和教師項目的AI老師也在籌備中。

粉筆副總裁劉帥表示,粉筆AI老師將是未來粉筆主流的最高端的產(chǎn)品之一。

越來越多的AI老師上線,真人老師會失業(yè)嗎?

當(dāng)日發(fā)布會上,粉筆創(chuàng)始人、CEO張小龍對此予以否定,技術(shù)進(jìn)步并不意味著就能取代行業(yè)人士,學(xué)習(xí)的過程不僅僅是知識學(xué)習(xí),與此同時還伴隨著老師提供的情緒價值。相反,技術(shù)解放了人之后,身體會變得越來越強(qiáng),人也會變得越來越有智慧,更有趣、更有意識。

張小龍還表示,粉筆AI老師作為一款C端的AI產(chǎn)品,是“收費(fèi)”且“收得起費(fèi)”的。他同時呼吁:“中國科技領(lǐng)域的朋友們,不要都盯著通用大模型,可以多一些針對具體領(lǐng)域的具體服務(wù),早日實現(xiàn)商業(yè)化?!?/span>

未經(jīng)正式授權(quán)嚴(yán)禁轉(zhuǎn)載本文,侵權(quán)必究。

粉筆科技

172
  • 公考培訓(xùn)龍頭粉筆上半年賺了2.8億,AI是大功臣
  • ETF市場日報 | 房地產(chǎn)板塊反彈,港股相關(guān)ETF批量回調(diào)

評論

暫無評論哦,快來評價一下吧!

下載界面新聞

微信公眾號

微博

大模型進(jìn)入公考行業(yè)

對于準(zhǔn)確性要求較高的教育場景,大模型在C端應(yīng)用落地最大的挑戰(zhàn)是“幻覺”問題。

圖片來源:圖蟲

界面新聞記者 | 查沁君

界面新聞編輯 | 文姝琪

大模型正在教育領(lǐng)域加速落地。

7月12日,職教巨頭粉筆(02469.HK)推出公考行業(yè)內(nèi)首個自研的垂直大模型,并宣布將于8月1日上線粉筆AI老師“粉筆頭”

在此之前,網(wǎng)易有道(NYSE:DAO)、好未來(NYSE:TAL)、作業(yè)幫、猿輔導(dǎo)等教企均已推出各自訓(xùn)練的教育大模型,并結(jié)合口語陪練、作文批改、個性化學(xué)習(xí)等場景,在學(xué)習(xí)機(jī)、詞典筆等硬件中落地。

此前業(yè)內(nèi)有觀點認(rèn)為,隨著通用大模型能力的普遍增強(qiáng),垂直領(lǐng)域的模型沒有存在的必要對此,粉筆CTO陳建華有不同的看法

據(jù)其介紹,粉筆從2023年一季度開始探索大模型和教育的結(jié)合。發(fā)現(xiàn),某些場景里,通用大模型的表現(xiàn)不預(yù)期,比如在回答行測這類客觀題時,正確率非常低。在命題方面,通用大模型只能做到模仿題目的形態(tài),在題目的難度、內(nèi)容和考點設(shè)置上法滿足需求。

但通用大模型在面試點評環(huán)節(jié)這類受限的小場景下,效果非常且可控。面試點評是學(xué)生備考的剛需,之前主要由老師人工完成,工作量大、效率低、單價高,如果借助于AI輔助老師進(jìn)行面試點評,老師的點評時間可以從20分鐘縮短到5分鐘之內(nèi)。AI面試點評的可用率也可在90%以上。

面對通用大模型和垂直大模型之間的“紛爭”,好未來CTO田密也曾公開表示,現(xiàn)在通用大模型可以來解決很多尋常的通用問題,但在某個專項任務(wù)上只能解決到六七分的水平,如果想取得更好的結(jié)果,必須在垂直領(lǐng)域上做更專項的訓(xùn)練。

“大模型在B端(企業(yè))內(nèi)部提效方面會更容易落地?!?/span>陳建華稱,例如上述提到的面試點評場景,通過大模型給出點評的內(nèi)容,再輔導(dǎo)老師把關(guān),輸出到學(xué)生端,可提高效率

在他看來,對于準(zhǔn)確性要求比較高的教育場景,C端(用戶)應(yīng)用的落地會面臨著非常大的挑戰(zhàn),其中最大的挑戰(zhàn)就是大模型的“幻覺”問題,例如在一些歷史人物類的嘗試問題中,可能會存在張冠李戴的效果,“這一點對教育行業(yè)來說是非常致命的”。

目前,粉筆的做法是借助于RAG(Retrieval-Augmented Generation)檢索增強(qiáng)生成輔助來克服幻覺,同時利用CoT(思維鏈)讓大模型按照步驟一步步進(jìn)行推理。

另一方面,采用分治法,嘗試將復(fù)雜的問題拆分成足夠簡單的任務(wù)再讓模型處理,陳建華稱,效果會遠(yuǎn)遠(yuǎn)好過于直接將整個復(fù)雜的任務(wù)交給模型處理。

“每個產(chǎn)品都值得用大模型技術(shù)重做一遍?!?/span>陳建華認(rèn)為,這里的重做不是要推倒過去已有的成果,而是要借助于大模型從效率、過程和結(jié)果上重塑整個流程,以提供更多可能性。

在應(yīng)用場景上,粉筆AI老師已覆蓋學(xué)員的入班測試、理論學(xué)習(xí)強(qiáng)化練習(xí)、模擬套卷,直到最后的沖刺階段。陳建華預(yù)計今年上線申論AI老師。此外,面試AI老師、事業(yè)單位和教師項目的AI老師也在籌備中。

粉筆副總裁劉帥表示,粉筆AI老師將是未來粉筆主流的最高端的產(chǎn)品之一。

越來越多的AI老師上線,真人老師會失業(yè)嗎?

當(dāng)日發(fā)布會上,粉筆創(chuàng)始人、CEO張小龍對此予以否定,技術(shù)進(jìn)步并不意味著就能取代行業(yè)人士,學(xué)習(xí)的過程不僅僅是知識學(xué)習(xí),與此同時還伴隨著老師提供的情緒價值。相反,技術(shù)解放了人之后,身體會變得越來越強(qiáng),人也會變得越來越有智慧,更有趣、更有意識。

張小龍還表示,粉筆AI老師作為一款C端的AI產(chǎn)品,是“收費(fèi)”且“收得起費(fèi)”的。他同時呼吁:“中國科技領(lǐng)域的朋友們,不要都盯著通用大模型,可以多一些針對具體領(lǐng)域的具體服務(wù),早日實現(xiàn)商業(yè)化?!?/span>

未經(jīng)正式授權(quán)嚴(yán)禁轉(zhuǎn)載本文,侵權(quán)必究。