文|腦極體
一度“元?dú)獯髠钡慕膛鄼C(jī)構(gòu),也開(kāi)始加入大模型的熱潮了。
教育+大模型,并不稀奇,自從AI大模型火爆之后,教育就被認(rèn)為是大語(yǔ)言模型最容易落地的領(lǐng)域。稀奇的是,和其他場(chǎng)內(nèi)玩家相比,教培機(jī)構(gòu)的優(yōu)勢(shì)確實(shí)稱(chēng)不上明顯。
目前,市面上在做教育大模型的廠商,大概可以分為三類(lèi):一類(lèi)是大模型廠商,如百度“文心一言”大模型被接入旗下品牌的學(xué)習(xí)手機(jī),科大訊飛推出了星火大模型及學(xué)習(xí)機(jī)產(chǎn)品;第二類(lèi)是教育科技公司,如網(wǎng)易有道打造了“子曰”大模型,作業(yè)幫自研了銀河大模型,可汗學(xué)院、多鄰國(guó)、Coursera、猿輔導(dǎo)等也都紛紛將產(chǎn)品與大模型結(jié)合,推出了AI助手型口語(yǔ)教練。
另一類(lèi),就是受“雙減”影響的教培機(jī)構(gòu)了,如新東方、好未來(lái)、學(xué)而思,也都披露了自家的大模型成果。
大模型在教培市場(chǎng)大有可為,與教培機(jī)構(gòu)在大模型競(jìng)爭(zhēng)中拔得頭籌,這兩個(gè)結(jié)論顯然是不能劃等號(hào)的。
畢竟三類(lèi)玩家中,教培機(jī)構(gòu)可能是離教育最近的一個(gè),但也是離大模型最遠(yuǎn)的一個(gè)。技術(shù)、算力、資金、人才、互聯(lián)網(wǎng)產(chǎn)品營(yíng)銷(xiāo)……教培機(jī)構(gòu)都不可能比科技巨頭、互聯(lián)網(wǎng)企業(yè)玩的更溜。
那么,教培機(jī)構(gòu)做大模型,是不是一場(chǎng)必輸?shù)挠螒蚰??我們認(rèn)為不是。
正像《馬太福音》中所說(shuō),“你們要進(jìn)窄門(mén)。因?yàn)橐綔缤?,那門(mén)是寬的,路是大的,進(jìn)去的人也多;引到永生,那門(mén)是窄的,路是小的,找著的人也少”。
教培機(jī)構(gòu)做大模型,應(yīng)該換一個(gè)思考方向——鉆入“場(chǎng)景”的窄門(mén),走巨頭大廠不愿意投入的“小路”,建立核心競(jìng)爭(zhēng)力。
理解這件事,我們從教培機(jī)構(gòu)究竟為什么要出發(fā),開(kāi)始說(shuō)起。
原點(diǎn),為什么出發(fā)
你可能會(huì)問(wèn),有錢(qián)、有技術(shù)、有實(shí)力的公司有壁壘,搞大模型順理成章。開(kāi)源大模型泛濫,普通公司搞大模型,簡(jiǎn)直就是往紅海里跳,教培機(jī)構(gòu)剛剛從“雙減”陣痛中恢復(fù)了一點(diǎn)元?dú)?,怎么這么想不開(kāi)?
說(shuō)句公道話,教培機(jī)構(gòu)做大模型,邏輯是能夠自洽的。
第一個(gè)合理之處:大模型時(shí)代的教育,也需要教培。
有人說(shuō),大模型可以取代人類(lèi)助教,智能導(dǎo)師比人類(lèi)教師成本更低,這是確實(shí)存在的。但是,大模型僅僅是一個(gè)工具,并不能替代教師和教培機(jī)構(gòu)的服務(wù)內(nèi)容。
短期內(nèi),大模型還有很多技術(shù)難題沒(méi)有解決,比如幻覺(jué),大模型“一本正經(jīng)地胡說(shuō)八道”,輸出的都是錯(cuò)誤的信息,很可能培養(yǎng)出“學(xué)渣”;比如黑箱,大模型生成的內(nèi)容可解釋性不高,思考過(guò)程不清晰的話,答案的可信度不高,讓AI“無(wú)人駕駛”來(lái)輔導(dǎo)孩子,學(xué)習(xí)效果不一定好。
長(zhǎng)期來(lái)看,即使大模型進(jìn)化到極高理解力、極高自動(dòng)化程度、極低錯(cuò)誤率,但教育產(chǎn)品和服務(wù)的本質(zhì)還是學(xué)生,還是需要教培服務(wù)來(lái)更好地滿足“千人千面”的具體需求。
正如同濟(jì)大學(xué)校長(zhǎng)、教授鄭慶華所說(shuō),過(guò)去是老師和學(xué)生的二元結(jié)構(gòu)。今天,機(jī)器在很多領(lǐng)域比老師干得還好。因此,未來(lái)的教學(xué)模式,可能會(huì)拓展為老師、機(jī)器、學(xué)生三元結(jié)構(gòu)。所以,教培機(jī)構(gòu)與AI結(jié)合,還是有很多的可能性的。
第二個(gè)合理之處:教育領(lǐng)域的大模型,精調(diào)少不了。
大模型自身的學(xué)習(xí)能力很強(qiáng),GPT-4在SAT 等考試中都超過(guò)了88%以上的人類(lèi)應(yīng)試者。但就像高考狀元不一定都是好老師,大模型學(xué)得好不代表一定能教得好。教育大模型,需要在通用大模型的基礎(chǔ)上,加上自身數(shù)據(jù)進(jìn)行精調(diào),針對(duì)具體場(chǎng)景進(jìn)行迭代優(yōu)化,才可能(注意是可能)解決很多教育環(huán)節(jié)的具體問(wèn)題。
舉個(gè)例子,實(shí)際應(yīng)用中,教育大模型非常重要的一點(diǎn)就是合規(guī),用于教學(xué)、備課等場(chǎng)景的大模型,對(duì)語(yǔ)言組織能力、邏輯推理能力要求更高,且容錯(cuò)率低,一旦爆出不適當(dāng)?shù)膬?nèi)容就是教學(xué)事故,要提升大模型在此類(lèi)任務(wù)中的安全可控,除了依靠高質(zhì)量的標(biāo)注數(shù)據(jù),還需要專(zhuān)業(yè)教師的反饋、知識(shí)經(jīng)驗(yàn),而擁有大量教師人才和教學(xué)經(jīng)驗(yàn)、數(shù)據(jù)的教培機(jī)構(gòu),顯然是更具備行業(yè)優(yōu)勢(shì)。
第三個(gè)合理之處:短板不是真的短,長(zhǎng)板卻是真的長(zhǎng)。
大家都學(xué)過(guò)田忌賽馬的故事,在競(jìng)賽中獲勝要用自己的長(zhǎng)處去對(duì)付對(duì)手的短處。一眼看去,似乎教培機(jī)構(gòu)在技術(shù)、人才、算力、資金等各方面,都比不上科技巨頭或互聯(lián)網(wǎng)公司,但有沒(méi)有可能,這些短板在實(shí)際中,都不算是什么短板呢?
比如技術(shù),教培機(jī)構(gòu)確實(shí)在基礎(chǔ)模型上的積累不多,但作為垂直行業(yè),教培機(jī)構(gòu)其實(shí)也沒(méi)有必要全力投入自建底層模型,通過(guò)API云端調(diào)用、與頭部廠商合作等方式,用相對(duì)較少的數(shù)據(jù)、算力資源和開(kāi)發(fā)人員,就能建設(shè)出垂類(lèi)的教育大模型。
多鄰國(guó)的生成式AI應(yīng)用,都是基于OpenAI的大模型來(lái)研發(fā)的,其報(bào)告中也強(qiáng)調(diào),要做好功能而非做大模型,專(zhuān)注于應(yīng)用場(chǎng)景。由此可見(jiàn),教培機(jī)構(gòu)如果不在基礎(chǔ)模型賽道上跟科技巨頭正面硬扛,那么所謂“短板”,其實(shí)對(duì)于做垂類(lèi)大模型,影響并沒(méi)有想象的大。
反而教培機(jī)構(gòu)所擁有的數(shù)據(jù)、場(chǎng)景、行業(yè)know-how等“長(zhǎng)板”,在大模型具體落地應(yīng)用時(shí),能發(fā)揮非常關(guān)鍵,甚至關(guān)乎生死的作用。
舉個(gè)例子,教育和AI大模型,本質(zhì)都是先苦后甜、漫長(zhǎng)回報(bào)的慢生意,中間要經(jīng)歷很長(zhǎng)的摸索、研發(fā)、客戶(hù)積累的過(guò)程,習(xí)慣了“大水漫灌”、燒錢(qián)式增長(zhǎng)的科技創(chuàng)業(yè)公司,反而可能因?yàn)樘^(guò)激進(jìn)、導(dǎo)致虧損,反倒是習(xí)慣了做慢生意的教培機(jī)構(gòu),有更多的耐心和教育大模型一同長(zhǎng)跑,更有可能等到盈利的那一天。
所以,往深了看,教培機(jī)構(gòu)做大模型的底層邏輯,其實(shí)是有其合理性的,也是有希望在激烈競(jìng)爭(zhēng)中獲得一席之地的。
終點(diǎn),彼岸的風(fēng)景
第二個(gè)問(wèn)題,更貼近教學(xué)場(chǎng)景的教培機(jī)構(gòu),能給教育大模型帶來(lái)哪些不一樣的選擇呢?區(qū)別于其它教育大模型的差異化競(jìng)爭(zhēng)力,究竟在哪里?
這就要來(lái)說(shuō)說(shuō),目前教育領(lǐng)域都在用大模型干什么。
軟件層面,大模型+教育的新應(yīng)用可以說(shuō)是“亂花漸欲迷人眼”,不過(guò)可以統(tǒng)稱(chēng)為“AI助教”。就是讓大語(yǔ)言模型來(lái)完成大量人類(lèi)教師的重復(fù)性工作,比如撰寫(xiě)講課大綱、口語(yǔ)陪練、作業(yè)助手、互動(dòng)式講題、課堂對(duì)話助手、知識(shí)點(diǎn)查詢(xún)、智能評(píng)卷等,減輕家長(zhǎng)和教師的輔導(dǎo)壓力。
硬件層面,將上述軟件能力集成到學(xué)習(xí)機(jī)、學(xué)生手表、學(xué)生手機(jī)、平板電腦等產(chǎn)品上,結(jié)合拍攝、OCR、姿態(tài)傳感器等硬件能力,對(duì)終端算力、配置、交互等進(jìn)行優(yōu)化,比如要將大模型的規(guī)模壓縮,以便在端側(cè)部署。
目前來(lái)看,隨著入局玩家的增多,無(wú)論是“AI老師”還是AI智能教育硬件,產(chǎn)品功能開(kāi)始趨于同質(zhì)化,逐漸呈現(xiàn)出白熱化的競(jìng)爭(zhēng)態(tài)勢(shì)。這時(shí)候,教培機(jī)構(gòu)做大模型,或許可以從既有優(yōu)勢(shì)中提取出一些差異化能力:
更專(zhuān)精。目前,“AI老師”的同質(zhì)化功能,主要集中在一些容錯(cuò)率較高的場(chǎng)景,比如口語(yǔ)對(duì)話,開(kāi)放式聊天對(duì)大模型的理解能力、邏輯能力等要求,是沒(méi)有那么高的,而一些容錯(cuò)率較低的場(chǎng)景,比如數(shù)學(xué)解題、結(jié)構(gòu)分析等,就比較難了。這恰好是教培機(jī)構(gòu)的強(qiáng)項(xiàng),通過(guò)精調(diào)、人工標(biāo)注等方法,可以與同類(lèi)產(chǎn)品拉開(kāi)差距。我們注意到,學(xué)而思就重點(diǎn)研發(fā)MathGPT數(shù)學(xué)大模型,聚焦在數(shù)學(xué)領(lǐng)域的解題和講題算法。單學(xué)科的精準(zhǔn)輔導(dǎo),可以成為教培機(jī)構(gòu)做大模型的突破方向。
更個(gè)性。大模型好不好用,關(guān)鍵還是要看學(xué)生學(xué)的好不好。有一項(xiàng)1984年的研究發(fā)現(xiàn),接受一對(duì)一輔導(dǎo)的學(xué)生表現(xiàn),比接受傳統(tǒng)課堂教學(xué)的學(xué)生高出兩個(gè)標(biāo)準(zhǔn)差。我們毫不懷疑,未來(lái)接受人類(lèi)優(yōu)秀老師輔導(dǎo)的學(xué)生表現(xiàn),也會(huì)比接受AI老師教學(xué)的學(xué)生高。
因?yàn)椋瑢W(xué)生在人類(lèi)老師的注意和評(píng)價(jià)下,更有學(xué)習(xí)動(dòng)力。所以,對(duì)于教培機(jī)構(gòu)來(lái)說(shuō),未來(lái)可以用大模型來(lái)賦能線上課堂,給老師找個(gè)AI助教,讓人類(lèi)教師有更多的時(shí)間和精力,去深入了解和指導(dǎo)每一個(gè)學(xué)生,洞悉學(xué)生的興趣,制定個(gè)性化的學(xué)習(xí)規(guī)劃,這或許是讓人類(lèi)教師更有職業(yè)成就感,讓學(xué)生學(xué)習(xí)效果更好的方式。通過(guò)人機(jī)協(xié)作,也能減少教育者在適應(yīng)新工具時(shí)的抗拒心理。
其實(shí)說(shuō)白了,教培機(jī)構(gòu)以前在整個(gè)教育體系中所提供的差異化價(jià)值,有了大模型之后,依然沒(méi)變,只不過(guò)用更高生產(chǎn)力的工具去實(shí)現(xiàn)。
兩點(diǎn)之間,過(guò)窄門(mén)
說(shuō)了這么多,感覺(jué)教培機(jī)構(gòu)做大模型,好像是有理有據(jù),既有前途又有錢(qián)途,是不是開(kāi)足馬力、全力投入,就能成功呢?
別忘了,在原點(diǎn)和終點(diǎn)之間,還有許多岔路口,而每一道都可能將教培機(jī)構(gòu)引向歧途。
比如說(shuō),教培機(jī)構(gòu)選基座模型,開(kāi)源還是閉源?
很多人可能會(huì)說(shuō),當(dāng)然是開(kāi)源了,大廠開(kāi)源的大模型性能高、成本近乎免費(fèi),fine-tune微調(diào)一下就能上線,簡(jiǎn)直不要太爽??墒菃?wèn)題來(lái)了,開(kāi)源的free代表自由,也代表著開(kāi)源人可以“不負(fù)責(zé)任”,畢竟又沒(méi)找你收錢(qián),后續(xù)出現(xiàn)了代碼問(wèn)題或者漏洞,沒(méi)人維護(hù)就成了大麻煩。遇到新的勒索軟件/病毒,開(kāi)源人撒手不管,企業(yè)也沒(méi)招。而且,開(kāi)源的open并不是沒(méi)有約束,是要有許可證的,如果開(kāi)發(fā)者不愿意授權(quán),或者濫用開(kāi)源項(xiàng)目,很可能導(dǎo)致系統(tǒng)后續(xù)不可用。所以,用開(kāi)源大模型來(lái)開(kāi)發(fā)自己的垂類(lèi)大模型,風(fēng)險(xiǎn)是客觀存在的,一定要注意合規(guī),防范失控的風(fēng)險(xiǎn)。
那有人可能會(huì)說(shuō),那我直接選閉源大模型作為基座,總沒(méi)問(wèn)題了吧?
值得注意的是,大廠的閉源的基座模型,能力上各有差異,很多排行榜所測(cè)試的能力,未必適配教育場(chǎng)景的需求。比如參數(shù)規(guī)模大的模型,性能表現(xiàn)比較好,但沒(méi)辦法部署到算力有限的端側(cè)教育平板上,教培機(jī)構(gòu)又不可能雇一個(gè)科學(xué)家團(tuán)隊(duì)來(lái)進(jìn)行蒸餾、剪枝之類(lèi)的壓縮處理,是不可用的。所以,要找到最為理想的解決方案,需要教培機(jī)構(gòu)有懂大模型的人才,開(kāi)展專(zhuān)業(yè)的評(píng)測(cè)和選型。
此外,選擇閉源大模型,給基礎(chǔ)模型廠商付費(fèi),這也是一筆真金白銀的開(kāi)支,對(duì)于“元?dú)獯髠钡慕膛鄼C(jī)構(gòu)來(lái)說(shuō),也會(huì)帶來(lái)一定的壓力。
而且基礎(chǔ)模型背靠大廠,在消費(fèi)者和用戶(hù)之間有較高的知名度,選擇這類(lèi)閉源模型確實(shí)可以很快說(shuō)服消費(fèi)者,快速做出購(gòu)買(mǎi)決策,但也將自己與基礎(chǔ)模型廠商捆綁在一起,一旦基礎(chǔ)模型出現(xiàn)誤差,就會(huì)影響消費(fèi)者對(duì)品牌的觀感。教育無(wú)小事,所以教培機(jī)構(gòu)在選擇閉源模型合作方時(shí),也需要慎重考慮,最好是選擇有“國(guó)家隊(duì)”背書(shū)的大模型廠商,才是長(zhǎng)久經(jīng)營(yíng)之道。
除了模型選型,在落地、迭代、營(yíng)銷(xiāo)等多個(gè)環(huán)節(jié),教培機(jī)構(gòu)要真正轉(zhuǎn)型成為一個(gè)大模型能力的科技公司,需要補(bǔ)的課還比較多。
比如應(yīng)用開(kāi)發(fā),教培機(jī)構(gòu)要成為“產(chǎn)品經(jīng)理”。教培機(jī)構(gòu)直接調(diào)用基礎(chǔ)模型API,可以短平快地打造出AI應(yīng)用,但很容易陷入同質(zhì)化競(jìng)爭(zhēng),無(wú)法發(fā)揮其優(yōu)勢(shì),利潤(rùn)空間也會(huì)非常有限,而打造一款爆款A(yù)I原生應(yīng)用,將大模型、AI跟業(yè)務(wù)結(jié)合起來(lái),甄別用戶(hù)的真?zhèn)涡枨?,解決剛需問(wèn)題,做到工程化的可用程度,需要深入到產(chǎn)品級(jí)思考。
幾年前,俞敏洪在《在線教育到底有沒(méi)有未來(lái)?》的一次發(fā)言中,說(shuō)了一句話:是否有持續(xù)的接近剛需的需求,是判斷一個(gè)教育公司的商業(yè)模式是否可以持續(xù)的關(guān)鍵。
大模型+教育剛剛開(kāi)始,老師、家長(zhǎng)、學(xué)生、學(xué)校、機(jī)構(gòu)……都還在一點(diǎn)點(diǎn)探尋需求。其中哪些是恐懼錯(cuò)過(guò)的FOMO情緒驅(qū)動(dòng)下的無(wú)效產(chǎn)物,哪些是真正的持續(xù)的剛需,或許只能交給時(shí)間。而在這個(gè)窗口期內(nèi),傳統(tǒng)教培機(jī)構(gòu)能否生長(zhǎng)出AI產(chǎn)品能力,還是未知數(shù)。
總結(jié)一下,做大模型的路上會(huì)有無(wú)數(shù)岔路,是否有過(guò)窄門(mén)、走小路的勇氣,能否做對(duì)選擇,或許比技術(shù)本身更加重要。
無(wú)論是為了教育,還是為了生意,教培機(jī)構(gòu)都需要新的故事,大模型是必然之選。
教育,將是大模型所孕育的無(wú)數(shù)新產(chǎn)業(yè)里,更早出發(fā)、更晚抵達(dá)的一個(gè)。對(duì)于教培機(jī)構(gòu)來(lái)說(shuō),未嘗不是一件好事,教育大模型的風(fēng)口吹得更久、更長(zhǎng),留給教培機(jī)構(gòu)的轉(zhuǎn)型窗口和成功概率,也就更大一點(diǎn)。