文|連線Insight 王慧瑩
編輯|子夜
國(guó)產(chǎn)大模型追上ChatGPT要多久?
“百模大戰(zhàn)”伊始,這個(gè)問(wèn)題的答案就成為國(guó)產(chǎn)大模型廠商的一種執(zhí)念。
五個(gè)月前,國(guó)內(nèi)市場(chǎng)正掀起一場(chǎng)大模型的熱潮,科大訊飛帶著星火大模型跑步入場(chǎng),立下了全面對(duì)標(biāo)ChatGPT的“軍令狀”。
“10月24日科大訊飛全球開發(fā)者大會(huì)期間,星火有望能夠全面對(duì)標(biāo)ChatGPT:在中文上要超越ChatGPT,在英文上要達(dá)到跟它相當(dāng)?shù)乃健?。彼時(shí),科大訊飛董事長(zhǎng)劉慶峰提出這個(gè)目標(biāo)。
盡管市場(chǎng)將信將疑,但科大訊飛給出了一張時(shí)間表,并在前天給出了答案。
10月24日,科大訊飛召開全球1024開發(fā)者節(jié)開幕,并發(fā)布了“訊飛星火”認(rèn)知大模型V3.0。據(jù)劉慶峰介紹,該大模型已全面對(duì)標(biāo)ChatGPT(GPT3.5),英文能力相當(dāng),中文能力已實(shí)現(xiàn)超越。
圖源科大訊飛微信公眾號(hào)
與此同時(shí),科大訊飛還發(fā)布了一系列應(yīng)用場(chǎng)景。醫(yī)療、教育、編程、汽車等多個(gè)垂類賽道都有星火大模型的身影。劉慶峰提到,“大模型首先要能夠在工業(yè)和科研領(lǐng)域造福人類,這才是我們真正解決社會(huì)剛需的地方。”
事實(shí)上,過(guò)去五個(gè)月,科大訊飛已經(jīng)完成了對(duì)星火大模型的多次升級(jí)。6月9日,星火大模型V1.5發(fā)布,開放式問(wèn)答、多輪對(duì)話及數(shù)學(xué)能力升級(jí);8月15日,星火大模型升級(jí)至V2.0,突破代碼能力、多模態(tài)交互再升級(jí)。
依靠算力、技術(shù)的支撐,星火大模型升級(jí)迭代速度的確夠快。不過(guò),當(dāng)同行業(yè)都在用力奔跑時(shí),科大訊飛也必須要面臨技術(shù)上和落地場(chǎng)景的考驗(yàn)。
更重要的是,過(guò)去幾年,業(yè)績(jī)?cè)鏊俜啪彙衾麧?rùn)下跌,科大訊飛需要一個(gè)新的故事來(lái)證明自己,并挽回資本市場(chǎng)信心。作為“A股第一家以人工智能為主業(yè)上市的公司 ”,抓住大模型的意義對(duì)于科大訊飛來(lái)說(shuō)不亞于尋找一條新的增長(zhǎng)曲線。
當(dāng)然,大模型行業(yè)的投入并非一朝一夕,科大訊飛還在繼續(xù)投入,劉慶峰又提出了一個(gè)新目標(biāo)——2024年上半年,星火大模型要實(shí)現(xiàn)對(duì)標(biāo)GPT-4,新的時(shí)間表的提出,也意味著科大訊飛接下來(lái)依然要全情投入,這對(duì)科大訊飛來(lái)說(shuō),有動(dòng)力也有壓力。
01 星火大模型,跑到了哪一步?
“我們?nèi)缙趦冬F(xiàn)了自己給大家的時(shí)刻表?!?/p>
10月24日,科大訊飛全球開發(fā)者大會(huì)上,科大訊飛董事長(zhǎng)劉慶峰激動(dòng)地說(shuō)出這句話,同時(shí)發(fā)布了“訊飛星火”認(rèn)知大模型V3.0。
這對(duì)于科大訊飛來(lái)說(shuō)確實(shí)不容易。從發(fā)布時(shí)間上看,隨著百度文心一言、阿里通義千問(wèn)的推出,今年5月份科大訊飛的星火大模型姍姍來(lái)遲,并不具備先發(fā)優(yōu)勢(shì)。
不過(guò),和別家不同的是,從一開始科大訊飛就給出了明確的升級(jí)版本時(shí)間表。
彼時(shí),科大訊飛方面表示,在2023年內(nèi)預(yù)計(jì)還會(huì)進(jìn)行三次升級(jí),分批次增強(qiáng)數(shù)學(xué)能力、補(bǔ)足代碼能力,希望最終將在10月24日全球開發(fā)者大會(huì)期間,能夠全面對(duì)標(biāo)ChatGPT,在中文上要超越ChatGPT,英文上要達(dá)到和它相當(dāng)?shù)乃健?/p>
科大訊飛研究院院長(zhǎng)劉聰在接受媒體群訪時(shí)談及原因,“定這個(gè)東西肯定不是拍腦袋,之所以能立這個(gè) flag,是因?yàn)榧扔屑夹g(shù)邏輯,也有我們產(chǎn)品和場(chǎng)景落地的邏輯?!?/p>
從科大訊飛宣布的進(jìn)展來(lái)看,經(jīng)歷兩次迭代,訊飛星火大模型先后突破開放式問(wèn)答、代碼能力,并升級(jí)了多輪對(duì)話能力、多模態(tài)交互能力。此次,星火V3.0在文本生成、語(yǔ)言理解、知識(shí)問(wèn)答、邏輯推理、數(shù)學(xué)能力、代碼能力和多模態(tài)能力7大方面都有了顯著的提升。
其中,星火V3.0最受關(guān)注的新功能莫過(guò)于虛擬人格功能。在應(yīng)用過(guò)程中,用戶可以通過(guò)“友伴”從性格、情緒、表達(dá)風(fēng)格等方面設(shè)定AI助手的基本人設(shè),且可以導(dǎo)入特定的知識(shí)、相關(guān)對(duì)話記錄形成個(gè)性化的記憶。
據(jù)劉慶峰介紹,科大訊飛根據(jù)《通用認(rèn)知智能大模型評(píng)測(cè)體系》構(gòu)建測(cè)試集,采用盲測(cè)進(jìn)行測(cè)試,結(jié)果顯示:訊飛星火V3.0的中文能力客觀評(píng)測(cè)已超越ChatGPT。
可以看到,自從入科大訊飛入局以來(lái),ChatGPT就被科大訊飛反復(fù)提及,并對(duì)標(biāo)超越。如今,要討論星火大模型是否超過(guò)了ChatGPT,一組報(bào)告或許可以參考。
根據(jù)國(guó)務(wù)院發(fā)展中心國(guó)研經(jīng)濟(jì)研究院的橫評(píng)報(bào)告,星火大模型綜合能力已超越ChatGPT,實(shí)現(xiàn)國(guó)內(nèi)領(lǐng)先,國(guó)際一流,且在教育、醫(yī)療和法律行業(yè)表現(xiàn)尤為突出。
此外,根據(jù)OpenAI在官網(wǎng)發(fā)布的英文任務(wù)測(cè)試集,在10月16日至20日的測(cè)試中,星火V3.0的英文能力對(duì)標(biāo)ChatGPT48項(xiàng)任務(wù)結(jié)果相當(dāng),二者得分分別為85.1%(星火V3.0)和84.3%。
事實(shí)上,星火V3.0是在星火V2.0基礎(chǔ)上的升級(jí),尤其是在數(shù)學(xué)能力和代碼能力等上有了明顯的“進(jìn)化”,也讓星火V3.0趕超ChatGPT3.5成為可能。
在發(fā)布會(huì)上,劉慶峰喊出了新一步的目標(biāo),預(yù)計(jì)在2024年上半年將會(huì)發(fā)布星火認(rèn)知大模型V4.0,屆時(shí)將會(huì)對(duì)標(biāo)GPT4。
不過(guò),盡管科大訊飛提到,星火V3.0綜合能力已經(jīng)超過(guò)ChatGPT3.5,但國(guó)產(chǎn)大模型仍在一些方面與ChatGPT存在差距,這也增加了星火大模型4.0對(duì)標(biāo)ChatGPT4的難度。
“中國(guó)現(xiàn)有的大模型根基實(shí)力,與GPT-4仍有差距?!眲c峰坦言,在復(fù)雜知識(shí)推理、小樣本快速學(xué)習(xí)、超長(zhǎng)文本處理以及跨模態(tài)的統(tǒng)一理解上,國(guó)產(chǎn)模型還有不小的差距。
“雖然 flag 立在那,但是客觀來(lái)說(shuō)完成得并沒有那么輕松。每次快開發(fā)布會(huì)時(shí),都處于緊急上線的狀態(tài),實(shí)際上這個(gè)目標(biāo)還是有挑戰(zhàn)性的。然而,有這樣一個(gè)團(tuán)隊(duì)存在,再加上我們之前對(duì) AI 的積累和理解,我們對(duì)達(dá)到 GPT4 這個(gè)水平非常有信心。唯一令人擔(dān)心的是我們需要花費(fèi)多少時(shí)間來(lái)實(shí)現(xiàn)這個(gè)目標(biāo)。”科大訊飛研究院院長(zhǎng)劉聰如是說(shuō)道。
02 為大模型投入巨大,也需要大模型拉升信心
“遙遙領(lǐng)先,如期而至”,這是發(fā)布會(huì)上科大訊飛董事長(zhǎng)劉慶峰多次提到的字眼。
看似篤定的話語(yǔ)中,其實(shí)透露著劉慶峰和科大訊飛的焦慮。盡管科大訊飛在AI領(lǐng)域有著多年積累,這場(chǎng)國(guó)產(chǎn)大模型軍備競(jìng)賽依舊打得火熱,科大訊飛想要一直對(duì)標(biāo)并超越ChatGPT,難度不小。
眾所周知,大模型是“大數(shù)據(jù)+大算力+強(qiáng)算法”結(jié)合的產(chǎn)物,科技企業(yè)的技術(shù)底座決定了其AI大模型的應(yīng)用價(jià)值。
對(duì)于星火大模型而言,科大訊飛很早就確認(rèn)了“1+N+X”的生態(tài)布局?!?”是核心的底座,“N”是訊飛自有賽道的自有產(chǎn)品,“X”是生態(tài)。它們之間的關(guān)聯(lián)是,底座本身的提升會(huì)帶來(lái)“N”的提升,也帶來(lái)“X”的提升。
這樣的思路之下,今年8月中旬,科大訊飛聯(lián)合華為推出了大模型算力硬件 “星火一體機(jī)”。一體機(jī)的特點(diǎn)是可以私有化部署大模型,讓所有企業(yè)都可以在國(guó)產(chǎn)自主創(chuàng)新平臺(tái)上私有化部署大模型。
1個(gè)月后的華為全聯(lián)接大會(huì)上,劉慶峰在演講中透露了與華為的進(jìn)一步合作。而在10月24日,科大訊飛聯(lián)合華為正式推出基于昇騰生態(tài)的自主創(chuàng)新大模型算力底座“飛星一號(hào)”平臺(tái),支持訊飛星火大模型在對(duì)標(biāo)GPT-4之路上,實(shí)現(xiàn)更大規(guī)模的訓(xùn)練。
自5月6日星火發(fā)布以來(lái),訊飛開放平臺(tái)新增143.4萬(wàn)開發(fā)者團(tuán)隊(duì),同比增幅331%,其中新增大模型開發(fā)者17.8萬(wàn)。大模型也顯著降低了開發(fā)者門檻,在訊飛星火上,已有1.5萬(wàn)助手開發(fā)者,開發(fā)超2.9萬(wàn)個(gè)助手應(yīng)用。
技術(shù)的升級(jí),離不開真金白銀的投入,更何況是燒錢的大模型行業(yè)。據(jù)新智元報(bào)道,大模型的訓(xùn)練及運(yùn)行成本極高,GPT-4一次訓(xùn)練成本估計(jì)要6300萬(wàn)美元,且由于每次提問(wèn)都需要進(jìn)行大量新的計(jì)算,難以形成標(biāo)準(zhǔn)軟件的規(guī)律效益,企業(yè)投入成本是個(gè)不小挑戰(zhàn)。
9月,知名投資機(jī)構(gòu)紅杉資本的David Cahn發(fā)布文章稱,如今的AI產(chǎn)業(yè)還需1250億美元的營(yíng)收,才能掙回為了大模型在GPU、數(shù)據(jù)中心、能源等成本上的投入。但目前AI在應(yīng)用層面上的創(chuàng)新與商業(yè)化前景,與1250億美元的閾值還有巨大的分歧。
巨大的投入成本,在科大訊飛身上也有體現(xiàn)。
科大訊飛2023年三季度財(cái)報(bào)顯示,2023年第三季度公司實(shí)現(xiàn)營(yíng)業(yè)收入47.72億元,同比增長(zhǎng)2.89%;歸母凈利潤(rùn)為2579.01萬(wàn)元,同比下滑81.86%;扣非后歸母凈利潤(rùn)由盈轉(zhuǎn)虧,為-2018.87萬(wàn)元,同比降113.65%。
從前三季度情況看,科大訊飛實(shí)現(xiàn)營(yíng)業(yè)收入126.14億元,同比略微下滑0.37%;歸屬于上市公司股東的凈利潤(rùn)9936.21萬(wàn)元,同比下滑76%。
對(duì)于財(cái)報(bào)的表現(xiàn),科大訊飛給出的理由為,“在通用人工智能認(rèn)知大模型等方面堅(jiān)定投入”。今年前三季度,科大訊飛在研發(fā)方面支出費(fèi)用達(dá)到24.98億,同比增長(zhǎng)7.19%。
成本居高不下,繼續(xù)投入?yún)s有必要,這種情況下,更需要盡快實(shí)現(xiàn)商業(yè)化。因此,當(dāng)廠商們?cè)诒绕醇夹g(shù)時(shí),拼場(chǎng)景、拼應(yīng)用也在同步進(jìn)行。
民生證券在研報(bào)中指出,“單純發(fā)布一個(gè)大模型的門檻沒有市場(chǎng)想象中的那么高”,難的是“有一個(gè)能持續(xù)迭代,性能不斷提升的優(yōu)質(zhì)大模型”,優(yōu)質(zhì)的、獨(dú)特的數(shù)據(jù)價(jià)值更大。
事實(shí)上,大模型的浪潮,科大訊飛必須要抓住。這不僅能給科大訊飛帶來(lái)新的增長(zhǎng),更重要的是通過(guò)大模型挽回資本市場(chǎng)的信心。
在發(fā)布星火V3.0的當(dāng)天,資本市場(chǎng)給科大訊飛澆了一盆冷水。10月24日,科大訊飛午后跳水持續(xù)走低,截至收盤,科大訊飛以跌停價(jià)46.70元報(bào)收。截至發(fā)稿,科大訊飛市值為1054.33億元。
總的來(lái)看,技術(shù)層面科大訊飛已然拿到了AI大模型的門票,最終能否在行業(yè)中搶占新的先機(jī),還要看具體的商業(yè)落地表現(xiàn)。
03 深耕垂類,更有希望?
科大訊飛是一家典型的技術(shù)公司。1999年,科大訊飛以智能語(yǔ)音技術(shù)起家,經(jīng)過(guò)二十多年的發(fā)展,科大訊飛在語(yǔ)音合成、語(yǔ)音識(shí)別、自然語(yǔ)言處理等核心技術(shù)領(lǐng)域處于國(guó)際領(lǐng)先水平。
但在AI大模型領(lǐng)域,技術(shù)是一回事,商業(yè)落地又是另一回事?;谶@樣的思考,“技術(shù)頂天,應(yīng)用落地”是科大訊飛在發(fā)展大模型過(guò)程中始終遵循的兩項(xiàng)準(zhǔn)則,在研發(fā)技術(shù)的同時(shí),思考場(chǎng)景落地與商業(yè)化。
一個(gè)業(yè)內(nèi)的共識(shí)是,“百模大戰(zhàn)”至今,國(guó)產(chǎn)大模型已從“卷參數(shù)”進(jìn)入了“卷應(yīng)用”。紅衫資本在近期的一份研究報(bào)告中也指出,當(dāng)下的大模型競(jìng)逐已進(jìn)入第二階段,比起技術(shù),更強(qiáng)調(diào)產(chǎn)品體驗(yàn)與應(yīng)用形態(tài)。
簡(jiǎn)而言之,大模型跑得快的標(biāo)準(zhǔn)正變成好用和實(shí)用。
放眼整個(gè)行業(yè),B端仍是大模型商業(yè)化落地的重點(diǎn),各行各業(yè)對(duì)大模型的需求很強(qiáng)烈,大家都想借助大模型的AI能力,助力企業(yè)的數(shù)智化轉(zhuǎn)型。
具體而言,發(fā)布會(huì)上,科大訊飛發(fā)布了星火V3.0的能力集成與部署進(jìn)一系列賦能行業(yè)與場(chǎng)景的商業(yè)化產(chǎn)品中,如全新升級(jí)的iFlyCode2.0(智能編程助手),與中科院文獻(xiàn)情報(bào)中心聯(lián)合打造的星火科研助手、教育領(lǐng)域的AI心理伙伴、醫(yī)療領(lǐng)域的曉醫(yī)助手等。
此外,最新發(fā)布的訊飛星火V3.0將賦能智能座艙全面升級(jí),面向多樣化的汽車使用場(chǎng)景,科大訊飛推出星火座艙OS、星火汽車APP和星火座艙域控,支持實(shí)時(shí)檢索,可以實(shí)現(xiàn)插件化調(diào)度,并集成多模態(tài)生成的能力,為合作伙伴提供自主可控、組件化、更開放的座艙解決方案。
同時(shí),科大訊飛還面向金融、汽車、運(yùn)營(yíng)商、工業(yè)、住建、物業(yè)、法律、科研文獻(xiàn)、傳媒、政務(wù)、文旅、水利等12個(gè)領(lǐng)域發(fā)布了垂直行業(yè)大模型。
一個(gè)明顯的趨勢(shì)是,大模型C端市場(chǎng)需求增量明顯,這給了B端和C端兩條腿走路的科大訊飛更多大模型落地的機(jī)會(huì)。
發(fā)布會(huì)上,星火V3.0推出了多項(xiàng)應(yīng)用大模型的C端產(chǎn)品,如具備英語(yǔ)AI答疑輔學(xué)的訊飛AI學(xué)習(xí)機(jī)、面向未來(lái)的人形機(jī)器人等。
值得關(guān)注的是,教育一直是科大訊飛的核心產(chǎn)品線。此次發(fā)布的AI心理咨詢師“小星”與以往發(fā)布的教育產(chǎn)品不同,更加關(guān)注學(xué)生心理健康?!靶⌒恰痹谛腔鸫竽P偷募映窒?,能夠通過(guò)視頻、語(yǔ)音、文字等多模態(tài)方式與青少年展開類人自由對(duì)話,理解青少年的情緒情感,表達(dá)接納與共情,促進(jìn)青少年自我覺察,并提供個(gè)性化行動(dòng)建議。
圖源科大訊飛微信公眾號(hào)
不過(guò),無(wú)論是企業(yè)和開發(fā)者,對(duì)于大模型的和使用方式有不同的差異。比起主打普惠使用的“全面型”能力,大模型要在千行百業(yè)應(yīng)用起來(lái),考驗(yàn)的是更快速精準(zhǔn)的算力,和更具特色化的功能。想讓大模型真正用起來(lái),需要國(guó)產(chǎn)大模型廠商找到高頻剛需的應(yīng)用場(chǎng)景,打造殺手級(jí)應(yīng)用。
劉慶峰在會(huì)上透露,自訊飛星火9月5日對(duì)公眾開放以來(lái),當(dāng)前已有1200萬(wàn)用戶。升級(jí)到V3.0后,訊飛星火在七大能力——文本生成、語(yǔ)言理解、知識(shí)問(wèn)答、邏輯推理、數(shù)學(xué)能力、代碼能力以及多模態(tài)上有了持續(xù)的提升。
談及大模型的商業(yè)回報(bào)周期,劉慶峰表示,“至于商業(yè)收益方面,我認(rèn)為明年將會(huì)顯現(xiàn)出明顯的效果。然而,我們還有很多工作要做,不能說(shuō)已經(jīng)達(dá)到了一個(gè)穩(wěn)定狀態(tài),還需要時(shí)間來(lái)完善細(xì)節(jié)并逐步訓(xùn)練?!?/p>
大模型掀起的熱潮過(guò)去了大半年,經(jīng)歷了一輪輪軍備競(jìng)賽之后,大模型已經(jīng)告別了最初的技術(shù)比拼,玩家們開始冷靜思考下半場(chǎng)的決勝點(diǎn)?;蛟S,誰(shuí)能率先將大模型技術(shù)與更多產(chǎn)業(yè)場(chǎng)景結(jié)合,訓(xùn)練更垂直化的能力,誰(shuí)就能搶到更多蛋糕。