文|雪豹財(cái)經(jīng)社 閆學(xué)功
AI時(shí)代最開放的大模型——12月1日,阿里云CTO周靖人在發(fā)布會(huì)上對(duì)通義千問(wèn)提出了這樣的期望。一個(gè)月前的云棲大會(huì)上,他也同樣將阿里云定義為“AI時(shí)代最開放的一朵云”。
這一天,阿里云開源了通義千問(wèn)720億參數(shù)模型Qwen-72B,這也是目前國(guó)內(nèi)大模型開源的最大參數(shù)。至此,通義千問(wèn)共開源了18億、70億、140億、720億參數(shù)的4款大模型,以及視覺理解、音頻理解兩款多模態(tài)大模型——阿里云稱之為“全尺寸、全模態(tài)”開源。
今年4月發(fā)布的通義千問(wèn),從8月起正式走向開源之路。據(jù)阿里云披露,截至10月末,旗下開源社區(qū)“魔搭”已有超過(guò)2300個(gè)模型,開發(fā)者超過(guò)280萬(wàn),模型下載次數(shù)破億。
開源是阿里云大模型最重要的戰(zhàn)略,但這在業(yè)內(nèi)并不常見。
不論國(guó)外的ChatGPT,還是國(guó)內(nèi)的文心一言,都是閉源形式。在半個(gè)月前,全球知名的人工智能科學(xué)家沈向洋在一個(gè)行業(yè)論壇上談及大模型開源閉源路徑之爭(zhēng)。他認(rèn)為,業(yè)內(nèi)第一名一定是閉源,第二名他仍然躊躇不定,第三名才會(huì)是開源。
當(dāng)時(shí),周靖人就坐在臺(tái)下。
在12月1日的發(fā)布會(huì)上,周靖人正面回答了阿里云一定要做開源的原因?!鞍⒗镌频某踔圆皇前涯P瓦谧约菏稚先ド虡I(yè)化,而是幫助開發(fā)者,開源的策略與阿里云的初心完全一致。”在他看來(lái),要在當(dāng)下突破和創(chuàng)新大模型核心技術(shù),開源是“最佳也是唯一的途徑”。
巨頭們爭(zhēng)相布局的大模型,想象空間到底有多大?
10月下旬,聯(lián)想展示了AI PC(人工智能個(gè)人電腦)功能,聯(lián)想集團(tuán)董事長(zhǎng)兼CEO楊元慶暢想未來(lái)“每個(gè)人都能有個(gè)人大模型”。周靖人則描繪了更具體的圖景:“大家可以想象今后每一個(gè)電子設(shè)備、生活的環(huán)節(jié),從你早上醒來(lái)第一聲鬧鐘開始,背后都有大模型的支持?!?/p>
他甚至表示,不遠(yuǎn)的將來(lái),阿里云再舉辦溝通會(huì),他希望全程用通義千問(wèn)來(lái)回答問(wèn)題。
大模型未來(lái)能為行業(yè)和社會(huì)帶來(lái)什么?目前國(guó)內(nèi)有200多個(gè)大模型,未來(lái)生態(tài)將更繁榮還是迅速洗牌?通義千問(wèn)與ChatGPT目前差距多大 ?令人振奮的超級(jí)人工智能(AGI)時(shí)代何時(shí)能夠到來(lái)?
就上述問(wèn)題,12月1日,阿里云CTO周靖人在通義千問(wèn)發(fā)布會(huì)后做了一場(chǎng)閉門分享,雪豹財(cái)經(jīng)社也受邀參與,以下是對(duì)話實(shí)錄(內(nèi)容經(jīng)摘編):
通義千問(wèn)和ChatGPT 4.0互有勝負(fù)
Q:阿里云在三季報(bào)發(fā)布后宣布,堅(jiān)持更長(zhǎng)期的投入及優(yōu)先公共云的戰(zhàn)略調(diào)整,大模型是否會(huì)有相應(yīng)的策略調(diào)整?
A:我們從年初發(fā)布至今整個(gè)策略都沒(méi)有變化,即一方面做技術(shù)的突破,另一方面做生態(tài),提供模型的能力。阿里CEO吳泳銘提出的戰(zhàn)略調(diào)整,也跟整個(gè)大模型社區(qū)的發(fā)展方向非常吻合,沒(méi)什么具體的差異。公司最近會(huì)把技術(shù)工作路線更加明確下來(lái)。
Q:很多大型廠商選擇了不開源,阿里云為什么要選擇開源模式?
A:我認(rèn)為是大家站位不同。在過(guò)去10年內(nèi),整個(gè)開源社區(qū)蓬勃發(fā)展,今天我們要讓更多技術(shù)和更多人參與進(jìn)來(lái)。開源社區(qū)是最佳的、也是唯一的途徑。只有真正從心底去擁抱開放的生態(tài),去促進(jìn)開發(fā)者社區(qū)的發(fā)展,才能將我們的技術(shù)融入到各行各業(yè),最終幫助整個(gè)核心技術(shù)的突破和創(chuàng)新。
阿里云的初衷不是把模型攥在自己手里,或者做商業(yè)化,而是幫助開發(fā)者。我們的開源策略,跟整個(gè)阿里云的初心是完全一致的。因此,我們不光在模型方面開源,數(shù)據(jù)庫(kù)、技術(shù)等也都貢獻(xiàn)到開源社區(qū)。今天AI的發(fā)展,一定不是由一家公司完成的。不管誰(shuí)有最強(qiáng)的模型,如果沒(méi)有開放的技術(shù)和經(jīng)驗(yàn),是無(wú)法在各項(xiàng)應(yīng)用場(chǎng)景中落地的。
Q:在大模型能力上中國(guó)企業(yè)和美國(guó)企業(yè)的差距是什么?
A:科技創(chuàng)新上,原則上是大家你追我趕,都在做非常中長(zhǎng)期的一系列探索,在這個(gè)時(shí)間點(diǎn)或許有差距,但也許差距在縮小,甚至扭轉(zhuǎn)也有可能。這就是科技創(chuàng)新的魅力。
我們能看到(和ChatGPT)之間有一定差距,還有需要提升的空間,但是不能妄自菲薄。比如多模態(tài)等,國(guó)內(nèi)很多產(chǎn)品也能做到ChatGPT的水平,甚至超越它。通義千問(wèn)和ChatGPT 4.0在使用體感上,是互有勝負(fù)的。
Q:通義千問(wèn)與其他閉源模型相比水平如何?
A:講到評(píng)測(cè)指標(biāo),國(guó)外的Hugging Face在全球比較有影響力,它有一系列測(cè)評(píng)標(biāo)準(zhǔn),會(huì)展現(xiàn)一個(gè)客觀的評(píng)價(jià)。當(dāng)然,不是所有閉源模型都會(huì)參與測(cè)評(píng)。在Hugging Face上,我們?cè)陂_源14B的時(shí)候是非全模型排名第三,72B發(fā)布之后我們會(huì)繼續(xù)等待測(cè)評(píng)。我認(rèn)為我們可能會(huì)登頂。
編者注:Hugging Face是全球最大的開源模型公司,它發(fā)布的各項(xiàng)關(guān)于AI公司的榜單在業(yè)界有一定影響力?!稌r(shí)代周刊》今年首次發(fā)布的全球百大AI人物中,有兩位來(lái)自Hugging Face。
Q:Open AI 最近選擇了Agent作為下一步開發(fā)方向,你們有什么思考和跟進(jìn)?
A:Agent這個(gè)概念不是Open AI最近提出的,但它是一個(gè)非常重要的模型利用的領(lǐng)域。目前我們社區(qū)已經(jīng)貢獻(xiàn)了很多關(guān)于Agent的開發(fā)和創(chuàng)新,接下來(lái)每個(gè)月都有相關(guān)進(jìn)展,包括如何幫開發(fā)者搭建這樣一個(gè)Agent,也會(huì)有一些新的功能推出。
編者注:Agent可以理解為“智能業(yè)務(wù)助理”,它具有人類的思維,在大模型技術(shù)驅(qū)動(dòng)下,以自然語(yǔ)言為交互方式,高自動(dòng)化地執(zhí)行和處理專業(yè)或繁復(fù)的工作任務(wù)。
AI時(shí)代:大模型將改變?nèi)粘I?/h3>
Q:聯(lián)想未來(lái)將會(huì)發(fā)布與阿里云合作完成的AI PC(個(gè)人電腦),大模型會(huì)給PC帶來(lái)哪些實(shí)質(zhì)性影響?
A:與聯(lián)想的合作是一個(gè)良好的開端。我們希望不單單是在復(fù)雜和昂貴的機(jī)器上使用模型的能力,而是把它帶到各種端。當(dāng)我們真正進(jìn)入AI時(shí)代,大模型將改變?nèi)粘I?,模型服?wù)在各個(gè)領(lǐng)域無(wú)所不在。今后每一個(gè)電子設(shè)備和生活環(huán)節(jié),從早晨的鬧鐘開始,都會(huì)有模型的支持。我相信很快會(huì)進(jìn)入這樣一個(gè)時(shí)代。
Q:未來(lái)是否會(huì)和更多硬件廠商進(jìn)行合作?
A:目前已經(jīng)有不少硬件廠商在洽談,我們的心態(tài)是非常開放的。之所以開源,就是為了不局限于某一個(gè)或某幾家廠商,而是有更多開發(fā)者和硬件廠商一起來(lái)參與、推動(dòng)。
Q:怎么看待大模型在C端和B端商業(yè)變現(xiàn)的機(jī)會(huì)和價(jià)值?
A:我們要做是生態(tài)的方方面面,所以當(dāng)前更加關(guān)注的是模型本身。在to C和to B方面應(yīng)用的探索會(huì)有一些,但還沒(méi)有到井噴的狀態(tài)。模型的應(yīng)用是沒(méi)有to C和to B之分的,但我們也希望模型的能力能夠滲透到日常生活和工作學(xué)習(xí)中。接下來(lái)會(huì)看到一些創(chuàng)新,也許今后幾個(gè)月,我們就會(huì)聊到一系列應(yīng)用,以及如何幫助到to C和to B的產(chǎn)品。
Q:阿里云認(rèn)為實(shí)現(xiàn)AGI還要多久?
A:AGI已經(jīng)成為社會(huì)性的話題,有各種各樣的解釋。但我認(rèn)為現(xiàn)在談AGI還太早,因?yàn)檫€有很多技術(shù)難題,還有很多長(zhǎng)足的工作要做。由于ChatGPT的爆發(fā),讓一年前不怎么關(guān)注人工智能的人現(xiàn)在都在關(guān)注,我作為技術(shù)工作者感到欣慰。但從整個(gè)技術(shù)發(fā)展來(lái)看還需要很多時(shí)間,請(qǐng)大家給予更多耐心。不要今天關(guān)注一個(gè)熱點(diǎn),3個(gè)月沒(méi)爆發(fā),大家就淡忘了。
編者注:AGI可以理解為超級(jí)人工智能,Open AI將其作為最終目標(biāo)并寫在公司白皮書中。它如此定義AGI:“一個(gè)高度自治的系統(tǒng),能在多數(shù)有經(jīng)濟(jì)價(jià)值的工作上超越人類。”
Q:通義千問(wèn)會(huì)將技術(shù)產(chǎn)品優(yōu)化和商業(yè)化落地當(dāng)成重點(diǎn),還是像Open AI一樣將AGI當(dāng)作愿景?
A:我們做的工作其實(shí)是沒(méi)有人指引的。通義千問(wèn)首先是追求技術(shù)的卓越和極致的技術(shù)探索。如何能夠把模型的方方面面提升起來(lái)?這本身就是一個(gè)研究課題,這方面一定是我們接下來(lái)的工作重點(diǎn)。
但在這個(gè)時(shí)代,科研、技術(shù)、產(chǎn)品這幾個(gè)維度是更有機(jī)地聯(lián)合在一起的,沒(méi)辦法像以前分得那么開。光埋頭苦干做研究,不做技術(shù)產(chǎn)品、不做技術(shù)生態(tài),在今天也不行。這就是為什么通義千問(wèn)是一整個(gè)通義模型家族。我們不斷追求技術(shù)突破,同時(shí)也開源自己的模型,幫助整個(gè)生態(tài)繁榮。我們還做產(chǎn)品,包括通義千問(wèn)App、網(wǎng)頁(yè)版產(chǎn)品。
200多款大模型的優(yōu)勝劣汰
Q:通義千問(wèn)在技術(shù)上還面臨哪些挑戰(zhàn)?
A:整個(gè)大模型還處在發(fā)展初期。不管誰(shuí)家的大模型,都還有很多提升空間。今天的模型具備視覺、聽覺的能力,但如何像人一樣思考、去識(shí)別萬(wàn)物,所有大模型都還有一定差距。通義千問(wèn)產(chǎn)品這次推出了視覺模型能力,對(duì)圖片的理解在很多層面是超過(guò)ChatGPT 4.0的,但距離人類的認(rèn)知能力還有一定差距。
如何讓這個(gè)模型有更多思維能力、像人一樣去思考,這方面才剛剛起步。我們當(dāng)前有非常多要解決的技術(shù)難點(diǎn),這也是為什么接下來(lái)每個(gè)月都會(huì)有一系列技術(shù)突破。整個(gè)通義千問(wèn)模型的升級(jí)能力遠(yuǎn)遠(yuǎn)沒(méi)有結(jié)束。
Q:實(shí)現(xiàn)了從0到1后,是創(chuàng)新更重要,還是推廣產(chǎn)品更重要?
A:追求技術(shù)的卓越一直是阿里云的初衷。在一定程度上,所謂從0到1和從1到2沒(méi)有本質(zhì)區(qū)別,都是在做突破。從0到1非常難,因?yàn)橐剿饕粭l新的道路。但繼續(xù)把產(chǎn)品技術(shù)打磨好,每提高一個(gè)百分點(diǎn),其實(shí)也隱藏著非常多的技術(shù)難題和投入。
Q:上一次開源14B反響不錯(cuò),為什么要再去開源更高的72B?哪些場(chǎng)景是14B無(wú)法解決的?
A:14B是一個(gè)非常好的起點(diǎn),但模型的能力還在不斷發(fā)展中,創(chuàng)新技術(shù)的突破一直沒(méi)有停止過(guò),14B更往上還有很多提升的空間。這是推出72B模型的初衷,今后14B和7B也會(huì)有升級(jí)的版本出來(lái)。
在不同的企業(yè)和不同的開發(fā)環(huán)境,大家對(duì)模型的尺寸、能力及背后使用的資源有不一樣的考慮,有時(shí)會(huì)追求極致的性能。我們不應(yīng)該用一個(gè)模型、一個(gè)尺寸,要求大家對(duì)接所有的場(chǎng)景,而是應(yīng)該把選擇權(quán)留給開發(fā)者和企業(yè)。
Q:國(guó)內(nèi)已經(jīng)發(fā)布了200多個(gè)大模型,需要這么多嗎?合理的生態(tài)是什么樣的結(jié)構(gòu)?
A:任何一項(xiàng)技術(shù)都有一個(gè)蓬勃發(fā)展并快速迭代的周期,最終也可能受技術(shù)、商業(yè)等各方面的約束而收斂。生態(tài)的好處,就是它自己會(huì)收斂到合適的局面。
今天我們有200多款大模型,能夠感受到科技界積極擁抱的態(tài)度。今年1月時(shí)大家還感覺很消極,覺得跟海外差距很大,到12月已經(jīng)沒(méi)有這樣的感覺。我相信整個(gè)市場(chǎng)、整個(gè)生態(tài)也會(huì)進(jìn)行優(yōu)勝劣汰的選擇,也會(huì)收斂到更完整、完善的狀態(tài),這就是生態(tài)的魅力。