正在閱讀:

對沖基金Coatue最新報告:OpenAI不一定是贏家,AI黃金時代還沒來

掃一掃下載界面新聞APP

對沖基金Coatue最新報告:OpenAI不一定是贏家,AI黃金時代還沒來

就目前來看,生成式人工智能是被過度炒作了?

文|適道  

Gary Marcus曾開過一個玩笑:“幾年前,如果你的初創(chuàng)公司域名中有.ai,那么你可以在你的估值后面加一個零?,F在呢,可能會是兩個零,尤其當你說自己正在用生成式AI?!?/p>

這句話道出了行業(yè)的最大疑慮——就目前來看,生成式人工智能是被過度炒作了嗎?

今年10月,全球科技研究和咨詢公司CCS Insight發(fā)布預測報告稱:2023年大熱的生成式人工智能領域將在2024年接受現實的檢驗。具體表現為:技術炒作逐漸消退,運行成本不斷上升,監(jiān)管呼聲越來越多,投資人不再像之前那樣興奮和樂觀。

近期,比爾.蓋茨在接受德國《商報》(Handelsblatt)采訪時也表示:“OpenAI內部包括Atlman在內的很多人,都相信GPT-5將明顯優(yōu)于GPT-4。但我有很多理由相信當前生成式人工智能已經達到極限?!?/p>

人們傾向于在短期內高估一項技術的效果,并在長期低估其效果?,F在誰都知道生成式AI尚處在“尷尬的青春期”,但對這個青春期要持續(xù)多久,什么時候轉變,還不是非常清晰。

而對于早期投資者而言,能夠準確判斷轉機至關重要。

前幾日,“華爾街TMT之王”美國對沖基金Coatue發(fā)布了一份115頁的報告(The AI Revolution),360度無死角分析了當前AI所處的階段、AI能否跨越炒作周期、開源和閉源、以AI為中心的生態(tài)系統等等。

其中,Coatue明確指出:AI不是炒作,關于AI的黃金時代還沒有到來。

一直以來,Coatue對AI都寄予厚望。在今年6月發(fā)布的Investor Deck中,Coatue進一步指出衰退時代已經來了,但同時指出下一個科技超級周期的“突破”時刻:AI可能成為經濟新的生命線。

而多年來,這家頭部基金在應對不同周期的實際策略和對宏觀的理解也超過大多數同行,穩(wěn)穩(wěn)地把控著科技行業(yè)的脈絡。

例如2020年,全球疫情最糟糕的情況下,Coatue Management的創(chuàng)立者Philippe Laffont 憑借精準的投資眼光,成為全球十大對沖基金經理第七名。

2022年,在美國大通脹、未盈利科技股大幅下跌的時刻,Coatue提前謀劃回撤,騰出了近80%的現金。

這份115頁的報告更是信息量滿滿,適道將從中截取的關鍵信息,進行整合。

01 2024年,AI炒作會結束?

首先,Coatue對AI的發(fā)展現狀給出了一個清晰的定位。

新技術在美國達到50%用戶滲透率的時間對比,PC用了20年,互聯網用了12年,智能手機用了6年,而生成式AI大概只用3年。

另一個對比:1986年,S&P 500公司創(chuàng)造$1m收入要雇傭約7.8人,現在是5.1人,而未來在AI時代,這個數字會少于3人。

在此背景下,Coatue于22/23年迅速擴大了AI投資組合。其中就包括最近陷入風波的 Stability AI 。據悉,Coatue Management寫信要求其創(chuàng)始人Mostaque 下臺,并要求公司還要求提供 Mostaque 和其他高管的薪酬細節(jié)。

接著,報告進入了第一個主題:AI是炒作嗎?

炒作有三大特征:1、入賬價值與投資不符,1990年代的光纖;2、高估技術發(fā)展的時間和能力,自動駕駛;3、技術尚未成熟導致缺乏普遍的實用性,量子計算。

Coatue針對以上三點分別進行回擊,明確指出AI不是炒作。

一、大多數 AI 投資都聚焦在模型層面(占比60%),入賬價值已經顯現;

不過,對于誰才是大模型的贏家,Coatue特意在報告中用了一頁ppt表示:我也不知道。。。

雖然,今年年中ChatGPT訪問量有所下降,但在推出新功能后,其使用量比8月份增長了27%。至于未來情況如何,我們拭目以待。

二、比起從“L1——L4”花費15年的“燒錢黑洞”自動駕駛,在過去的5年間,AI 已經表現出了自己的有效性,例如現在AI autopilots已經能夠自主完成復雜任務,大概達到了自動駕駛L3的水平。即便處于早期階段,但有60%的企業(yè)都計劃采用AI。

而且,在基準測試中,未來模型達到與人類水平的時間正在縮短。這點大家從ChatGPT3.5“小學生”和4.0“博士生”呈現出的巨大差異就能發(fā)現。

三、目前量子計算空有理論,甚至還沒有被證實,但AI 已在各個領域證明了其實用性,例如開發(fā)人員使用CopilotGithub節(jié)省了55%時間;在 Runway 上編輯視頻節(jié)約了90%的時間等等。

一家名為的Finicch 公司,使用AI 的客服節(jié)省了95%的人工成本;將回復時間從45分鐘降至1分鐘;客戶滿意度從55%提高至69%。

另外,咨詢等知識型工作也會被 AI 改變。研究顯示,BCG 的顧問在使用 AI 后所有任務都表現更佳,工作質量提高了 40%。

總體來看,Coatue認為AI技術演進日新月異,企業(yè)和民眾采用意愿積極,且AI已經在一些領域切實地提升了生產力。因此,AI不是一場炒作。

總體來看,目前支持“AI炒作論”的聲音主要分三種:1、智能化程度不夠,以至于2023年勢頭太猛,需要洗個“冷水澡”;2、投資人不想花錢,運行成本太高,畢竟連微軟的GitHub Copilot都在虧;3、監(jiān)管問題——懸在AI頭上的“達摩克利斯之劍”。

適道認為:首先,與其說2024年AI會涼,不如說熱錢退潮期,一些產品匹配不上市場預期,沒有技術護城河的AI企業(yè)會涼,最多只算公司層面上的“炒作”(在此反復“鞭尸”Jasper),完全稱不上整個行業(yè)的炒作。

其次,算力成本過高其實是一個短期問題,畢竟任何新事物剛出現時成本都會很高,包括互聯網。就目前來看,可以通過優(yōu)化算法底層降低成本?,F在有許多開源的大型模型,發(fā)布了新的優(yōu)化方法,大家都在通過各種各樣的方法將訓練微調模型的成本降到最低。

對于目前來看不那么容易“降本”的硬件。借用馬斯克的一句話:“英偉達不會永遠在大規(guī)模訓練和推理芯片市場占據壟斷地位。”

如今,六大門派正在圍攻英偉達的光明頂。前有英特爾、AMD等半導體巨頭公布新一輪的AI芯片研發(fā)計劃,后有OpenAI、微軟等下游客戶推動自研芯片,自己做“鏟”自己挖。從國內來看,也有 4-5 家企業(yè)卷在芯片的賽道里。甚至有業(yè)內人士樂觀估計:“AI芯片賽道會在年底再度爆發(fā),芯片危機最快會在明年解決?!?/p>

長期來看,根據萊特定律,AI相關計算單元(RCU)的生產成本和軟件成本將分別以每年57%和47%的速度下降。到2030年,硬件和軟件的融合可以使AI培訓成本以每年70%的速度下降,生成式AI將創(chuàng)造數百萬億美元的經濟價值。

降本的同時是增效。根據ARK的研究,2030年生成式AI將使知識工作者的生產力提高4倍以上。在100%采用AI的情況下,全球勞動生產率將提高約200萬億美元。諸如Copilot等AI編碼助手在2030年可以使軟件工程師的產出增加10倍左右。

無論是現在還是未來,AI都完全稱不上一個“炒作”產物。

那么現在就只剩下了監(jiān)管問題。

對此,Coatue在報告明確表達了擔憂。在調查中,有83%的受訪者不信任AI安全,甚至有57%的受訪者支持此前的“暫停AI開發(fā)6個月”倡議。但根據斯坦福的研究,目前大部分AI模型不符合EU AI Act的要求。

今年11月初,首屆全球人工智能(AI)安全峰會在英國召開,包括中國、美國、英國和歐盟在內的超25個國家代表,以及馬斯克、Sam Altman等科技巨頭與會,最終參會所有成員國簽署《布萊切利宣言》,同意通過國際合作,建立人工智能(AI)監(jiān)管方法。

02 開源好還是閉源香?

對此,Coatue認為開源是AI的心臟,且開放社區(qū)生態(tài)對AI的下一步發(fā)展至關重要——“AI is built in th open”。同時AI社區(qū)的開發(fā)者正在迅猛增長,軟件開發(fā)人員變成AI工程師,業(yè)余愛好者也參與其中。

但盡管如此,目前不同的AI模型開放程度不同。

Coatue認為,在此背景下,數據就變成了一種貨幣,Reddit和X都已經為訓練數據讀取收費。Reddit對5000 萬次API調用收取12000美元;X則是每月5000 美元可以刷100 萬篇帖子。

盡管如此,Coatue發(fā)現開源模型的水平也在迅速追趕閉源模型,藍色是開源,綠色是閉源。

其實對于開源和閉源之爭,適道在這里引用中科院院士、CCF開源發(fā)展委員會主任王懷民教授的一段話:在一個確定性的時代,比如確定性PC時代,微軟以它的企業(yè)組織模式封閉推進一個產品的開發(fā),我們稱為單性繁殖,每個新的產品都由微軟定義,這種模式在應對確定性的發(fā)展態(tài)勢的時候它是有競爭力的,個人計算機的發(fā)展是微軟的成功。

但是在互聯網時代到來時,在一個不確定性的互聯網時代要適應可能性,開源競爭力就強了,開源Linux這個社區(qū)發(fā)布一個核心版本,更多人在這個核心版本上根據他對需求和領域的理解進行不斷地修改,形成了雙性繁殖,能夠產生或者低成本產生更多的適應未來發(fā)展的新版本,就是有一個種子復制,大家都可以復制,根據自己對未來變化的理解產生一個新版本,開源出來來適應一個環(huán)境,由環(huán)境來評價,然后再迭代回來不斷地開發(fā),而這個新版本并不是由一家企業(yè)完成的,是由全社會參與者,當然也包括一些新的創(chuàng)新企業(yè)在其中推動這個工作。因此它產生適應未來不確定性的新版本的參與的人數和對于參與者來講的成本相對于過去微軟的一家大公司的組織模式成為了一個模式。開源在不確定性的時代更加有競爭力。”

如今我們又站在了一個不那么確定的人工智能時代,開源更多是一個創(chuàng)新方向。而開源與閉源的競爭,并不是在某一個領域,而是各自走出一條差異化的道路,迎來自己的天地。

但就初創(chuàng)企業(yè)的角度來講,閉源大模型顯然更具商業(yè)價值。有觀點認為:模型的的商業(yè)化盡頭是產業(yè),而大模型走向產業(yè),落地還是要靠閉源。

不過,如果已經有了例如 Llama 2這樣強大的開源大模型,還有人愿意用閉源嗎?

有,但大家想用的一定是“卷王之王”。

例如ChatGPT,在 Llama 2(水平類似ChatGPT 3.5)已經發(fā)布的背景下,如上文所述,即便今年年中訪問量有所下降,但在推出新功能后,其使用量比8月份增長了27%。

也就是說,一些本就占據優(yōu)勢的企業(yè)才能成為“閉源之王”,它們在實現大型模型的全面商業(yè)化和產業(yè)化方面也更具有優(yōu)勢。對此,其他企業(yè)還是不必“死磕”閉源大模型,畢竟數據都變成貨幣了,多刷點帖子又要給馬斯克添錢了。

 03 以AI為中心的生態(tài)系統

在這部分,Coatue提出了一個新范式:CPU+Software=計算機——Gpu+AI=人類大腦

Coatue認為,AI將開創(chuàng)“智能即服務IQaas”時代。

在提升模型性能方面,Coatue著重提出了數據的重要性,包括數據質量、數據數量、數據稀缺性、優(yōu)化微調方法都會成為關鍵因素。

具體來看:

1、訓練數據集中的 token 數量呈上升趨勢,訓練模型的前提是增加數據集;

2、到2026年,高質量文本數據可能很快耗盡,而圖像和視頻數據可以維持到2024年,數據稀缺性可能成為訓練模型時的一項潛在障礙;

3、數據質量和數量同樣重要,有證據表明,在精簡過的數據集上進行訓練,會達到與在完整數據集上訓練相似甚至更好的效果;

4、合成生成的數據有助于清洗、提煉數據集,以便進行微調,盡管目前仍然無法與真實數據相媲美。

另外,通過用戶反饋數據改進模型也是一條有效的優(yōu)化之路,以Midjourney為例。

在后面一部分,Coatue認為對GPU的需求才剛剛開始。

同時,Coatue預測到2026年將會帶來超過50%的新增能源需求,并會給云市場的增長和半導體行業(yè)帶來大量機會。

不過,在邊緣設備上運行 AI 模型可能有助于緩解 GPU 短缺問題。比如Apple 芯片本地模型運行的速度與 GPU 上運行居然一樣快。

最后,Coatue提出了一個問題:AI到底是現有巨頭的游戲還是 AI 原生挑戰(zhàn)者的游戲?并得出結論:先發(fā)制人的現有企業(yè) > AI 原生企業(yè) > 落后的現有企業(yè)

與此同時,Coatue用 Character AI 舉例指出AI初創(chuàng)企業(yè)的突破之路:像互聯網前輩那樣開創(chuàng)新模式。帶著各領域還沒解決的問題,在未來AI有望解鎖更多殺手級應用。

04 Coatue觀點:最好的AI還沒到來

收尾部分,Coatue做了一些總結:

1、英語會成為未來的編程語言。

2、邊緣AI設備會被廣泛應用,口袋大模型指日可待。

3、擴展AI模型會是一項工程挑戰(zhàn),自GPT-3 發(fā)布以來,OpenAI 的工程師數量增加了 3倍多。

4、私有數據會解鎖更多的使用場景。生物技術領域出現個性化醫(yī)療;NETFLIX會按需定制節(jié)目;電商平臺成為AI購物管家;人人都能成為工程師等等。

5、多模態(tài)大模型是前沿創(chuàng)新方向,基礎架構會有新的發(fā)展。例如,今年10月,斯坦福大學提出新架構:Monarch Mixer,無需Attention,有望成為Transformer的替代者等等。如果一旦實現,真如Coatue在第一部分所提出的:Open AI還會是大模型最終贏家嗎?

本文為轉載內容,授權事宜請聯系原著作權人。

OpenAI

  • 【獨家】字節(jié)即夢將在Sora發(fā)布前上線視頻生成模型PixelDance
  • OpenAI首個AI助理產品或將于明年1月發(fā)布

評論

暫無評論哦,快來評價一下吧!

下載界面新聞

微信公眾號

微博

對沖基金Coatue最新報告:OpenAI不一定是贏家,AI黃金時代還沒來

就目前來看,生成式人工智能是被過度炒作了?

文|適道  

Gary Marcus曾開過一個玩笑:“幾年前,如果你的初創(chuàng)公司域名中有.ai,那么你可以在你的估值后面加一個零?,F在呢,可能會是兩個零,尤其當你說自己正在用生成式AI?!?/p>

這句話道出了行業(yè)的最大疑慮——就目前來看,生成式人工智能是被過度炒作了嗎?

今年10月,全球科技研究和咨詢公司CCS Insight發(fā)布預測報告稱:2023年大熱的生成式人工智能領域將在2024年接受現實的檢驗。具體表現為:技術炒作逐漸消退,運行成本不斷上升,監(jiān)管呼聲越來越多,投資人不再像之前那樣興奮和樂觀。

近期,比爾.蓋茨在接受德國《商報》(Handelsblatt)采訪時也表示:“OpenAI內部包括Atlman在內的很多人,都相信GPT-5將明顯優(yōu)于GPT-4。但我有很多理由相信當前生成式人工智能已經達到極限?!?/p>

人們傾向于在短期內高估一項技術的效果,并在長期低估其效果?,F在誰都知道生成式AI尚處在“尷尬的青春期”,但對這個青春期要持續(xù)多久,什么時候轉變,還不是非常清晰。

而對于早期投資者而言,能夠準確判斷轉機至關重要。

前幾日,“華爾街TMT之王”美國對沖基金Coatue發(fā)布了一份115頁的報告(The AI Revolution),360度無死角分析了當前AI所處的階段、AI能否跨越炒作周期、開源和閉源、以AI為中心的生態(tài)系統等等。

其中,Coatue明確指出:AI不是炒作,關于AI的黃金時代還沒有到來。

一直以來,Coatue對AI都寄予厚望。在今年6月發(fā)布的Investor Deck中,Coatue進一步指出衰退時代已經來了,但同時指出下一個科技超級周期的“突破”時刻:AI可能成為經濟新的生命線。

而多年來,這家頭部基金在應對不同周期的實際策略和對宏觀的理解也超過大多數同行,穩(wěn)穩(wěn)地把控著科技行業(yè)的脈絡。

例如2020年,全球疫情最糟糕的情況下,Coatue Management的創(chuàng)立者Philippe Laffont 憑借精準的投資眼光,成為全球十大對沖基金經理第七名。

2022年,在美國大通脹、未盈利科技股大幅下跌的時刻,Coatue提前謀劃回撤,騰出了近80%的現金。

這份115頁的報告更是信息量滿滿,適道將從中截取的關鍵信息,進行整合。

01 2024年,AI炒作會結束?

首先,Coatue對AI的發(fā)展現狀給出了一個清晰的定位。

新技術在美國達到50%用戶滲透率的時間對比,PC用了20年,互聯網用了12年,智能手機用了6年,而生成式AI大概只用3年。

另一個對比:1986年,S&P 500公司創(chuàng)造$1m收入要雇傭約7.8人,現在是5.1人,而未來在AI時代,這個數字會少于3人。

在此背景下,Coatue于22/23年迅速擴大了AI投資組合。其中就包括最近陷入風波的 Stability AI 。據悉,Coatue Management寫信要求其創(chuàng)始人Mostaque 下臺,并要求公司還要求提供 Mostaque 和其他高管的薪酬細節(jié)。

接著,報告進入了第一個主題:AI是炒作嗎?

炒作有三大特征:1、入賬價值與投資不符,1990年代的光纖;2、高估技術發(fā)展的時間和能力,自動駕駛;3、技術尚未成熟導致缺乏普遍的實用性,量子計算。

Coatue針對以上三點分別進行回擊,明確指出AI不是炒作。

一、大多數 AI 投資都聚焦在模型層面(占比60%),入賬價值已經顯現;

不過,對于誰才是大模型的贏家,Coatue特意在報告中用了一頁ppt表示:我也不知道。。。

雖然,今年年中ChatGPT訪問量有所下降,但在推出新功能后,其使用量比8月份增長了27%。至于未來情況如何,我們拭目以待。

二、比起從“L1——L4”花費15年的“燒錢黑洞”自動駕駛,在過去的5年間,AI 已經表現出了自己的有效性,例如現在AI autopilots已經能夠自主完成復雜任務,大概達到了自動駕駛L3的水平。即便處于早期階段,但有60%的企業(yè)都計劃采用AI。

而且,在基準測試中,未來模型達到與人類水平的時間正在縮短。這點大家從ChatGPT3.5“小學生”和4.0“博士生”呈現出的巨大差異就能發(fā)現。

三、目前量子計算空有理論,甚至還沒有被證實,但AI 已在各個領域證明了其實用性,例如開發(fā)人員使用CopilotGithub節(jié)省了55%時間;在 Runway 上編輯視頻節(jié)約了90%的時間等等。

一家名為的Finicch 公司,使用AI 的客服節(jié)省了95%的人工成本;將回復時間從45分鐘降至1分鐘;客戶滿意度從55%提高至69%。

另外,咨詢等知識型工作也會被 AI 改變。研究顯示,BCG 的顧問在使用 AI 后所有任務都表現更佳,工作質量提高了 40%。

總體來看,Coatue認為AI技術演進日新月異,企業(yè)和民眾采用意愿積極,且AI已經在一些領域切實地提升了生產力。因此,AI不是一場炒作。

總體來看,目前支持“AI炒作論”的聲音主要分三種:1、智能化程度不夠,以至于2023年勢頭太猛,需要洗個“冷水澡”;2、投資人不想花錢,運行成本太高,畢竟連微軟的GitHub Copilot都在虧;3、監(jiān)管問題——懸在AI頭上的“達摩克利斯之劍”。

適道認為:首先,與其說2024年AI會涼,不如說熱錢退潮期,一些產品匹配不上市場預期,沒有技術護城河的AI企業(yè)會涼,最多只算公司層面上的“炒作”(在此反復“鞭尸”Jasper),完全稱不上整個行業(yè)的炒作。

其次,算力成本過高其實是一個短期問題,畢竟任何新事物剛出現時成本都會很高,包括互聯網。就目前來看,可以通過優(yōu)化算法底層降低成本?,F在有許多開源的大型模型,發(fā)布了新的優(yōu)化方法,大家都在通過各種各樣的方法將訓練微調模型的成本降到最低。

對于目前來看不那么容易“降本”的硬件。借用馬斯克的一句話:“英偉達不會永遠在大規(guī)模訓練和推理芯片市場占據壟斷地位?!?/p>

如今,六大門派正在圍攻英偉達的光明頂。前有英特爾、AMD等半導體巨頭公布新一輪的AI芯片研發(fā)計劃,后有OpenAI、微軟等下游客戶推動自研芯片,自己做“鏟”自己挖。從國內來看,也有 4-5 家企業(yè)卷在芯片的賽道里。甚至有業(yè)內人士樂觀估計:“AI芯片賽道會在年底再度爆發(fā),芯片危機最快會在明年解決?!?/p>

長期來看,根據萊特定律,AI相關計算單元(RCU)的生產成本和軟件成本將分別以每年57%和47%的速度下降。到2030年,硬件和軟件的融合可以使AI培訓成本以每年70%的速度下降,生成式AI將創(chuàng)造數百萬億美元的經濟價值。

降本的同時是增效。根據ARK的研究,2030年生成式AI將使知識工作者的生產力提高4倍以上。在100%采用AI的情況下,全球勞動生產率將提高約200萬億美元。諸如Copilot等AI編碼助手在2030年可以使軟件工程師的產出增加10倍左右。

無論是現在還是未來,AI都完全稱不上一個“炒作”產物。

那么現在就只剩下了監(jiān)管問題。

對此,Coatue在報告明確表達了擔憂。在調查中,有83%的受訪者不信任AI安全,甚至有57%的受訪者支持此前的“暫停AI開發(fā)6個月”倡議。但根據斯坦福的研究,目前大部分AI模型不符合EU AI Act的要求。

今年11月初,首屆全球人工智能(AI)安全峰會在英國召開,包括中國、美國、英國和歐盟在內的超25個國家代表,以及馬斯克、Sam Altman等科技巨頭與會,最終參會所有成員國簽署《布萊切利宣言》,同意通過國際合作,建立人工智能(AI)監(jiān)管方法。

02 開源好還是閉源香?

對此,Coatue認為開源是AI的心臟,且開放社區(qū)生態(tài)對AI的下一步發(fā)展至關重要——“AI is built in th open”。同時AI社區(qū)的開發(fā)者正在迅猛增長,軟件開發(fā)人員變成AI工程師,業(yè)余愛好者也參與其中。

但盡管如此,目前不同的AI模型開放程度不同。

Coatue認為,在此背景下,數據就變成了一種貨幣,Reddit和X都已經為訓練數據讀取收費。Reddit對5000 萬次API調用收取12000美元;X則是每月5000 美元可以刷100 萬篇帖子。

盡管如此,Coatue發(fā)現開源模型的水平也在迅速追趕閉源模型,藍色是開源,綠色是閉源。

其實對于開源和閉源之爭,適道在這里引用中科院院士、CCF開源發(fā)展委員會主任王懷民教授的一段話:在一個確定性的時代,比如確定性PC時代,微軟以它的企業(yè)組織模式封閉推進一個產品的開發(fā),我們稱為單性繁殖,每個新的產品都由微軟定義,這種模式在應對確定性的發(fā)展態(tài)勢的時候它是有競爭力的,個人計算機的發(fā)展是微軟的成功。

但是在互聯網時代到來時,在一個不確定性的互聯網時代要適應可能性,開源競爭力就強了,開源Linux這個社區(qū)發(fā)布一個核心版本,更多人在這個核心版本上根據他對需求和領域的理解進行不斷地修改,形成了雙性繁殖,能夠產生或者低成本產生更多的適應未來發(fā)展的新版本,就是有一個種子復制,大家都可以復制,根據自己對未來變化的理解產生一個新版本,開源出來來適應一個環(huán)境,由環(huán)境來評價,然后再迭代回來不斷地開發(fā),而這個新版本并不是由一家企業(yè)完成的,是由全社會參與者,當然也包括一些新的創(chuàng)新企業(yè)在其中推動這個工作。因此它產生適應未來不確定性的新版本的參與的人數和對于參與者來講的成本相對于過去微軟的一家大公司的組織模式成為了一個模式。開源在不確定性的時代更加有競爭力?!?/p>

如今我們又站在了一個不那么確定的人工智能時代,開源更多是一個創(chuàng)新方向。而開源與閉源的競爭,并不是在某一個領域,而是各自走出一條差異化的道路,迎來自己的天地。

但就初創(chuàng)企業(yè)的角度來講,閉源大模型顯然更具商業(yè)價值。有觀點認為:模型的的商業(yè)化盡頭是產業(yè),而大模型走向產業(yè),落地還是要靠閉源。

不過,如果已經有了例如 Llama 2這樣強大的開源大模型,還有人愿意用閉源嗎?

有,但大家想用的一定是“卷王之王”。

例如ChatGPT,在 Llama 2(水平類似ChatGPT 3.5)已經發(fā)布的背景下,如上文所述,即便今年年中訪問量有所下降,但在推出新功能后,其使用量比8月份增長了27%。

也就是說,一些本就占據優(yōu)勢的企業(yè)才能成為“閉源之王”,它們在實現大型模型的全面商業(yè)化和產業(yè)化方面也更具有優(yōu)勢。對此,其他企業(yè)還是不必“死磕”閉源大模型,畢竟數據都變成貨幣了,多刷點帖子又要給馬斯克添錢了。

 03 以AI為中心的生態(tài)系統

在這部分,Coatue提出了一個新范式:CPU+Software=計算機——Gpu+AI=人類大腦

Coatue認為,AI將開創(chuàng)“智能即服務IQaas”時代。

在提升模型性能方面,Coatue著重提出了數據的重要性,包括數據質量、數據數量、數據稀缺性、優(yōu)化微調方法都會成為關鍵因素。

具體來看:

1、訓練數據集中的 token 數量呈上升趨勢,訓練模型的前提是增加數據集;

2、到2026年,高質量文本數據可能很快耗盡,而圖像和視頻數據可以維持到2024年,數據稀缺性可能成為訓練模型時的一項潛在障礙;

3、數據質量和數量同樣重要,有證據表明,在精簡過的數據集上進行訓練,會達到與在完整數據集上訓練相似甚至更好的效果;

4、合成生成的數據有助于清洗、提煉數據集,以便進行微調,盡管目前仍然無法與真實數據相媲美。

另外,通過用戶反饋數據改進模型也是一條有效的優(yōu)化之路,以Midjourney為例。

在后面一部分,Coatue認為對GPU的需求才剛剛開始。

同時,Coatue預測到2026年將會帶來超過50%的新增能源需求,并會給云市場的增長和半導體行業(yè)帶來大量機會。

不過,在邊緣設備上運行 AI 模型可能有助于緩解 GPU 短缺問題。比如Apple 芯片本地模型運行的速度與 GPU 上運行居然一樣快。

最后,Coatue提出了一個問題:AI到底是現有巨頭的游戲還是 AI 原生挑戰(zhàn)者的游戲?并得出結論:先發(fā)制人的現有企業(yè) > AI 原生企業(yè) > 落后的現有企業(yè)

與此同時,Coatue用 Character AI 舉例指出AI初創(chuàng)企業(yè)的突破之路:像互聯網前輩那樣開創(chuàng)新模式。帶著各領域還沒解決的問題,在未來AI有望解鎖更多殺手級應用。

04 Coatue觀點:最好的AI還沒到來

收尾部分,Coatue做了一些總結:

1、英語會成為未來的編程語言。

2、邊緣AI設備會被廣泛應用,口袋大模型指日可待。

3、擴展AI模型會是一項工程挑戰(zhàn),自GPT-3 發(fā)布以來,OpenAI 的工程師數量增加了 3倍多。

4、私有數據會解鎖更多的使用場景。生物技術領域出現個性化醫(yī)療;NETFLIX會按需定制節(jié)目;電商平臺成為AI購物管家;人人都能成為工程師等等。

5、多模態(tài)大模型是前沿創(chuàng)新方向,基礎架構會有新的發(fā)展。例如,今年10月,斯坦福大學提出新架構:Monarch Mixer,無需Attention,有望成為Transformer的替代者等等。如果一旦實現,真如Coatue在第一部分所提出的:Open AI還會是大模型最終贏家嗎?

本文為轉載內容,授權事宜請聯系原著作權人。