文|半導體產業(yè)縱橫
?隨著聊天機器人和其他生成式AI應用程序變得越來越流行,人們對AI推理的需求將呈指數(shù)級增長,該市場規(guī)模最終將達到數(shù)百億美元。AI芯片需求快速增長,市場規(guī)模增長顯著。
從谷歌的TPU、蘋果的M1和M2、微軟Maia 100和Cobalt 100、Meta的MTIA、亞馬遜的Trainium和Inferentia、特斯拉的Dojo,到英特爾的FPGA系列、AMD的MI300系列……巨頭們一次次沖擊著英偉達的帝國圍墻。
而在AI競速的大時代里,涌現(xiàn)了一大批初創(chuàng)GPU、AI芯片公司,這些從業(yè)者和科技廠商們無不在找尋突破口。全球初創(chuàng)企業(yè)如今正試圖證明它們可以在某些應用領域提供比行業(yè)巨頭英偉達更好的芯片解決方案。雖然英偉達的GPU繼續(xù)主導人工智能(AI)領域,但AI初創(chuàng)企業(yè)認為,GPU的高能耗和龐大的設計留下了市場空隙,供新興企業(yè)填補,希望分享AI技術繁榮帶來的利益。
01、AI芯片技術層出不窮,初創(chuàng)公司大量涌現(xiàn)
AI芯片也被稱為AI加速器或計算卡,從廣義上講只要能夠運行人工智能算法的芯片都叫作AI芯片。但是通常意義上的 AI 芯片指的是針對人工智能算法做了特殊加速設計的芯片。
按技術架構分類,AI芯片可分為CPU、GPU、FPGA、ASIC、神經擬態(tài)芯片等。CPU不適用于AI計算,但是在AI應用領域也是必不可少,比較常見的是CPU+GPU,CPU+NPU等組合。GPU是一種通用型芯片,ASIC是一種專用型芯片,而FPGA則處于兩者之間,具有半定制化的特點。
CPU:CPU是馮諾依曼架構下的處理器,在執(zhí)行計算任務過程中,數(shù)據(jù)需要先獲取并存入RAM,然后解碼獲得指令,然后在ALU計算模塊計算,最終將計算結果返回RAM。整個流程更強調控制和決策,在并行計算效率上有較大提升空間。
GPU:GPU最早用于圖像處理領域,減少了大量數(shù)據(jù)預取和決策模塊,增加了計算單元ALU的占比,從而在并行化計算效率上有較大優(yōu)勢。
FPGA:FPGA的設計使得計算邏輯十分靈活,它不像CPU和GPU那樣只能執(zhí)行編譯和匯編的內容,F(xiàn)PGA因為幾乎沒有控制模塊,所有模塊都是ALU計算模塊,而且所有模塊都可定制開發(fā)。但這也是FPGA的主要缺陷,因為具備很強的靈活度,導致設計難度和復雜度較高。
ASIC:ASIC是專門針對某一領域設計的芯片,比如神經網絡計算芯片NPU、Tensor計算芯片TPU等。因為是針對特定領域定制,所以ASIC往往可以表現(xiàn)出比GPU和CPU更強的性能,ASIC也是目前國內外許多AI芯片設計公司主要研究的方向,可以預見未來市面上會逐漸有大量AI領域的ASIC芯片出現(xiàn)。
神經擬態(tài)芯片:神經擬態(tài)計算是模擬生物神經網絡的計算機制。神經擬態(tài)計算從結構層面去逼近大腦,其研究工作還可進一步分為兩個層次,一是神經網絡層面,與之相應的是神經擬態(tài)架構和處理器。其邏輯結構與傳統(tǒng)馮·諾依曼結構不同:它的內存、CPU 和通信部件完全集成在一起,因此信息的處理在本地進行,克服了傳統(tǒng)計算機內存與 CPU 之間的速度瓶頸問題。
按功能分類,可分為訓練(training)和推理(inference)兩個環(huán)節(jié),對應的AI芯片則分別是訓練卡和推理卡。訓練卡一般都可以作為推理卡使用,而推理卡努努力不在乎時間成本的情況下大部分也能作為訓練卡使用,但通常不這么做。
主要原因在于二者在架構上就有很大的差別,推理芯片通常針對前向傳播過程進行了高度優(yōu)化,以實現(xiàn)高效的預測和分類任務。因此,它們的架構和指令集對于訓練過程所需的大量參數(shù)更新和反向傳播操作支持能力就弱了很多。
此外,訓練芯片通常擁有更高的計算能力和內存帶寬,以支持訓練過程中的大量計算和數(shù)據(jù)處理。相比之下,推理芯片通常會在計算資源和內存帶寬方面受到一定的限制。同時,二者支持的計算精度也通常不同,訓練階段需要高精度計算,因此常用高精度浮點數(shù)如:fp32,而推理階段一般只需要int8就可以保證推理精度。
除了高帶寬高并行度外,就片內片外的存儲空間而言訓練芯片通常比較“大”,這是訓練過程中通常需要大量的內存來存儲訓練數(shù)據(jù)、中間計算結果以及模型參數(shù)。相較而言推理芯片可能無法提供足夠的存儲容量來支持訓練過程。
AI浪潮席卷全球,一批AI初創(chuàng)新貴企業(yè)如雨后春筍般出現(xiàn),新技術新產品層出不窮。近期,斯坦福大學的一份《2024年人工智能指數(shù)報告》中的數(shù)據(jù),展示了過去十年間AI初創(chuàng)公司活動最多的15個國家。數(shù)據(jù)表明,美國、中國、英國、以色列等已成為全球AI創(chuàng)新領域的領先者。
美國情況來看,美國AI初創(chuàng)企業(yè)涵蓋大模型公司Reka AI、DPU新貴DreamBig Semiconductor、規(guī)?;斯ぶ悄堋⒆詣踊瘷C器學習平臺DataRobot、AI芯片設計新企Tenstorrent、軟件和機器人初創(chuàng)企業(yè)Bright Machines、AI芯片創(chuàng)企Etched.ai、訓練AI模型新貴Scale AI、邊緣AI領軍企業(yè)Blaize、人工智能模型創(chuàng)企Augment、AI協(xié)助工具新企Cognition、硅光子創(chuàng)新企業(yè)Celestial AI、大模型開源企業(yè)Together AI等等。
中國方面在政策利好和市場急速發(fā)展下,一批AI創(chuàng)企殺出重圍,優(yōu)質標的包括大模型玩家商湯科技、百川智能、智譜AI、第四范式、Minimax稀宇科技等等,以及人工智能AIGC大模型零一萬物、通用人工智能研究月之暗面、多模態(tài)大模型企業(yè)智子引擎、視頻生產大模型愛詩科技、AI芯片新貴愛芯元智、人工智能視覺技術企業(yè)影譜科技等等。
英國在AI領域有著悠久的歷史,幾十年來圍繞這個領域建立了豐富的生態(tài)系統(tǒng)。從艾倫·圖靈早期奠定AI領域基礎的工作,到世界級的研究機構推動AI技術的發(fā)展(如帝國理工學院、劍橋大學、愛丁堡大學、牛津大學、倫敦大學學院)以及2015年DeepMind的成立,英國一直是AI人才的重要聚集地。深厚的AI研究歷史和頂尖的研究機構使得英國成為AI人才重要聚集地。近年來,英國涌現(xiàn)了包括AI獨角獸Wayve、知識圖譜初創(chuàng)企業(yè)Oxford Semantic、AI語音客戶服務企業(yè)PolyAI、AI智能員工和軟件創(chuàng)企Artisan AI、大模型應用創(chuàng)企Robin AI等。
以色列高科技行業(yè)發(fā)達,AI初創(chuàng)企業(yè)包括有人工智能工具企業(yè)AI21、人工智能芯片明星企業(yè)Habana Labs、量子芯片企業(yè)Quantum、高性能微處理器公司NeoLogic、深度學習和人工智能解決方案架構顛覆企業(yè)NeuReality、AI芯片冷卻革命者ZutaCore等等。
02、行業(yè)巨頭大規(guī)模收購AI芯片初創(chuàng)公司
過去兩年,AI初創(chuàng)公司在資本市場上的表現(xiàn)可謂風頭無兩,吸引了數(shù)十億美元的投資。然而,隨著市場對AI技術的懷疑情緒日益增長,加之生成式AI技術的高成本和長周期回報特性,在邁過前兩年的投資高峰熱潮后,AI新貴如今面臨新的融資危機。
就美國而言,過去一年,美國AI初創(chuàng)企業(yè)失敗率躍升了60%,盡管數(shù)十億美元的風險投資流入AI公司,但初創(chuàng)企業(yè)倒閉的數(shù)量仍在急劇上升,原因是相關AI企業(yè)創(chuàng)始人在2021-2022年科技繁榮時期籌集的資金近年來已經耗費大半。
不止美國企業(yè)如此,全球AI新貴無疑都面臨著同樣困境。行業(yè)金融投資相關人士表示,短期大量資金涌入導致某些AI初創(chuàng)公司的估值過高,但是這些企業(yè)都面臨著巨大的風險,如資金枯竭、投資回報率下降或市場飽和等。目前,市場投資者已經變得更加謹慎,開始評估AI初創(chuàng)公司的長期可行性和盈利能力,而不是僅僅基于其技術潛力進行投資。
與此同時,AI頭部企業(yè)虎視眈眈,意圖吞下更多優(yōu)質AI標的,快速補充短板,以占領更大市場份額。一場AI芯片并購戰(zhàn),在AI新貴和頭部AI大企中悄然拉開。許多初創(chuàng)公司發(fā)現(xiàn)自己難以為繼,其中不少被迫選擇“賣身”求生。頭部企業(yè)通過收購AI初創(chuàng)公司,快速拓展產品線,布局新的技術和業(yè)務,還消滅了潛在的競爭對手。AI芯片巨頭企業(yè)并購案正在爆發(fā)。
英偉達:英國咨詢機構 Dealroom曾對英偉達2023年間的一級市場交易進行了統(tǒng)計,僅2023年英偉達就投資了超30家AI初創(chuàng)公司,融資總價值超過50億美元。投資過程中,英偉達似乎沒有排斥任何應用場景,亦不在乎標的的輪次與大小。無論是上游的通用大模型,中游的企業(yè)SaaS,下游的To C垂直應用,還是大模型基礎設施建設中動輒百億的B、C輪項目,To C端不到百萬的種子輪。
而今年以來,英偉達投資的AI企業(yè)更是超17家,其中有兩筆投資所在輪次融資金額不低于10億美元。收購方面,英偉達則陸續(xù)收購了AI創(chuàng)企Run.ai、Deci。
AMD:過去一年時間里,AMD向十幾家AI公司投資了超過1.25億美元,其中包括Firework AI、AI數(shù)據(jù)平臺Scale AI等,另外還收購了Mipsology 、 Nod.ai等超7家AI公司,以擴展AMD AI生態(tài)系統(tǒng)、支持合作伙伴,并提升AMD計算平臺的領導地位。
近期該公司就有兩筆大手筆并購——49億美元收購服務器制造商ZT Systems,以及6.65億美元全現(xiàn)金收購歐洲最大的私人AI實驗室Silo AI。
不過AI巨頭的并購也非一帆風順,特別是跨國并購面臨著各國巨大的反壟斷壓力。比如,英偉達曾嘗試以400億美元的巨額收購Arm,但由于全球監(jiān)管機構的反對和市場擔憂,這筆交易最終以失敗告終。
03、AI芯片初創(chuàng)公司前路如何?
當下,AI初創(chuàng)公司面臨的主要困境在于,生成式AI的研發(fā)和維護需要數(shù)億美元的前期投資,而這些投資往往在短期內難以獲得回報。許多初創(chuàng)公司發(fā)現(xiàn),他們根本沒有足夠的資源和渠道來實現(xiàn)這一目標。
目前來看,投資者對于初創(chuàng)公司的耐心也在減少,越來越多投資者退出這場AI游戲,導致一些初創(chuàng)公司不得不尋找新的融資渠道和合作伙伴。比如一些AI芯片公司正在尋求IPO上市。
而就在日前,AI芯片獨角獸燧原科技同中金公司簽署輔導協(xié)議,正式啟動IPO進程。此前,燧原科技已經完成了近70億元的融資,其中騰訊是最大的投資者之一,天眼查數(shù)據(jù)顯示,騰訊持股比例為20.4944%。值得注意的是,自燧原科技成立以來,騰訊已經在公司的六輪融資中都有投資。
通過IPO,企業(yè)可以向公眾發(fā)行股票融資,提供可觀的資金來源,有助于企業(yè)擴大規(guī)模、增加投資,維持企業(yè)運轉。
此外,一些AI芯片公司正在尋求合并,以應對行業(yè)巨頭的巨大壓力。目前各國都意識到了AI芯片的重要性,AI芯片巨頭在跨國并購上收到了極大的限制。為了扶持本國企業(yè),各國政府一方面通過政策和資金扶持萌芽的AI芯片企業(yè)。另一方面,也在推動這些公司之間的整合合并。
日前,韓國國內兩家人工智能(AI)芯片制造商Sapeon Korea和Rebellions簽署了正式合并協(xié)議。合并后的新公司的價值預計將超過1萬億韓元(合7.438億美元),將成為代表韓國人工智能芯片產業(yè)的獨角獸企業(yè),并將在全球市場上具有更強的競爭力,最終能夠與英偉達、AMD等巨頭相抗衡。
隨著AI技術的發(fā)展與普及,行業(yè)對高性能、低功耗的AI芯片的需求不斷增加,全球半導體企業(yè)將繼續(xù)在該領域展開激烈角逐。