文|半導(dǎo)體產(chǎn)業(yè)縱橫
7月30日,英偉達(dá)股價(jià)下跌7%,這是該公司3個(gè)月來最大跌幅,市值一夜蒸發(fā)1934億美元,下滑至2.55萬億美元。
7月10日~30日,英偉達(dá)股價(jià)崩跌23%,從每股134.91美元跌至103.73美元。此前,該公司不停歇的上漲勢頭,似乎讓投資人忽視了風(fēng)險(xiǎn)。
在過去兩周,投資人從英偉達(dá)這類大型科技股撤出資金,因?yàn)樗麄冊絹碓綋?dān)心大企業(yè)的AI支出難以獲得回報(bào)。
技術(shù)分析師指出,這樣的轉(zhuǎn)變讓英偉達(dá)股價(jià)還有進(jìn)一步下跌的空間。
01、蘋果惹的禍?
英偉達(dá)股價(jià)大幅下跌或許與蘋果公司有關(guān)。
7月29日,蘋果在一份技術(shù)論文中表示,其人工智能(AI)系統(tǒng)Apple Intelligence的兩個(gè)模型是在谷歌設(shè)計(jì)的云端芯片上進(jìn)行訓(xùn)練的,蘋果詳細(xì)介紹了用于訓(xùn)練的張量處理器(TPU)。另外,蘋果還發(fā)布了適用于部分設(shè)備的Apple Intelligence預(yù)覽版。
蘋果在其47頁的論文中沒有提到谷歌或英偉達(dá),但指出其蘋果基金會(huì)模型 (AFM) 和 AFM 服務(wù)器是在云端TPU群集上訓(xùn)練的。該論文表示,該系統(tǒng)使蘋果能夠有效地、可擴(kuò)展地訓(xùn)練AFM模型,包括AFM-on-device、AFM-server和更大的模型。
蘋果表示,AFM-on-device是在 2048個(gè)TPU v5p芯片的單一切片上進(jìn)行訓(xùn)練的,這是最先進(jìn)的TPU,于2023年12月推出。AFM-server是在8192 TPU v4芯片上進(jìn)行訓(xùn)練的,這些芯片被配置為通過數(shù)據(jù)中心網(wǎng)絡(luò)作為8個(gè)切片一起工作。
谷歌很早就在數(shù)據(jù)中心內(nèi)大量部署TPU了,用于加速AI模型訓(xùn)練和推理,而且,不僅自家使用,谷歌還把TPU當(dāng)作云計(jì)算服務(wù)提供給第三方使用,將它變成產(chǎn)品銷售。
谷歌最新的TPU每小時(shí)的成本不到2美元,芯片需要提前3年預(yù)訂才能使用。谷歌于2015年首次推出了用于內(nèi)部工作負(fù)載的TPU,并于2017年向公眾開放?,F(xiàn)在,它們是為人工智能設(shè)計(jì)的最成熟的定制化芯片。
不過,谷歌仍然是英偉達(dá)的頂級(jí)客戶之一,并在其云平臺(tái)上出售英偉達(dá)技術(shù)的使用權(quán)。
蘋果先前表示,推理,即采用預(yù)先訓(xùn)練的人工智能模型并運(yùn)行它來產(chǎn)生內(nèi)容或做出預(yù)測,將部分在蘋果自家數(shù)據(jù)中心的芯片上完成。
蘋果在6月WWDC 2024期間發(fā)布相關(guān)技術(shù)文件顯示,工程師除了在Apple Intelligence采用蘋果自有處理器等硬件,搭配自有軟件框架之外,還用自家GPU結(jié)合谷歌 TPU進(jìn)行人工智能模型加速訓(xùn)練。
英偉達(dá)面臨的競爭壓力越來越大,以谷歌為例,這家科技巨頭通過自研AI芯片不斷壯大其市場份額。來自TechInsights的數(shù)據(jù)顯示,在2023年的數(shù)據(jù)中心加速器市場,谷歌 TPU的出貨量達(dá)到200萬臺(tái),雖然略遜于英偉達(dá)的380萬臺(tái),但已穩(wěn)居行業(yè)第三,且增長勢頭強(qiáng)勁,對英偉達(dá)構(gòu)成了挑戰(zhàn)。與此同時(shí),微軟等科技巨頭也在逐步減少對英偉達(dá)的依賴,轉(zhuǎn)而采用其他競爭品牌的芯片。
02、GPU太貴了
除了單一依賴風(fēng)險(xiǎn),英偉達(dá)GPU的高昂價(jià)格也嚇跑了不少廠家。
有報(bào)告顯示,配備英偉達(dá)下一代Blackwell GPU的AI服務(wù)器,每臺(tái)要價(jià)高達(dá)200-300萬美元。
英偉達(dá)推出了兩套基于Blackwell架構(gòu)的參考設(shè)計(jì),其中,NVL36搭載了36塊B200 GPU加速卡,預(yù)計(jì)要價(jià)200萬美元,之前預(yù)計(jì)180萬美元,現(xiàn)在又漲價(jià)了。NVL72規(guī)模翻番,搭載72塊B200加速卡,預(yù)計(jì)起步價(jià)就要300萬美元。
英偉達(dá)預(yù)計(jì),2025年,B200服務(wù)器的出貨量有望達(dá)到6-7萬臺(tái),總價(jià)達(dá)到1200億~2100億美元。
目前,AWS、戴爾、谷歌、Meta、微軟等都有意采購B200服務(wù)器,規(guī)模超預(yù)期。
AI服務(wù)器主要由CPU、GPU、FPGA等處理器組成,用于處理大量的計(jì)算任務(wù),相比傳統(tǒng)服務(wù)器,AI服務(wù)器通常需要更高性能的硬件,以滿足對于大規(guī)模數(shù)據(jù)處理和復(fù)雜計(jì)算的需求。由于這些硬件的價(jià)格較高,它們在AI服務(wù)器的成本中占比最大。這其中,GPU是各種處理器中成本占比最大的。
在AI訓(xùn)練和推理過程中,GPU通常是最昂貴的硬件,這是因?yàn)镚PU具有較強(qiáng)的計(jì)算能力和并行處理能力,可以加速AI模型的訓(xùn)練和推理過程。大多數(shù)AI服務(wù)器都配備了多個(gè)GPU,以滿足高性能計(jì)算的需求。
由于GPU具有強(qiáng)大的計(jì)算能力,其功耗也較高。為了滿足AI模型的計(jì)算需求,通常需要配置多個(gè)GPU,這將導(dǎo)致服務(wù)器的功耗進(jìn)一步增加。高功耗意味著服務(wù)器在運(yùn)行時(shí)需要更大的電力供應(yīng),并產(chǎn)生更高的電費(fèi)支出。
與CPU相比,GPU具有更復(fù)雜的體系結(jié)構(gòu)和更多的組件,這意味著GPU的維護(hù)工作更為繁瑣和復(fù)雜,需要更專業(yè)的技術(shù)人員進(jìn)行維護(hù)和管理。而且,由于GPU的高功耗,其散熱需求也更高,需要額外的散熱設(shè)備和維護(hù)成本。
隨著AI技術(shù)的快速發(fā)展,GPU的性能也在不斷提升。為了保持競爭力,許多公司需要頻繁購買新版GPU,這將增加服務(wù)器的成本。
隨著AI應(yīng)用的推廣,越來越多的企業(yè)開始使用AI服務(wù)器,這導(dǎo)致了對GPU的需求不斷增加,供不應(yīng)求的情況下,GPU的價(jià)格也會(huì)上漲。
03、競爭對手施壓
英偉達(dá)的競爭對手們都在摩拳擦掌,其中,最引人關(guān)注的AMD近期表現(xiàn)優(yōu)異。
7月30日,AMD發(fā)布了2024年第二季度財(cái)報(bào),凈利潤同比激增881%,數(shù)據(jù)中心業(yè)務(wù)收入翻番,搶了英偉達(dá)不少生意。
AMD本季度總營收達(dá)到58.35億美元,不僅超出了此前預(yù)期的57.2億美元,還實(shí)現(xiàn)了9%的同比增長和7%的環(huán)比增長。凈利潤達(dá)到了2.65億美元,同比增長幅度高達(dá)881%,環(huán)比增長115%。
數(shù)據(jù)中心用GPU芯片MI300在單季度內(nèi)的銷售額超過了10億美元,推動(dòng)數(shù)據(jù)中心部門收入大幅增長。
MI300系列是AMD于2023年底發(fā)布的AI GPU,包括MI300X,以及集成CPU內(nèi)核和GPU加速器MI300A,其中,MI300X對標(biāo)英偉達(dá)的H100。據(jù)AMD介紹,MI300X用于AI訓(xùn)練時(shí)的性能與英偉達(dá)H100持平,推理方面,其性能超出競品。以8個(gè)GPU組成的單臺(tái)服務(wù)器為例,運(yùn)行1760億參數(shù)的BLOOM模型和700億參數(shù)的Llama2模型時(shí),MI300X平臺(tái)性能是H100平臺(tái)的1.4~1.6倍。
AMD首席執(zhí)行官蘇姿豐表示,公司AI芯片的銷售額“高于預(yù)期”,微軟對MI300芯片的使用量正在增加,以作為GPT-4 Turbo的算力支撐,并支撐微軟的word、teams等多個(gè)Copilot服務(wù)。Hugging Face則是首批采用新的微軟云Azure的客戶之一,使企業(yè)和AI客戶能通過一次點(diǎn)擊,便在MI300上部署數(shù)十萬個(gè)模型。
今年6月,AMD公布了迭代路線圖,計(jì)劃今年第四季度推出MI325X,并在明、后兩年陸續(xù)推出MI350系列和MI400系列,其中,M1300X、MI325X將采用CDNA3架構(gòu),M1350將采用CDNA4結(jié)構(gòu),MI400將采用下一代CDNA架構(gòu)。AMD后續(xù)每年都會(huì)推出新的產(chǎn)品系列。在業(yè)內(nèi)看來,這一速度與英偉達(dá)發(fā)布的計(jì)劃看齊。
此外,蘇姿豐表示,AI推理的需求將比訓(xùn)練更大。AI PC是PC類別中很重要的一部分,PC市場對AMD業(yè)務(wù)來說是很好的收入增長機(jī)會(huì)。
今年,AMD在通過投資加速布局AI。7月,該公司出資6.65億美元收購了歐洲最大的人工智能實(shí)驗(yàn)室Silo AI,該公司提供端到端AI驅(qū)動(dòng)的解決方案,此次收購被認(rèn)為是AMD追趕英偉達(dá)的重要一步。
蘇姿豐表示,除了收購Silo AI,AMD在過去12個(gè)月中還向十幾家人工智能公司投資超過1.25億美元,以擴(kuò)大AMD生態(tài)系統(tǒng)并維持AMD計(jì)算平臺(tái)的領(lǐng)先地位。她表示,AMD將繼續(xù)投資軟件,這是投資Silo AI的原因之一。
基于優(yōu)質(zhì)的GPU硬件,發(fā)展軟件和生態(tài)系統(tǒng),AMD正在以英偉達(dá)的成功方式與之競爭。
04、英偉達(dá)也有弱點(diǎn)
要與英偉達(dá)競爭,揚(yáng)長避短是上策,也就是說,發(fā)揮自己的優(yōu)勢,去攻擊英偉達(dá)的短板。
雖然GPU并行處理能力非常強(qiáng),這也是其擅長AI訓(xùn)練的根本原因。但是,當(dāng)數(shù)據(jù)來回移動(dòng)時(shí),GPU的處理速度就不快了。AI大模型運(yùn)行時(shí),往往需要大量GPU和大量內(nèi)存芯片,它們相互連接在一起,數(shù)據(jù)在GPU和內(nèi)存間移動(dòng)越快,性能越好。當(dāng)訓(xùn)練大型AI模型時(shí),一些GPU內(nèi)核會(huì)閑置,幾乎一半時(shí)間都在等待數(shù)據(jù)。
如果能將大量處理器內(nèi)核和海量內(nèi)存組合在一起,形成存內(nèi)計(jì)算,則可大大降低多芯片間的連接復(fù)雜性,可大幅提升數(shù)據(jù)的傳輸速度。大量處理器內(nèi)核在芯片內(nèi)連接在一起,其運(yùn)行速度比獨(dú)立GPU組合快上百倍。目前,有幾家創(chuàng)業(yè)公司正在做這樣的事情,發(fā)展情況值得關(guān)注。
另外,必須在軟硬件生態(tài)方面有打持久戰(zhàn)的準(zhǔn)備,才能與英偉達(dá)周旋,在這方面,需要有強(qiáng)大的資源背景,才能有命去爭。AMD和英特爾正在做這樣的事。
再有,除了芯片本身,可以在芯片與芯片互聯(lián)方面多下功夫,英偉達(dá)在這方面并不是老大,博通是。
博通解決的是芯片與芯片之間的互聯(lián)問題,并非與英偉達(dá)GPU直接競爭。雖然英偉達(dá)也有自家的芯片間互聯(lián)技術(shù),但從整個(gè)行業(yè)來看,博通的技術(shù)和產(chǎn)品更勝一籌,在全球8大AI服務(wù)器系統(tǒng)當(dāng)中,有7個(gè)都部署了由博通技術(shù)支持的以太網(wǎng)基礎(chǔ)設(shè)施,預(yù)計(jì)到2025年,所有超大規(guī)模AI服務(wù)器系統(tǒng)都將由以太網(wǎng)提供支持。
博通最善于解決通信帶寬問題,在全球50GB/s的SerDes市場中,博通占據(jù)了76%的份額,其SerDes接口通過將低速并行數(shù)據(jù)轉(zhuǎn)換為高速串行數(shù)據(jù),然后在接收端轉(zhuǎn)換回并行數(shù)據(jù)。通過這樣的操作,數(shù)據(jù)可以從一個(gè)TPU高速轉(zhuǎn)移到另一個(gè)TPU,大大提升了傳輸效率。
同樣受益于AI增長,博通的網(wǎng)通產(chǎn)品營收正以40%的同比增速增長。該公司財(cái)報(bào)顯示,截至今年5月的第二財(cái)季,AI營收同比增長280%,達(dá)到31億美元,預(yù)計(jì)這一數(shù)字將在本財(cái)年結(jié)束前突破110億美元。
05、大落之后又大起
一眾競爭對手都在給英偉達(dá)施壓,是該公司股價(jià)下跌的重要原因,然而,市場變化速度之快,讓人反應(yīng)不及。
7月31日晚間,英偉達(dá)股價(jià)突然大漲,漲幅一度超過14%,單日市值增加3269億美元。
英偉達(dá)成為了首只單日市值增量超過3000億美元的股票。目前,在美股單日市值增量排行榜上,英偉達(dá)占據(jù)了前三位,今年2月22日、5月23日,英偉達(dá)單日市值分別增長了2766億美元、2177億美元。
摩根士丹利發(fā)表研究報(bào)告指出,考慮到英偉達(dá)近期遭到市場拋售,雖然具體原因未明,但相信可為有興趣的投資者帶來良好的入市機(jī)會(huì),因此,重新將其列為首選股,盈利預(yù)測及目標(biāo)價(jià)未變,評級(jí)為“增持”,目標(biāo)價(jià)為144美元。
短短兩天內(nèi),英偉達(dá)股價(jià)大落后又大起,或許與Blackwell供應(yīng)吃緊,難以全部按時(shí)交付有關(guān)。
大摩表示,Blackwell產(chǎn)品在市場上引起了強(qiáng)烈的興趣,尤其是其推理性能的顯著提升,進(jìn)一步驅(qū)動(dòng)了客戶的購買欲望。
不過,業(yè)界傳出消息,Blackwell GPU芯片可能延遲,或者是搭配該芯片的服務(wù)器產(chǎn)品可能延遲。
雖然諸多競爭對手的技術(shù)和產(chǎn)品表現(xiàn)越來越好,給英偉達(dá)帶來了壓力,但在目前和未來中短期內(nèi),該公司的GPU產(chǎn)品依然是AI服務(wù)器市場主力,總體供不應(yīng)求。而在眾多客戶期待的Blackwell GPU即將出貨之際,傳出交付會(huì)延期的消息,肯定會(huì)吊足市場胃口,有利于股價(jià)上漲。