文 | 硅基研究室 kiki 謝浩
比起去年把Transformer八子、OpenAI、xAI等明星企業(yè)攢到一起,今年的英偉達(dá)GTC似乎狂熱稍減。
但這并不影響黃仁勛的AI敘事,在美國加州圣何塞,「英偉達(dá)綠」依舊是科技圈的符號(hào)。除了現(xiàn)場超2萬人的圍觀,成千上萬的人在線觀看黃仁勛的主題演講,他說了什么、英偉達(dá)會(huì)干什么,這些都會(huì)成為人們判斷AI時(shí)代的依據(jù)。
不過,比起預(yù)測未來,今年GTC,黃仁勛可能干的最多的是重復(fù)和反駁——比如「買得越多,省得越多,甚至比這更好——買得越多,賺得越多」,這是經(jīng)典的黃式定律,再比如「幾乎全世界都誤解了Scaling Law放緩」。
也許是這些重復(fù)敘事,沒能帶來更多的效果,對(duì)于英偉達(dá)GTC大會(huì)發(fā)布的一系列產(chǎn)品,華爾街的態(tài)度反響平平,英偉達(dá)盤后股價(jià)下跌了約4%。
1、53次token,捍衛(wèi)Scaling Law的信仰
黃仁勛演講里有個(gè)隱秘的主題——tokens,他在自己的演講里至少提到了53次。
如此反復(fù)強(qiáng)調(diào)tokens,某種程度上黃仁勛在說Scaling Law沒有終結(jié),源源不斷的tokens消耗,就能帶來持續(xù)的算力需求,這是英偉達(dá)講述一切增長的前提。
他給出一組數(shù)據(jù),隨著Agentic AI和推理能力的發(fā)展,目前所需的計(jì)算量是過去的至少100倍。
給予黃仁勛信心的是英偉達(dá)GPU的下游應(yīng)用場景——主要包括數(shù)據(jù)中心、汽車領(lǐng)域、機(jī)器人等,科技巨頭、云廠商和算力租賃服務(wù)商都會(huì)大筆采購英偉達(dá)的先進(jìn)芯片建設(shè)AI基建。
黃仁勛曾這樣形容:“英偉達(dá)不造芯片,英偉達(dá)造數(shù)據(jù)中心”。
遵循這一認(rèn)知,黃仁勛公布了一組數(shù)據(jù),2024年,美國Top4云公司總計(jì)采購了130萬顆Hopper架構(gòu)GPU,到了2025年,這一數(shù)據(jù)飆升至360萬顆Blackwell GPU,他預(yù)計(jì)數(shù)據(jù)中心建設(shè)的價(jià)值將達(dá)到1萬億美元。
面向這些云廠商等企業(yè)端客戶,英偉達(dá)主要出售的是包括AI服務(wù)器、高速交換機(jī)等AI算力集群服務(wù),英偉達(dá)所提供的是系統(tǒng)和網(wǎng)絡(luò)、硬件和軟件等方案。
與此前的AI服務(wù)器GB200 NVL72一樣,英偉達(dá)公布了新產(chǎn)品:Blackwell Ultra NVL72機(jī)柜,黃仁勛特別強(qiáng)調(diào)這是「AI推理專用機(jī)柜」。
天風(fēng)證券分析師郭明錤曾提到,影響英偉達(dá)AI服務(wù)器增長的一個(gè)重要因素是,它能否提供算力更強(qiáng)且平均token成本更低的Scale-up?
至少從英偉達(dá)提供的數(shù)據(jù)來看,黃仁勛已想到了這一點(diǎn):相比前一代產(chǎn)品GB200 NVL72,帶寬是前代的兩倍,內(nèi)存速度是前代的1.5倍,同時(shí)由于因機(jī)柜尺寸和電源規(guī)格相似,這對(duì)科技公司的數(shù)據(jù)中心升級(jí)而言,有著一定的性價(jià)比優(yōu)勢。
不過黃仁勛沒說的是,英偉達(dá)數(shù)據(jù)中心業(yè)務(wù)的暴漲年代已經(jīng)過去了。單從財(cái)報(bào)看,英偉達(dá)數(shù)據(jù)中心業(yè)務(wù)已結(jié)束了六個(gè)季度以來連續(xù)保持的「三位數(shù)高增」,環(huán)比下降趨勢也十分顯著。
郭明錤還提到,英偉達(dá)數(shù)據(jù)中心業(yè)務(wù)目前存在的問題是「量產(chǎn)的能見度不高」,英偉達(dá)需要更多具體列舉數(shù)據(jù)中心部署GB200 NVL72的案例,以及客戶轉(zhuǎn)換到新產(chǎn)品的具體效益情況。
2、下一代芯片:黃式定律能否有效?
除去行業(yè)宏觀層面,對(duì)Scaling Law的展望,過去的幾個(gè)小時(shí)里,花費(fèi)1萬美金購票入場的技術(shù)信徒們,還在期待另一個(gè)問題的答案:
“黃氏定律”能否延續(xù)。
作為英偉達(dá)首席科學(xué)家所提出的,對(duì)后摩爾定律時(shí)代的重要補(bǔ)充,黃氏定律表明:GPU架構(gòu)、軟件的革新將推動(dòng)AI性能實(shí)現(xiàn)每年翻倍。
如果說Scaling Law關(guān)注的是“行業(yè)需不需要更多GPU”,那么黃氏定律所傳達(dá)的內(nèi)容則更為直觀——行業(yè)需不需要英偉達(dá)。
盡管從目前的市場趨勢來看,Blackwell取得了遠(yuǎn)超于Hopper架構(gòu)GPU的市場成績,并直接帶動(dòng)了AI領(lǐng)域基建的新一輪繁榮,參考黃仁勛本人的說法:“Blackwell開始出貨的一年內(nèi),你能看到人工智能基礎(chǔ)設(shè)施建設(shè)出現(xiàn)了難以置信的增長。”
但股價(jià)的下跌還是側(cè)面?zhèn)鬟f出了市場的不滿情緒。
這一不滿情緒的源頭,很大程度上來自于年度算力“核彈”——Blackwell Ultra GB300的不佳表現(xiàn)。
這顆被外界寄予厚望的芯片,并未能重現(xiàn)Blackwell架構(gòu)橫空出世時(shí)的驚艷感,反而更像是上一代芯片的內(nèi)存“超大杯”版本。
雖然黃仁勛并未對(duì)比兩代Blackwell產(chǎn)品間的性能差異。但根據(jù)此前英偉達(dá)官方透露的信息顯示,單個(gè)Ultra芯片將提供與Blackwell相同的20 petaflops的AI性能,HBM3e內(nèi)存從192GB升級(jí)到了現(xiàn)在的288GB。
似乎是為了補(bǔ)救現(xiàn)場用戶的失望感,老黃直接趁勢預(yù)告了明年上市的新一代Rubin架構(gòu)GPU,并表示,新一代GPU的性能預(yù)計(jì)是Blackwell Ultra NVL72的3.3倍。
但很顯然,這種畫餅行為并沒有得到市場的認(rèn)可。原因也很簡單,想象一下庫克在蘋果發(fā)布會(huì)上掏出一部4TB版本的iPhone16告訴大家,這就是本屆發(fā)布會(huì)的新品,順便再吹一波iPhone18的性能——對(duì)比往期發(fā)布會(huì)上的遙遙領(lǐng)先,至少在今年,黃氏定律在硬件側(cè),短暫按下了暫停鍵。
相比之下,軟件側(cè)的Nvidia Dynamo,反而成為了黃氏定律續(xù)命的關(guān)鍵。
作為業(yè)內(nèi)人士口中,英偉達(dá)“在推理領(lǐng)域構(gòu)建的新CUDA”,Nvidia Dynamo絕對(duì)擔(dān)得起發(fā)布會(huì)王炸的頭銜。
作為一個(gè)專為推理、訓(xùn)練和跨整個(gè)數(shù)據(jù)中心加速而構(gòu)建的開源軟件。Dynamo的性能數(shù)據(jù)相當(dāng)出色:在NVIDIA Hoppe平臺(tái)上,軟件能夠在同樣的GPU前提下,將AI工廠的性能和收入提高一倍。而在GB200 NVL72機(jī)架集群上運(yùn)行DeepSeek-R1模型時(shí),生成的token數(shù)量更是進(jìn)一步被提高了30多倍。
從黃仁勛的演講細(xì)節(jié)來看,他對(duì)這款產(chǎn)品的表現(xiàn)也非常滿意,在介紹完相關(guān)性能后,他甚至輕松地和現(xiàn)場開啟了玩笑:
“這就是我以前為什么說,當(dāng)Blackwell批量發(fā)貨時(shí),你不要把Hopper送人。”
從科技?xì)v史來看,三次技術(shù)浪潮誕生了三家市值超三萬億美元的公司,他們是微軟、蘋果和英偉達(dá),隨著英偉達(dá)成為這個(gè)時(shí)代最偉大的企業(yè)之一,GTC大會(huì)已不僅僅只是黃仁勛的個(gè)人秀,而是整個(gè)AI圈的文化符號(hào)。
人們對(duì)文化符號(hào)自帶信仰和高預(yù)期,就像華爾街對(duì)英偉達(dá)的期待一樣:人們的恐懼是,如果英偉達(dá)也不能講出新故事了,那么下一個(gè)英偉達(dá)在哪里呢?