文|硅谷101
在萬(wàn)眾矚目的英偉達(dá)年度GTC大會(huì)中,黃仁勛告訴臺(tái)下的上萬(wàn)名參會(huì)者:新一代AI革命是百萬(wàn)億美元的市場(chǎng),而他的賭注在遠(yuǎn)方。
01 英偉達(dá)GTC 2024
英偉達(dá),2024財(cái)年四季度營(yíng)收是前一年同期水平的3.5倍。
利潤(rùn)是前一年同期水平的9倍。
股價(jià)在16個(gè)月內(nèi)上漲了6倍。
AI浪潮給予英偉達(dá)的榮耀讓這家公司坐上了全球市值第三的位置,也吸引了上萬(wàn)人來(lái)到英偉達(dá)在美國(guó)時(shí)間3月18日到21日舉辦的2024年度GTC大會(huì)現(xiàn)場(chǎng),包括作為受邀媒體參會(huì)的我們硅谷101。
我們?cè)趨?huì)前非常好奇,已經(jīng)成為AI芯片霸主的英偉達(dá)在接下來(lái)面對(duì)AMD、英特爾以及Groq等眾多競(jìng)爭(zhēng)對(duì)手的追擊,以及英偉達(dá)的大客戶們,包括谷歌、Meta、亞馬遜等等科技巨頭都正在自研芯片的壓力下,它如何向市場(chǎng)傳達(dá)出,英偉達(dá)能守住霸主地位并且這個(gè)市場(chǎng)在未來(lái)還有巨大增長(zhǎng)潛力的信號(hào),來(lái)繼續(xù)激勵(lì)華爾街和硅谷。
我們經(jīng)過(guò)四天的參會(huì)、逛展會(huì)、聽論壇和分析師采訪,帶大家云參會(huì)2024年英偉達(dá)GTC,也順便聊聊,作為AI芯片市場(chǎng)絕對(duì)霸主的英偉達(dá)想要傳達(dá)出的野心和布局。
在今年英偉達(dá)GTC大會(huì)中,有四大板塊和議程是我們非常關(guān)注的,分別是:
1)英偉達(dá)創(chuàng)始人和CEO黃仁勛在第一天的重磅演講keynote中將傳達(dá)出的信號(hào);
2)第三天議程中,黃仁勛會(huì)主持一場(chǎng)座談panel,邀請(qǐng)了當(dāng)今生成式AI浪潮的奠基石論文Transformer架構(gòu)的Attention Is All You Need論文8位作者到場(chǎng),這8位作者當(dāng)年都在谷歌,但后來(lái)都紛紛出來(lái)自己創(chuàng)業(yè),所以這會(huì)是第一次他們8人再聚在一起討論AI的未來(lái),非常是歷史性一刻;
3)前來(lái)參展的各家英偉達(dá)合作公司,因?yàn)檫@顯示出英偉達(dá)的業(yè)務(wù)前景,以及軟硬件落地的實(shí)際效果我們能有一個(gè)很直觀的感受;
4)就是分別在這四天中英偉達(dá)請(qǐng)來(lái)的演講和論壇嘉賓,從各個(gè)科技巨頭和AI獨(dú)角獸的科技領(lǐng)袖分享中,大家對(duì)AI行業(yè)傳遞出的信號(hào)。
接下來(lái),我們就結(jié)合以上四點(diǎn)來(lái)聊聊我們對(duì)這次GTC的觀察。
02 芯片架構(gòu)更新Blackwell
黃仁勛的整場(chǎng)演講從下午1點(diǎn)到3點(diǎn),持續(xù)兩個(gè)小時(shí),其中涵蓋了英偉達(dá)的硬件和軟件的各類產(chǎn)品更新,現(xiàn)場(chǎng)PPT和視頻效果非常震撼。
老黃非常善于演講,沒(méi)有請(qǐng)任何的嘉賓,就一個(gè)人在臺(tái)上講了兩個(gè)小時(shí),很會(huì)控場(chǎng)也有幽默,臺(tái)下的效果和觀眾反應(yīng)都很熱烈,特別是最后講到英偉達(dá)機(jī)器人業(yè)務(wù)那一塊,老黃把迪士尼正在研發(fā)的Wall-E小機(jī)器人請(qǐng)到臺(tái)上互動(dòng),開了些小玩笑,簡(jiǎn)直太可愛(ài)了,效果非常好。
整體來(lái)說(shuō),除了有幾個(gè)段子沒(méi)響之外,氣氛都拉到了頂點(diǎn),很多人看了keynote出來(lái)之后都直呼興奮。
這場(chǎng)萬(wàn)眾聚焦的GTC演講的重點(diǎn)之一就是:重磅GPU架構(gòu)更新,所以黃仁勛把很大一部分演講重點(diǎn)放在了名為Blackwell的下一代GPU架構(gòu)。
他告訴臺(tái)下觀眾們:“如今AI訓(xùn)練需要更大的算力,那么就需要研發(fā)出更大的AI芯片來(lái)支持訓(xùn)練”。
(我們很快會(huì)上線一個(gè)和業(yè)內(nèi)人士一起逐幀講解這個(gè)動(dòng)畫的視頻,詳細(xì)講講每一步,英偉達(dá)在Blackwell系列芯片硬件更新上做了哪些設(shè)計(jì)優(yōu)化,以及接下來(lái)對(duì)AI芯片產(chǎn)業(yè)將帶來(lái)如何的影響。)
總的來(lái)說(shuō),新的架構(gòu)下,Blackwell系列包括三個(gè)型號(hào):B100、B200 和Grace-Blackwell Superchip(GB200)將是下一代更強(qiáng)大的芯片性能更新,也繼續(xù)實(shí)現(xiàn)著黃仁勛之前制定的黃氏定律Huang’s Law – 也就是,GPU將推動(dòng)AI性能實(shí)現(xiàn)逐年翻倍。
黃仁勛,NVIDIA創(chuàng)始人兼首席執(zhí)行官:
如果要訓(xùn)練一個(gè)1.8萬(wàn)億參數(shù)GPT模型,大約需要三到五個(gè)月的時(shí)間:如果使用傳統(tǒng)的安培芯片,大約需要25000個(gè)。如果用Hopper來(lái)做,可能需要8000個(gè)GPU,并且會(huì)消耗15兆瓦。8000個(gè)GPU和15兆瓦,它會(huì)需要90天,大約三個(gè)月的時(shí)間。如果你用Blackwell來(lái)做,只需要2000個(gè)GPU。2000個(gè)GPU,同樣的90天。但這是驚人的部分,只需要4兆瓦的電力。
這里還有幾個(gè)值得注意的點(diǎn):對(duì)于新一代的B100、B200 和 GB200,這些芯片的工作功率范圍在700W到1200W之間。隨著新一代芯片的功率和性能都大幅度升級(jí),在AI數(shù)據(jù)中心領(lǐng)域,想要發(fā)揮Blackwell的最大潛力,轉(zhuǎn)向液態(tài)冷卻幾乎成為必須,這也給超微電腦Super Micro等數(shù)據(jù)中心硬件供應(yīng)商提出了新的挑戰(zhàn)。
陳茜,硅谷101聯(lián)合創(chuàng)始人:
新出來(lái)的B200可能算力更大、耗能更大對(duì)吧?裝載的rack跟現(xiàn)在來(lái)比,是不是技術(shù)、設(shè)計(jì)層 面上需要更大更多的一些提升?
Chiawei Chen博士,Senior Director, Super Micro Computer:
基本上以現(xiàn)在我們都按熱設(shè)計(jì)功耗(TDP),它以GPU來(lái)講是越來(lái)越高,比如現(xiàn)在的H100大概一顆大概700瓦,那B200已經(jīng)到一顆到1千瓦,所以水冷這件事情已經(jīng)不是可以有,而是必須有。對(duì),我們必須要做這件事情。因?yàn)樗懔π枨笤絹?lái)越高,你用ChatGPT,那就對(duì)算力需求越來(lái)越高,但是它又是一個(gè)比較高耗能的東西,所以你必須要有一個(gè)很有效率的散熱的解決方法,去把算力保持住或者甚至提高。但是你去降低所有環(huán)境,或者是說(shuō)空調(diào)設(shè)備的使用電量,那大概就是水冷。
另外,芯片的產(chǎn)能問(wèn)題也一直是困擾英偉達(dá)的一個(gè)方面,因?yàn)殡m然發(fā)布了B200,但是市面上能配置到H200的公司都不多。在這次大會(huì)上,英偉達(dá)也試圖直面這個(gè)問(wèn)題,包括臺(tái)積電TSMC 和Synopsys將 NVIDIA合作,將在生產(chǎn)中使用 NVIDIA 計(jì)算光刻平臺(tái),希望在加速芯片制造速度的同時(shí),也加快了對(duì)未來(lái)最新一代NVIDIA Blackwell架構(gòu)GPU的支持。
03 華爾街“暫不接招”
整體來(lái)說(shuō),黃仁勛的keynote期間在硬件上的發(fā)布效果還是非常好的,但是,從GTC這幾天的股價(jià)震蕩就可以看出來(lái),華爾街并不覺(jué)得驚喜,因?yàn)橹霸?月公布財(cái)報(bào)的時(shí)候,利好都已經(jīng)出盡了,市場(chǎng)已經(jīng)知道英偉達(dá)會(huì)出新的芯片,這些硬件的更新已經(jīng)被市場(chǎng)提前消化了。
Yang Ren,Senior Analyst&Partner at Jirong Investment Management (濟(jì)容投資):
新發(fā)布的這個(gè)硬件的產(chǎn)品來(lái)看的話,其實(shí)我覺(jué)得沒(méi)有什么特別大的意外。因?yàn)槠鋵?shí)目前供應(yīng)鏈的這些渠道檢查,大家做得確實(shí)也都比較細(xì)致,比較到位了。我覺(jué)得就是硬件,如果讓我來(lái)總結(jié)我的感受的話,我覺(jué)得是“預(yù)期之內(nèi)的好”。我覺(jué)得可能是比較客觀的一個(gè)評(píng)價(jià)了。
陳茜,硅谷101聯(lián)合創(chuàng)始人:
你們會(huì)覺(jué)得說(shuō)這個(gè)新的硬件的發(fā)布會(huì),對(duì)整個(gè)英偉達(dá)在AI芯片中的地位造成任何的影響嗎?會(huì)進(jìn)一步的去鞏固它的現(xiàn)狀?還是會(huì)跟其他的,例如MI300等其他的一些競(jìng)爭(zhēng)對(duì)手其實(shí)拉得更遠(yuǎn)?
Yang Ren,Senior Analyst&Partner at Jirong Investment Management (濟(jì)容投資):
我覺(jué)得其實(shí)現(xiàn)在這是一個(gè)大家交替領(lǐng)先,同時(shí)在進(jìn)步的這么一個(gè)狀態(tài)。因?yàn)榭赡芊旁趲讉€(gè)月之前,MI300剛剛出來(lái)的時(shí)候,大家會(huì)覺(jué)得MI300在硬件層面上,其實(shí)在已經(jīng)一定程度上超越了H100。 然后當(dāng)時(shí)大家對(duì)AMD的預(yù)期就拔得很高,認(rèn)為MI300可以很快地占據(jù)市場(chǎng)。但是我覺(jué)得這種角度去看可能是過(guò)于靜態(tài)了,因?yàn)闆](méi)有一家公司他真的就會(huì)止步不前,然后不再進(jìn)步。
包括像Jensen英偉達(dá),他們是已經(jīng)對(duì)于MI300的這些進(jìn)步吧,他們是完全是看在眼里,也是有預(yù)期。他們自己在B100里面也是了加入了很多:比如像內(nèi)存一致性、比如將更大的高帶寬內(nèi)存,這些東西加入到B100里面,其實(shí)是大家共同進(jìn)步,交替領(lǐng)先的一個(gè)狀態(tài)。所以我覺(jué)得整體來(lái)看,我覺(jué)得硬件上英偉達(dá)確實(shí)還是走得很穩(wěn),還是在全速地往前推的這么一個(gè)狀態(tài)。他跟其他的競(jìng)爭(zhēng)對(duì)的是持續(xù)性地一個(gè)差距,沒(méi)有再縮短的狀態(tài)。
所以,在這次GTC上,硬件的發(fā)布更新固然重要,但我們能強(qiáng)烈感覺(jué)到,黃仁勛想要強(qiáng)調(diào)的是,英偉達(dá)不僅僅是一家GPU公司,英偉達(dá)想要通過(guò)軟件的升級(jí),不僅僅是已經(jīng)成功變成英偉達(dá)牢固護(hù)城河的CUDA,還有更遠(yuǎn)的布局。
黃仁勛在他的keynote中強(qiáng)調(diào)的很清楚,他眼中的新一代市值100萬(wàn)億美元的新工業(yè)革命市場(chǎng),英偉達(dá)是這樣布局的:除了Blackwell硬件算力平臺(tái),黃仁勛還著重推出NIMs,幫助企業(yè)級(jí)客戶接入AI。
NVIDIA NIM是經(jīng)過(guò)優(yōu)化的推理微服務(wù),用于大規(guī)模部署 AI 模型,為開發(fā)AI驅(qū)動(dòng)的企業(yè)應(yīng)用程序和在生產(chǎn)中部署AI模型提供了比較便捷和簡(jiǎn)化的路徑。也就是說(shuō),企業(yè)想要部署AI,英偉達(dá)在生態(tài)上已經(jīng)給你提供了各種api和基礎(chǔ)大模型,讓企業(yè)更快的上手。
此外的生態(tài)重點(diǎn)是英偉達(dá)的AI foundry和NeMo。去年英偉達(dá)發(fā)布的AI foundry 具備三個(gè)要素:英偉達(dá)的AI基礎(chǔ)模型,NVIDIA NeMo 框架和工具、用于構(gòu)建、自定義和部署生成式AI 模型,以及NVIDIA DGX 云AI 超級(jí)計(jì)算服務(wù)。這樣依賴,AI foundry就可以用于為企業(yè)軟件、電信、媒體等各個(gè)行業(yè)的生成式AI 應(yīng)用定制模型。而在今年,英偉達(dá)進(jìn)一步在這樣的AI foundry生態(tài)上繼續(xù)更新各種基礎(chǔ)模型和生態(tài)服務(wù)。
下一個(gè)重點(diǎn)就是英偉達(dá)的Omniverse,也就是物理模擬反饋的平臺(tái),通過(guò)模擬與物理世界中各種互動(dòng)的過(guò)程,來(lái)訓(xùn)練AI。我們?cè)谥爸v機(jī)器人那一集的時(shí)候就著重提過(guò),AI機(jī)器人在模擬環(huán)境中的訓(xùn)練非常重要,而現(xiàn)在來(lái)看,不僅僅是AI機(jī)器人,還有無(wú)人駕駛,氣候模擬,藥物發(fā)現(xiàn),計(jì)算生物學(xué),乃至于Vision Pro所構(gòu)建的XR生態(tài),英偉達(dá)的Omniverse都已經(jīng)在布局。
這次GTC上,英偉達(dá)宣布了Omniverse Cloud API接口,讓開發(fā)者能夠輕松地將Omniverse的核心技術(shù)直接集成到現(xiàn)有的數(shù)字孿生設(shè)計(jì)與自動(dòng)化軟件應(yīng)用中,或是集成到用于測(cè)試和驗(yàn)證機(jī)器人或自動(dòng)駕駛汽車等自主機(jī)器的仿真工作流中。
同時(shí)在keynote中,黃仁勛進(jìn)一步強(qiáng)調(diào)Isaac Sim,這個(gè)基于Omniverse平臺(tái)之上的機(jī)器人培訓(xùn)與模擬系統(tǒng),這相當(dāng)于給機(jī)器人構(gòu)建了一個(gè)全新的“操作系統(tǒng)”,同時(shí),英偉達(dá)還宣布了一個(gè)名為GROOT的機(jī)器人通用基礎(chǔ)大模型,和新型計(jì)算機(jī)Jetson Thor來(lái)加速機(jī)器人訓(xùn)練。
而且,黃仁勛的一對(duì)兒女都在Omniver部門就職,女兒Madison Huang是Omniverse部門的高級(jí)產(chǎn)品營(yíng)銷經(jīng)理,兒子Spencer Huang是Omniverse旗下機(jī)器人仿真和擴(kuò)展組的產(chǎn)品經(jīng)理,可見老黃對(duì)這個(gè)Omniverse這項(xiàng)業(yè)務(wù)的重視程度。
而從英偉達(dá)邀請(qǐng)的這四天的分享嘉賓中,我們能從現(xiàn)場(chǎng)就感受到,公司在軟件生態(tài)上的布局和發(fā)力。在各個(gè)panel和分享會(huì)上,我們也很直觀的感受到英偉達(dá)軟件生態(tài)的升級(jí),給各個(gè)行業(yè)帶來(lái)的助力,這包括大語(yǔ)言模型賦能自動(dòng)駕駛技術(shù)上,英偉達(dá)的數(shù)字孿生的模擬技術(shù)能讓自動(dòng)駕駛繼續(xù)在模擬器中得以更好更快更有效率的訓(xùn)練。
另外,在具身智能專家李飛飛和波士頓動(dòng)力機(jī)器人的分享環(huán)節(jié)中,嘉賓也都強(qiáng)調(diào)了深度機(jī)器學(xué)習(xí)給機(jī)器人技術(shù)帶來(lái)的巨大潛力,包括在模擬環(huán)境中的訓(xùn)練,以及在周一,黃仁勛也宣布了一個(gè)通用人形機(jī)器人基礎(chǔ)模型的新平臺(tái),來(lái)和波士頓動(dòng)力等等機(jī)器人公司合作,加速機(jī)器人的發(fā)展。
然而,雖然我身邊一些做軟件和研究的科學(xué)家和博士朋友們都對(duì)Omniverse以及數(shù)字孿生的升級(jí)有很大的期待,但無(wú)論是從昨天黃仁勛的演講現(xiàn)場(chǎng),還是今天的分享會(huì)上,我們的感受和觀察是,軟件上的升級(jí)似乎并沒(méi)有給外界帶來(lái)非常大的興奮值,包括在昨天的keynote演講中,特別在軟件環(huán)節(jié),黃仁勛好幾個(gè)講的笑話和?,F(xiàn)場(chǎng)的觀眾都沒(méi)有理解到,好幾度比較冷場(chǎng)。
陳茜,硅谷101聯(lián)合創(chuàng)始人:
有幾個(gè)朋友他們是讀PhD技術(shù)背景出來(lái)的。他們會(huì)覺(jué)得說(shuō)特別是軟件方向,包括數(shù)字孿生,包括模擬方面,英偉達(dá)在軟件方向提供這么多的支持,整個(gè)的研究、調(diào)研、他們的工作會(huì)加快非常多,所以他們感覺(jué)非常的興奮。但是感覺(jué)就是講硬件的那一塊,當(dāng)然很燃,大家就是能夠很快地理解到他硬件提升多少倍。但是好像講了軟件的那一塊,我感覺(jué)到現(xiàn)場(chǎng)好像參會(huì)者不是那么容易的能理解到,英偉達(dá)他想要去做什么事情,他想的是一個(gè)什么樣的市場(chǎng)。我覺(jué)得說(shuō)老黃他表達(dá)出來(lái)的東西,跟現(xiàn)場(chǎng)觀眾接受到的信息中間還是有一個(gè)不對(duì)等。
Yang Ren,Senior Analyst&Partner at Jirong Investment Management (濟(jì)容投資):
對(duì),我特別同意你這個(gè)觀察。我覺(jué)得英偉達(dá),大家對(duì)于它的芯片這一塊其實(shí)已經(jīng)認(rèn)知得非常充分了,軟件這部分我覺(jué)得可能不光是聽眾或者說(shuō)投資人,有時(shí)候我甚至有一個(gè)感覺(jué),就是英偉達(dá)自己對(duì)于他們的軟件這一塊到底是什么樣一個(gè)戰(zhàn)略,或者什么樣一個(gè)策略,也還是沒(méi)有一個(gè)特別清晰或者說(shuō)完全成型的一個(gè)狀態(tài),都是在走一步、看一步,然后逐漸慢慢摸索的這種狀態(tài)。你剛才提到一點(diǎn),就是說(shuō)覺(jué)得中間好像還隔著點(diǎn)什么?我也是這么一種感受。包括這次,大家都聽到他提很多關(guān)于數(shù)字孿生、關(guān)于Ominverse的這些東西。
但是這前兩年他第一次把Omniverse這個(gè)東西拿出來(lái)講的時(shí)候,大家都非常困惑,不知道Jensen到底想把這個(gè)東西來(lái)干嘛用?怎么去賣?一開始的時(shí)候,大家只是感覺(jué)這就是一個(gè),對(duì)于這些3D設(shè)計(jì)師或者說(shuō)平面設(shè)計(jì)師用來(lái)協(xié)作的一個(gè)平臺(tái)。但是隨著現(xiàn)在慢慢的發(fā)展,慢慢地變成了數(shù)字孿生的一個(gè)操作系統(tǒng)。同時(shí)這些數(shù)字孿生在工業(yè)里面最初始的應(yīng)用,跟現(xiàn)在比較類似。我記得他最早提到在寶馬工廠里面一個(gè)應(yīng)用,就是幫助在工廠建設(shè)的過(guò)程中,提前做好布局設(shè)計(jì),做好工作流程的這些安排,這樣的話可以提升整體運(yùn)行的效率。因?yàn)檫@次提到了包括Wistron公司的例子、包括西門子的例子,都是類似的一個(gè)概念,我覺(jué)得非常合理。
一定程度上就是,在這些工業(yè)制造領(lǐng)域里面虛擬實(shí)境的一個(gè)應(yīng)用。另外他提到Omniverse的一個(gè)應(yīng)用,就是機(jī)器人的訓(xùn)練場(chǎng)。我覺(jué)得這個(gè)也是他們一直在做的事情,之前也斷斷續(xù)續(xù)有提到過(guò)。但之前整個(gè)軟件的版圖,給我的感覺(jué)就是他們這有一點(diǎn)東西,那有一點(diǎn)東西,但是一直缺一個(gè)特別好的、特別有凝聚力的一個(gè)戰(zhàn)略,能夠把所有的拼圖拼在一起。這一次聽完我其實(shí)真的有這種感覺(jué)了,就是有一種AI和Omniverse匯聚這么一種感覺(jué)。我現(xiàn)在能慢慢能夠看到他們軟件這一塊更清晰的一個(gè)版圖、一個(gè)戰(zhàn)略往后走是什么樣的。我能理解,為什么你剛才提到很多比較關(guān)注軟件的朋友,他們會(huì)覺(jué)得非常興奮。
陳茜,硅谷101聯(lián)合創(chuàng)始人:
你覺(jué)得對(duì)于就是華爾街來(lái)說(shuō),看到它軟件上面的一些業(yè)務(wù)慢慢的清晰化了,以及AI跟軟件的結(jié)合,這會(huì)對(duì)它的估值來(lái)說(shuō),會(huì)有一個(gè)更高的提升嗎?
Qindong Liu,Portfolio Manager&Partner at Jirong Investment Management (濟(jì)容投資):
我覺(jué)得其實(shí)是這樣子,就是我們管叫rerating(重新評(píng)定)的這么一個(gè)過(guò)程。那我覺(jué)得現(xiàn)在大部分,你從它現(xiàn)在估值水平,我覺(jué)得市場(chǎng)其實(shí)還是把它當(dāng)成一個(gè)芯片公司。我覺(jué)得這個(gè)是落后于英偉達(dá)自己的想法的。英偉達(dá)慢慢把自己定位成一個(gè)系統(tǒng)公司,不但是有硬件、軟件,我又能幫助你打造整個(gè)生態(tài),就給你提供一個(gè)大的生態(tài)。
譬如說(shuō)我們之前還在講,說(shuō)起來(lái)這相關(guān)又不那么相關(guān):就說(shuō)以后無(wú)人駕駛這一塊,特斯拉大家都知道了,我不知道有多少人真的會(huì)想到說(shuō),英偉達(dá)在這里面以后也會(huì)成為特別重要的一環(huán)。像我前兩天和任總還在討論,以后是不是除了特斯拉之外的這些原始設(shè)備制造商,都要給英偉達(dá)去打工了。就是當(dāng)市場(chǎng)逐漸意識(shí)到這是需要時(shí)間的。像Jensen這樣這么一個(gè)有遠(yuǎn)見的CEO,在接下來(lái)的幾年,只要是AI這個(gè)賽道不冷,只要能一直這么發(fā)展下去,他會(huì)逐漸地把這些東西灌輸給市場(chǎng),然后逐漸地被大家接受。
華爾街總是難以討好的,硬件升級(jí),華爾街并不驚喜,因?yàn)橹皥?bào)財(cái)報(bào)的時(shí)候已經(jīng)被市場(chǎng)消化了,而軟件布局,華爾街沒(méi)有看到即刻的營(yíng)收價(jià)值,目前也沒(méi)有買賬。但這并不影響黃仁勛的長(zhǎng)期主義和未來(lái)布局,畢竟,加速計(jì)算他布局了20年,CUDA軟件布局了10多年。
04 權(quán)力與野心
無(wú)論華爾街是否在現(xiàn)在買賬,黃仁勛管理下的英偉達(dá)正在動(dòng)用一切的努力去加固自己的護(hù)城河,也毫不掩飾的展示出未來(lái)朝著更多領(lǐng)域提供服務(wù)的野心。
最近一個(gè)黃仁勛在斯坦福的演講中,他說(shuō):他的目標(biāo)是就算競(jìng)爭(zhēng)對(duì)手的芯片免費(fèi)送,也不如英偉達(dá)的劃算。非常大的口氣。
黃仁勛,NVIDIA創(chuàng)始人兼首席執(zhí)行官:
我們部署的時(shí)間、我們的表現(xiàn)、我們的落地應(yīng)用,以及在不同應(yīng)用間的靈活性,這些綜合起來(lái),容許我們的運(yùn)營(yíng)成本,我們的總體運(yùn)營(yíng)成本好到一個(gè)程度。就是即便競(jìng)爭(zhēng)對(duì)手的芯片免費(fèi)送,也無(wú)法便宜過(guò)我們。這就是我們的目標(biāo):讓成本不再成為我們產(chǎn)品價(jià)值的衡量標(biāo)準(zhǔn)。當(dāng)然這個(gè)需要我們付出很多心血,得持續(xù)創(chuàng)新、虛心前行。但我們的競(jìng)爭(zhēng)對(duì)手太多了。
所以,更高的護(hù)城河,更大的生態(tài)系統(tǒng),是黃仁勛追求的。
一篇華爾街日?qǐng)?bào)里面寫到的細(xì)節(jié),說(shuō)風(fēng)險(xiǎn)投資公司Thomvest Ventures的董事總經(jīng)理Umesh Padval說(shuō)他和黃仁勛一起去投資布局一些初創(chuàng)公司的時(shí)候,黃仁勛毫不掩飾并且以來(lái)就比較aggressively、比較激進(jìn)的直接問(wèn):“我需要做什么才能建立生態(tài)系統(tǒng),以便我可以銷售更多的芯片和系統(tǒng)?”
所以,我們看到,目前英偉達(dá)參與了很多的初創(chuàng)公司投資,除了上面說(shuō)的這家Thomvest和英偉達(dá)一起投資的基礎(chǔ)模型AI公司Cohere之外,英偉達(dá)還投資了云計(jì)算公司CoreWeave。華爾街日?qǐng)?bào)報(bào)道, 在上一財(cái)年中,英偉達(dá)所持其他公司的股份價(jià)值增長(zhǎng)了五倍多,截至2024年1月底達(dá)到約 15.5 億美元。而英偉達(dá)在 2023 年總共投資了超過(guò)35家初創(chuàng)公司,這個(gè)投資量級(jí)是上一年的三倍多。
所以,在這些人工智能、機(jī)器人、自動(dòng)化、醫(yī)療保健公司等等賽道,黃仁勛都在布局。也許這些賽道還沒(méi)有爆發(fā),也許還需要很長(zhǎng)的時(shí)間,但就像黃仁勛20年前就開始布局加速計(jì)算、10多年前就開始布局CUDA一樣,這些產(chǎn)業(yè)被老黃稱為“Zero-billion dollar markets”,就是目前市場(chǎng)有限、但在未來(lái)可能會(huì)爆發(fā)的市場(chǎng),黃仁勛在一如既往的提前布局他遙遠(yuǎn)的野心。
而黃仁勛在目前是有資本進(jìn)行布局的:股價(jià)一路上漲、手握大量現(xiàn)金不說(shuō),另外一個(gè)原因我們?cè)诟韫纫粋€(gè)VC聊天的時(shí)候?qū)Ψ秸f(shuō):現(xiàn)在VC去搶好項(xiàng)目,明星AI公司看的不是你給的估值有多好,而是看你有沒(méi)有買GPU的渠道。而這個(gè)渠道的權(quán)力,有誰(shuí)搶得過(guò)英偉達(dá)本身呢?
所以,英偉達(dá)如今搶占各個(gè)明星AI項(xiàng)目的席位,也是非常順理成章。而這樣的市場(chǎng)絕對(duì)霸主地位帶來(lái)的權(quán)力讓英偉達(dá)有著很大的話語(yǔ)權(quán)。
華爾街日?qǐng)?bào)同樣的一篇文章中寫到:甲骨文創(chuàng)始人兼董事長(zhǎng)Larry Ellison在去年9月的一次公司會(huì)議上講述了他和馬斯克與黃仁勛在硅谷Palo Alto的Nobu日本餐廳吃晚餐。Larry Ellison回憶說(shuō),描述這頓飯最貼切的方式是:一個(gè)小時(shí)的壽司和乞討。
原文真的用的乞討(begging)這個(gè)詞。所以,我們用了“絕對(duì)霸主的權(quán)力”和“遙遠(yuǎn)的野心”作為視頻的主題,我覺(jué)得還挺能概括目前英偉達(dá)的狀態(tài)的。
但是并不是說(shuō)英偉達(dá)就沒(méi)有挑戰(zhàn)了。英偉達(dá)可能面對(duì)的最大威脅,正是自己。
如果生成式AI像自動(dòng)駕駛一樣發(fā)展到瓶頸期,或者最終證明transformer這個(gè)架構(gòu)并不是將人類帶向AGI,那么英偉達(dá)將面臨非常大的危機(jī)。
可能這也是為什么黃仁勛將本次GTC大會(huì)上,將Transformer論文作者聚集在一起的原因之一。
05 Transformer七子:AI的未來(lái)
最后,再來(lái)說(shuō)說(shuō)本次GTC大會(huì)上的一個(gè)大熱門環(huán)節(jié):由黃仁勛親自主持,邀請(qǐng)了Transformer這篇論文的幾位作者到場(chǎng)。
2017年,8位谷歌的研究員發(fā)表了一篇論文叫做Attention is all you need,這篇論文提出了一種新的簡(jiǎn)單網(wǎng)絡(luò)架構(gòu),這就是Transformer,它完全基于Attention注意力機(jī)制,完全摒棄了之前的RNN和卷積CNN等機(jī)制。
而正是因?yàn)檫@篇論文,剛成立的OpenAI開始用transformer的架構(gòu)開始訓(xùn)練GPT路線,開始走堆算力和堆參數(shù)的AI訓(xùn)練方法,之后才造就了今天我們所看到的生成式AI革命。所以這8位研究員可以稱為如今生成式AI的大功臣,而他們?cè)谝庾R(shí)到transformer架構(gòu)的潛力之后,也相繼的離開了谷歌,開始投身于不同的初創(chuàng)公司和項(xiàng)目當(dāng)中。
這里面其實(shí)有兩個(gè)很有意思的點(diǎn):
1)Transformer架構(gòu)是谷歌最先推出的,但這幾位研究元老一位都沒(méi)有留住,他們?cè)诜窒碇幸舱f(shuō)道,因?yàn)榉椒ㄓ辛耍酉聛?lái)最重要的就是快速的出應(yīng)用,接觸用戶,完善產(chǎn)品,尋求市場(chǎng)反饋,然后再快速的推進(jìn),但顯然,谷歌陷入的所謂的“大公司創(chuàng)新陷阱”里,很難在公司內(nèi)部來(lái)快速推進(jìn),所以大家只能紛紛叛逃,出來(lái)自己做初創(chuàng)公司,這8位從前的研究員,如今的創(chuàng)業(yè)者,全部都是這樣。
2)他們也看到了如今AI浪潮所帶來(lái)的機(jī)會(huì),而他們本身的光環(huán)就足夠能吸引融資和人才人脈加入他們。在硅谷,人們都想創(chuàng)業(yè),都想自己推出產(chǎn)品,主導(dǎo)創(chuàng)新,而就像黃仁勛說(shuō)的,接下來(lái)10年將是黃金10年的機(jī)會(huì),所以也難怪8位研究員都出來(lái)自己?jiǎn)胃?。很有意思的是,他們之前從?lái)都沒(méi)有聚在一起過(guò),之前都是線上合作辦公,而這一次,除了一位女性研究員Niki Parmar 因?yàn)橛屑依锛笔聸](méi)有來(lái)之外,其它七位研究員都來(lái)到了現(xiàn)場(chǎng),可以說(shuō)是非常有歷史紀(jì)念意義的一個(gè)瞬間了。
整個(gè)會(huì)場(chǎng)從很早就開始排隊(duì),差不多接近2000人的會(huì)場(chǎng)都坐滿了,黃仁勛也提前來(lái)到現(xiàn)場(chǎng)和大家打招呼合影,之后介紹每位研究員上場(chǎng)。
他們分別是AI角色扮演對(duì)話公司Character AI聯(lián)合創(chuàng)始人兼首席執(zhí)行官Noam Shazeer;
我們上面提到的基礎(chǔ)模型AI創(chuàng)業(yè)公司,Cohere聯(lián)合創(chuàng)始人兼首席執(zhí)行官Aidan Gomez;
Ashish Vaswani和缺席的Niki Parmar 兩人聯(lián)合創(chuàng)立了Essential AI這家基于大模型的全棧型智能產(chǎn)品開發(fā)商,Essential AI開發(fā)了一項(xiàng)名為“企業(yè)大腦”的技術(shù),可以利用AI執(zhí)行企業(yè)職能,比如說(shuō)數(shù)據(jù)分析,并自動(dòng)執(zhí)行單調(diào)的任務(wù)。
此外,Llion Jones在日本東京創(chuàng)建了Sakana AI,這是一家AI技術(shù)研發(fā)商,專注于為基礎(chǔ)模型創(chuàng)建新架構(gòu);
Illia Polosukhin聯(lián)合創(chuàng)立的使用區(qū)塊鏈為AI 賦能的Near Protocol公司;
此外,Jakob Uskhoreit是Inceptive的聯(lián)合創(chuàng)始人兼首席執(zhí)行官,這家公司將人工智能用于mRNA疫苗開發(fā);
同時(shí)英偉達(dá)也投資了他們;最后是Lukasz Kaiser,加入了OpenAI,而黃仁勛介紹他上臺(tái)時(shí)開玩笑說(shuō),這是8位作者中唯一一位還在做工程師的技術(shù)人員。
而在座談會(huì)上,大家分享了自己從事的公司方向,以及對(duì)技術(shù)的理解。大家認(rèn)為,模型還需要進(jìn)一步的優(yōu)化,無(wú)論是在技術(shù)還是在推理上,我們還需要看到技術(shù)的繼續(xù)突破,甚至需要有比transformer更好的框架。
Aidan Gomez,Cohere聯(lián)合創(chuàng)始人兼首席執(zhí)行官:
我仍然覺(jué)得,我們與最初的設(shè)計(jì)形態(tài)相似過(guò)高。這讓我有些不安。我認(rèn)為世界需要一種比transformer更先進(jìn)的模型。我們所有人都希望它能被更高效的技術(shù)所取代。將性能繼續(xù)往上拔高。
而一個(gè)比transformer更好的模型或者框架,英偉達(dá)的GPU是否還是必不可少的呢?這其實(shí)是一個(gè)問(wèn)號(hào),也是英偉達(dá)最大的危機(jī)所在。
但無(wú)論如何,目前算力是緊缺的,七位作者也一致認(rèn)為,接下來(lái),自適應(yīng)計(jì)算(adaptive computation),也就是如何在特定的問(wèn)題上分配合適的計(jì)算量,也是接下來(lái)的著力點(diǎn)之一。
換句話說(shuō),如果我們把2+2=4這個(gè)問(wèn)題輸入現(xiàn)有模型,計(jì)算機(jī)需要使用一萬(wàn)億參數(shù)解答這個(gè)問(wèn)題,而這個(gè)問(wèn)題的價(jià)值就不如問(wèn)“2+2為什么等于4”,所以之后我們?nèi)绾稳ゼ兴懔鉀Q更有價(jià)值的問(wèn)題、更合理分配算力,也是接下來(lái)需要推動(dòng)的方向。
同時(shí),七位作者也認(rèn)為,AI下一個(gè)更重要的方向是訓(xùn)練AI的推理和自主決策能力,因?yàn)锳I的推理能力越強(qiáng),所需要的數(shù)據(jù)訓(xùn)練量就越少,屆時(shí)用于訓(xùn)練的數(shù)據(jù)質(zhì)量會(huì)更加重要,人機(jī)交互會(huì)更加深度,而接下來(lái) 如何去訓(xùn)練更高質(zhì)量的數(shù)據(jù)、私人的數(shù)據(jù),將是接下來(lái)發(fā)展的重點(diǎn)和挑戰(zhàn)。
而隨著AI技術(shù)迅速往前更迭,創(chuàng)業(yè)者以及創(chuàng)業(yè)賽道都面臨著巨大的不確定性。所以今年2024年GTC給我的唯一確定性就是,AI還是繼續(xù)發(fā)展和變化。
最后,問(wèn)大家一個(gè)問(wèn)題,大家知道GTC的全稱是什么嗎?
公布答案:GTC大會(huì)的全稱是“GPU Technology Conference”。
第一屆是2009年,此前都是非常GPU非常硬件的會(huì)議,但之后隨著英偉達(dá)公布CUDA,公布軟件布局,如今,GTC已經(jīng)不止是GPU,而是更大的生態(tài),以及將會(huì)影響人類未來(lái)的各種可能性。