文|硅谷101
在萬眾矚目的英偉達年度GTC大會中,黃仁勛告訴臺下的上萬名參會者:新一代AI革命是百萬億美元的市場,而他的賭注在遠方。
01 英偉達GTC 2024
英偉達,2024財年四季度營收是前一年同期水平的3.5倍。
利潤是前一年同期水平的9倍。
股價在16個月內(nèi)上漲了6倍。
AI浪潮給予英偉達的榮耀讓這家公司坐上了全球市值第三的位置,也吸引了上萬人來到英偉達在美國時間3月18日到21日舉辦的2024年度GTC大會現(xiàn)場,包括作為受邀媒體參會的我們硅谷101。
我們在參會前非常好奇,已經(jīng)成為AI芯片霸主的英偉達在接下來面對AMD、英特爾以及Groq等眾多競爭對手的追擊,以及英偉達的大客戶們,包括谷歌、Meta、亞馬遜等等科技巨頭都正在自研芯片的壓力下,它如何向市場傳達出,英偉達能守住霸主地位并且這個市場在未來還有巨大增長潛力的信號,來繼續(xù)激勵華爾街和硅谷。
我們經(jīng)過四天的參會、逛展會、聽論壇和分析師采訪,帶大家云參會2024年英偉達GTC,也順便聊聊,作為AI芯片市場絕對霸主的英偉達想要傳達出的野心和布局。
在今年英偉達GTC大會中,有四大板塊和議程是我們非常關(guān)注的,分別是:
1)英偉達創(chuàng)始人和CEO黃仁勛在第一天的重磅演講keynote中將傳達出的信號;
2)第三天議程中,黃仁勛會主持一場座談panel,邀請了當今生成式AI浪潮的奠基石論文Transformer架構(gòu)的Attention Is All You Need論文8位作者到場,這8位作者當年都在谷歌,但后來都紛紛出來自己創(chuàng)業(yè),所以這會是第一次他們8人再聚在一起討論AI的未來,非常是歷史性一刻;
3)前來參展的各家英偉達合作公司,因為這顯示出英偉達的業(yè)務(wù)前景,以及軟硬件落地的實際效果我們能有一個很直觀的感受;
4)就是分別在這四天中英偉達請來的演講和論壇嘉賓,從各個科技巨頭和AI獨角獸的科技領(lǐng)袖分享中,大家對AI行業(yè)傳遞出的信號。
接下來,我們就結(jié)合以上四點來聊聊我們對這次GTC的觀察。
02 芯片架構(gòu)更新Blackwell
黃仁勛的整場演講從下午1點到3點,持續(xù)兩個小時,其中涵蓋了英偉達的硬件和軟件的各類產(chǎn)品更新,現(xiàn)場PPT和視頻效果非常震撼。
老黃非常善于演講,沒有請任何的嘉賓,就一個人在臺上講了兩個小時,很會控場也有幽默,臺下的效果和觀眾反應都很熱烈,特別是最后講到英偉達機器人業(yè)務(wù)那一塊,老黃把迪士尼正在研發(fā)的Wall-E小機器人請到臺上互動,開了些小玩笑,簡直太可愛了,效果非常好。
整體來說,除了有幾個段子沒響之外,氣氛都拉到了頂點,很多人看了keynote出來之后都直呼興奮。
這場萬眾聚焦的GTC演講的重點之一就是:重磅GPU架構(gòu)更新,所以黃仁勛把很大一部分演講重點放在了名為Blackwell的下一代GPU架構(gòu)。
他告訴臺下觀眾們:“如今AI訓練需要更大的算力,那么就需要研發(fā)出更大的AI芯片來支持訓練”。
(我們很快會上線一個和業(yè)內(nèi)人士一起逐幀講解這個動畫的視頻,詳細講講每一步,英偉達在Blackwell系列芯片硬件更新上做了哪些設(shè)計優(yōu)化,以及接下來對AI芯片產(chǎn)業(yè)將帶來如何的影響。)
總的來說,新的架構(gòu)下,Blackwell系列包括三個型號:B100、B200 和Grace-Blackwell Superchip(GB200)將是下一代更強大的芯片性能更新,也繼續(xù)實現(xiàn)著黃仁勛之前制定的黃氏定律Huang’s Law – 也就是,GPU將推動AI性能實現(xiàn)逐年翻倍。
黃仁勛,NVIDIA創(chuàng)始人兼首席執(zhí)行官:
如果要訓練一個1.8萬億參數(shù)GPT模型,大約需要三到五個月的時間:如果使用傳統(tǒng)的安培芯片,大約需要25000個。如果用Hopper來做,可能需要8000個GPU,并且會消耗15兆瓦。8000個GPU和15兆瓦,它會需要90天,大約三個月的時間。如果你用Blackwell來做,只需要2000個GPU。2000個GPU,同樣的90天。但這是驚人的部分,只需要4兆瓦的電力。
這里還有幾個值得注意的點:對于新一代的B100、B200 和 GB200,這些芯片的工作功率范圍在700W到1200W之間。隨著新一代芯片的功率和性能都大幅度升級,在AI數(shù)據(jù)中心領(lǐng)域,想要發(fā)揮Blackwell的最大潛力,轉(zhuǎn)向液態(tài)冷卻幾乎成為必須,這也給超微電腦Super Micro等數(shù)據(jù)中心硬件供應商提出了新的挑戰(zhàn)。
陳茜,硅谷101聯(lián)合創(chuàng)始人:
新出來的B200可能算力更大、耗能更大對吧?裝載的rack跟現(xiàn)在來比,是不是技術(shù)、設(shè)計層 面上需要更大更多的一些提升?
Chiawei Chen博士,Senior Director, Super Micro Computer:
基本上以現(xiàn)在我們都按熱設(shè)計功耗(TDP),它以GPU來講是越來越高,比如現(xiàn)在的H100大概一顆大概700瓦,那B200已經(jīng)到一顆到1千瓦,所以水冷這件事情已經(jīng)不是可以有,而是必須有。對,我們必須要做這件事情。因為算力需求越來越高,你用ChatGPT,那就對算力需求越來越高,但是它又是一個比較高耗能的東西,所以你必須要有一個很有效率的散熱的解決方法,去把算力保持住或者甚至提高。但是你去降低所有環(huán)境,或者是說空調(diào)設(shè)備的使用電量,那大概就是水冷。
另外,芯片的產(chǎn)能問題也一直是困擾英偉達的一個方面,因為雖然發(fā)布了B200,但是市面上能配置到H200的公司都不多。在這次大會上,英偉達也試圖直面這個問題,包括臺積電TSMC 和Synopsys將 NVIDIA合作,將在生產(chǎn)中使用 NVIDIA 計算光刻平臺,希望在加速芯片制造速度的同時,也加快了對未來最新一代NVIDIA Blackwell架構(gòu)GPU的支持。
03 華爾街“暫不接招”
整體來說,黃仁勛的keynote期間在硬件上的發(fā)布效果還是非常好的,但是,從GTC這幾天的股價震蕩就可以看出來,華爾街并不覺得驚喜,因為之前在2月公布財報的時候,利好都已經(jīng)出盡了,市場已經(jīng)知道英偉達會出新的芯片,這些硬件的更新已經(jīng)被市場提前消化了。
Yang Ren,Senior Analyst&Partner at Jirong Investment Management (濟容投資):
新發(fā)布的這個硬件的產(chǎn)品來看的話,其實我覺得沒有什么特別大的意外。因為其實目前供應鏈的這些渠道檢查,大家做得確實也都比較細致,比較到位了。我覺得就是硬件,如果讓我來總結(jié)我的感受的話,我覺得是“預期之內(nèi)的好”。我覺得可能是比較客觀的一個評價了。
陳茜,硅谷101聯(lián)合創(chuàng)始人:
你們會覺得說這個新的硬件的發(fā)布會,對整個英偉達在AI芯片中的地位造成任何的影響嗎?會進一步的去鞏固它的現(xiàn)狀?還是會跟其他的,例如MI300等其他的一些競爭對手其實拉得更遠?
Yang Ren,Senior Analyst&Partner at Jirong Investment Management (濟容投資):
我覺得其實現(xiàn)在這是一個大家交替領(lǐng)先,同時在進步的這么一個狀態(tài)。因為可能放在幾個月之前,MI300剛剛出來的時候,大家會覺得MI300在硬件層面上,其實在已經(jīng)一定程度上超越了H100。 然后當時大家對AMD的預期就拔得很高,認為MI300可以很快地占據(jù)市場。但是我覺得這種角度去看可能是過于靜態(tài)了,因為沒有一家公司他真的就會止步不前,然后不再進步。
包括像Jensen英偉達,他們是已經(jīng)對于MI300的這些進步吧,他們是完全是看在眼里,也是有預期。他們自己在B100里面也是了加入了很多:比如像內(nèi)存一致性、比如將更大的高帶寬內(nèi)存,這些東西加入到B100里面,其實是大家共同進步,交替領(lǐng)先的一個狀態(tài)。所以我覺得整體來看,我覺得硬件上英偉達確實還是走得很穩(wěn),還是在全速地往前推的這么一個狀態(tài)。他跟其他的競爭對的是持續(xù)性地一個差距,沒有再縮短的狀態(tài)。
所以,在這次GTC上,硬件的發(fā)布更新固然重要,但我們能強烈感覺到,黃仁勛想要強調(diào)的是,英偉達不僅僅是一家GPU公司,英偉達想要通過軟件的升級,不僅僅是已經(jīng)成功變成英偉達牢固護城河的CUDA,還有更遠的布局。
黃仁勛在他的keynote中強調(diào)的很清楚,他眼中的新一代市值100萬億美元的新工業(yè)革命市場,英偉達是這樣布局的:除了Blackwell硬件算力平臺,黃仁勛還著重推出NIMs,幫助企業(yè)級客戶接入AI。
NVIDIA NIM是經(jīng)過優(yōu)化的推理微服務(wù),用于大規(guī)模部署 AI 模型,為開發(fā)AI驅(qū)動的企業(yè)應用程序和在生產(chǎn)中部署AI模型提供了比較便捷和簡化的路徑。也就是說,企業(yè)想要部署AI,英偉達在生態(tài)上已經(jīng)給你提供了各種api和基礎(chǔ)大模型,讓企業(yè)更快的上手。
此外的生態(tài)重點是英偉達的AI foundry和NeMo。去年英偉達發(fā)布的AI foundry 具備三個要素:英偉達的AI基礎(chǔ)模型,NVIDIA NeMo 框架和工具、用于構(gòu)建、自定義和部署生成式AI 模型,以及NVIDIA DGX 云AI 超級計算服務(wù)。這樣依賴,AI foundry就可以用于為企業(yè)軟件、電信、媒體等各個行業(yè)的生成式AI 應用定制模型。而在今年,英偉達進一步在這樣的AI foundry生態(tài)上繼續(xù)更新各種基礎(chǔ)模型和生態(tài)服務(wù)。
下一個重點就是英偉達的Omniverse,也就是物理模擬反饋的平臺,通過模擬與物理世界中各種互動的過程,來訓練AI。我們在之前講機器人那一集的時候就著重提過,AI機器人在模擬環(huán)境中的訓練非常重要,而現(xiàn)在來看,不僅僅是AI機器人,還有無人駕駛,氣候模擬,藥物發(fā)現(xiàn),計算生物學,乃至于Vision Pro所構(gòu)建的XR生態(tài),英偉達的Omniverse都已經(jīng)在布局。
這次GTC上,英偉達宣布了Omniverse Cloud API接口,讓開發(fā)者能夠輕松地將Omniverse的核心技術(shù)直接集成到現(xiàn)有的數(shù)字孿生設(shè)計與自動化軟件應用中,或是集成到用于測試和驗證機器人或自動駕駛汽車等自主機器的仿真工作流中。
同時在keynote中,黃仁勛進一步強調(diào)Isaac Sim,這個基于Omniverse平臺之上的機器人培訓與模擬系統(tǒng),這相當于給機器人構(gòu)建了一個全新的“操作系統(tǒng)”,同時,英偉達還宣布了一個名為GROOT的機器人通用基礎(chǔ)大模型,和新型計算機Jetson Thor來加速機器人訓練。
而且,黃仁勛的一對兒女都在Omniver部門就職,女兒Madison Huang是Omniverse部門的高級產(chǎn)品營銷經(jīng)理,兒子Spencer Huang是Omniverse旗下機器人仿真和擴展組的產(chǎn)品經(jīng)理,可見老黃對這個Omniverse這項業(yè)務(wù)的重視程度。
而從英偉達邀請的這四天的分享嘉賓中,我們能從現(xiàn)場就感受到,公司在軟件生態(tài)上的布局和發(fā)力。在各個panel和分享會上,我們也很直觀的感受到英偉達軟件生態(tài)的升級,給各個行業(yè)帶來的助力,這包括大語言模型賦能自動駕駛技術(shù)上,英偉達的數(shù)字孿生的模擬技術(shù)能讓自動駕駛繼續(xù)在模擬器中得以更好更快更有效率的訓練。
另外,在具身智能專家李飛飛和波士頓動力機器人的分享環(huán)節(jié)中,嘉賓也都強調(diào)了深度機器學習給機器人技術(shù)帶來的巨大潛力,包括在模擬環(huán)境中的訓練,以及在周一,黃仁勛也宣布了一個通用人形機器人基礎(chǔ)模型的新平臺,來和波士頓動力等等機器人公司合作,加速機器人的發(fā)展。
然而,雖然我身邊一些做軟件和研究的科學家和博士朋友們都對Omniverse以及數(shù)字孿生的升級有很大的期待,但無論是從昨天黃仁勛的演講現(xiàn)場,還是今天的分享會上,我們的感受和觀察是,軟件上的升級似乎并沒有給外界帶來非常大的興奮值,包括在昨天的keynote演講中,特別在軟件環(huán)節(jié),黃仁勛好幾個講的笑話和?,F(xiàn)場的觀眾都沒有理解到,好幾度比較冷場。
陳茜,硅谷101聯(lián)合創(chuàng)始人:
有幾個朋友他們是讀PhD技術(shù)背景出來的。他們會覺得說特別是軟件方向,包括數(shù)字孿生,包括模擬方面,英偉達在軟件方向提供這么多的支持,整個的研究、調(diào)研、他們的工作會加快非常多,所以他們感覺非常的興奮。但是感覺就是講硬件的那一塊,當然很燃,大家就是能夠很快地理解到他硬件提升多少倍。但是好像講了軟件的那一塊,我感覺到現(xiàn)場好像參會者不是那么容易的能理解到,英偉達他想要去做什么事情,他想的是一個什么樣的市場。我覺得說老黃他表達出來的東西,跟現(xiàn)場觀眾接受到的信息中間還是有一個不對等。
Yang Ren,Senior Analyst&Partner at Jirong Investment Management (濟容投資):
對,我特別同意你這個觀察。我覺得英偉達,大家對于它的芯片這一塊其實已經(jīng)認知得非常充分了,軟件這部分我覺得可能不光是聽眾或者說投資人,有時候我甚至有一個感覺,就是英偉達自己對于他們的軟件這一塊到底是什么樣一個戰(zhàn)略,或者什么樣一個策略,也還是沒有一個特別清晰或者說完全成型的一個狀態(tài),都是在走一步、看一步,然后逐漸慢慢摸索的這種狀態(tài)。你剛才提到一點,就是說覺得中間好像還隔著點什么?我也是這么一種感受。包括這次,大家都聽到他提很多關(guān)于數(shù)字孿生、關(guān)于Ominverse的這些東西。
但是這前兩年他第一次把Omniverse這個東西拿出來講的時候,大家都非常困惑,不知道Jensen到底想把這個東西來干嘛用?怎么去賣?一開始的時候,大家只是感覺這就是一個,對于這些3D設(shè)計師或者說平面設(shè)計師用來協(xié)作的一個平臺。但是隨著現(xiàn)在慢慢的發(fā)展,慢慢地變成了數(shù)字孿生的一個操作系統(tǒng)。同時這些數(shù)字孿生在工業(yè)里面最初始的應用,跟現(xiàn)在比較類似。我記得他最早提到在寶馬工廠里面一個應用,就是幫助在工廠建設(shè)的過程中,提前做好布局設(shè)計,做好工作流程的這些安排,這樣的話可以提升整體運行的效率。因為這次提到了包括Wistron公司的例子、包括西門子的例子,都是類似的一個概念,我覺得非常合理。
一定程度上就是,在這些工業(yè)制造領(lǐng)域里面虛擬實境的一個應用。另外他提到Omniverse的一個應用,就是機器人的訓練場。我覺得這個也是他們一直在做的事情,之前也斷斷續(xù)續(xù)有提到過。但之前整個軟件的版圖,給我的感覺就是他們這有一點東西,那有一點東西,但是一直缺一個特別好的、特別有凝聚力的一個戰(zhàn)略,能夠把所有的拼圖拼在一起。這一次聽完我其實真的有這種感覺了,就是有一種AI和Omniverse匯聚這么一種感覺。我現(xiàn)在能慢慢能夠看到他們軟件這一塊更清晰的一個版圖、一個戰(zhàn)略往后走是什么樣的。我能理解,為什么你剛才提到很多比較關(guān)注軟件的朋友,他們會覺得非常興奮。
陳茜,硅谷101聯(lián)合創(chuàng)始人:
你覺得對于就是華爾街來說,看到它軟件上面的一些業(yè)務(wù)慢慢的清晰化了,以及AI跟軟件的結(jié)合,這會對它的估值來說,會有一個更高的提升嗎?
Qindong Liu,Portfolio Manager&Partner at Jirong Investment Management (濟容投資):
我覺得其實是這樣子,就是我們管叫rerating(重新評定)的這么一個過程。那我覺得現(xiàn)在大部分,你從它現(xiàn)在估值水平,我覺得市場其實還是把它當成一個芯片公司。我覺得這個是落后于英偉達自己的想法的。英偉達慢慢把自己定位成一個系統(tǒng)公司,不但是有硬件、軟件,我又能幫助你打造整個生態(tài),就給你提供一個大的生態(tài)。
譬如說我們之前還在講,說起來這相關(guān)又不那么相關(guān):就說以后無人駕駛這一塊,特斯拉大家都知道了,我不知道有多少人真的會想到說,英偉達在這里面以后也會成為特別重要的一環(huán)。像我前兩天和任總還在討論,以后是不是除了特斯拉之外的這些原始設(shè)備制造商,都要給英偉達去打工了。就是當市場逐漸意識到這是需要時間的。像Jensen這樣這么一個有遠見的CEO,在接下來的幾年,只要是AI這個賽道不冷,只要能一直這么發(fā)展下去,他會逐漸地把這些東西灌輸給市場,然后逐漸地被大家接受。
華爾街總是難以討好的,硬件升級,華爾街并不驚喜,因為之前報財報的時候已經(jīng)被市場消化了,而軟件布局,華爾街沒有看到即刻的營收價值,目前也沒有買賬。但這并不影響黃仁勛的長期主義和未來布局,畢竟,加速計算他布局了20年,CUDA軟件布局了10多年。
04 權(quán)力與野心
無論華爾街是否在現(xiàn)在買賬,黃仁勛管理下的英偉達正在動用一切的努力去加固自己的護城河,也毫不掩飾的展示出未來朝著更多領(lǐng)域提供服務(wù)的野心。
最近一個黃仁勛在斯坦福的演講中,他說:他的目標是就算競爭對手的芯片免費送,也不如英偉達的劃算。非常大的口氣。
黃仁勛,NVIDIA創(chuàng)始人兼首席執(zhí)行官:
我們部署的時間、我們的表現(xiàn)、我們的落地應用,以及在不同應用間的靈活性,這些綜合起來,容許我們的運營成本,我們的總體運營成本好到一個程度。就是即便競爭對手的芯片免費送,也無法便宜過我們。這就是我們的目標:讓成本不再成為我們產(chǎn)品價值的衡量標準。當然這個需要我們付出很多心血,得持續(xù)創(chuàng)新、虛心前行。但我們的競爭對手太多了。
所以,更高的護城河,更大的生態(tài)系統(tǒng),是黃仁勛追求的。
一篇華爾街日報里面寫到的細節(jié),說風險投資公司Thomvest Ventures的董事總經(jīng)理Umesh Padval說他和黃仁勛一起去投資布局一些初創(chuàng)公司的時候,黃仁勛毫不掩飾并且以來就比較aggressively、比較激進的直接問:“我需要做什么才能建立生態(tài)系統(tǒng),以便我可以銷售更多的芯片和系統(tǒng)?”
所以,我們看到,目前英偉達參與了很多的初創(chuàng)公司投資,除了上面說的這家Thomvest和英偉達一起投資的基礎(chǔ)模型AI公司Cohere之外,英偉達還投資了云計算公司CoreWeave。華爾街日報報道, 在上一財年中,英偉達所持其他公司的股份價值增長了五倍多,截至2024年1月底達到約 15.5 億美元。而英偉達在 2023 年總共投資了超過35家初創(chuàng)公司,這個投資量級是上一年的三倍多。
所以,在這些人工智能、機器人、自動化、醫(yī)療保健公司等等賽道,黃仁勛都在布局。也許這些賽道還沒有爆發(fā),也許還需要很長的時間,但就像黃仁勛20年前就開始布局加速計算、10多年前就開始布局CUDA一樣,這些產(chǎn)業(yè)被老黃稱為“Zero-billion dollar markets”,就是目前市場有限、但在未來可能會爆發(fā)的市場,黃仁勛在一如既往的提前布局他遙遠的野心。
而黃仁勛在目前是有資本進行布局的:股價一路上漲、手握大量現(xiàn)金不說,另外一個原因我們在跟硅谷一個VC聊天的時候?qū)Ψ秸f:現(xiàn)在VC去搶好項目,明星AI公司看的不是你給的估值有多好,而是看你有沒有買GPU的渠道。而這個渠道的權(quán)力,有誰搶得過英偉達本身呢?
所以,英偉達如今搶占各個明星AI項目的席位,也是非常順理成章。而這樣的市場絕對霸主地位帶來的權(quán)力讓英偉達有著很大的話語權(quán)。
華爾街日報同樣的一篇文章中寫到:甲骨文創(chuàng)始人兼董事長Larry Ellison在去年9月的一次公司會議上講述了他和馬斯克與黃仁勛在硅谷Palo Alto的Nobu日本餐廳吃晚餐。Larry Ellison回憶說,描述這頓飯最貼切的方式是:一個小時的壽司和乞討。
原文真的用的乞討(begging)這個詞。所以,我們用了“絕對霸主的權(quán)力”和“遙遠的野心”作為視頻的主題,我覺得還挺能概括目前英偉達的狀態(tài)的。
但是并不是說英偉達就沒有挑戰(zhàn)了。英偉達可能面對的最大威脅,正是自己。
如果生成式AI像自動駕駛一樣發(fā)展到瓶頸期,或者最終證明transformer這個架構(gòu)并不是將人類帶向AGI,那么英偉達將面臨非常大的危機。
可能這也是為什么黃仁勛將本次GTC大會上,將Transformer論文作者聚集在一起的原因之一。
05 Transformer七子:AI的未來
最后,再來說說本次GTC大會上的一個大熱門環(huán)節(jié):由黃仁勛親自主持,邀請了Transformer這篇論文的幾位作者到場。
2017年,8位谷歌的研究員發(fā)表了一篇論文叫做Attention is all you need,這篇論文提出了一種新的簡單網(wǎng)絡(luò)架構(gòu),這就是Transformer,它完全基于Attention注意力機制,完全摒棄了之前的RNN和卷積CNN等機制。
而正是因為這篇論文,剛成立的OpenAI開始用transformer的架構(gòu)開始訓練GPT路線,開始走堆算力和堆參數(shù)的AI訓練方法,之后才造就了今天我們所看到的生成式AI革命。所以這8位研究員可以稱為如今生成式AI的大功臣,而他們在意識到transformer架構(gòu)的潛力之后,也相繼的離開了谷歌,開始投身于不同的初創(chuàng)公司和項目當中。
這里面其實有兩個很有意思的點:
1)Transformer架構(gòu)是谷歌最先推出的,但這幾位研究元老一位都沒有留住,他們在分享中也說道,因為方法有了,接下來最重要的就是快速的出應用,接觸用戶,完善產(chǎn)品,尋求市場反饋,然后再快速的推進,但顯然,谷歌陷入的所謂的“大公司創(chuàng)新陷阱”里,很難在公司內(nèi)部來快速推進,所以大家只能紛紛叛逃,出來自己做初創(chuàng)公司,這8位從前的研究員,如今的創(chuàng)業(yè)者,全部都是這樣。
2)他們也看到了如今AI浪潮所帶來的機會,而他們本身的光環(huán)就足夠能吸引融資和人才人脈加入他們。在硅谷,人們都想創(chuàng)業(yè),都想自己推出產(chǎn)品,主導創(chuàng)新,而就像黃仁勛說的,接下來10年將是黃金10年的機會,所以也難怪8位研究員都出來自己單干。很有意思的是,他們之前從來都沒有聚在一起過,之前都是線上合作辦公,而這一次,除了一位女性研究員Niki Parmar 因為有家里急事沒有來之外,其它七位研究員都來到了現(xiàn)場,可以說是非常有歷史紀念意義的一個瞬間了。
整個會場從很早就開始排隊,差不多接近2000人的會場都坐滿了,黃仁勛也提前來到現(xiàn)場和大家打招呼合影,之后介紹每位研究員上場。
他們分別是AI角色扮演對話公司Character AI聯(lián)合創(chuàng)始人兼首席執(zhí)行官Noam Shazeer;
我們上面提到的基礎(chǔ)模型AI創(chuàng)業(yè)公司,Cohere聯(lián)合創(chuàng)始人兼首席執(zhí)行官Aidan Gomez;
Ashish Vaswani和缺席的Niki Parmar 兩人聯(lián)合創(chuàng)立了Essential AI這家基于大模型的全棧型智能產(chǎn)品開發(fā)商,Essential AI開發(fā)了一項名為“企業(yè)大腦”的技術(shù),可以利用AI執(zhí)行企業(yè)職能,比如說數(shù)據(jù)分析,并自動執(zhí)行單調(diào)的任務(wù)。
此外,Llion Jones在日本東京創(chuàng)建了Sakana AI,這是一家AI技術(shù)研發(fā)商,專注于為基礎(chǔ)模型創(chuàng)建新架構(gòu);
Illia Polosukhin聯(lián)合創(chuàng)立的使用區(qū)塊鏈為AI 賦能的Near Protocol公司;
此外,Jakob Uskhoreit是Inceptive的聯(lián)合創(chuàng)始人兼首席執(zhí)行官,這家公司將人工智能用于mRNA疫苗開發(fā);
同時英偉達也投資了他們;最后是Lukasz Kaiser,加入了OpenAI,而黃仁勛介紹他上臺時開玩笑說,這是8位作者中唯一一位還在做工程師的技術(shù)人員。
而在座談會上,大家分享了自己從事的公司方向,以及對技術(shù)的理解。大家認為,模型還需要進一步的優(yōu)化,無論是在技術(shù)還是在推理上,我們還需要看到技術(shù)的繼續(xù)突破,甚至需要有比transformer更好的框架。
Aidan Gomez,Cohere聯(lián)合創(chuàng)始人兼首席執(zhí)行官:
我仍然覺得,我們與最初的設(shè)計形態(tài)相似過高。這讓我有些不安。我認為世界需要一種比transformer更先進的模型。我們所有人都希望它能被更高效的技術(shù)所取代。將性能繼續(xù)往上拔高。
而一個比transformer更好的模型或者框架,英偉達的GPU是否還是必不可少的呢?這其實是一個問號,也是英偉達最大的危機所在。
但無論如何,目前算力是緊缺的,七位作者也一致認為,接下來,自適應計算(adaptive computation),也就是如何在特定的問題上分配合適的計算量,也是接下來的著力點之一。
換句話說,如果我們把2+2=4這個問題輸入現(xiàn)有模型,計算機需要使用一萬億參數(shù)解答這個問題,而這個問題的價值就不如問“2+2為什么等于4”,所以之后我們?nèi)绾稳ゼ兴懔鉀Q更有價值的問題、更合理分配算力,也是接下來需要推動的方向。
同時,七位作者也認為,AI下一個更重要的方向是訓練AI的推理和自主決策能力,因為AI的推理能力越強,所需要的數(shù)據(jù)訓練量就越少,屆時用于訓練的數(shù)據(jù)質(zhì)量會更加重要,人機交互會更加深度,而接下來 如何去訓練更高質(zhì)量的數(shù)據(jù)、私人的數(shù)據(jù),將是接下來發(fā)展的重點和挑戰(zhàn)。
而隨著AI技術(shù)迅速往前更迭,創(chuàng)業(yè)者以及創(chuàng)業(yè)賽道都面臨著巨大的不確定性。所以今年2024年GTC給我的唯一確定性就是,AI還是繼續(xù)發(fā)展和變化。
最后,問大家一個問題,大家知道GTC的全稱是什么嗎?
公布答案:GTC大會的全稱是“GPU Technology Conference”。
第一屆是2009年,此前都是非常GPU非常硬件的會議,但之后隨著英偉達公布CUDA,公布軟件布局,如今,GTC已經(jīng)不止是GPU,而是更大的生態(tài),以及將會影響人類未來的各種可能性。