編譯|半導(dǎo)體產(chǎn)業(yè)縱橫
GPU租賃是一種經(jīng)濟(jì)高效的方式,可以訪問高性能芯片。
隨著 OpenAI 和 Meta 等科技巨頭大量采購圖形處理器(GPU)來驅(qū)動人工智能模型,GPU 的獲取難度日益增大。在芯片持續(xù)短缺的形勢下,一批初創(chuàng)公司開始通過出租芯片來增加人們獲得這些備受青睞的人工智能芯片的機(jī)會。
GPU 租賃市場是 GPU 即服務(wù)這一現(xiàn)有小眾行業(yè)的一部分,芯片所有者借助在線市場,通過云在固定時間段向客戶出售計算能力。通常,公司會選擇亞馬遜網(wǎng)絡(luò)服務(wù)、微軟 Azure 和 Google Cloud 等主要云服務(wù)提供商,它們占據(jù)了全球云計算市場 63% 的份額,在其內(nèi)部部署的數(shù)據(jù)中心運行人工智能工作負(fù)載。
然而,GPU 即服務(wù)提供了一種更為分散的方式。該領(lǐng)域的提供商與全球的數(shù)據(jù)中心和 GPU 所有者合作,在客戶有需求時將芯片集群出租給他們。新澤西理工學(xué)院數(shù)據(jù)科學(xué)研究所主任大衛(wèi)?貝德(David Bader)表示,租用計算機(jī)能力能讓預(yù)算有限的組織,如初創(chuàng)企業(yè)和學(xué)術(shù)機(jī)構(gòu),為特定項目獲得高性能的 GPU。
“GPU as a service 極大地平衡了人工智能和高性能計算領(lǐng)域的競爭環(huán)境,” 貝德說,“企業(yè)如今可以按需獲取 GPU 計算能力,無需在快速貶值和易過時的硬件上進(jìn)行大量前期投資?!?/p>
盡管 GPU 的供應(yīng)鏈限制開始有所緩解,但租賃市場仍在增長。Grand View Research 的數(shù)據(jù)顯示,隨著對高級數(shù)據(jù)分析(如運行機(jī)器學(xué)習(xí)算法)需求的增加,預(yù)計到 2030 年,2023 年價值 37.9 億美元的 GPU 即服務(wù)市場將以每年 21.5% 的速度增長,達(dá)到 122.6 億美元。
生成式 AI 激發(fā)了人們對 GPU 租賃的興趣
自 2022 年 11 月 ChatGPT 問世以來,一些 GPU 租賃領(lǐng)域的初創(chuàng)公司發(fā)現(xiàn)需求急劇上升,因為企業(yè)需要計算能力來構(gòu)建人工智能。
Vast.ai 創(chuàng)始人兼首席執(zhí)行官杰克?卡內(nèi)爾(Jake Cannell)表示,在生成式人工智能受到熱捧之前,他的公司主要客戶是加密貨幣礦工。如今,在 Vast.ai 的 GPU 租賃服務(wù)中,超過一半的項目與人工智能相關(guān)??▋?nèi)爾稱,客戶包括人工智能企業(yè)家、初創(chuàng)公司和學(xué)者,他們使用 OpenAI 的 GPT 等基礎(chǔ)模型構(gòu)建自定義大型語言模型,并將大型語言模型(LLM)應(yīng)用于人工智能圖像生成器 Stable Diffusion 等人工智能相關(guān)工作負(fù)載。據(jù)卡內(nèi)爾介紹,ChatGPT 的發(fā)布,加上主要云提供商的高需求和 GPU 短缺,促使更多客戶尋找替代方案,這在一定程度上加速了 Vast.ai 的 GPU 租賃需求。這位執(zhí)行官說:“現(xiàn)在產(chǎn)量已經(jīng)跟上,情況可能有所緩解,但需求似乎依舊很高且在不斷增長。”
Vast.ai 成立于 2017 年,它將英偉達(dá)和 AMD 的 GPU 集群所有者與尋求租用計算能力的組織聯(lián)系起來。據(jù)卡內(nèi)爾稱,截至 10 月底,市場提供 109 個 GPU 集群,包括英偉達(dá)備受歡迎的 H100 芯片,這些集群位于數(shù)據(jù)中心,部分分布在美國、歐洲、亞洲和澳大利亞的數(shù)據(jù)庫中。
Vast.ai 通過提供不同容量、速度和系統(tǒng)要求的 GPU 集群,旨在讓租戶能夠自由選擇特定項目所需的 GPU,并根據(jù)需求靈活地擴(kuò)展或縮小規(guī)模。例如,開發(fā)人工智能聊天機(jī)器人的客戶最初可能租用 100 個 GPU 來訓(xùn)練模型,后續(xù)可以通過租用數(shù)千個 GPU 來提升計算能力。該公司稱,在產(chǎn)品開發(fā)的不同階段能靈活獲取不同數(shù)量的計算能力,這使得 GPU 租賃比購買芯片更具吸引力。
“只有當(dāng)對 GPU 存在更可預(yù)測且長期穩(wěn)定的需求時,購買才是有意義的,” 卡內(nèi)爾說。
雖然像 Vast.ai 這類在 ChatGPT 發(fā)布前就已成立的初創(chuàng)公司發(fā)現(xiàn)市場對其服務(wù)的興趣有所增加,但在聊天機(jī)器人發(fā)布后,也有新的初創(chuàng)公司涌現(xiàn),以利用日益增長的 GPU 租賃市場。
Foundry 是一家專為人工智能工作負(fù)載打造的 GPU 市場,據(jù)其首席執(zhí)行官賈里德?昆西?戴維斯(Jared Quincy Davis)稱,自 8 月份推出云平臺以來,已經(jīng)吸引了 “數(shù)十家” 客戶,并且能夠通過利用現(xiàn)有芯片的閑置算力大幅降低計算成本。
這家初創(chuàng)公司今年 3 月從紅杉資本和光速創(chuàng)投等投資者那里籌集了 8000 萬美元,通過公司自有的計算集群以及從數(shù)據(jù)中心合作伙伴處獲得的 “未充分利用的集群” 來出租 GPU。
Foundry 的客戶包括技術(shù)、電信、媒體和保健行業(yè)的公司,基金會和學(xué)術(shù)實驗室也在使用其服務(wù)。常見的應(yīng)用場景包括對模型(如 Meta 的 Llama)進(jìn)行微調(diào)以呈現(xiàn)所需特性、從零開始構(gòu)建神經(jīng)網(wǎng)絡(luò)以及執(zhí)行情緒分析(一種用于分析文本情緒傾向的深度學(xué)習(xí)技術(shù))。Foundry 甚至允許客戶租用 GPU 來預(yù)測蛋白質(zhì)序列用于藥物研發(fā)、訓(xùn)練模型翻譯稀有語言,以及構(gòu)建無需人工干預(yù)就能控制網(wǎng)站的人工智能代理。
“許多以前只有 OpenAI 和 DeepMind 這類實驗室才能進(jìn)行的前沿開發(fā),現(xiàn)在其他人也能做到了,因為 Foundry 讓 GPU 計算更易獲取且成本更低,” 戴維斯表示,他曾在 Google DeepMind 擔(dān)任工程師。
一些組織已經(jīng)從 GPU 租用中獲益。新澤西理工學(xué)院的教授貝德說,他看到自己所在的大學(xué)通過 GPU 租賃為研發(fā)等 “關(guān)鍵活動” 釋放資源。他認(rèn)為,GPU 租賃模式非常適合有 “臨時性” 或 “季節(jié)性計算需求” 的項目,并且 “省去了成本高昂的硬件管理和維護(hù)負(fù)擔(dān)”。貝德還表示,他看到小企業(yè)通過與大學(xué)合作,獲得了與大企業(yè)相同的 GPU 能力。
“我親眼見證了無數(shù)初創(chuàng)公司從中受益,” 貝德說,“他們不再需要投入數(shù)百萬美元的前期資金來購買專用硬件。相反,他們可以使用租來的 GPU 制作原型、測試和迭代算法,確保資金用于開發(fā)而非基礎(chǔ)設(shè)施?!?/p>
長期租用 GPU 可能并不省錢
不過,貝德指出,租用 GPU 與購買 GPU 相比存在一些利弊。
共享基礎(chǔ)設(shè)施的性能可能不穩(wěn)定,一旦出現(xiàn)服務(wù)中斷,可能會減慢人工智能模型訓(xùn)練等任務(wù)的執(zhí)行速度。盡管前期成本能得到節(jié)省,但租用 GPU 的費用可能會很高。貝德表示,在云和公司之間傳輸數(shù)據(jù)的成本可能會 “快速攀升”,對于需要實時處理的工作負(fù)載,不斷遭遇延遲問題的客戶最終可能花費比購買 GPU 更多的費用。對于有嚴(yán)格安全和合規(guī)要求的公司來說,缺乏對基礎(chǔ)設(shè)施的控制也可能是個 “問題”。
GPU 租賃市場的未來或許還取決于芯片行業(yè)的發(fā)展。畢竟,據(jù)貝德稱,像亞馬遜網(wǎng)絡(luò)服務(wù)這樣的主要云提供商預(yù)計會繼續(xù)拓展業(yè)務(wù)范圍,可能會吞并一些小公司,這在短期內(nèi)可能會使價格降低,但從長遠(yuǎn)來看會限制消費者的選擇。此外,供應(yīng)鏈延遲可能會讓云巨頭更難獲得 GPU。
盡管存在這些擔(dān)憂,初創(chuàng)公司仍然堅信,隨著人工智能的持續(xù)發(fā)展,未來幾年市場對它們的服務(wù)仍有需求。Vast.ai 將繼續(xù)優(yōu)化其 GPU 匹配服務(wù),并更多地直接參與大型語言模型推理等應(yīng)用場景,特別是針對人工智能代理。Foundry 計劃發(fā)布更多功能,提升平臺的可用性,使其對構(gòu)建先進(jìn)模型的人工智能開發(fā)人員更有幫助。
Vast.ai 首席執(zhí)行官卡內(nèi)爾說:“英偉達(dá)目前仍是行業(yè)領(lǐng)導(dǎo)者,我認(rèn)為這種情況不會在短期內(nèi)改變,但競爭愈發(fā)激烈了。”
原文:observer