正在閱讀:

夏天到了,給數(shù)據(jù)中心潑點(diǎn)“冷水”

掃一掃下載界面新聞APP

夏天到了,給數(shù)據(jù)中心潑點(diǎn)“冷水”

液冷來(lái)到臨界點(diǎn)。

文|腦極體

氣溫上升,還有什么能比“工作沒(méi)了”,更能讓人一瞬間心里拔涼拔涼的呢?

這個(gè)“薪盡自然涼”的故事,就發(fā)生在數(shù)據(jù)中心。

前不久,某電商平臺(tái)正在購(gòu)物高峰期,結(jié)果IDC冷凍系統(tǒng)故障,機(jī)房設(shè)備溫度快速升高,直接宕機(jī)了12個(gè)小時(shí),據(jù)說(shuō)損失高達(dá)一億以上。

業(yè)務(wù)涼了,該企業(yè)的基礎(chǔ)平臺(tái)部負(fù)責(zé)人的職業(yè)生涯也涼了。當(dāng)然,受傷的不止一個(gè)人,因?yàn)檫@次機(jī)房事故影響的還有微信、QQ等軟件,騰訊內(nèi)部的幾個(gè)高管也遭到了降級(jí)、免職的處罰。

(事故公告)

AI熱度狂飆,數(shù)字經(jīng)濟(jì)加速,作為計(jì)算的心臟最該保持涼爽的數(shù)據(jù)中心,也越來(lái)越難以冷靜,所以液冷也成了除AI之外,計(jì)算廠商“群起而攻之”的概念,也是IT人不得不關(guān)注的技術(shù)。

2022年被認(rèn)為是數(shù)據(jù)中心的“液冷元年”。

因?yàn)榭蛻?hù)多了,雙碳戰(zhàn)略和東數(shù)西算的政策持續(xù)牽引,液冷從少數(shù)互聯(lián)網(wǎng)巨頭、公有云廠商、智算中心、HPC高性能計(jì)算中心等的選擇,開(kāi)始引發(fā)更多大眾行業(yè)和企業(yè)的關(guān)注。

有需求就有供給,廠商動(dòng)作也明顯多了。眾多服務(wù)器廠商、云計(jì)算和互聯(lián)網(wǎng)企業(yè)爭(zhēng)先研發(fā)數(shù)據(jù)中心液冷技術(shù),甚至有廠商喊出了 “All in 液冷 ”的口號(hào),許多新的液冷產(chǎn)品和解決方案被推向市場(chǎng)。

資本市場(chǎng)也愿意為液冷概念買(mǎi)單,今年以來(lái),中科曙光、申菱環(huán)境、網(wǎng)宿科技、英維克等相關(guān)企業(yè)都出現(xiàn)過(guò)大漲。

多股力量之下,液冷的熱度很難不高。

不過(guò),數(shù)據(jù)中心的冷卻技術(shù)發(fā)展了很多年,液冷對(duì)于數(shù)據(jù)中心來(lái)說(shuō)并非新鮮事物,降本降PUE需求也不是一年兩年了,為什么AI一來(lái)液冷就突然成了風(fēng)口?這個(gè)熱度是真實(shí)的嗎?

這個(gè)炙熱的夏天,我們不妨通過(guò)液冷的故事,來(lái)清涼一下。

時(shí)也:真的假的 “元年”?

元年,是個(gè)被用濫了的詞,我們聽(tīng)過(guò)太多野心家嘴里的“元年”了。2014“智能家居元年”,買(mǎi)回家的藍(lán)牙聯(lián)網(wǎng)電器再也沒(méi)有更新過(guò);2015“VR元年”,沒(méi)兩年行業(yè)就驟然降溫;2021“元宇宙元年”,一時(shí)沸騰,很快就被大家忘在腦后了……

數(shù)據(jù)中心的“液冷元年”,會(huì)不會(huì)也是曇花一現(xiàn)的概念炒作和噱頭呢?

我們也可以換個(gè)角度,來(lái)看看那些公認(rèn)靠譜的“元年”,液冷是不是有雷同的要素加持?

2019被稱(chēng)為5G商業(yè)應(yīng)用元年,大量5G商用牌照發(fā)放,進(jìn)入明顯的加速進(jìn)程——這是政策的強(qiáng)力牽引。

再看液冷,數(shù)據(jù)中心是能源密集型的,隨著雙碳政策的推進(jìn),數(shù)字經(jīng)濟(jì)加速,工信部提出,2022年全國(guó)新建大型數(shù)據(jù)中心PUE要達(dá)到1.4以下;“東數(shù)西算”文件進(jìn)一步要求,東部地區(qū)集群數(shù)據(jù)中心的PUE要控制在1.25以?xún)?nèi),西部地區(qū)在1.2以?xún)?nèi)。在此背景下,數(shù)據(jù)中心“節(jié)能減排”已經(jīng)勢(shì)在必行,風(fēng)冷技術(shù)進(jìn)步已經(jīng)放緩,液冷開(kāi)始得到重視,合理。

2022,被稱(chēng)為AIGC元年,AI作畫(huà)爆火,能力開(kāi)始為全球用戶(hù)所接受,歲末年初的大語(yǔ)言模型又添一把火,AIGC進(jìn)入產(chǎn)業(yè)化應(yīng)用已成必然——這是技術(shù)的成果扎實(shí)。

目前,風(fēng)冷在數(shù)據(jù)中心中仍占主導(dǎo)地位,液冷尚未得到更廣泛的采用,但主流服務(wù)器制造商都在 2022 年陸續(xù)開(kāi)始建設(shè)標(biāo)準(zhǔn)化規(guī)模生產(chǎn)冷板液冷服務(wù)器的產(chǎn)線(xiàn),幾乎所有的頭部互聯(lián)網(wǎng)公司都已對(duì)液冷技術(shù)密切跟蹤。技術(shù)夯實(shí),成本隨產(chǎn)業(yè)化、標(biāo)準(zhǔn)化、規(guī)?;蠓陆?,液冷開(kāi)始滲透,有戲。

往遠(yuǎn)一點(diǎn),1956年被稱(chēng)為“人工智能元年”,是因?yàn)辂溈ㄥa、閔斯基、香農(nóng)等知名學(xué)者匯聚在達(dá)特茅斯會(huì)議,群星璀璨——這是高屋建瓴的洞察。

新一輪AI革命已經(jīng)“做實(shí)”,當(dāng)前 AI 正處于史上最長(zhǎng)繁榮大周期,而AI計(jì)算等高性能應(yīng)用的芯片架構(gòu),熱功率密度急劇上升,CPU已從每個(gè)芯片的150瓦增加到300瓦以上,圖形處理單元(GPU)已增加到每個(gè)芯片700瓦以上。功率越大,芯片就越熱,冷卻要求也就越高。這些高功率 CPU 和 GPU 被封裝到服務(wù)器中,每個(gè)機(jī)架產(chǎn)生的熱量就更多了。越來(lái)越多計(jì)算專(zhuān)家、科學(xué)家認(rèn)同數(shù)據(jù)中心要供給高效綠色低碳的算力,Azure的首席架構(gòu)師Marcus Fontoura指出,5到10年內(nèi),液冷的數(shù)據(jù)中心將成為主流,而不僅僅在超算和比特幣挖礦領(lǐng)域。液冷+DC的長(zhǎng)期前景,看好。

從這個(gè)幾個(gè)判斷依據(jù)來(lái)看,“液冷”和數(shù)字經(jīng)濟(jì)之間的聯(lián)系密切,成為這一年來(lái)數(shù)據(jù)中心行業(yè)的關(guān)鍵詞,“元年”這個(gè)詞不是行業(yè)炒作的噱頭,是有真材實(shí)料的支撐。

命也:打鐵還需自身硬

或許有人會(huì)說(shuō):到底還是政策導(dǎo)向,雙碳降PUE的需求,只要機(jī)房里空調(diào)夠給力,增加的熱氣一樣會(huì)被冷卻,IT設(shè)備照樣好好地很可靠。

確實(shí),只要服務(wù)器入口能保持在17-27攝氏度(64.4° F 和 80.6° F )之間,那管你什么冷卻技術(shù),能抓住老鼠的都是好貓,能降溫就行。液冷能被選中,還是在于自身的技術(shù)先進(jìn)性。

傳統(tǒng)冷卻方式,氣流對(duì)流冷卻,可以簡(jiǎn)單統(tǒng)稱(chēng)為“風(fēng)冷”。因?yàn)槎际峭ㄟ^(guò)冷空氣與服務(wù)器的發(fā)熱元器件(CPU、圖像處理器、存儲(chǔ)等)進(jìn)行熱交換,來(lái)達(dá)到制冷的效果,通常會(huì)有機(jī)房空調(diào)(CRAC)或機(jī)房空氣處理器(CRAH)單元,就類(lèi)似于大家在家里吹空調(diào),大熱天里涼風(fēng)習(xí)習(xí),想想就美滋滋。所以,數(shù)據(jù)中心有80-90%都是風(fēng)冷。

吹空調(diào)已經(jīng)很爽了,為什么還要沖“冷水澡”?

液體冷卻,就是通過(guò)液體冷媒,將發(fā)熱源的熱量傳遞到遠(yuǎn)處,再進(jìn)行冷卻。

這就是液冷技術(shù)的“天生命好”——技術(shù)更先進(jìn)。

液體冷媒比空氣的比熱容大,所以液冷的制冷效率和散熱速度,遠(yuǎn)遠(yuǎn)高于風(fēng)冷。相當(dāng)于室溫太高,空調(diào)得吹個(gè)十幾分鐘才舒適,而沖涼水一下子就能從頭涼到腳,哪臺(tái)高速運(yùn)轉(zhuǎn)的服務(wù)器能拒絕這種快樂(lè)呢?達(dá)到同樣的冷卻效果,液冷的電源消耗更小,PUE(電源使用效率)也更低,很多浸沒(méi)式液冷數(shù)據(jù)中心的PUE值甚至可以達(dá)到1.03~1.05,IT打工人降PUE的績(jī)效穩(wěn)了。

液冷元件比風(fēng)扇的聲音小,所以整個(gè)液冷系統(tǒng)的噪聲,也比風(fēng)冷CRAH單元小,基本可以達(dá)到“靜音”效果。想象一下,如果沒(méi)有單獨(dú)的機(jī)房,又要在辦公室里放一臺(tái)服務(wù)器,誰(shuí)坐在嗡嗡嗡的機(jī)器旁邊還能安心辦公啊,所以哪怕稍微貴一點(diǎn),也愿意選液冷。

液冷系統(tǒng)比空氣更可控。風(fēng)冷“看天吃飯”,外部氣溫變化都可能影響到制冷效果,導(dǎo)致意想不到的故障,液冷就可控多了,只要冷媒不斷不漏,能持續(xù)穩(wěn)定地發(fā)揮冷卻作用。這意味著,像新聞里那樣因?yàn)樵O(shè)備過(guò)熱中斷宕機(jī)而丟工作的IT倒霉蛋,會(huì)少很多。

空調(diào)可樂(lè)冰西瓜,是普通人眼里美妙的夏天,而緊緊巴巴擠在機(jī)柜服務(wù)器的處理器們,“沖涼”才是最?lèi)芤獾南硎堋?/p>

運(yùn)也:液冷來(lái)到臨界點(diǎn)Tipping Point

既然液冷這么好用,為什么風(fēng)冷還是數(shù)據(jù)中心的主流,為什么微軟還要把數(shù)據(jù)中心搬去海底,為什么谷歌不早點(diǎn)向液冷轉(zhuǎn)型?

答案就是,液冷技術(shù)剛剛才來(lái)到“臨界點(diǎn)Tipping Point”。

液冷在數(shù)據(jù)中心的應(yīng)用并非新鮮事物,已經(jīng)存在了一段時(shí)間。上世紀(jì)60年代,IBM大型主機(jī)就通過(guò)液冷來(lái)解決固態(tài)設(shè)備的散熱難題。發(fā)展到本世紀(jì),浸沒(méi)式液冷也應(yīng)用在超算、高性能計(jì)算場(chǎng)景中,是當(dāng)之無(wú)愧的黑科技。

而普通的數(shù)據(jù)中心機(jī)房,開(kāi)始趨勢(shì)性地采用液冷,是近兩年才開(kāi)始到達(dá)“臨界點(diǎn)”。

所謂“Tipping Point”,也被翻譯成轉(zhuǎn)折點(diǎn)、引爆點(diǎn),指的是某個(gè)事物發(fā)展到一定程度,會(huì)產(chǎn)生重大且通常不可阻擋的變化,向野火一樣蔓延的神奇時(shí)刻。

根據(jù)格拉德威爾的說(shuō)法,臨界點(diǎn)到來(lái)的一個(gè)重要因素是“粘性”,即一個(gè)事物是不是能夠“粘”在公眾的腦海中,并影響他們的決策行為。

而我們觀察到,近年來(lái)液冷行業(yè)的一些變化:

首先,產(chǎn)業(yè)需求的粘性很強(qiáng)。

以往液冷技術(shù)主要應(yīng)用于高性能計(jì)算領(lǐng)域,數(shù)據(jù)中心又是一個(gè)較為傳統(tǒng)的行業(yè),液冷的部署環(huán)境與傳統(tǒng)的機(jī)房有較大的差異,改造成本是很高的——除非它值得。

而AI和數(shù)字化的普及,讓液冷的需求粘性變得跟502一樣黏著。

以谷歌為例,一開(kāi)始并不愿意采用液冷方案。谷歌數(shù)據(jù)中心副總裁卡瓦曾說(shuō):“想象一下,有一排又一排,一排又一排的機(jī)架,裝滿(mǎn)了我們的服務(wù)器。我們的硬件運(yùn)營(yíng)團(tuán)隊(duì)每天都在那里,升級(jí)、維修、部署......如果所有這些服務(wù)器浸泡在數(shù)十萬(wàn)加侖的礦物油中,日常操作將變得更加復(fù)雜?!?/p>

他本人承認(rèn),“液冷是非常好的東西,但對(duì)于谷歌的大規(guī)模部署,卻不是必需的”。結(jié)果我們都知道,谷歌變了,2018年開(kāi)始向液冷轉(zhuǎn)型,原因是AI。自從谷歌的AI芯片TPU問(wèn)世之后,它的并行計(jì)算能力強(qiáng)大,也十分耗電,以至于到了TPU 3.0,傳統(tǒng)的空氣冷卻完全不行了。所以,自從 TPU 3.0 在內(nèi)部推出以來(lái),谷歌數(shù)據(jù)中心的工程師就急忙改造基礎(chǔ)設(shè)施以適應(yīng)芯片級(jí)液冷,即使這樣會(huì)增加成本。

AI所帶來(lái)的先進(jìn)生產(chǎn)力和競(jìng)爭(zhēng)力,讓風(fēng)冷轉(zhuǎn)液冷的麻煩和投入,變得非常值得。

其次,技術(shù)的粘性在變強(qiáng)。

每一種新興技術(shù)的規(guī)模應(yīng)用,都需要經(jīng)過(guò)長(zhǎng)期的實(shí)驗(yàn)和迭代,來(lái)保證技術(shù)的實(shí)用性、穩(wěn)定性。

近年來(lái)我們看到,液冷的技術(shù)也有了非常大的飛躍,使其能夠走向產(chǎn)業(yè)化應(yīng)用。

技術(shù)變化一,芯片級(jí)冷卻的突破。

芯片級(jí)冷卻,可以直接對(duì)發(fā)熱量較大的CPU、GPU,進(jìn)行針對(duì)性地冷卻,這樣制冷更精確,冷卻效果當(dāng)然也就更出色,可以支持更強(qiáng)大的芯片。而做到芯片冷卻,是非常考驗(yàn)設(shè)計(jì)能力和制造工藝的。目前這方面已經(jīng)有非常多的產(chǎn)品問(wèn)世,比如阿里云“麒麟”是國(guó)內(nèi)第一個(gè)嘗試芯片級(jí)液態(tài)制冷的產(chǎn)品,將帶有芯片的集成電路板直接浸入液體,有效提升散熱效果。

技術(shù)變化二,冷板式液冷的可靠性加強(qiáng)。

應(yīng)用最為廣泛的冷板式液冷技術(shù),也有非常大的提升。對(duì)于冷板式來(lái)說(shuō),用戶(hù)最擔(dān)心的就是漏液風(fēng)險(xiǎn)。冷卻液仍存在極小的安全性泄漏隱患,一旦發(fā)生可能引發(fā)嚴(yán)重的生產(chǎn)停運(yùn)事故。

我們看到,頭部廠商已經(jīng)通過(guò)提升管路焊接工藝、增加智能漏液監(jiān)測(cè)裝置、使用相變等新技術(shù)、液環(huán)式真空CDU系統(tǒng)等,來(lái)多角度、全方位防范漏液風(fēng)險(xiǎn),提升冷板式液冷的可靠性、安全性。

技術(shù)變化三,浸沒(méi)式液冷的下沉。

液冷有三種主流方式:冷板式、浸沒(méi)式、噴淋式。其中,冷板式最大眾,是應(yīng)用最早的液冷技術(shù),曙光、浪潮、百度、華為等都開(kāi)始在數(shù)據(jù)中心應(yīng)用冷板式液冷技術(shù);噴淋式最沒(méi)存在感,公開(kāi)的應(yīng)用很少;浸沒(méi)式,長(zhǎng)期以來(lái)是創(chuàng)新性極強(qiáng)的“黑科技”,節(jié)能性強(qiáng),也是最為昂貴的“高嶺之花”。近年來(lái),浸沒(méi)式液冷也開(kāi)始從超算飛入尋常數(shù)據(jù)中心,有了“技術(shù)下沉”的趨勢(shì)。

比如2021 年,微軟研發(fā)了一種非常先進(jìn)的兩相浸入式液冷方案,將電子元件浸入一桶液體中,這種液體的沸點(diǎn)很低,50°C(122°F)就會(huì)沸騰蒸發(fā),吸走設(shè)備運(yùn)行時(shí)產(chǎn)生的熱量,這一技術(shù)已經(jīng)在位于華盛頓州昆西的數(shù)據(jù)中心運(yùn)行,也讓微軟成為第一家在生產(chǎn)環(huán)境中運(yùn)行兩相浸入式液冷的云廠商。

國(guó)內(nèi),中科曙光此前也已經(jīng)在超算系統(tǒng)中應(yīng)用了浸沒(méi)式液體相變的冷卻方式,積累了相應(yīng)的技術(shù)和實(shí)踐,并開(kāi)始將其帶到數(shù)據(jù)中心,阿里也推出了單相變液冷產(chǎn)品。

另一個(gè)粘性,體現(xiàn)在成本的顯著下降。

前期的建設(shè)成本。目前國(guó)內(nèi)外廠商都開(kāi)始推出模塊化設(shè)計(jì)的冷板式液冷解決方案,各個(gè)模塊(外冷設(shè)備、CDU模塊、集群環(huán)網(wǎng)模塊等)獨(dú)立設(shè)計(jì)、獨(dú)立安裝,大大提升了數(shù)據(jù)中心的建設(shè)效率,可以快速部署,省掉很多工時(shí)和流程,從而間接降低用戶(hù)成本。

后期的維護(hù)成本。近年來(lái)有實(shí)力的頭部廠商開(kāi)始推出“交鑰匙工程”,提供液冷數(shù)據(jù)中心全生命周期整體解決方案,全線(xiàn)布局、加強(qiáng)服務(wù),來(lái)降低綠色數(shù)據(jù)中心的后續(xù)成本。

折中的部署成本。一些傳統(tǒng)的風(fēng)冷數(shù)據(jù)中心,不能新建機(jī)房,改造成本又比較高,難道就只能望洋興嘆了嗎?液冷產(chǎn)業(yè)還真想出辦法了,有廠商的液冷產(chǎn)品支持風(fēng)液混布,風(fēng)冷和液冷分別處于不同的子機(jī)房,互相之間獨(dú)立無(wú)干擾,一樣可以達(dá)到降PUE的效果,同時(shí)無(wú)需改造風(fēng)冷機(jī)房,避免了樓梯改造、空間重布的麻煩。

需求強(qiáng)勁、技術(shù)可用、成本下降,液冷近年來(lái)的創(chuàng)新確實(shí)是踩在了時(shí)代的韻腳,黏住了數(shù)據(jù)中心,也黏住了基礎(chǔ)設(shè)施廠商。曙光、華為、聯(lián)想、阿里云、浪潮、寧暢等知名廠商紛紛發(fā)力,熱度看來(lái)還能再持續(xù)一陣。

能也:命運(yùn)掌握在誰(shuí)手里?

有句老話(huà),時(shí)也命也運(yùn)也,非吾所能也。成功有時(shí)候靠的是天命和運(yùn)勢(shì)等,超出了個(gè)人的掌控能力。表現(xiàn)在科技領(lǐng)域,就是那些站在新技術(shù)浪潮之巔的企業(yè),往往能隨著時(shí)代巨浪向前發(fā)展。

這是不是說(shuō),只要抓住“液冷”這個(gè)概念,就能吃到數(shù)據(jù)中心行業(yè)接下來(lái)的紅利呢?

歸根結(jié)底,要站上時(shí)代之巔確實(shí)有運(yùn)勢(shì)一說(shuō),不全看真本事,但不能沒(méi)有真本事。

2022年以來(lái),廠商都在將液冷列入戰(zhàn)略規(guī)劃,加大投入力度,我們能隔三岔五聽(tīng)到液冷的產(chǎn)品與解決方案發(fā)布,隱隱有著全行業(yè)開(kāi)花的趨勢(shì)。

然而必須承認(rèn)的是,大眾對(duì)液冷的關(guān)注,很大一部分來(lái)自雙碳政策的壓力,追求數(shù)據(jù)中心節(jié)能的“政策正確”,企業(yè)必須在壓力下去更新IT基礎(chǔ)設(shè)施是“液冷”邏輯成立的前提。

而商業(yè)邏輯之外,我們更應(yīng)該看到,液冷技術(shù)大規(guī)模商用的瓶頸,才能更好判斷,哪些企業(yè)是真的能交付成熟的產(chǎn)品,哪些企業(yè)是將“液冷”作為一種趨勢(shì)在對(duì)客戶(hù)宣講。

第一個(gè)門(mén)檻,就是長(zhǎng)時(shí)間投入的定力。

液冷數(shù)據(jù)中心是典型的技術(shù)密集型產(chǎn)業(yè),需要參與者有多年的研發(fā)經(jīng)驗(yàn),來(lái)積累和掌握前沿技術(shù),較高的研發(fā)費(fèi)用決定了這只可能是少數(shù)頭部廠商的游戲,還是要跟進(jìn)微軟、谷歌、華為、阿里、浪潮、曙光、聯(lián)想等頭部廠商的動(dòng)態(tài)。尤其液冷數(shù)據(jù)中心的落地部署都是近年來(lái)才完成,缺乏長(zhǎng)周期、大規(guī)模的驗(yàn)證,比如浸沒(méi)式液冷還有很多技術(shù)規(guī)范是空缺狀態(tài),這些企業(yè)的發(fā)展布局較早,使用過(guò)程中的可靠性更有保障。

第二個(gè)門(mén)檻,是標(biāo)準(zhǔn)化和定制化的平衡。

沒(méi)有標(biāo)準(zhǔn)化、規(guī)范化的產(chǎn)品設(shè)計(jì)和制造能力,產(chǎn)品和解決方案的成本很難被攤薄,后續(xù)的擴(kuò)展和適配也可能存在隱患。與此同時(shí),數(shù)據(jù)中心的規(guī)模不同、承載的業(yè)務(wù)負(fù)載也不同,比如用來(lái)進(jìn)行AI大模型訓(xùn)練的企業(yè)級(jí)數(shù)據(jù)中心,和小型數(shù)據(jù)中心,對(duì)液冷服務(wù)器產(chǎn)品的需求截然不同,電力系統(tǒng)、能源條件、能效目標(biāo)等指標(biāo)也各不相同,這又要求企業(yè)能夠針對(duì)性地定制產(chǎn)品和解決方案,滿(mǎn)足多元化的需求,非標(biāo)產(chǎn)品也能做到成本可控,這非??简?yàn)廠商的精益生產(chǎn)。

第三個(gè)瓶頸,是軟實(shí)力的充分完善。

數(shù)據(jù)中心采用液冷技術(shù)和產(chǎn)品涉及到復(fù)雜的規(guī)劃、改造、運(yùn)維等工作,基礎(chǔ)設(shè)施廠商不僅要能提供過(guò)硬的硬件產(chǎn)品,軟實(shí)力也必須過(guò)關(guān)。一方面,是足夠全面,通過(guò)全生命周期從規(guī)劃到運(yùn)維的服務(wù),為客戶(hù)解決全系統(tǒng)環(huán)節(jié)可能出現(xiàn)的問(wèn)題,充分保障液冷數(shù)據(jù)中心的可靠運(yùn)行。另一個(gè)是足夠高效,通過(guò)人工智能等技術(shù)提高服務(wù)器利用效率,能耗治理不是“引入液冷,萬(wàn)事大吉”,還要通過(guò)電力網(wǎng)、算力網(wǎng)和熱力網(wǎng)的協(xié)同優(yōu)化,構(gòu)建最優(yōu)能耗體系。谷歌使用DeepMind AI產(chǎn)品在40個(gè)月內(nèi)將冷卻能耗減少了18%。此外,足夠多的朋友。液冷是非常需要產(chǎn)業(yè)鏈協(xié)作的,從上游的冷卻液、芯片供應(yīng)商到部件生產(chǎn)商、下游的ISV經(jīng)銷(xiāo)伙伴,擁有一個(gè)友好開(kāi)放的朋友圈,確保供應(yīng)鏈的韌性和最終交付效果也是“軟實(shí)力”的體現(xiàn)。

從長(zhǎng)遠(yuǎn)來(lái)看,面向算力時(shí)代,液冷本身的前景遠(yuǎn)大是真實(shí)的,不過(guò)短時(shí)間內(nèi),產(chǎn)業(yè)條件和應(yīng)用性還有待加強(qiáng),必定是先經(jīng)過(guò)一個(gè)個(gè)示范案例落地的逐步驗(yàn)證和經(jīng)驗(yàn)積累,最終一步步過(guò)渡到全液冷、全綠色的產(chǎn)業(yè)革命。

液冷來(lái)到臨界點(diǎn),后面必然是巨大變化的開(kāi)始。數(shù)據(jù)中心和一個(gè)涼爽的夏天,距離已經(jīng)不遠(yuǎn)了。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。

評(píng)論

暫無(wú)評(píng)論哦,快來(lái)評(píng)價(jià)一下吧!

下載界面新聞

微信公眾號(hào)

微博

夏天到了,給數(shù)據(jù)中心潑點(diǎn)“冷水”

液冷來(lái)到臨界點(diǎn)。

文|腦極體

氣溫上升,還有什么能比“工作沒(méi)了”,更能讓人一瞬間心里拔涼拔涼的呢?

這個(gè)“薪盡自然涼”的故事,就發(fā)生在數(shù)據(jù)中心。

前不久,某電商平臺(tái)正在購(gòu)物高峰期,結(jié)果IDC冷凍系統(tǒng)故障,機(jī)房設(shè)備溫度快速升高,直接宕機(jī)了12個(gè)小時(shí),據(jù)說(shuō)損失高達(dá)一億以上。

業(yè)務(wù)涼了,該企業(yè)的基礎(chǔ)平臺(tái)部負(fù)責(zé)人的職業(yè)生涯也涼了。當(dāng)然,受傷的不止一個(gè)人,因?yàn)檫@次機(jī)房事故影響的還有微信、QQ等軟件,騰訊內(nèi)部的幾個(gè)高管也遭到了降級(jí)、免職的處罰。

(事故公告)

AI熱度狂飆,數(shù)字經(jīng)濟(jì)加速,作為計(jì)算的心臟最該保持涼爽的數(shù)據(jù)中心,也越來(lái)越難以冷靜,所以液冷也成了除AI之外,計(jì)算廠商“群起而攻之”的概念,也是IT人不得不關(guān)注的技術(shù)。

2022年被認(rèn)為是數(shù)據(jù)中心的“液冷元年”。

因?yàn)榭蛻?hù)多了,雙碳戰(zhàn)略和東數(shù)西算的政策持續(xù)牽引,液冷從少數(shù)互聯(lián)網(wǎng)巨頭、公有云廠商、智算中心、HPC高性能計(jì)算中心等的選擇,開(kāi)始引發(fā)更多大眾行業(yè)和企業(yè)的關(guān)注。

有需求就有供給,廠商動(dòng)作也明顯多了。眾多服務(wù)器廠商、云計(jì)算和互聯(lián)網(wǎng)企業(yè)爭(zhēng)先研發(fā)數(shù)據(jù)中心液冷技術(shù),甚至有廠商喊出了 “All in 液冷 ”的口號(hào),許多新的液冷產(chǎn)品和解決方案被推向市場(chǎng)。

資本市場(chǎng)也愿意為液冷概念買(mǎi)單,今年以來(lái),中科曙光、申菱環(huán)境、網(wǎng)宿科技、英維克等相關(guān)企業(yè)都出現(xiàn)過(guò)大漲。

多股力量之下,液冷的熱度很難不高。

不過(guò),數(shù)據(jù)中心的冷卻技術(shù)發(fā)展了很多年,液冷對(duì)于數(shù)據(jù)中心來(lái)說(shuō)并非新鮮事物,降本降PUE需求也不是一年兩年了,為什么AI一來(lái)液冷就突然成了風(fēng)口?這個(gè)熱度是真實(shí)的嗎?

這個(gè)炙熱的夏天,我們不妨通過(guò)液冷的故事,來(lái)清涼一下。

時(shí)也:真的假的 “元年”?

元年,是個(gè)被用濫了的詞,我們聽(tīng)過(guò)太多野心家嘴里的“元年”了。2014“智能家居元年”,買(mǎi)回家的藍(lán)牙聯(lián)網(wǎng)電器再也沒(méi)有更新過(guò);2015“VR元年”,沒(méi)兩年行業(yè)就驟然降溫;2021“元宇宙元年”,一時(shí)沸騰,很快就被大家忘在腦后了……

數(shù)據(jù)中心的“液冷元年”,會(huì)不會(huì)也是曇花一現(xiàn)的概念炒作和噱頭呢?

我們也可以換個(gè)角度,來(lái)看看那些公認(rèn)靠譜的“元年”,液冷是不是有雷同的要素加持?

2019被稱(chēng)為5G商業(yè)應(yīng)用元年,大量5G商用牌照發(fā)放,進(jìn)入明顯的加速進(jìn)程——這是政策的強(qiáng)力牽引。

再看液冷,數(shù)據(jù)中心是能源密集型的,隨著雙碳政策的推進(jìn),數(shù)字經(jīng)濟(jì)加速,工信部提出,2022年全國(guó)新建大型數(shù)據(jù)中心PUE要達(dá)到1.4以下;“東數(shù)西算”文件進(jìn)一步要求,東部地區(qū)集群數(shù)據(jù)中心的PUE要控制在1.25以?xún)?nèi),西部地區(qū)在1.2以?xún)?nèi)。在此背景下,數(shù)據(jù)中心“節(jié)能減排”已經(jīng)勢(shì)在必行,風(fēng)冷技術(shù)進(jìn)步已經(jīng)放緩,液冷開(kāi)始得到重視,合理。

2022,被稱(chēng)為AIGC元年,AI作畫(huà)爆火,能力開(kāi)始為全球用戶(hù)所接受,歲末年初的大語(yǔ)言模型又添一把火,AIGC進(jìn)入產(chǎn)業(yè)化應(yīng)用已成必然——這是技術(shù)的成果扎實(shí)。

目前,風(fēng)冷在數(shù)據(jù)中心中仍占主導(dǎo)地位,液冷尚未得到更廣泛的采用,但主流服務(wù)器制造商都在 2022 年陸續(xù)開(kāi)始建設(shè)標(biāo)準(zhǔn)化規(guī)模生產(chǎn)冷板液冷服務(wù)器的產(chǎn)線(xiàn),幾乎所有的頭部互聯(lián)網(wǎng)公司都已對(duì)液冷技術(shù)密切跟蹤。技術(shù)夯實(shí),成本隨產(chǎn)業(yè)化、標(biāo)準(zhǔn)化、規(guī)?;蠓陆?,液冷開(kāi)始滲透,有戲。

往遠(yuǎn)一點(diǎn),1956年被稱(chēng)為“人工智能元年”,是因?yàn)辂溈ㄥa、閔斯基、香農(nóng)等知名學(xué)者匯聚在達(dá)特茅斯會(huì)議,群星璀璨——這是高屋建瓴的洞察。

新一輪AI革命已經(jīng)“做實(shí)”,當(dāng)前 AI 正處于史上最長(zhǎng)繁榮大周期,而AI計(jì)算等高性能應(yīng)用的芯片架構(gòu),熱功率密度急劇上升,CPU已從每個(gè)芯片的150瓦增加到300瓦以上,圖形處理單元(GPU)已增加到每個(gè)芯片700瓦以上。功率越大,芯片就越熱,冷卻要求也就越高。這些高功率 CPU 和 GPU 被封裝到服務(wù)器中,每個(gè)機(jī)架產(chǎn)生的熱量就更多了。越來(lái)越多計(jì)算專(zhuān)家、科學(xué)家認(rèn)同數(shù)據(jù)中心要供給高效綠色低碳的算力,Azure的首席架構(gòu)師Marcus Fontoura指出,5到10年內(nèi),液冷的數(shù)據(jù)中心將成為主流,而不僅僅在超算和比特幣挖礦領(lǐng)域。液冷+DC的長(zhǎng)期前景,看好。

從這個(gè)幾個(gè)判斷依據(jù)來(lái)看,“液冷”和數(shù)字經(jīng)濟(jì)之間的聯(lián)系密切,成為這一年來(lái)數(shù)據(jù)中心行業(yè)的關(guān)鍵詞,“元年”這個(gè)詞不是行業(yè)炒作的噱頭,是有真材實(shí)料的支撐。

命也:打鐵還需自身硬

或許有人會(huì)說(shuō):到底還是政策導(dǎo)向,雙碳降PUE的需求,只要機(jī)房里空調(diào)夠給力,增加的熱氣一樣會(huì)被冷卻,IT設(shè)備照樣好好地很可靠。

確實(shí),只要服務(wù)器入口能保持在17-27攝氏度(64.4° F 和 80.6° F )之間,那管你什么冷卻技術(shù),能抓住老鼠的都是好貓,能降溫就行。液冷能被選中,還是在于自身的技術(shù)先進(jìn)性。

傳統(tǒng)冷卻方式,氣流對(duì)流冷卻,可以簡(jiǎn)單統(tǒng)稱(chēng)為“風(fēng)冷”。因?yàn)槎际峭ㄟ^(guò)冷空氣與服務(wù)器的發(fā)熱元器件(CPU、圖像處理器、存儲(chǔ)等)進(jìn)行熱交換,來(lái)達(dá)到制冷的效果,通常會(huì)有機(jī)房空調(diào)(CRAC)或機(jī)房空氣處理器(CRAH)單元,就類(lèi)似于大家在家里吹空調(diào),大熱天里涼風(fēng)習(xí)習(xí),想想就美滋滋。所以,數(shù)據(jù)中心有80-90%都是風(fēng)冷。

吹空調(diào)已經(jīng)很爽了,為什么還要沖“冷水澡”?

液體冷卻,就是通過(guò)液體冷媒,將發(fā)熱源的熱量傳遞到遠(yuǎn)處,再進(jìn)行冷卻。

這就是液冷技術(shù)的“天生命好”——技術(shù)更先進(jìn)。

液體冷媒比空氣的比熱容大,所以液冷的制冷效率和散熱速度,遠(yuǎn)遠(yuǎn)高于風(fēng)冷。相當(dāng)于室溫太高,空調(diào)得吹個(gè)十幾分鐘才舒適,而沖涼水一下子就能從頭涼到腳,哪臺(tái)高速運(yùn)轉(zhuǎn)的服務(wù)器能拒絕這種快樂(lè)呢?達(dá)到同樣的冷卻效果,液冷的電源消耗更小,PUE(電源使用效率)也更低,很多浸沒(méi)式液冷數(shù)據(jù)中心的PUE值甚至可以達(dá)到1.03~1.05,IT打工人降PUE的績(jī)效穩(wěn)了。

液冷元件比風(fēng)扇的聲音小,所以整個(gè)液冷系統(tǒng)的噪聲,也比風(fēng)冷CRAH單元小,基本可以達(dá)到“靜音”效果。想象一下,如果沒(méi)有單獨(dú)的機(jī)房,又要在辦公室里放一臺(tái)服務(wù)器,誰(shuí)坐在嗡嗡嗡的機(jī)器旁邊還能安心辦公啊,所以哪怕稍微貴一點(diǎn),也愿意選液冷。

液冷系統(tǒng)比空氣更可控。風(fēng)冷“看天吃飯”,外部氣溫變化都可能影響到制冷效果,導(dǎo)致意想不到的故障,液冷就可控多了,只要冷媒不斷不漏,能持續(xù)穩(wěn)定地發(fā)揮冷卻作用。這意味著,像新聞里那樣因?yàn)樵O(shè)備過(guò)熱中斷宕機(jī)而丟工作的IT倒霉蛋,會(huì)少很多。

空調(diào)可樂(lè)冰西瓜,是普通人眼里美妙的夏天,而緊緊巴巴擠在機(jī)柜服務(wù)器的處理器們,“沖涼”才是最?lèi)芤獾南硎堋?/p>

運(yùn)也:液冷來(lái)到臨界點(diǎn)Tipping Point

既然液冷這么好用,為什么風(fēng)冷還是數(shù)據(jù)中心的主流,為什么微軟還要把數(shù)據(jù)中心搬去海底,為什么谷歌不早點(diǎn)向液冷轉(zhuǎn)型?

答案就是,液冷技術(shù)剛剛才來(lái)到“臨界點(diǎn)Tipping Point”。

液冷在數(shù)據(jù)中心的應(yīng)用并非新鮮事物,已經(jīng)存在了一段時(shí)間。上世紀(jì)60年代,IBM大型主機(jī)就通過(guò)液冷來(lái)解決固態(tài)設(shè)備的散熱難題。發(fā)展到本世紀(jì),浸沒(méi)式液冷也應(yīng)用在超算、高性能計(jì)算場(chǎng)景中,是當(dāng)之無(wú)愧的黑科技。

而普通的數(shù)據(jù)中心機(jī)房,開(kāi)始趨勢(shì)性地采用液冷,是近兩年才開(kāi)始到達(dá)“臨界點(diǎn)”。

所謂“Tipping Point”,也被翻譯成轉(zhuǎn)折點(diǎn)、引爆點(diǎn),指的是某個(gè)事物發(fā)展到一定程度,會(huì)產(chǎn)生重大且通常不可阻擋的變化,向野火一樣蔓延的神奇時(shí)刻。

根據(jù)格拉德威爾的說(shuō)法,臨界點(diǎn)到來(lái)的一個(gè)重要因素是“粘性”,即一個(gè)事物是不是能夠“粘”在公眾的腦海中,并影響他們的決策行為。

而我們觀察到,近年來(lái)液冷行業(yè)的一些變化:

首先,產(chǎn)業(yè)需求的粘性很強(qiáng)。

以往液冷技術(shù)主要應(yīng)用于高性能計(jì)算領(lǐng)域,數(shù)據(jù)中心又是一個(gè)較為傳統(tǒng)的行業(yè),液冷的部署環(huán)境與傳統(tǒng)的機(jī)房有較大的差異,改造成本是很高的——除非它值得。

而AI和數(shù)字化的普及,讓液冷的需求粘性變得跟502一樣黏著。

以谷歌為例,一開(kāi)始并不愿意采用液冷方案。谷歌數(shù)據(jù)中心副總裁卡瓦曾說(shuō):“想象一下,有一排又一排,一排又一排的機(jī)架,裝滿(mǎn)了我們的服務(wù)器。我們的硬件運(yùn)營(yíng)團(tuán)隊(duì)每天都在那里,升級(jí)、維修、部署......如果所有這些服務(wù)器浸泡在數(shù)十萬(wàn)加侖的礦物油中,日常操作將變得更加復(fù)雜?!?/p>

他本人承認(rèn),“液冷是非常好的東西,但對(duì)于谷歌的大規(guī)模部署,卻不是必需的”。結(jié)果我們都知道,谷歌變了,2018年開(kāi)始向液冷轉(zhuǎn)型,原因是AI。自從谷歌的AI芯片TPU問(wèn)世之后,它的并行計(jì)算能力強(qiáng)大,也十分耗電,以至于到了TPU 3.0,傳統(tǒng)的空氣冷卻完全不行了。所以,自從 TPU 3.0 在內(nèi)部推出以來(lái),谷歌數(shù)據(jù)中心的工程師就急忙改造基礎(chǔ)設(shè)施以適應(yīng)芯片級(jí)液冷,即使這樣會(huì)增加成本。

AI所帶來(lái)的先進(jìn)生產(chǎn)力和競(jìng)爭(zhēng)力,讓風(fēng)冷轉(zhuǎn)液冷的麻煩和投入,變得非常值得。

其次,技術(shù)的粘性在變強(qiáng)。

每一種新興技術(shù)的規(guī)模應(yīng)用,都需要經(jīng)過(guò)長(zhǎng)期的實(shí)驗(yàn)和迭代,來(lái)保證技術(shù)的實(shí)用性、穩(wěn)定性。

近年來(lái)我們看到,液冷的技術(shù)也有了非常大的飛躍,使其能夠走向產(chǎn)業(yè)化應(yīng)用。

技術(shù)變化一,芯片級(jí)冷卻的突破。

芯片級(jí)冷卻,可以直接對(duì)發(fā)熱量較大的CPU、GPU,進(jìn)行針對(duì)性地冷卻,這樣制冷更精確,冷卻效果當(dāng)然也就更出色,可以支持更強(qiáng)大的芯片。而做到芯片冷卻,是非??简?yàn)設(shè)計(jì)能力和制造工藝的。目前這方面已經(jīng)有非常多的產(chǎn)品問(wèn)世,比如阿里云“麒麟”是國(guó)內(nèi)第一個(gè)嘗試芯片級(jí)液態(tài)制冷的產(chǎn)品,將帶有芯片的集成電路板直接浸入液體,有效提升散熱效果。

技術(shù)變化二,冷板式液冷的可靠性加強(qiáng)。

應(yīng)用最為廣泛的冷板式液冷技術(shù),也有非常大的提升。對(duì)于冷板式來(lái)說(shuō),用戶(hù)最擔(dān)心的就是漏液風(fēng)險(xiǎn)。冷卻液仍存在極小的安全性泄漏隱患,一旦發(fā)生可能引發(fā)嚴(yán)重的生產(chǎn)停運(yùn)事故。

我們看到,頭部廠商已經(jīng)通過(guò)提升管路焊接工藝、增加智能漏液監(jiān)測(cè)裝置、使用相變等新技術(shù)、液環(huán)式真空CDU系統(tǒng)等,來(lái)多角度、全方位防范漏液風(fēng)險(xiǎn),提升冷板式液冷的可靠性、安全性。

技術(shù)變化三,浸沒(méi)式液冷的下沉。

液冷有三種主流方式:冷板式、浸沒(méi)式、噴淋式。其中,冷板式最大眾,是應(yīng)用最早的液冷技術(shù),曙光、浪潮、百度、華為等都開(kāi)始在數(shù)據(jù)中心應(yīng)用冷板式液冷技術(shù);噴淋式最沒(méi)存在感,公開(kāi)的應(yīng)用很少;浸沒(méi)式,長(zhǎng)期以來(lái)是創(chuàng)新性極強(qiáng)的“黑科技”,節(jié)能性強(qiáng),也是最為昂貴的“高嶺之花”。近年來(lái),浸沒(méi)式液冷也開(kāi)始從超算飛入尋常數(shù)據(jù)中心,有了“技術(shù)下沉”的趨勢(shì)。

比如2021 年,微軟研發(fā)了一種非常先進(jìn)的兩相浸入式液冷方案,將電子元件浸入一桶液體中,這種液體的沸點(diǎn)很低,50°C(122°F)就會(huì)沸騰蒸發(fā),吸走設(shè)備運(yùn)行時(shí)產(chǎn)生的熱量,這一技術(shù)已經(jīng)在位于華盛頓州昆西的數(shù)據(jù)中心運(yùn)行,也讓微軟成為第一家在生產(chǎn)環(huán)境中運(yùn)行兩相浸入式液冷的云廠商。

國(guó)內(nèi),中科曙光此前也已經(jīng)在超算系統(tǒng)中應(yīng)用了浸沒(méi)式液體相變的冷卻方式,積累了相應(yīng)的技術(shù)和實(shí)踐,并開(kāi)始將其帶到數(shù)據(jù)中心,阿里也推出了單相變液冷產(chǎn)品。

另一個(gè)粘性,體現(xiàn)在成本的顯著下降。

前期的建設(shè)成本。目前國(guó)內(nèi)外廠商都開(kāi)始推出模塊化設(shè)計(jì)的冷板式液冷解決方案,各個(gè)模塊(外冷設(shè)備、CDU模塊、集群環(huán)網(wǎng)模塊等)獨(dú)立設(shè)計(jì)、獨(dú)立安裝,大大提升了數(shù)據(jù)中心的建設(shè)效率,可以快速部署,省掉很多工時(shí)和流程,從而間接降低用戶(hù)成本。

后期的維護(hù)成本。近年來(lái)有實(shí)力的頭部廠商開(kāi)始推出“交鑰匙工程”,提供液冷數(shù)據(jù)中心全生命周期整體解決方案,全線(xiàn)布局、加強(qiáng)服務(wù),來(lái)降低綠色數(shù)據(jù)中心的后續(xù)成本。

折中的部署成本。一些傳統(tǒng)的風(fēng)冷數(shù)據(jù)中心,不能新建機(jī)房,改造成本又比較高,難道就只能望洋興嘆了嗎?液冷產(chǎn)業(yè)還真想出辦法了,有廠商的液冷產(chǎn)品支持風(fēng)液混布,風(fēng)冷和液冷分別處于不同的子機(jī)房,互相之間獨(dú)立無(wú)干擾,一樣可以達(dá)到降PUE的效果,同時(shí)無(wú)需改造風(fēng)冷機(jī)房,避免了樓梯改造、空間重布的麻煩。

需求強(qiáng)勁、技術(shù)可用、成本下降,液冷近年來(lái)的創(chuàng)新確實(shí)是踩在了時(shí)代的韻腳,黏住了數(shù)據(jù)中心,也黏住了基礎(chǔ)設(shè)施廠商。曙光、華為、聯(lián)想、阿里云、浪潮、寧暢等知名廠商紛紛發(fā)力,熱度看來(lái)還能再持續(xù)一陣。

能也:命運(yùn)掌握在誰(shuí)手里?

有句老話(huà),時(shí)也命也運(yùn)也,非吾所能也。成功有時(shí)候靠的是天命和運(yùn)勢(shì)等,超出了個(gè)人的掌控能力。表現(xiàn)在科技領(lǐng)域,就是那些站在新技術(shù)浪潮之巔的企業(yè),往往能隨著時(shí)代巨浪向前發(fā)展。

這是不是說(shuō),只要抓住“液冷”這個(gè)概念,就能吃到數(shù)據(jù)中心行業(yè)接下來(lái)的紅利呢?

歸根結(jié)底,要站上時(shí)代之巔確實(shí)有運(yùn)勢(shì)一說(shuō),不全看真本事,但不能沒(méi)有真本事。

2022年以來(lái),廠商都在將液冷列入戰(zhàn)略規(guī)劃,加大投入力度,我們能隔三岔五聽(tīng)到液冷的產(chǎn)品與解決方案發(fā)布,隱隱有著全行業(yè)開(kāi)花的趨勢(shì)。

然而必須承認(rèn)的是,大眾對(duì)液冷的關(guān)注,很大一部分來(lái)自雙碳政策的壓力,追求數(shù)據(jù)中心節(jié)能的“政策正確”,企業(yè)必須在壓力下去更新IT基礎(chǔ)設(shè)施是“液冷”邏輯成立的前提。

而商業(yè)邏輯之外,我們更應(yīng)該看到,液冷技術(shù)大規(guī)模商用的瓶頸,才能更好判斷,哪些企業(yè)是真的能交付成熟的產(chǎn)品,哪些企業(yè)是將“液冷”作為一種趨勢(shì)在對(duì)客戶(hù)宣講。

第一個(gè)門(mén)檻,就是長(zhǎng)時(shí)間投入的定力。

液冷數(shù)據(jù)中心是典型的技術(shù)密集型產(chǎn)業(yè),需要參與者有多年的研發(fā)經(jīng)驗(yàn),來(lái)積累和掌握前沿技術(shù),較高的研發(fā)費(fèi)用決定了這只可能是少數(shù)頭部廠商的游戲,還是要跟進(jìn)微軟、谷歌、華為、阿里、浪潮、曙光、聯(lián)想等頭部廠商的動(dòng)態(tài)。尤其液冷數(shù)據(jù)中心的落地部署都是近年來(lái)才完成,缺乏長(zhǎng)周期、大規(guī)模的驗(yàn)證,比如浸沒(méi)式液冷還有很多技術(shù)規(guī)范是空缺狀態(tài),這些企業(yè)的發(fā)展布局較早,使用過(guò)程中的可靠性更有保障。

第二個(gè)門(mén)檻,是標(biāo)準(zhǔn)化和定制化的平衡。

沒(méi)有標(biāo)準(zhǔn)化、規(guī)范化的產(chǎn)品設(shè)計(jì)和制造能力,產(chǎn)品和解決方案的成本很難被攤薄,后續(xù)的擴(kuò)展和適配也可能存在隱患。與此同時(shí),數(shù)據(jù)中心的規(guī)模不同、承載的業(yè)務(wù)負(fù)載也不同,比如用來(lái)進(jìn)行AI大模型訓(xùn)練的企業(yè)級(jí)數(shù)據(jù)中心,和小型數(shù)據(jù)中心,對(duì)液冷服務(wù)器產(chǎn)品的需求截然不同,電力系統(tǒng)、能源條件、能效目標(biāo)等指標(biāo)也各不相同,這又要求企業(yè)能夠針對(duì)性地定制產(chǎn)品和解決方案,滿(mǎn)足多元化的需求,非標(biāo)產(chǎn)品也能做到成本可控,這非??简?yàn)廠商的精益生產(chǎn)。

第三個(gè)瓶頸,是軟實(shí)力的充分完善。

數(shù)據(jù)中心采用液冷技術(shù)和產(chǎn)品涉及到復(fù)雜的規(guī)劃、改造、運(yùn)維等工作,基礎(chǔ)設(shè)施廠商不僅要能提供過(guò)硬的硬件產(chǎn)品,軟實(shí)力也必須過(guò)關(guān)。一方面,是足夠全面,通過(guò)全生命周期從規(guī)劃到運(yùn)維的服務(wù),為客戶(hù)解決全系統(tǒng)環(huán)節(jié)可能出現(xiàn)的問(wèn)題,充分保障液冷數(shù)據(jù)中心的可靠運(yùn)行。另一個(gè)是足夠高效,通過(guò)人工智能等技術(shù)提高服務(wù)器利用效率,能耗治理不是“引入液冷,萬(wàn)事大吉”,還要通過(guò)電力網(wǎng)、算力網(wǎng)和熱力網(wǎng)的協(xié)同優(yōu)化,構(gòu)建最優(yōu)能耗體系。谷歌使用DeepMind AI產(chǎn)品在40個(gè)月內(nèi)將冷卻能耗減少了18%。此外,足夠多的朋友。液冷是非常需要產(chǎn)業(yè)鏈協(xié)作的,從上游的冷卻液、芯片供應(yīng)商到部件生產(chǎn)商、下游的ISV經(jīng)銷(xiāo)伙伴,擁有一個(gè)友好開(kāi)放的朋友圈,確保供應(yīng)鏈的韌性和最終交付效果也是“軟實(shí)力”的體現(xiàn)。

從長(zhǎng)遠(yuǎn)來(lái)看,面向算力時(shí)代,液冷本身的前景遠(yuǎn)大是真實(shí)的,不過(guò)短時(shí)間內(nèi),產(chǎn)業(yè)條件和應(yīng)用性還有待加強(qiáng),必定是先經(jīng)過(guò)一個(gè)個(gè)示范案例落地的逐步驗(yàn)證和經(jīng)驗(yàn)積累,最終一步步過(guò)渡到全液冷、全綠色的產(chǎn)業(yè)革命。

液冷來(lái)到臨界點(diǎn),后面必然是巨大變化的開(kāi)始。數(shù)據(jù)中心和一個(gè)涼爽的夏天,距離已經(jīng)不遠(yuǎn)了。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。