文|銀杏財(cái)經(jīng)
生成式人工智能在互聯(lián)網(wǎng)行業(yè)掀起了一波浪潮,大模型也帶來了數(shù)據(jù)中心行業(yè)又一次高速發(fā)展的機(jī)會。相關(guān)產(chǎn)業(yè)協(xié)同迭代,液冷將迎來關(guān)鍵的一年。
一位從事數(shù)據(jù)中心建設(shè)的專家向《銀杏科技》表示,目前國內(nèi)數(shù)據(jù)中心液冷應(yīng)用比例約為10%,發(fā)展前景巨大。
隨著大模型應(yīng)用的快速增長,國內(nèi)部分液冷方案供應(yīng)商今年上半年銷售額較去年全年增長了100%,預(yù)計(jì)全年銷售額較去年增長將超過300%。數(shù)據(jù)中心規(guī)模提升,讓業(yè)內(nèi)普遍認(rèn)為液冷將在未來幾年內(nèi)迅速成為數(shù)據(jù)中心行業(yè)的絕對主導(dǎo)。
據(jù)《中國通信院》公布的數(shù)據(jù)顯示,去年我國數(shù)據(jù)中心規(guī)模穩(wěn)步增長,按照標(biāo)準(zhǔn)機(jī)架2.5kW來統(tǒng)計(jì),2022年我國數(shù)據(jù)中心機(jī)架規(guī)模達(dá)到670萬架,近五年的年復(fù)合增長率超過30%。其中大型以上數(shù)據(jù)中心增長更為迅速,2022年底規(guī)模達(dá)540萬架,占比達(dá)81%。
外部環(huán)境的變遷也讓市場對液冷的需求日盛??刂铺寂欧诺挠残砸笾猓S著全球平均氣溫紀(jì)錄被不斷刷新、高溫成為常態(tài),數(shù)據(jù)中心也需要處理高溫對其正常運(yùn)轉(zhuǎn)的妨礙。
2022年7月,受到全球熱浪的影響,亞馬遜公司在倫敦的一座數(shù)據(jù)中心由于高溫而導(dǎo)致宕機(jī),一周后,谷歌和Oracle在英國托管的云服務(wù)和服務(wù)器也由于冷卻問題而停機(jī)。同年9月,位于加州的推特?cái)?shù)據(jù)中心也因45攝氏度高溫停擺。
2023年夏季,當(dāng)創(chuàng)紀(jì)錄的高溫再次席卷全球,行業(yè)也在不斷推出更有效的降溫方式以應(yīng)對新的挑戰(zhàn),液冷數(shù)據(jù)中心逐漸成為標(biāo)配。
高溫襲擊數(shù)據(jù)中心
數(shù)據(jù)中心,尤其是科技公司新建的大型數(shù)據(jù)中心,往往并不扎堆在一線城市,而是分布在內(nèi)蒙古、貴州、甘肅、寧夏等省區(qū)。集中在這些地區(qū)的原因和氣溫有關(guān):高溫會降低其運(yùn)行效率,提高運(yùn)行成本,平均氣溫越低的地區(qū)越受數(shù)據(jù)中心青睞。
數(shù)據(jù)中心工程師陳鋒表示,數(shù)據(jù)中心的溫度需要控制在22攝氏度左右。最高性能的處理器通常會帶來高頻和多核特性,較低的溫度能夠使具備動態(tài)頻率調(diào)節(jié)能力的CPU、GPU等運(yùn)算設(shè)備能夠以較高頻率穩(wěn)定運(yùn)行,設(shè)備的運(yùn)行壽命也會得到提升。
因此,解決最高性能處理器的散熱問題,就意味著服務(wù)器生產(chǎn)力的提升。
相反,一旦機(jī)房溫度過高就會導(dǎo)致設(shè)備宕機(jī)。這是電子設(shè)備的物理特性決定的,機(jī)房設(shè)備中有很多電子元件,在工作時(shí)會產(chǎn)生大量的熱量。如果不能及時(shí)散熱,就會影響機(jī)房性能。通信設(shè)備遵循“10攝氏度法則”,即溫度每升高10攝氏度,設(shè)備的可靠性就會下降25%。
“磁盤所處的環(huán)境溫度如果高于70攝氏度就會開始出現(xiàn)損壞,當(dāng)溫度持續(xù)高于100攝氏度時(shí)就會完全損壞,” 數(shù)據(jù)中心工程師陳鋒表示,“機(jī)房設(shè)備里的電容在高溫環(huán)境下會使電介質(zhì)溶液當(dāng)中的水分蒸發(fā)增大,降低容量,縮短壽命?!?/p>
因此,數(shù)據(jù)中心需要大量制冷設(shè)備和電力對機(jī)房進(jìn)行制冷。連續(xù)的高溫天氣容易導(dǎo)致制冷設(shè)備超負(fù)荷運(yùn)轉(zhuǎn),最終發(fā)生故障,從而導(dǎo)致數(shù)據(jù)中心癱瘓。
高溫天氣對供電系統(tǒng)也是一個(gè)考驗(yàn),供電壓力巨大的情況下可能會發(fā)生突發(fā)性斷電,影響設(shè)備性能,甚至損壞設(shè)備。高溫天氣還會讓機(jī)房內(nèi)的空氣變得干燥,產(chǎn)生靜電,影響設(shè)備工作甚至引發(fā)火災(zāi)。
對于數(shù)據(jù)中心來說,高溫?zé)o疑是最大的敵人之一。2021年我國數(shù)據(jù)中心耗電量為2166億kWh,占社會總耗電量的2.6%,相當(dāng)于1.3個(gè)上海市的總社會用電量,而其中用于散熱的能耗占比超過40%,更是占到了非IT能耗的80%。
因此,天氣涼爽的地區(qū)成為了數(shù)據(jù)中心行業(yè)的心頭好。內(nèi)蒙古自治區(qū)最大的數(shù)據(jù)中心集群所在地和林格爾年平均最高氣溫約15攝氏度,年平均氣溫為3.5至8攝氏度;貴州省最大數(shù)據(jù)中心核心區(qū)所在的貴安新區(qū),年平均最高氣溫約18攝氏度,年平均氣溫為15攝氏度。
作為我國北方和南方最大的數(shù)據(jù)中心所在地,和林格爾和貴陽都可以稱得上是涼爽,也因此格外受到數(shù)據(jù)中心行業(yè)的青睞。
進(jìn)入液冷時(shí)代
雖然低溫有著足夠的吸引力,但并非所有數(shù)據(jù)中心都可以搬遷到這些地區(qū)。
高溫天氣的常態(tài)化、碳排放要求、能源價(jià)格的上漲也讓行業(yè)不斷尋找新的突破口。種種條件限制下,液冷成為了近年來新建設(shè)數(shù)據(jù)中心的最佳方案。
從事數(shù)據(jù)中心建設(shè)的田文靖告訴《銀杏科技》,傳統(tǒng)數(shù)據(jù)中心一般選擇直接降低機(jī)房內(nèi)的氣溫,也就是利用空氣作為冷卻介質(zhì)??照{(diào)降溫的效率較低,高密度數(shù)據(jù)中心中冷卻系統(tǒng)的功率常常會超過100kW,噪聲超過95分貝,工作人員必須戴降噪設(shè)備才能進(jìn)入機(jī)房工作。
此外,當(dāng)數(shù)據(jù)中心中假設(shè)了大量服務(wù)器時(shí),房間內(nèi)會出現(xiàn)明顯的溫度分層情況:熱空氣會聚集在房間上部,冷空氣則聚集在腳底,這會讓同一個(gè)機(jī)架上不同高度的設(shè)備獲得不同的降溫效果,影響設(shè)備的運(yùn)行。
液冷數(shù)據(jù)中心的原理與空調(diào)非常類似,都是利用比熱容較大的液體將設(shè)備運(yùn)轉(zhuǎn)產(chǎn)生的熱量轉(zhuǎn)移到室外,根據(jù)設(shè)備與液體不同的接觸方式可以分為冷板式、噴淋式、浸沒式等,使用的液體也包含礦物油、氟化液等種類。
在建設(shè)過程當(dāng)中,液冷數(shù)據(jù)中心的建設(shè)與維護(hù)成本普遍較風(fēng)冷數(shù)據(jù)中心更高。田文靖表示,液冷數(shù)據(jù)中心需要更精細(xì)的管理。冷卻系統(tǒng)管理不善可能會導(dǎo)致冷卻液腐蝕、沉積、微生物生長,最終使數(shù)據(jù)中心冷卻效率下降,甚至可能出現(xiàn)宕機(jī)、損壞設(shè)備的結(jié)果。因此,液冷數(shù)據(jù)中心的維護(hù)成本也較風(fēng)冷數(shù)據(jù)中心更高。
但這些都無法掩蓋液冷數(shù)據(jù)中心最大的優(yōu)勢——節(jié)能。相比以空氣介質(zhì),冷卻液的導(dǎo)熱系數(shù)是空氣的6倍,熱容是空氣的1000倍,因此,液冷可以讓冷卻液的傳熱次數(shù)更少,容量衰減更小,冷卻效率更高。
液體冷卻的傳熱比空氣冷卻的傳熱系數(shù)高數(shù)百倍,所需的實(shí)施空間也更小。數(shù)據(jù)中心50%-80%的散熱都可以通過液體轉(zhuǎn)移到外部冷卻塔,減少冷卻塔的使用,最終降低PUE。
PUE指全年數(shù)據(jù)中心總能耗與IT設(shè)備能耗的比值,越接近1,意味著數(shù)據(jù)中心用于散熱的能源消耗越小,數(shù)據(jù)中心就越省電。風(fēng)冷數(shù)據(jù)中心平均PUE約為1.3,液冷數(shù)據(jù)中心PUE往往更低。
田文靖透露,阿里云數(shù)據(jù)中心去年進(jìn)行測試的浸沒式液冷系統(tǒng),最低能夠達(dá)到年均PUE1.09;京東云數(shù)據(jù)中心在2021年換用冷板液冷后,PUE從1.3降低到了1.1,反映在電量上,一個(gè)14kW的機(jī)柜一年可以節(jié)省31000多度電,產(chǎn)生的經(jīng)濟(jì)效益和環(huán)境效益足以抵消液冷中心的額外建設(shè)與維護(hù)成本。
新環(huán)境、新挑戰(zhàn)、新機(jī)遇
液冷相對于風(fēng)冷數(shù)據(jù)中心有著無法替代的優(yōu)勢,其間包含的商業(yè)價(jià)值不容忽視。
市場分析機(jī)構(gòu)預(yù)計(jì),到2026年,液冷數(shù)據(jù)中心市場的初始估值從2018年的14.3億美元增至1205億美元,年化復(fù)合增長率達(dá)30.45%。
對于數(shù)據(jù)中心需求更高的通信行業(yè)也將液冷的普及化提上了日程。在技術(shù)上,不少廠商都在數(shù)年前開始提前布局液冷技術(shù),中科曙光、華為、阿里、聯(lián)想、浪潮等國內(nèi)企業(yè)對液冷技術(shù)均有儲備,近年來更是不斷加大在液冷技術(shù)研發(fā)方面的投入。
三大通信運(yùn)營商也積極擁抱液冷。
2023年6月,移動、聯(lián)通、電信三大運(yùn)營商聯(lián)合發(fā)布《電信運(yùn)營商液冷技術(shù)白皮書》,宣布將從今年起開展技術(shù)驗(yàn)證,驗(yàn)證液冷技術(shù)性能,降低PUE,儲備規(guī)劃、建設(shè)與維護(hù)等技術(shù)能力,最終在2025年開展規(guī)模應(yīng)用。
相對于海外企業(yè),我國自研液冷技術(shù)并不落后,而在應(yīng)用層面則擁有更多商業(yè)實(shí)踐案例,總體競爭力上已經(jīng)處于領(lǐng)先地位。
但作為新興市場,液冷行業(yè)也存在著缺乏統(tǒng)一標(biāo)準(zhǔn)、產(chǎn)品仍在迭代的問題。
與有著完善行業(yè)標(biāo)準(zhǔn)的風(fēng)冷設(shè)備不同,由于液冷方案中機(jī)柜與服務(wù)器深度耦合,根據(jù)不同的液冷方案和中下游供應(yīng)商,服務(wù)器與機(jī)柜相結(jié)合的方式、接頭尺寸、冷卻液規(guī)格等零部件和設(shè)備也各有不同,互不兼容,嚴(yán)重干擾了行業(yè)的發(fā)展。
行業(yè)頭部科技企業(yè)也意識到了這個(gè)問題,2021年4月,中國信通院牽頭,阿里巴巴、百度、騰訊、美團(tuán)、京東、中國電信、中國移動、3M等企業(yè)共同發(fā)布了5項(xiàng)數(shù)據(jù)中心液冷行業(yè)標(biāo)準(zhǔn);中科曙光、英特爾等方案提供商也提出了各自的液冷數(shù)據(jù)中心建設(shè)標(biāo)準(zhǔn)。
總體來看,處于市場競爭早期階段的液冷行業(yè)依然缺乏統(tǒng)一標(biāo)準(zhǔn)。
此外,近些年數(shù)據(jù)中心行業(yè)蓬勃發(fā)展,各種全新的降溫技術(shù)也在不斷出現(xiàn),液冷設(shè)備及其周邊系統(tǒng)的架構(gòu)也在不斷演進(jìn)當(dāng)中,甚至有部分方案已采用耐高溫服務(wù)器,從根源上進(jìn)一步降低散熱需求,簡化冷源架構(gòu)。
面對不斷演進(jìn)的數(shù)據(jù)中心建設(shè)方案,液冷初期投資高、全生命周期成本高就成為了液冷數(shù)據(jù)中心建設(shè)時(shí)不得不考慮的關(guān)鍵因素。
雖然液冷行業(yè)仍在發(fā)展早期階段,但其間蘊(yùn)含的潛力已不容忽視。作為技術(shù)迭代最關(guān)鍵的基礎(chǔ)設(shè)施之一,液冷數(shù)據(jù)中心的發(fā)展不僅會縱向滲透到不同行業(yè),也會橫向與人工智能、邊緣計(jì)算和5G其他技術(shù)相結(jié)合,支持其他技術(shù)落地的同時(shí),也在實(shí)際應(yīng)用中完善自身體系。
大模型帶動相關(guān)產(chǎn)業(yè)協(xié)同發(fā)展,也要求產(chǎn)業(yè)鏈上下完成技術(shù)迭代,進(jìn)入新工業(yè)范式。液冷的爆發(fā)可作為一個(gè)提示:機(jī)遇涌現(xiàn)之際,市場需要更多想象力。