正在閱讀:

Grace CPU推遲至下半年發(fā)布,60%功率下性能提升1.3倍

掃一掃下載界面新聞APP

Grace CPU推遲至下半年發(fā)布,60%功率下性能提升1.3倍

英偉達(dá)基于Arm架構(gòu)的Grace CPU預(yù)計(jì)將延遲至今年下半年發(fā)貨。

編譯|段祎

編輯|Panken

芯東西3月23日消息,據(jù)Tom’s Hardware報(bào)道,近日,美國人工智能訓(xùn)練芯片巨頭英偉達(dá)CEO黃仁勛在GTC大會(huì)上就其即將推出的基于Arm架構(gòu)的Grace CPU延遲發(fā)貨一事向Tom’s Hardware的記者Paul Alcorn做出了解釋,稱芯片延遲發(fā)布是正常情況,且由于此次研制的Grace芯片添加了許多創(chuàng)新設(shè)計(jì),工作量增大,相應(yīng)的制造時(shí)間有所延長。

在本周二的GTC大會(huì)上,黃仁勛首次展示了基于Arm架構(gòu)的Grace芯片,該芯片在僅使用60%的功率下比基于x86架構(gòu)的芯片快1.3倍。并且Grace CPU和Hopper GPU的新設(shè)計(jì)可以讓芯片實(shí)現(xiàn)速度和效率兼顧的共享內(nèi)存中保存的信息,同時(shí)速度是PCIe接口的七倍。

一、推遲發(fā)布是正常現(xiàn)象,基于Arm架構(gòu)帶來更大工作量

談及Grace CPU和Grace Hopper Superchip系統(tǒng)延遲交付終端市場的問題。他解釋道:“Grace和Grace Hopper都在生產(chǎn)中,‘硅片現(xiàn)在正在工廠里飛來飛去’。系統(tǒng)正在制作中,我們發(fā)布了很多公告。世界上的原始設(shè)備制造商(OEM)和計(jì)算機(jī)制造商正在構(gòu)建它們?!秉S仁勛還說,英偉達(dá)只用了兩年的時(shí)間來開發(fā)芯片,考慮到現(xiàn)代芯片通常需要多年的設(shè)計(jì)周期,這個(gè)時(shí)間相對(duì)較短。

▲Grace CPU(圖源:Tom’s Hardware)

此前,美國芯片制造巨頭AMD和英特爾開發(fā)的CPU在芯片量產(chǎn)上市前就會(huì)被部署到超大規(guī)模計(jì)算的設(shè)備上,不過,目前英偉達(dá)Grace芯片是否已經(jīng)提供給客戶使用還是未知的,黃仁勛透露他們正在向客戶提供芯片樣品。

一般而言,像英特爾這樣的企業(yè),也經(jīng)常會(huì)延遲推出芯片,即便是基于其幾十年來成熟的在硬件和軟件平臺(tái)占主導(dǎo)地位的x86架構(gòu)構(gòu)建芯片,推出新芯片的難度也并不小。

相比之下,英偉達(dá)的Grace和Grace Hopper芯片在芯片設(shè)計(jì)方面注入了許多的全新思考,它采用了創(chuàng)新的芯片間互連技術(shù)。英偉達(dá)使用Arm指令集也意味著軟件優(yōu)化和遷移的工作更重,該公司需要構(gòu)建一個(gè)全新的平臺(tái)來生產(chǎn)該芯片。

二、Grace芯片消耗60%功率,數(shù)據(jù)處理速度快一倍多

黃仁勛在他的其余回應(yīng)中提到了關(guān)于芯片設(shè)計(jì)思考的一些內(nèi)容,他說:“我們從Superchips(超級(jí)芯片)而不是chiplet(小芯片)開始,是因?yàn)槲覀兿胍獦?gòu)建的東西很大,不過這兩種產(chǎn)品現(xiàn)在都在生產(chǎn)中。英偉達(dá)正在做很多測試,軟件也正在被遷移到芯片,同時(shí)英偉達(dá)向客戶提供芯片樣品。在會(huì)上,我用確切的數(shù)字展示了Grace芯片的各大性能優(yōu)勢,但我不想堆砌數(shù)字來增加演講的負(fù)擔(dān),但芯片的性能真的非常棒?!?/p>

在問答環(huán)節(jié)中,黃仁勛聲稱該芯片在HiBench Apache Spark內(nèi)存密集型基準(zhǔn)測試中比下一代x86服務(wù)器芯片數(shù)據(jù)處理速度快1.2倍,在谷歌微服務(wù)通信基準(zhǔn)測試(Google microservices communication benchmark)中快1.3倍,同時(shí)只消耗了60%功率。

他說這允許數(shù)據(jù)中心將1.7倍以上數(shù)量的Grace芯片部署到功率受限的裝置中,每臺(tái)服務(wù)器的吞吐量提高了25%。他還說Grace在計(jì)算流體動(dòng)力學(xué) (CFD)工作負(fù)載方面的速度提高了1.9倍。

三、為云計(jì)算、AI定制芯片,兼具低功耗、高性能

Grace芯片在某些應(yīng)用場景中雖然表現(xiàn)出超強(qiáng)的性能和效率,但英偉達(dá)并沒有計(jì)劃將它們定位到通用服務(wù)器市場。該公司針對(duì)特定使用場景定制了芯片,例如人工智能和云計(jì)算場景,這些場景需要支持卓越的單線程和內(nèi)存處理性能以及出色的能效。

黃仁勛告訴說:“現(xiàn)在幾乎每個(gè)數(shù)據(jù)中心都受到功率限制,我們?cè)O(shè)計(jì)的Grace在功率受限的環(huán)境中表現(xiàn)出色”,“在那種情況下,你必須既有非常高的性能,又必須有非常低的功率,而且效率也要非常高。因此,與最新一代CPU相比,Grace系統(tǒng)的功率/性能效率大約高其兩倍?!?/p>

▲相同功耗下,英偉達(dá)Grace CPU性能比較圖(圖源:Tom’s Hardware)

“而且它是針對(duì)不同的場景而設(shè)計(jì)的,所以這是非常好理解的?!秉S仁勛繼續(xù)說道,“例如,我剛才描述的內(nèi)容對(duì)大多數(shù)企業(yè)來說并不重要。但它對(duì)提供云服務(wù)的企業(yè)來說很重要,對(duì)電力消耗大的數(shù)據(jù)中心也很重要?!?/p>

能源效率比以往任何時(shí)候都更受關(guān)注,黃仁勛說,他們最近評(píng)測過的AMD EPYC Genoa和英特爾的Sapphire Rapids等芯片的功率現(xiàn)在分別達(dá)到400瓦和350瓦。這需要特殊的新空氣冷卻解決方案來控制標(biāo)準(zhǔn)設(shè)置下的巨大功耗,并為達(dá)到芯片的最高性能提供液體冷卻。

相比之下,Grace的低功耗將使芯片更容易冷卻。正如GTC大會(huì)上首次展示的那樣,英偉達(dá)的144核Grace封裝為5英寸x8英寸,可以裝入體積非常小的被動(dòng)冷卻模塊中。這些模塊仍然依靠空氣冷卻,但兩個(gè)模塊可以在單個(gè)超薄的1U機(jī)箱中進(jìn)行空氣冷卻。

四、同時(shí)嵌入CPU、GPU,芯片間互聯(lián)速度快7倍

英偉達(dá)還在GTC大會(huì)上首次展示了其Grace Hopper 超級(jí)芯片。Superchip在同一個(gè)封裝上結(jié)合了Grace CPU和Hopper GPU,這兩個(gè)模塊就可以裝入一個(gè)服務(wù)器機(jī)箱中。

▲Grace Hopper(圖源:Tom’s Hardware)

這種設(shè)計(jì)的最大優(yōu)勢是使CPU與GPU的結(jié)合更連貫協(xié)調(diào),提供更低延遲的芯片與芯片之間的連接,其接口速度是PCIe接口的七倍,之前的設(shè)計(jì)無法實(shí)現(xiàn)速度和效率兼顧以共享內(nèi)存中保存的信息,而現(xiàn)在CPU與GPU的結(jié)合成功解決了這一問題。

黃仁勛解釋說,這種方法非常適合人工智能、數(shù)據(jù)庫、推薦系統(tǒng)和大型語言模型(LLM),所有這些對(duì)這項(xiàng)具有新設(shè)計(jì)的芯片都有著巨大的需求。采用新設(shè)計(jì)的Grace芯片通過允許GPU直接訪問CPU的內(nèi)存,簡化了數(shù)據(jù)傳輸以提高性能。

英偉達(dá)的Grace芯片可能有點(diǎn)落后于其此前制定的發(fā)布計(jì)劃,由于芯片制造商和原始設(shè)備制造商(OEM)在供應(yīng)鏈中的關(guān)系,芯片制造商設(shè)計(jì)芯片并將設(shè)計(jì)方案交付給OEM,英偉達(dá)和華碩、Atos、技嘉、HPE、Supermicro、QCT、Wiston和Zt密切合作,這些合作伙伴都在為市場準(zhǔn)備OEM系統(tǒng),OEM系統(tǒng)現(xiàn)在預(yù)計(jì)將在今年下半年推出,但英偉達(dá)尚未說明給到這些合作伙伴芯片的確切時(shí)間。

結(jié)語:Grace芯片性能優(yōu)勢顯著,推遲發(fā)布影響較小

各大芯片公司新芯片的研發(fā)通常需要較長的時(shí)間周期,再加上運(yùn)輸鏈和設(shè)計(jì)難度的影響,這些公司往往會(huì)被迫推遲芯片發(fā)布時(shí)間。對(duì)英偉達(dá)此次基于Arm架構(gòu)的Grace芯片發(fā)布延遲,黃仁勛依舊持樂觀態(tài)度,對(duì)外只是戲稱“硅”正在工廠“起飛”,預(yù)計(jì)今年下半年正式推出Grace芯片。

據(jù)黃仁勛介紹,此次Grace芯片僅在60%的低能耗下,速度就能簡單超越下一代x86芯片。同時(shí),Grace的低功耗將使芯片更容易冷卻。Grace CPU和Hopper GPU的新設(shè)計(jì)可以實(shí)現(xiàn)共享內(nèi)存中保存的信息,增強(qiáng)了CPU+GPU內(nèi)存一致性。相比市面上現(xiàn)有的芯片,英偉達(dá)的Grace芯片性能優(yōu)勢明顯,盡管此次新芯片延遲發(fā)貨,但對(duì)英偉達(dá)影響似乎并不大,我們拭目以待下半年Grace芯片發(fā)布。

來源:Tom’s Hardware

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。

英偉達(dá)

8.6k
  • 美股三大指數(shù)收盤均漲超1%,道指創(chuàng)10月下旬以來最大單周跌幅
  • 英偉達(dá)收購AI創(chuàng)企Run:ai獲歐盟批準(zhǔn)

評(píng)論

暫無評(píng)論哦,快來評(píng)價(jià)一下吧!

下載界面新聞

微信公眾號(hào)

微博

Grace CPU推遲至下半年發(fā)布,60%功率下性能提升1.3倍

英偉達(dá)基于Arm架構(gòu)的Grace CPU預(yù)計(jì)將延遲至今年下半年發(fā)貨。

編譯|段祎

編輯|Panken

芯東西3月23日消息,據(jù)Tom’s Hardware報(bào)道,近日,美國人工智能訓(xùn)練芯片巨頭英偉達(dá)CEO黃仁勛在GTC大會(huì)上就其即將推出的基于Arm架構(gòu)的Grace CPU延遲發(fā)貨一事向Tom’s Hardware的記者Paul Alcorn做出了解釋,稱芯片延遲發(fā)布是正常情況,且由于此次研制的Grace芯片添加了許多創(chuàng)新設(shè)計(jì),工作量增大,相應(yīng)的制造時(shí)間有所延長。

在本周二的GTC大會(huì)上,黃仁勛首次展示了基于Arm架構(gòu)的Grace芯片,該芯片在僅使用60%的功率下比基于x86架構(gòu)的芯片快1.3倍。并且Grace CPU和Hopper GPU的新設(shè)計(jì)可以讓芯片實(shí)現(xiàn)速度和效率兼顧的共享內(nèi)存中保存的信息,同時(shí)速度是PCIe接口的七倍。

一、推遲發(fā)布是正?,F(xiàn)象,基于Arm架構(gòu)帶來更大工作量

談及Grace CPU和Grace Hopper Superchip系統(tǒng)延遲交付終端市場的問題。他解釋道:“Grace和Grace Hopper都在生產(chǎn)中,‘硅片現(xiàn)在正在工廠里飛來飛去’。系統(tǒng)正在制作中,我們發(fā)布了很多公告。世界上的原始設(shè)備制造商(OEM)和計(jì)算機(jī)制造商正在構(gòu)建它們?!秉S仁勛還說,英偉達(dá)只用了兩年的時(shí)間來開發(fā)芯片,考慮到現(xiàn)代芯片通常需要多年的設(shè)計(jì)周期,這個(gè)時(shí)間相對(duì)較短。

▲Grace CPU(圖源:Tom’s Hardware)

此前,美國芯片制造巨頭AMD和英特爾開發(fā)的CPU在芯片量產(chǎn)上市前就會(huì)被部署到超大規(guī)模計(jì)算的設(shè)備上,不過,目前英偉達(dá)Grace芯片是否已經(jīng)提供給客戶使用還是未知的,黃仁勛透露他們正在向客戶提供芯片樣品。

一般而言,像英特爾這樣的企業(yè),也經(jīng)常會(huì)延遲推出芯片,即便是基于其幾十年來成熟的在硬件和軟件平臺(tái)占主導(dǎo)地位的x86架構(gòu)構(gòu)建芯片,推出新芯片的難度也并不小。

相比之下,英偉達(dá)的Grace和Grace Hopper芯片在芯片設(shè)計(jì)方面注入了許多的全新思考,它采用了創(chuàng)新的芯片間互連技術(shù)。英偉達(dá)使用Arm指令集也意味著軟件優(yōu)化和遷移的工作更重,該公司需要構(gòu)建一個(gè)全新的平臺(tái)來生產(chǎn)該芯片。

二、Grace芯片消耗60%功率,數(shù)據(jù)處理速度快一倍多

黃仁勛在他的其余回應(yīng)中提到了關(guān)于芯片設(shè)計(jì)思考的一些內(nèi)容,他說:“我們從Superchips(超級(jí)芯片)而不是chiplet(小芯片)開始,是因?yàn)槲覀兿胍獦?gòu)建的東西很大,不過這兩種產(chǎn)品現(xiàn)在都在生產(chǎn)中。英偉達(dá)正在做很多測試,軟件也正在被遷移到芯片,同時(shí)英偉達(dá)向客戶提供芯片樣品。在會(huì)上,我用確切的數(shù)字展示了Grace芯片的各大性能優(yōu)勢,但我不想堆砌數(shù)字來增加演講的負(fù)擔(dān),但芯片的性能真的非常棒。”

在問答環(huán)節(jié)中,黃仁勛聲稱該芯片在HiBench Apache Spark內(nèi)存密集型基準(zhǔn)測試中比下一代x86服務(wù)器芯片數(shù)據(jù)處理速度快1.2倍,在谷歌微服務(wù)通信基準(zhǔn)測試(Google microservices communication benchmark)中快1.3倍,同時(shí)只消耗了60%功率。

他說這允許數(shù)據(jù)中心將1.7倍以上數(shù)量的Grace芯片部署到功率受限的裝置中,每臺(tái)服務(wù)器的吞吐量提高了25%。他還說Grace在計(jì)算流體動(dòng)力學(xué) (CFD)工作負(fù)載方面的速度提高了1.9倍。

三、為云計(jì)算、AI定制芯片,兼具低功耗、高性能

Grace芯片在某些應(yīng)用場景中雖然表現(xiàn)出超強(qiáng)的性能和效率,但英偉達(dá)并沒有計(jì)劃將它們定位到通用服務(wù)器市場。該公司針對(duì)特定使用場景定制了芯片,例如人工智能和云計(jì)算場景,這些場景需要支持卓越的單線程和內(nèi)存處理性能以及出色的能效。

黃仁勛告訴說:“現(xiàn)在幾乎每個(gè)數(shù)據(jù)中心都受到功率限制,我們?cè)O(shè)計(jì)的Grace在功率受限的環(huán)境中表現(xiàn)出色”,“在那種情況下,你必須既有非常高的性能,又必須有非常低的功率,而且效率也要非常高。因此,與最新一代CPU相比,Grace系統(tǒng)的功率/性能效率大約高其兩倍?!?/p>

▲相同功耗下,英偉達(dá)Grace CPU性能比較圖(圖源:Tom’s Hardware)

“而且它是針對(duì)不同的場景而設(shè)計(jì)的,所以這是非常好理解的?!秉S仁勛繼續(xù)說道,“例如,我剛才描述的內(nèi)容對(duì)大多數(shù)企業(yè)來說并不重要。但它對(duì)提供云服務(wù)的企業(yè)來說很重要,對(duì)電力消耗大的數(shù)據(jù)中心也很重要?!?/p>

能源效率比以往任何時(shí)候都更受關(guān)注,黃仁勛說,他們最近評(píng)測過的AMD EPYC Genoa和英特爾的Sapphire Rapids等芯片的功率現(xiàn)在分別達(dá)到400瓦和350瓦。這需要特殊的新空氣冷卻解決方案來控制標(biāo)準(zhǔn)設(shè)置下的巨大功耗,并為達(dá)到芯片的最高性能提供液體冷卻。

相比之下,Grace的低功耗將使芯片更容易冷卻。正如GTC大會(huì)上首次展示的那樣,英偉達(dá)的144核Grace封裝為5英寸x8英寸,可以裝入體積非常小的被動(dòng)冷卻模塊中。這些模塊仍然依靠空氣冷卻,但兩個(gè)模塊可以在單個(gè)超薄的1U機(jī)箱中進(jìn)行空氣冷卻。

四、同時(shí)嵌入CPU、GPU,芯片間互聯(lián)速度快7倍

英偉達(dá)還在GTC大會(huì)上首次展示了其Grace Hopper 超級(jí)芯片。Superchip在同一個(gè)封裝上結(jié)合了Grace CPU和Hopper GPU,這兩個(gè)模塊就可以裝入一個(gè)服務(wù)器機(jī)箱中。

▲Grace Hopper(圖源:Tom’s Hardware)

這種設(shè)計(jì)的最大優(yōu)勢是使CPU與GPU的結(jié)合更連貫協(xié)調(diào),提供更低延遲的芯片與芯片之間的連接,其接口速度是PCIe接口的七倍,之前的設(shè)計(jì)無法實(shí)現(xiàn)速度和效率兼顧以共享內(nèi)存中保存的信息,而現(xiàn)在CPU與GPU的結(jié)合成功解決了這一問題。

黃仁勛解釋說,這種方法非常適合人工智能、數(shù)據(jù)庫、推薦系統(tǒng)和大型語言模型(LLM),所有這些對(duì)這項(xiàng)具有新設(shè)計(jì)的芯片都有著巨大的需求。采用新設(shè)計(jì)的Grace芯片通過允許GPU直接訪問CPU的內(nèi)存,簡化了數(shù)據(jù)傳輸以提高性能。

英偉達(dá)的Grace芯片可能有點(diǎn)落后于其此前制定的發(fā)布計(jì)劃,由于芯片制造商和原始設(shè)備制造商(OEM)在供應(yīng)鏈中的關(guān)系,芯片制造商設(shè)計(jì)芯片并將設(shè)計(jì)方案交付給OEM,英偉達(dá)和華碩、Atos、技嘉、HPE、Supermicro、QCT、Wiston和Zt密切合作,這些合作伙伴都在為市場準(zhǔn)備OEM系統(tǒng),OEM系統(tǒng)現(xiàn)在預(yù)計(jì)將在今年下半年推出,但英偉達(dá)尚未說明給到這些合作伙伴芯片的確切時(shí)間。

結(jié)語:Grace芯片性能優(yōu)勢顯著,推遲發(fā)布影響較小

各大芯片公司新芯片的研發(fā)通常需要較長的時(shí)間周期,再加上運(yùn)輸鏈和設(shè)計(jì)難度的影響,這些公司往往會(huì)被迫推遲芯片發(fā)布時(shí)間。對(duì)英偉達(dá)此次基于Arm架構(gòu)的Grace芯片發(fā)布延遲,黃仁勛依舊持樂觀態(tài)度,對(duì)外只是戲稱“硅”正在工廠“起飛”,預(yù)計(jì)今年下半年正式推出Grace芯片。

據(jù)黃仁勛介紹,此次Grace芯片僅在60%的低能耗下,速度就能簡單超越下一代x86芯片。同時(shí),Grace的低功耗將使芯片更容易冷卻。Grace CPU和Hopper GPU的新設(shè)計(jì)可以實(shí)現(xiàn)共享內(nèi)存中保存的信息,增強(qiáng)了CPU+GPU內(nèi)存一致性。相比市面上現(xiàn)有的芯片,英偉達(dá)的Grace芯片性能優(yōu)勢明顯,盡管此次新芯片延遲發(fā)貨,但對(duì)英偉達(dá)影響似乎并不大,我們拭目以待下半年Grace芯片發(fā)布。

來源:Tom’s Hardware

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。