人妻无码高清在线播放,亚洲男同帅gay片在线观看,亚洲AⅤ无码中文字幕

編譯|段祎

編輯|Panken

芯東西3月23日消息，據(jù)Tom’s Hardware報(bào)道，近日，美國(guó)人工智能訓(xùn)練芯片巨頭英偉達(dá)CEO黃仁勛在GTC大會(huì)上就其即將推出的基于Arm架構(gòu)的Grace CPU延遲發(fā)貨一事向Tom’s Hardware的記者Paul Alcorn做出了解釋?zhuān)Q芯片延遲發(fā)布是正常情況，且由于此次研制的Grace芯片添加了許多創(chuàng)新設(shè)計(jì)，工作量增大，相應(yīng)的制造時(shí)間有所延長(zhǎng)。

在本周二的GTC大會(huì)上，黃仁勛首次展示了基于Arm架構(gòu)的Grace芯片，該芯片在僅使用60%的功率下比基于x86架構(gòu)的芯片快1.3倍。并且Grace CPU和Hopper GPU的新設(shè)計(jì)可以讓芯片實(shí)現(xiàn)速度和效率兼顧的共享內(nèi)存中保存的信息，同時(shí)速度是PCIe接口的七倍。

一、推遲發(fā)布是正常現(xiàn)象，基于Arm架構(gòu)帶來(lái)更大工作量

談及Grace CPU和Grace Hopper Superchip系統(tǒng)延遲交付終端市場(chǎng)的問(wèn)題。他解釋道：“Grace和Grace Hopper都在生產(chǎn)中，‘硅片現(xiàn)在正在工廠里飛來(lái)飛去’。系統(tǒng)正在制作中，我們發(fā)布了很多公告。世界上的原始設(shè)備制造商（OEM）和計(jì)算機(jī)制造商正在構(gòu)建它們?！秉S仁勛還說(shuō)，英偉達(dá)只用了兩年的時(shí)間來(lái)開(kāi)發(fā)芯片，考慮到現(xiàn)代芯片通常需要多年的設(shè)計(jì)周期，這個(gè)時(shí)間相對(duì)較短。

▲Grace CPU（圖源：Tom’s Hardware）

此前，美國(guó)芯片制造巨頭AMD和英特爾開(kāi)發(fā)的CPU在芯片量產(chǎn)上市前就會(huì)被部署到超大規(guī)模計(jì)算的設(shè)備上，不過(guò)，目前英偉達(dá)Grace芯片是否已經(jīng)提供給客戶使用還是未知的，黃仁勛透露他們正在向客戶提供芯片樣品。

一般而言，像英特爾這樣的企業(yè)，也經(jīng)常會(huì)延遲推出芯片，即便是基于其幾十年來(lái)成熟的在硬件和軟件平臺(tái)占主導(dǎo)地位的x86架構(gòu)構(gòu)建芯片，推出新芯片的難度也并不小。

相比之下，英偉達(dá)的Grace和Grace Hopper芯片在芯片設(shè)計(jì)方面注入了許多的全新思考，它采用了創(chuàng)新的芯片間互連技術(shù)。英偉達(dá)使用Arm指令集也意味著軟件優(yōu)化和遷移的工作更重，該公司需要構(gòu)建一個(gè)全新的平臺(tái)來(lái)生產(chǎn)該芯片。

二、Grace芯片消耗60%功率，數(shù)據(jù)處理速度快一倍多

黃仁勛在他的其余回應(yīng)中提到了關(guān)于芯片設(shè)計(jì)思考的一些內(nèi)容，他說(shuō)：“我們從Superchips（超級(jí)芯片）而不是chiplet（小芯片）開(kāi)始，是因?yàn)槲覀兿胍獦?gòu)建的東西很大，不過(guò)這兩種產(chǎn)品現(xiàn)在都在生產(chǎn)中。英偉達(dá)正在做很多測(cè)試，軟件也正在被遷移到芯片，同時(shí)英偉達(dá)向客戶提供芯片樣品。在會(huì)上，我用確切的數(shù)字展示了Grace芯片的各大性能優(yōu)勢(shì)，但我不想堆砌數(shù)字來(lái)增加演講的負(fù)擔(dān)，但芯片的性能真的非常棒。”

在問(wèn)答環(huán)節(jié)中，黃仁勛聲稱該芯片在HiBench Apache Spark內(nèi)存密集型基準(zhǔn)測(cè)試中比下一代x86服務(wù)器芯片數(shù)據(jù)處理速度快1.2倍，在谷歌微服務(wù)通信基準(zhǔn)測(cè)試（Google microservices communication benchmark）中快1.3倍，同時(shí)只消耗了60%功率。

他說(shuō)這允許數(shù)據(jù)中心將1.7倍以上數(shù)量的Grace芯片部署到功率受限的裝置中，每臺(tái)服務(wù)器的吞吐量提高了25%。他還說(shuō)Grace在計(jì)算流體動(dòng)力學(xué) （CFD）工作負(fù)載方面的速度提高了1.9倍。

三、為云計(jì)算、AI定制芯片，兼具低功耗、高性能

Grace芯片在某些應(yīng)用場(chǎng)景中雖然表現(xiàn)出超強(qiáng)的性能和效率，但英偉達(dá)并沒(méi)有計(jì)劃將它們定位到通用服務(wù)器市場(chǎng)。該公司針對(duì)特定使用場(chǎng)景定制了芯片，例如人工智能和云計(jì)算場(chǎng)景，這些場(chǎng)景需要支持卓越的單線程和內(nèi)存處理性能以及出色的能效。

黃仁勛告訴說(shuō)：“現(xiàn)在幾乎每個(gè)數(shù)據(jù)中心都受到功率限制，我們?cè)O(shè)計(jì)的Grace在功率受限的環(huán)境中表現(xiàn)出色”，“在那種情況下，你必須既有非常高的性能，又必須有非常低的功率，而且效率也要非常高。因此，與最新一代CPU相比，Grace系統(tǒng)的功率/性能效率大約高其兩倍?！?/p>

▲相同功耗下，英偉達(dá)Grace CPU性能比較圖（圖源：Tom’s Hardware）

“而且它是針對(duì)不同的場(chǎng)景而設(shè)計(jì)的，所以這是非常好理解的?！秉S仁勛繼續(xù)說(shuō)道，“例如，我剛才描述的內(nèi)容對(duì)大多數(shù)企業(yè)來(lái)說(shuō)并不重要。但它對(duì)提供云服務(wù)的企業(yè)來(lái)說(shuō)很重要，對(duì)電力消耗大的數(shù)據(jù)中心也很重要。”

能源效率比以往任何時(shí)候都更受關(guān)注，黃仁勛說(shuō)，他們最近評(píng)測(cè)過(guò)的AMD EPYC Genoa和英特爾的Sapphire Rapids等芯片的功率現(xiàn)在分別達(dá)到400瓦和350瓦。這需要特殊的新空氣冷卻解決方案來(lái)控制標(biāo)準(zhǔn)設(shè)置下的巨大功耗，并為達(dá)到芯片的最高性能提供液體冷卻。

相比之下，Grace的低功耗將使芯片更容易冷卻。正如GTC大會(huì)上首次展示的那樣，英偉達(dá)的144核Grace封裝為5英寸x8英寸，可以裝入體積非常小的被動(dòng)冷卻模塊中。這些模塊仍然依靠空氣冷卻，但兩個(gè)模塊可以在單個(gè)超薄的1U機(jī)箱中進(jìn)行空氣冷卻。

四、同時(shí)嵌入CPU、GPU，芯片間互聯(lián)速度快7倍

英偉達(dá)還在GTC大會(huì)上首次展示了其Grace Hopper 超級(jí)芯片。Superchip在同一個(gè)封裝上結(jié)合了Grace CPU和Hopper GPU，這兩個(gè)模塊就可以裝入一個(gè)服務(wù)器機(jī)箱中。

▲Grace Hopper（圖源：Tom’s Hardware）

這種設(shè)計(jì)的最大優(yōu)勢(shì)是使CPU與GPU的結(jié)合更連貫協(xié)調(diào)，提供更低延遲的芯片與芯片之間的連接，其接口速度是PCIe接口的七倍，之前的設(shè)計(jì)無(wú)法實(shí)現(xiàn)速度和效率兼顧以共享內(nèi)存中保存的信息，而現(xiàn)在CPU與GPU的結(jié)合成功解決了這一問(wèn)題。

黃仁勛解釋說(shuō)，這種方法非常適合人工智能、數(shù)據(jù)庫(kù)、推薦系統(tǒng)和大型語(yǔ)言模型（LLM），所有這些對(duì)這項(xiàng)具有新設(shè)計(jì)的芯片都有著巨大的需求。采用新設(shè)計(jì)的Grace芯片通過(guò)允許GPU直接訪問(wèn)CPU的內(nèi)存，簡(jiǎn)化了數(shù)據(jù)傳輸以提高性能。

英偉達(dá)的Grace芯片可能有點(diǎn)落后于其此前制定的發(fā)布計(jì)劃，由于芯片制造商和原始設(shè)備制造商（OEM）在供應(yīng)鏈中的關(guān)系，芯片制造商設(shè)計(jì)芯片并將設(shè)計(jì)方案交付給OEM，英偉達(dá)和華碩、Atos、技嘉、HPE、Supermicro、QCT、Wiston和Zt密切合作，這些合作伙伴都在為市場(chǎng)準(zhǔn)備OEM系統(tǒng)，OEM系統(tǒng)現(xiàn)在預(yù)計(jì)將在今年下半年推出，但英偉達(dá)尚未說(shuō)明給到這些合作伙伴芯片的確切時(shí)間。

結(jié)語(yǔ)：Grace芯片性能優(yōu)勢(shì)顯著，推遲發(fā)布影響較小

各大芯片公司新芯片的研發(fā)通常需要較長(zhǎng)的時(shí)間周期，再加上運(yùn)輸鏈和設(shè)計(jì)難度的影響，這些公司往往會(huì)被迫推遲芯片發(fā)布時(shí)間。對(duì)英偉達(dá)此次基于Arm架構(gòu)的Grace芯片發(fā)布延遲，黃仁勛依舊持樂(lè)觀態(tài)度，對(duì)外只是戲稱“硅”正在工廠“起飛”，預(yù)計(jì)今年下半年正式推出Grace芯片。

據(jù)黃仁勛介紹，此次Grace芯片僅在60%的低能耗下，速度就能簡(jiǎn)單超越下一代x86芯片。同時(shí)，Grace的低功耗將使芯片更容易冷卻。Grace CPU和Hopper GPU的新設(shè)計(jì)可以實(shí)現(xiàn)共享內(nèi)存中保存的信息，增強(qiáng)了CPU+GPU內(nèi)存一致性。相比市面上現(xiàn)有的芯片，英偉達(dá)的Grace芯片性能優(yōu)勢(shì)明顯，盡管此次新芯片延遲發(fā)貨，但對(duì)英偉達(dá)影響似乎并不大，我們拭目以待下半年Grace芯片發(fā)布。

來(lái)源：Tom’s Hardware

編譯|段祎

編輯|Panken

一、推遲發(fā)布是正?，F(xiàn)象，基于Arm架構(gòu)帶來(lái)更大工作量

▲Grace CPU（圖源：Tom’s Hardware）

二、Grace芯片消耗60%功率，數(shù)據(jù)處理速度快一倍多

三、為云計(jì)算、AI定制芯片，兼具低功耗、高性能

▲相同功耗下，英偉達(dá)Grace CPU性能比較圖（圖源：Tom’s Hardware）

四、同時(shí)嵌入CPU、GPU，芯片間互聯(lián)速度快7倍

▲Grace Hopper（圖源：Tom’s Hardware）

結(jié)語(yǔ)：Grace芯片性能優(yōu)勢(shì)顯著，推遲發(fā)布影響較小

來(lái)源：Tom’s Hardware

歷史搜索全部刪除

熱門(mén)搜索

Grace CPU推遲至下半年發(fā)布，60%功率下性能提升1.3倍

一、推遲發(fā)布是正常現(xiàn)象，基于Arm架構(gòu)帶來(lái)更大工作量

二、Grace芯片消耗60%功率，數(shù)據(jù)處理速度快一倍多

三、為云計(jì)算、AI定制芯片，兼具低功耗、高性能

四、同時(shí)嵌入CPU、GPU，芯片間互聯(lián)速度快7倍

結(jié)語(yǔ)：Grace芯片性能優(yōu)勢(shì)顯著，推遲發(fā)布影響較小

英偉達(dá)

評(píng)論

Grace CPU推遲至下半年發(fā)布，60%功率下性能提升1.3倍

一、推遲發(fā)布是正?，F(xiàn)象，基于Arm架構(gòu)帶來(lái)更大工作量

二、Grace芯片消耗60%功率，數(shù)據(jù)處理速度快一倍多

三、為云計(jì)算、AI定制芯片，兼具低功耗、高性能

四、同時(shí)嵌入CPU、GPU，芯片間互聯(lián)速度快7倍

結(jié)語(yǔ)：Grace芯片性能優(yōu)勢(shì)顯著，推遲發(fā)布影響較小

Grace CPU推遲至下半年發(fā)布，60%功率下性能提升1.3倍

一、推遲發(fā)布是正常現(xiàn)象，基于Arm架構(gòu)帶來(lái)更大工作量

二、Grace芯片消耗60%功率，數(shù)據(jù)處理速度快一倍多

三、為云計(jì)算、AI定制芯片，兼具低功耗、高性能

四、同時(shí)嵌入CPU、GPU，芯片間互聯(lián)速度快7倍

結(jié)語(yǔ)：Grace芯片性能優(yōu)勢(shì)顯著，推遲發(fā)布影響較小

英偉達(dá)

評(píng)論

Grace CPU推遲至下半年發(fā)布，60%功率下性能提升1.3倍

一、推遲發(fā)布是正?，F(xiàn)象，基于Arm架構(gòu)帶來(lái)更大工作量

二、Grace芯片消耗60%功率，數(shù)據(jù)處理速度快一倍多

三、為云計(jì)算、AI定制芯片，兼具低功耗、高性能

四、同時(shí)嵌入CPU、GPU，芯片間互聯(lián)速度快7倍

結(jié)語(yǔ)：Grace芯片性能優(yōu)勢(shì)顯著，推遲發(fā)布影響較小

Grace CPU推遲至下半年發(fā)布，60%功率下性能提升1.3倍

一、推遲發(fā)布是正常現(xiàn)象，基于Arm架構(gòu)帶來(lái)更大工作量

二、Grace芯片消耗60%功率，數(shù)據(jù)處理速度快一倍多

三、為云計(jì)算、AI定制芯片，兼具低功耗、高性能

四、同時(shí)嵌入CPU、GPU，芯片間互聯(lián)速度快7倍

結(jié)語(yǔ)：Grace芯片性能優(yōu)勢(shì)顯著，推遲發(fā)布影響較小

一、推遲發(fā)布是正?，F(xiàn)象，基于Arm架構(gòu)帶來(lái)更大工作量

二、Grace芯片消耗60%功率，數(shù)據(jù)處理速度快一倍多

三、為云計(jì)算、AI定制芯片，兼具低功耗、高性能

四、同時(shí)嵌入CPU、GPU，芯片間互聯(lián)速度快7倍

結(jié)語(yǔ)：Grace芯片性能優(yōu)勢(shì)顯著，推遲發(fā)布影響較小