編譯|ZeR0
編輯|漠影
今夜凌晨,蘋果又開了一場“芯片上”的發(fā)布會!
意料之內(nèi),芯片再次成為蘋果春季新品發(fā)布中最亮眼的存在;意料之外,傳聞已久的M2芯片沒有登場,反而是M1系列推出旗艦版M1 Ultra,以將兩塊M1芯片“粘”在一起的設(shè)計思路,震驚全場。
作為M1系列Mac電腦芯片的第四彈,M1 Ultra成為了蘋果電腦芯片的終極武器。蘋果通過一個三步走的策略,幾近完成Mac兩年換芯的大計,而且?guī)缀趺看味荚凇案煞弊约?,也幾乎每次都在“教”芯片同行做事?/p>
1140億顆晶體管、20核CPU、最高64核GPU、32核神經(jīng)網(wǎng)絡(luò)引擎、2.5TB/s數(shù)據(jù)傳輸速率、800GB/s內(nèi)存帶寬、最高128GB統(tǒng)一內(nèi)存……這些堪稱恐怖的規(guī)格全部集聚于一塊“至尊版”電腦芯片上。
至此,蘋果在M1系列電腦芯片棋局上的落子,得以清晰而完整的展現(xiàn)。
▲蘋果M1系列四大芯片,從左至右:M1、M1 Pro、M1 Max、M1 Ultra
好馬配好鞍,M1 Ultra芯片被搭載于單臺3萬元起售的臺式機(jī)主機(jī)Mac Studio上,號稱比最快的iMac性能最高提升3.4倍,比頂配Mac Pro性能提升80%。
這是蘋果繼早前圓柱形“垃圾桶”式外形、長方形機(jī)箱式外形后,對專業(yè)級桌面主機(jī)形態(tài)的又一次嘗試。雖然外形第一眼看起來像一個加厚版的Mac mini,但其內(nèi)里從結(jié)構(gòu)到配置則完全不同。
▲Mac Studio
除了首次在頂級專業(yè)臺式Mac中采用自研M1系列芯片外,蘋果還第一次往顯示器新品Studio Display里塞了一顆A13仿生芯片,A13之前被用在2019年iPhone 11系列智能手機(jī)、2021年入門級iPad 9中。
而加入手機(jī)SoC級別的芯片,用來強(qiáng)化攝像頭和音箱功能,也是蘋果的顯示器形態(tài)的一次新嘗試。不過目前蘋果專業(yè)顯示器的天花板仍然是那臺售價超4萬元的XDR 6K專業(yè)顯示器。
▲Studio Display(圖左)和Mac Studio(圖右)
Mac Studio主機(jī)和Studio Display顯示器都從3月10日9點(diǎn)起預(yù)購,主機(jī)3月18日發(fā)售,顯示器則要等獲批后發(fā)售。
此外,新款iPad Air 5首次搭載與iPad Pro同款的M1芯片,第三代iPhone SE智能手機(jī)也換上了與最新iPhone 13系列同款的A15仿生芯片,兩款新品將從3月11日21點(diǎn)起預(yù)購,3月18日發(fā)售。
蘋果Mac換芯的策略是什么?這個性能突破天際的電腦芯片解決了哪些核心難題?下面,芯東西將著重復(fù)盤和解讀這背后的技術(shù)邏輯。
01.M1 Max + M1 Max = M1 Ultra
從2020年6月宣布Mac換芯計劃,并在當(dāng)年11月首推電腦芯片M1,到現(xiàn)在不到兩年的時間,蘋果已接近完成既定的“兩年芯片過渡計劃”,只差最后一款Mac Pro。
去年蘋果推出性能爆棚的M1 Max芯片時,大家普遍以為這已經(jīng)是M1系列芯片的封頂之作,畢竟M1 Max芯片已經(jīng)觸及臺積電N5制程可制造的極限,面積達(dá)到432mm2。
結(jié)果,蘋果這次直接掀翻了臺式機(jī)芯片的天花板,亮出M1系列的真正收官之作——M1 Ultra。
據(jù)芯東西得知,M1 Ultra就是蘋果M1系列的最后一顆芯片,不會有第五顆了。而且從一開始,蘋果就有清晰計劃要分為三個階段來將M1用到Mac產(chǎn)品:第一階段,進(jìn)入到普及性的Mac,包括MacBook Air、Mac Mini乃至入門版MacBook Pro;第二階段,來到更高階的MacBook Pro;第三階段,進(jìn)入專業(yè)級臺式機(jī)主機(jī),將桌面電腦性能推升到一個新的高度。
M1 Ultra采用臺積電5nm工藝,由兩塊M1 Max芯片拼接而成,這樣的“組合”使得其晶體管數(shù)量達(dá)到1140億顆,這也是蘋果自研芯片的晶體管數(shù)量首次突破1000億顆。
該芯片的各項硬件指標(biāo)也翻番:20核CPU包含16個高性能核心、4個高能效核心;GPU核心數(shù)量增至64核;32核神經(jīng)網(wǎng)絡(luò)引擎能夠帶來每秒22萬億次的運(yùn)算能力;統(tǒng)一內(nèi)存最高規(guī)格達(dá)到128GB;內(nèi)存帶寬提升至800GB/s,達(dá)到最新型號臺式PC芯片的10倍以上。同時,M1 Ultra最高支持8TB的SSD固態(tài)硬盤存儲。
尤其是多die(Multi-die)GPU配置,可以說是做了大膽而驚人的設(shè)計,這里的核心難度在于高端部件通常消耗的內(nèi)部帶寬過高,超過1TB/s,致使將它們連接起來在技術(shù)上很難實現(xiàn)。
像之前Mac Pro中用的傳統(tǒng)多GPU系統(tǒng),每個GPU都是獨(dú)立的。因為帶寬不夠,多個GPU難以在單個圖形任務(wù)上進(jìn)行有效地協(xié)同。但如果能通過某種方式將多個GPU借助die-to-die技術(shù)連接起來,就可能在一個任務(wù)中同時使用它們。
這是多家芯片公司都在研究的問題,目前看來,蘋果似乎成為了第一家實現(xiàn)目標(biāo)的公司。
在介紹M1 Ultra前,蘋果高管也就兩塊芯片“粘”在一起的難點(diǎn)賣了個關(guān)子,他說直接采用兩塊芯片來增加芯片核心面積的方式很常見,但以前這種做法會增加功耗、拖慢傳輸速率,給開發(fā)者增加負(fù)擔(dān)。
那么蘋果怎么做呢?
今天,蘋果揭曉了其秘密武器——UltraFusion。
在對M1 Ultra做規(guī)劃時,蘋果考慮到對統(tǒng)一內(nèi)存的擴(kuò)充,重點(diǎn)思考了延遲、帶寬、功耗和性能等指標(biāo),選擇采用了融合拼接的方式,并與合作伙伴(芯片代工制造方)進(jìn)行了非常密切的合作,來實現(xiàn)UltraFusion技術(shù)的應(yīng)用。
這里涉及復(fù)雜的技術(shù)難關(guān),比如,為了做到統(tǒng)一的架構(gòu),上面和下面的芯片延遲需相同,CPU看到的必須是一致的。蘋果要求其延遲不要超過一般的延遲,對性能的影響不到10%。
此前M1系列芯片一直采用蘋果自己定制的封裝方式來實現(xiàn)高速統(tǒng)一內(nèi)存架構(gòu),而UltraFusion作為蘋果創(chuàng)新定制的多晶粒架構(gòu),是2.5D先進(jìn)封裝的一個最新例子。
其基本原理應(yīng)該是某種硅中介層(interposer)被鋪在兩個M1 Max芯片下面,兩個芯片之間的信號可以通過硅中介層的布線。這使得M1 Ultra芯片可同時傳輸超過10000個信號,其連接密度是現(xiàn)有技術(shù)的兩倍,實現(xiàn)高達(dá)2.5TB/s低延遲處理器間帶寬,比業(yè)內(nèi)高端多芯片帶寬的4倍還多。
這意味著,M1 Ultra芯片雖然是兩個芯片的組合體,但在工作時會表現(xiàn)出一枚芯片的整體性,被所有軟件識別為一枚完整芯片,開發(fā)者無需重寫代碼就能直接運(yùn)用它的強(qiáng)大性能。
可以說,史無前例。
總而言之,借助UltraFusion架構(gòu),蘋果成為第一家將兩個GPU拼在一起而且實現(xiàn)2.5TB/秒超高傳輸速率的芯片供應(yīng)商。
蘋果這些不按常理出牌的做法,背后其實是一種以解決問題為第一目的實用主義原則在做指導(dǎo),比如他們把這個“粘接融合多個芯片”的UltraFusion架構(gòu)沒有當(dāng)做一個標(biāo)準(zhǔn)接口,只是他們?yōu)榱藢崿F(xiàn)M1 Ultra性能功耗目標(biāo)的一個工具,而如果后面遇到更大的挑戰(zhàn),說不定還有整出怎樣更腦洞大開的“工具”。
除了這些以外,M1 Ultra內(nèi)還集成了多種定制的蘋果技術(shù),如能夠同時驅(qū)動多臺外接顯示器的顯示引擎、雷電4控制器集成、同類最佳的安全技術(shù),包括蘋果最新的安全隔區(qū)、基于認(rèn)證硬件的安全啟動和運(yùn)行時防漏洞利用技術(shù)。
02.性能實測:GPU功耗遠(yuǎn)低于英偉達(dá)3090
蘋果在特定電腦系統(tǒng)上進(jìn)行了性能測試,大致可以反映Mac Studio、Mac Pro和iMac的性能對比。
參與測試的Mac Studio系統(tǒng)配置為M1 Ultra芯片、128GB RAM、8TB 固態(tài)硬盤,Mac Pro系統(tǒng)配備了3.2GHz 16核英特爾Xeon W處理器、192GB RAM、4TB固態(tài)硬盤,27英寸iMac系統(tǒng)配備了3.6GHz 10核英特爾Core i9 處理器、128GB RAM、8TB固態(tài)硬盤。
根據(jù)蘋果提供的數(shù)據(jù),在相同功耗下,M1 Ultra處理多線程任務(wù)的速度比16核英特爾旗艦至強(qiáng)i9-12900K提升了90%;實現(xiàn)同樣性能時,M1 Ultra的功耗比12900K少100W。
這里需注意的是,在多線程工作負(fù)載方面,蘋果可以說一直都是頂級守擂者,但其在單線程方面有點(diǎn)擠牙膏,高性能核心已經(jīng)被英特爾新架構(gòu)超越。
GPU方面尤其值得一提。
蘋果聲稱實現(xiàn)同樣的性能,M1 Ultra的功耗只有主流獨(dú)立GPU的1/3,或比最強(qiáng)顯卡英偉達(dá)GeForce RTX 3090少200W。
當(dāng)然,考慮到蘋果M1 Ultra采用的是臺積電5nm工藝,而英偉達(dá)3090采用的是三星8nm工藝,這里制造工藝的升級貢獻(xiàn)了一部分能效的提升。
相比27英寸iMac中的AMD Radeon Pro 5700XT獨(dú)立顯卡,M1 Ultra的GPU性能提升高達(dá)4.5倍,甚至比起Mac Pro中的AMD Radeon Pro W6900X,性能提升幅度也達(dá)到了80%。下圖是蘋果關(guān)于8K渲染速度提升情況的測試結(jié)果。
M1 Ultra的媒體處理引擎資源同樣翻倍,其處理 ProRes格式視頻編解碼任務(wù)的吞吐能力提升至史上最高,最多可同時播放18條8K ProRes 422格式的視頻流。
03.將A13仿生芯片塞入顯示器
為了配合Mac Studio主機(jī),蘋果還推出了一款分辨率達(dá)5K級別的新顯示器產(chǎn)品Studio Display。
這款顯示器首次內(nèi)置了蘋果的自研旗艦手機(jī)芯片A13,用于優(yōu)化視頻人物居中、空間音頻和“嘿 Siri”等功能的處理能力。
同時,新款iPhone SE用上和iPhone 13系列同款的A15仿生芯片,有6核CPU和4核GPU,CPU性能比iPhone 8提升1.8倍,GPU處理速度比二代SE最高提升1.2倍,神經(jīng)網(wǎng)絡(luò)處理能力提升26倍。
iPad Air 5亦換上與iPad Pro同款的M1芯片,相比上代A14性能提升達(dá)到了60%,8核圖形處理器最高提速至2倍,16核神經(jīng)網(wǎng)絡(luò)引擎也讓機(jī)器學(xué)習(xí)性能大幅提升。
當(dāng)然,軟硬件協(xié)同是蘋果產(chǎn)品體驗的一貫優(yōu)勢,macOS系統(tǒng)和各款專業(yè)App已為蘋果M1系列芯片優(yōu)化,能夠充分利用M1 Ultra的性能。
面向碳中和,蘋果稱其定制芯片的出色能效幫助 Mac Studio在整個產(chǎn)品生命周期內(nèi)消耗更少電力,并稱Mac Studio在一整年里所消耗的電力比起一臺高端配置的臺式PC可節(jié)省最高達(dá)1000千瓦時。
蘋果目前在全球公司運(yùn)營方面已實現(xiàn)碳中和,計劃在2030年年底前讓全部公司業(yè)務(wù)實現(xiàn)碳中和,包括制造供應(yīng)鏈和所有產(chǎn)品生命周期在內(nèi)。這意味著蘋果所生產(chǎn)的每一枚芯片,從設(shè)計到制造,都將實現(xiàn)100%碳中和。
04.結(jié)語:蘋果芯,干翻自己!
如今,蘋果已經(jīng)在幾乎所有的Mac產(chǎn)品線中全面應(yīng)用了其自研芯片。
今天蘋果的推出M1 Ultra芯片,雖說與此前盛傳的M2芯片不符,但其直接將兩塊GPU連在一起的設(shè)計思路,乍一看有些出乎意料,但細(xì)想其實是非常合理的進(jìn)化方向。
決心在自研電腦芯片上一往無前后,蘋果每一次推出的M1系列芯片新品類都是各種先進(jìn)技術(shù)的集大成者,并且每一次都創(chuàng)造了一個新的芯片設(shè)計高地,誰能想到當(dāng)初驚艷登場的M1芯片,如今竟成了M1系列中最低配的存在呢?
在單個芯片觸達(dá)實際尺寸極限后,蘋果開始走堆料路線,并通過創(chuàng)新架構(gòu)將多個芯片封在一起,實現(xiàn)更強(qiáng)悍的性能效果。理論上,三個乃至更多芯片的組合,也是可以實現(xiàn)的,不過據(jù)芯東西了解,蘋果暫無這么做的興趣。
至于M1芯片終極版本究竟能在實際產(chǎn)品中發(fā)揮出怎樣的水準(zhǔn)?我們非常期待看到它在后續(xù)實測的表現(xiàn)。