文|半導(dǎo)體產(chǎn)業(yè)縱橫
近些年,以CPU和GPU為代表的處理器在應(yīng)用需求的推動(dòng)下,相關(guān)的設(shè)計(jì)、制造和封裝等技術(shù)都在發(fā)展變化當(dāng)中。封裝方面,雖然當(dāng)下的3D技術(shù)很熱,但對(duì)于絕大多數(shù)處理器來說,2D和2.5D封裝技術(shù)仍是主流,而傳統(tǒng)的MCM(Multi-Chip-Module,多芯片模塊)煥發(fā)了第二春,各大CPU和GPU廠商都在大規(guī)模部署采用這種封裝技術(shù)的產(chǎn)品。
MCM是一種由兩個(gè)及以上Die,或者芯片尺寸封裝(CSP)的IC組裝在一個(gè)基板上的模塊,形成一個(gè)電子系統(tǒng)或子系統(tǒng),基板可以是PCB、陶瓷或硅片。整個(gè)MCM可以封裝在基板上,也可以封裝在封裝體內(nèi)。MCM可以是便于安裝在電路板上的標(biāo)準(zhǔn)化封裝,也可以是一個(gè)具備電子功能的模塊,它們都可直接安裝到電子系統(tǒng)中(PC、儀器、機(jī)械設(shè)備等)。
MCM可分為以下三種基本類型:
MCM-L:是采用片狀多層基板的MCM,MCM-L是高密度封裝的PCB技術(shù),適用于采用鍵合和FC工藝的MCM。MCM-L不適用于有長期可靠性要求和使用環(huán)境溫差大的場(chǎng)合。
MCM-C:是采用多層陶瓷基板的MCM,適于模擬電路、數(shù)字電路、混合電路、微波器件等多種應(yīng)用。
MCM-D:是采用薄膜技術(shù)的MCM,MCM-D的基板由多層介質(zhì)、金屬層和基材組成。介質(zhì)層要求薄,金屬互連要細(xì)小,同時(shí)具備適當(dāng)?shù)幕ミB阻抗。
MCM封裝的優(yōu)點(diǎn)可以概括為以下三點(diǎn):1、可大幅提高電路連線密度,提升封裝效率;2、可完成“輕、薄、短、小”的封裝設(shè)計(jì);3、可提升封裝的可靠性。
近些年,SiP封裝技術(shù)深入產(chǎn)業(yè)人心,那么,MCM與它相比如何呢?實(shí)際上,芯片封裝技術(shù)的發(fā)展是不斷進(jìn)步和創(chuàng)新的過程,是對(duì)原有技術(shù)的整理、迭代、創(chuàng)新和再發(fā)展,MCM和SiP也是如此。MCM是在各種高密度多層基板上封裝,主體是Die,制成部件的電路一般較為復(fù)雜,因此,MCM是一種高級(jí)混合集成技術(shù)。SIP的市場(chǎng)規(guī)模和增長空間比MCM大,SIP是MCM進(jìn)一步發(fā)展的產(chǎn)物,是芯片和元器件在不同工作頻段的高密度組裝和互連。MCM主要通過將各種Die堆疊連接,元器件較少,通常以數(shù)字芯片、存儲(chǔ)器為主,而SIP可封裝不同制程工藝、不同功能的芯片,芯片之間可進(jìn)行信號(hào)的存取和交換,從而實(shí)現(xiàn)一個(gè)系統(tǒng)目標(biāo)產(chǎn)品的全部互連、功能和性能。
可見,相對(duì)而言,SiP比MCM先進(jìn),但這并不影響后者被越來越多的CPU和GPU廠商采用。因此,成熟的技術(shù)并不一定不如先進(jìn)技術(shù),這與近些年成熟制程節(jié)點(diǎn)技術(shù)火爆,產(chǎn)能供不應(yīng)求的局面有異曲同工之妙。
MCM CPU大行其道
對(duì)于CPU而言,MCM并不是新技術(shù),早在1995年,英特爾推出Pentium Pro時(shí),就曾采用MCM封裝技術(shù),用以提升處理器執(zhí)行效能。2005年,發(fā)布新款Pentium D和Xeon 5000系列CPU時(shí),也都采用了MCM封裝技術(shù),當(dāng)時(shí)是業(yè)界首款雙核CPU。
不過,過去十幾年,主流多核CPU更多采用原生多核設(shè)計(jì),直到近幾年,原生多核設(shè)計(jì)CPU的核心數(shù)量很難有更高增長,使得MCM封裝技術(shù)重新嶄露頭角。
目前來看,越來越多新一代多核CPU開始采用MCM封裝。2018年前后,AMD在設(shè)計(jì)64核服務(wù)器CPU時(shí),就采用了該技術(shù)。AMD的這一設(shè)計(jì)是領(lǐng)先英特爾的,價(jià)格只是競(jìng)爭(zhēng)對(duì)手Xeon處理器的一半,而且還更省電。做到這一點(diǎn),是因?yàn)锳MD采取了“老設(shè)計(jì),新制程”策略,“老設(shè)計(jì)”就是已經(jīng)很成熟的MCM封裝技術(shù),“新制程”則是采用當(dāng)時(shí)最先進(jìn)的7nm制程,以提高核心密度。近兩年,AMD將該思路進(jìn)一步拓展,也就是當(dāng)下最為火爆的Chiplet及其封裝技術(shù)。
對(duì)于CPU,特別是服務(wù)器CPU廠商來說,多核產(chǎn)品已經(jīng)是標(biāo)配,因?yàn)樗粌H功耗更低,良率也能提高不少。采用MCM封裝設(shè)計(jì),廠商在設(shè)計(jì)多核CPU時(shí),不用非要將所有核都放入單一晶粒,而是可以設(shè)計(jì)成多晶粒架構(gòu),也就是將一個(gè)大核分拆成多個(gè)小核,封裝在多個(gè)晶粒里,再整合成單一CPU。與原生多核設(shè)計(jì)相比,采用MCM封裝設(shè)計(jì)的多核CPU,核數(shù)可以實(shí)現(xiàn)突破性增長,甚至翻倍,這也是近些年AMD服務(wù)器CPU市場(chǎng)規(guī)??焖僭鲩L的一個(gè)原因。
不止AMD,原本主張?jiān)嗪嗽O(shè)計(jì)的英特爾,也不得不做出妥協(xié),近些年在設(shè)計(jì)新款多核CPU時(shí),重新采用MCM封裝,以實(shí)現(xiàn)更多核心數(shù)量和更高效能。
2019年發(fā)布第十代HEDT高端桌面處理器之后,英特爾已有兩年多沒推出HEDT新品,最新消息顯示,該公司可能在2022下半年推出Golden?Cove高性能核心HEDT產(chǎn)品,主要是Sapphire?Rapids-AP。
在最近泄露的Xeon CPU基準(zhǔn)測(cè)試中,消息人士表示,英特爾正在醞釀Sapphire?Rapids-AP新陣容,其中“AP”曾被用于使用MCM封裝的旗艦級(jí)Cascade?Lake-AP產(chǎn)品線。Sapphire?Rapids-SP系列已采用過4組MCM設(shè)計(jì),每個(gè)芯片最多有15個(gè)核,Sapphire?Rapids-SP被視作“AP”的衍生版本。有消息稱,HEDT產(chǎn)品線雖然針對(duì)臺(tái)式機(jī)市場(chǎng),但英特爾更傾向于將其投放到工作站市場(chǎng)。作為采用MCM封裝的產(chǎn)品,Sapphire?Rapids系列包含許多款SKU,旗艦款的熱設(shè)計(jì)功耗可輕松突破350W。
近幾年,蘋果正在爭(zhēng)奪英特爾和AMD的CPU市場(chǎng),特別是筆記本電腦,蘋果在較短時(shí)間內(nèi)取得了不錯(cuò)的業(yè)績。該公司設(shè)計(jì)的CPU同樣看中了MCM封裝設(shè)計(jì)。2021年12月,有業(yè)內(nèi)人士展示了M1 Max芯片底部的隱藏部分,如下圖所示,所展示的就是MCM,蘋果采用該封裝設(shè)計(jì)的主要目的是將多個(gè)Die堆疊在一起,從而大大增加CPU和GPU內(nèi)核數(shù)量。
GPU跟進(jìn)
隨著GPU在數(shù)據(jù)中心的應(yīng)用越來越普及,原本用于CPU的MCM封裝技術(shù)開始向GPU領(lǐng)域滲透,特別是高性能計(jì)算,在業(yè)界受到了越來越多的關(guān)注。
傳統(tǒng)顯卡是帶有多個(gè)GPU的PCB板卡,需要連接兩個(gè)獨(dú)立顯卡的Crossfire或SLI橋接器。傳統(tǒng)的SLI 和 CrossFire需要 PCIe 總線來交換數(shù)據(jù)、紋理、同步等。由于GPU之間的渲染時(shí)間會(huì)產(chǎn)生同步問題,因此在許多情況下,傳統(tǒng)的雙GPU顯卡,即單個(gè)PCB上的兩個(gè)芯片由它互連,每個(gè)芯片都有自己的VRAM。SLI或CrossFire的能耗很大,冷卻也是一個(gè)挑戰(zhàn),這些在很長一段時(shí)間內(nèi)都困擾著工程師。MCM是一個(gè)單獨(dú)封裝,其板載橋接器取代了傳統(tǒng)兩個(gè)獨(dú)立顯卡之間的Crossfire或SLI橋接器。在高性能計(jì)算應(yīng)用領(lǐng)域,這種采用MCM封裝的GPU優(yōu)勢(shì)明顯。
最早將MCM封裝技術(shù)引入GPU的是AMD。2020年,該公司把游戲卡與專業(yè)卡的GPU架構(gòu)分家了,游戲卡的架構(gòu)是RDNA,而專業(yè)卡的架構(gòu)是CDNA,首款產(chǎn)品是Instinct MI100系列。2021年,AMD的Q2財(cái)報(bào)確認(rèn)CDNA 2 GPU已經(jīng)向客戶發(fā)貨了,其GPU核心代號(hào)是Aldebaran,它成為該公司首款采用MCM封裝的產(chǎn)品。在PC方面,2022年引入下一代RDNA 3架構(gòu)后,基于MCM的消費(fèi)級(jí)Radeon GPU也會(huì)出現(xiàn)。
制造多芯片計(jì)算 GPU 類似于制造多核 MCM CPU,例如Ryzen 5000或Threadripper處理器。首先,將芯片靠得更近可以提高計(jì)算效率。AMD 的 Infinity 架構(gòu)確保了高性能互連,有望使兩個(gè)芯片的效率接近一個(gè)的。其次,使用先進(jìn)的工藝技術(shù)批量生產(chǎn)多個(gè)小芯片比大芯片更容易,因?yàn)樾⌒酒ǔH毕葺^少,因此比大芯片的產(chǎn)量更好。
不久前,AMD發(fā)布了基于RDNA 3架構(gòu)的GPU,也就是Radeon RX 7000,該系列最新顯卡有三款GPU,分別是Navi 31、Navi 32和Navi 33,其中,Navi 31和Navi 32將采用MCM封裝。
GPU大廠英偉達(dá)也在跟進(jìn)MCM封裝。
目前,英偉達(dá)在MCM封裝GPU上的方案稱為“Composable On Package GPU”(COPA)。COPA GPU架構(gòu)具有混合/匹配多個(gè)硬件塊能力,它能更好地適應(yīng)當(dāng)今高性能計(jì)算的動(dòng)態(tài)工作負(fù)載和深度學(xué)習(xí)環(huán)境。這種整合更適應(yīng)多種類型工作負(fù)載,可帶來更高水平的GPU復(fù)用。
面向數(shù)據(jù)中心和消費(fèi)市場(chǎng),英偉達(dá)分別推出了基于Hopper架構(gòu)和Ada Lovelace架構(gòu)的GPU。據(jù)悉,該公司只會(huì)在Hopper架構(gòu)GPU上采用MCM技術(shù),Ada Lovelace架構(gòu)GPU仍會(huì)保留傳統(tǒng)的封裝設(shè)計(jì)。
作為英偉達(dá)第一款基于MCM技術(shù)的GPU,Hopper架構(gòu)產(chǎn)品將采用臺(tái)積電5nm制程工藝,支持HBM2e和其它連接特性,競(jìng)爭(zhēng)對(duì)手是AMD的CDNA 2架構(gòu)產(chǎn)品,以及英特爾的Xe-HP架構(gòu)GPU。
在獨(dú)立顯卡GPU的研發(fā)方面,英特爾落后了不少,看到英偉達(dá)在GPU市場(chǎng)呼風(fēng)喚雨,英特爾坐不住了,近些年在這方面大力投入,以期趕上產(chǎn)業(yè)步伐。而在MCM封裝GPU方面,該公司也有了新動(dòng)作。
不久前,英特爾公布新專利,描述了多個(gè)計(jì)算模組如何協(xié)同工作執(zhí)行圖像渲染,表示該公司GPU將采用MCM封裝設(shè)計(jì)。在新專利中,英特爾提出GPU圖像渲染解決方案,將多芯片整合至同一單元,解決制造和功耗等問題,同時(shí)優(yōu)化可擴(kuò)展性和互聯(lián)性。
據(jù)悉,英特爾整合了運(yùn)算模組的棋盤格式渲染,還有分布式運(yùn)算,使多芯片設(shè)計(jì)GPU有更高的運(yùn)算效率。雖然該公司沒有對(duì)架構(gòu)細(xì)節(jié)做深入描述,但估計(jì)搭載MCM封裝GPU的Intel Arc顯卡離我們不遠(yuǎn)了。
綜上,無論是CPU,還是GPU,各大廠商都越來越多地采用了MCM封裝技術(shù),掀起了一波“復(fù)古”熱潮。