文|半導(dǎo)體產(chǎn)業(yè)縱橫
在和業(yè)內(nèi)人士交流時(shí),有人曾表示:“要么業(yè)界采用Chiplet技術(shù),維持摩爾定律的影響繼續(xù)前進(jìn),要么就面臨商業(yè)市場(chǎng)的損失?!彪S著摩爾定律走到極限,Chiplet被行業(yè)普遍認(rèn)為是未來(lái)5年算力的主要提升技術(shù)。
01、戰(zhàn)場(chǎng)已拉開(kāi),紛爭(zhēng)開(kāi)始了
Chiplet不算是新的技術(shù),但是這股浪潮確實(shí)是近年來(lái)開(kāi)始火熱的。
什么是Chiplet?
Chiplet俗稱芯粒,也叫小芯片,它是將一類滿足特定功能的die(裸片),通過(guò)die-to-die內(nèi)部互聯(lián)技術(shù)實(shí)現(xiàn)多個(gè)模塊芯片與底層基礎(chǔ)芯片封裝在一起,形成一個(gè)系統(tǒng)芯片,以實(shí)現(xiàn)一種新形式的IP復(fù)用。
簡(jiǎn)單來(lái)說(shuō),可以理解為將每個(gè)小的芯片用“膠水”縫合在一起,形成一個(gè)性能更強(qiáng)的大芯片。這也不算是一個(gè)新鮮的技術(shù),例如:英特爾將兩個(gè)芯片(一個(gè) CPU 和一個(gè)用于 CPU 大型 L2 高速緩存的快速靜態(tài)內(nèi)存芯片)放在一起,放入公司于1995年末推出的Pentium Pro CPU 的封裝中。
也許去年,大部分廠商還沉浸在Chiplet技術(shù)的未來(lái)應(yīng)用上,那到了今天Chiplet已經(jīng)成為各大廠商的產(chǎn)品中的必選角色。
首先來(lái)看AMD,AMD是選擇Chiplet最積極的廠商之一。
在2019年的時(shí)候,AMD就初次嘗試了Chiplet封裝,將不同工藝節(jié)點(diǎn)的CPU內(nèi)核且I/O規(guī)格不同的芯片封裝在一起,顯著提高了能效和功能。
之后,AMD又發(fā)布了實(shí)驗(yàn)性產(chǎn)品,即基于3D Chiplet技術(shù)的3D V-Cache。使用的處理器芯片是Ryzen 5000,采用臺(tái)積電3D Fabric先進(jìn)封裝技術(shù),成功地將包含有64MB L3 Cache的Chiplet以3D堆疊的形式與處理器封裝在了一起。
從數(shù)據(jù)性能來(lái)看,采用3D Chiplet的原型芯片將性能平均提高了12%。從這一點(diǎn)上,也能看到3D Chiplet對(duì)實(shí)際工作負(fù)載的提升有實(shí)質(zhì)性的貢獻(xiàn)。
不止在CPU,AMD在GPU方面也選擇了Chiplet技術(shù)。目前,AMD發(fā)布的最新MI300系列芯片時(shí),同樣采用Chiplet技術(shù),8個(gè)GPU Chiplet加4個(gè)I/O內(nèi)存Chiplet的設(shè)計(jì),總共12個(gè)5nm Chiplet封裝在一起,使其集成的晶體管數(shù)量達(dá)到了1530億,高于英偉達(dá)H100的800億晶體管。這款芯片在推出時(shí),也是打出了對(duì)標(biāo)英偉達(dá)H100的口號(hào)。
此外,AMD含Chiplet技術(shù)的CPU銷量占比也在不斷提高。根據(jù)德國(guó)電腦零售商Mindfactory數(shù)據(jù),2021年10月至2022年12月間AMD CPU的銷量中,含Chiplet技術(shù)的CPU銷量占比不斷提高,從約80%上升至約97%。
再來(lái)看英特爾。英特爾的首次推出基于Chiplet設(shè)計(jì)的處理器是Sapphire Rapids,時(shí)間在2023年1月。
具體來(lái)看,通過(guò)兩組鏡像對(duì)稱的相同架構(gòu)的building blocks,組合4個(gè)Chiplets,獲得4倍的性能和互聯(lián)帶寬。每個(gè)基本模塊包含計(jì)算部分(CHA &LLC &Cores mesh, Accelerators)、memory interface部分(controller, Ch0/1)、I/O部分(UPI,PCIe)。通過(guò)將上述高性能組件組成基本的building block,再通過(guò)EMIB技術(shù)進(jìn)行Chiplet互聯(lián),可以獲得線性性能提升和成本收益。
最后,來(lái)看英偉達(dá)。英偉達(dá)坐穩(wěn)GPU領(lǐng)域霸主這一點(diǎn)毋庸置疑,而霸主英偉達(dá)在今年推出的“最強(qiáng)”GPU B200也同樣采用Chiplet技術(shù)。GB200超級(jí)芯片是由2顆B200 GPU和1顆Arm架構(gòu)的Grace CPU(中央處理器)組合而來(lái)。
由此可見(jiàn),英特爾、AMD、英偉達(dá)都在自家的CPU、GPU上使用了Chiplet技術(shù)。這將Chiplet推入了一個(gè)全新的商業(yè)化階段。
Chiplet這一錘,算是重重砸下了。
02、Chiplet從CPU到GPU
在之前傳統(tǒng)的GPU也是由一個(gè)中央工作負(fù)載處理器,將渲染任務(wù)發(fā)送到芯片內(nèi)的多個(gè)著色器塊之一。每個(gè)單元都被賦予一塊幾何體來(lái)處理、轉(zhuǎn)換為像素,然后對(duì)它們進(jìn)行著色。
后來(lái)AMD發(fā)現(xiàn),Chiplet 用在CPU上效果很好,并且降低了制造成本。于是在GPU上也選擇了放棄中央處理器,用多個(gè)小芯片取代單個(gè)硅塊,每個(gè)小芯片處理自己的任務(wù)。渲染指令以稱為命令列表的長(zhǎng)序列發(fā)送到 GPU,其中所有內(nèi)容都稱為繪制調(diào)用。
AMD 2019年Chiplet專利
該文件于 2019 年 6 月發(fā)布,即提交近兩年后,該功能已在 RDNA 2 中實(shí)現(xiàn)。AMD 于 2020 年開(kāi)始推廣該架構(gòu),并于同年 11 月推出了首款配備全新 RT-texture 處理器的產(chǎn)品。
不同制程及封裝技術(shù)下的芯片良率、成本、面積的關(guān)系 注:D為缺陷密度,c為負(fù)二項(xiàng)分布中的集群參數(shù)或Seed’s model中臨界值數(shù)量
摩爾定律沒(méi)死,但確實(shí)是老了,在14nm之后成本曲線就變了。5nm工藝的成本相比7nm工藝增長(zhǎng)了近1倍,3nm工藝相比5nm工藝預(yù)計(jì)將增長(zhǎng)近1倍。在半導(dǎo)體工藝、規(guī)模限制越來(lái)越大的情況下,傳統(tǒng)大芯片的策略確實(shí)是寸步難行。
總體來(lái)看,Chiplet有四大優(yōu)點(diǎn):
第一,通過(guò)將功能塊劃分為小芯片,那么不需要芯片尺寸的持續(xù)增加。這就提高了良率并簡(jiǎn)化了設(shè)計(jì)和驗(yàn)證的流程。
第二,每個(gè)小芯片是獨(dú)立的,那就可以選擇最佳工藝。邏輯部分可以采用尖端工藝制造,大容量SRAM可以使用7nm左右的工藝制造,I/O和外圍電路可以使用12nm或28nm左右的工藝制造,這就大大降低了制造的成本。
第三,組合多樣,適合定制化,輕松制造衍生類型。比如說(shuō)采用相同的邏輯電路但是不一樣的外圍電路,或相同外圍電路但不同的邏輯電路。
第四,不同制造商的小芯片可以混合使用,而不僅僅是局限在單個(gè)制造商內(nèi)。
這些特點(diǎn)都非常適合用在大算力芯片上。相較于傳統(tǒng)消費(fèi)級(jí)芯片,算力芯片面積更大,存儲(chǔ)容量更大,對(duì)互連速度要求更高。采用Chiplet既可以降低成本提升良率,又可以允許更多計(jì)算核心的“堆料”,還能便于引入HBM存儲(chǔ)。
越接近摩爾定律極限如5nm、3nm和2nm的芯片走Chiplet設(shè)計(jì)路線越有意義。
清華大學(xué)交叉信息研究院特聘研究員、助理教授馬愷聲也分析過(guò),到底什么樣的芯片適合使用Chiplet:“具體到芯片應(yīng)用來(lái)說(shuō),CPU和GPU這種大芯片是適合的,對(duì)于大芯片來(lái)說(shuō),建議是超過(guò)200平方毫米,最好是超過(guò)400平方毫米的是適合做Chiplet的;如果僅從成本角度看,如MCU這樣本身價(jià)格較低的芯片目前是沒(méi)有必要的?!?/p>
我們也能看到,Chiplet技術(shù)在CPU和GPU上的商用確實(shí)比較順利。
03、Chiplet時(shí)代,代工廠偷偷賺大錢(qián)
Chiplet制造步驟相對(duì)于封裝復(fù)雜度大幅提升,同時(shí)考慮到不同的連接方式對(duì)于精度的要求和工藝要求不同,制造過(guò)程分布在IDM、晶圓廠和封裝廠。
這給臺(tái)積電、英特爾帶來(lái)了商機(jī)。
3nm制程技術(shù)占據(jù)了臺(tái)積電晶圓總收入的6%,5nm和7nm分別占晶圓總收入33%和19%。先進(jìn)制程(7nm及以下)占臺(tái)積電晶圓總收入的比重達(dá)到了58%。
前文提到的AMD發(fā)布的3D V-Cache實(shí)驗(yàn)性產(chǎn)品背后,是臺(tái)積電的先進(jìn)半導(dǎo)體工藝技術(shù)和先進(jìn)封裝技術(shù)。臺(tái)積電作為同時(shí)掌握了最先進(jìn)半導(dǎo)體工藝和封裝技術(shù)的代工廠,其全球最頂尖代工廠的地位得到了鞏固,同時(shí)其在先進(jìn)技術(shù)領(lǐng)域也將變得更加強(qiáng)勢(shì)。
那么臺(tái)積電的7m、5nm可以得到更好地利用。如果仔細(xì)來(lái)看臺(tái)積電的營(yíng)收,在先進(jìn)制程方面的收入使得其業(yè)績(jī)一路高升。
不過(guò),對(duì)于臺(tái)積電來(lái)說(shuō),Chiplet也帶來(lái)了新的挑戰(zhàn)。通過(guò)采用Chiplet,臺(tái)積電避免了傳統(tǒng)的壟斷模式,使客戶理論上能夠從多個(gè)來(lái)源獲得其芯片。這增加了客戶的選擇自由度,促使了更加競(jìng)爭(zhēng)激烈的市場(chǎng)環(huán)境。
不同于AMD和英偉達(dá),英特爾一直在發(fā)展其IDM 2.0的戰(zhàn)略,將晶圓代工看得非常重要。
從代工這方面來(lái)看,Chiplet對(duì)于英特爾也有不一樣的影響。
一方面,英特爾承諾過(guò)的4年交付5個(gè)工藝節(jié)點(diǎn)(intel 7、intel 4、intel 3、intel 20A、intel 18A),如果使用Chiplet,那么英特爾可以避免為復(fù)雜的CPU或GPU執(zhí)行完整工藝所需的困難。
另一方面,英特爾還可以利用混合制造廠商(使用來(lái)自多個(gè)代工廠的Chiplet并將其打包)的概念來(lái)獲得代工廠商機(jī)。在去年,英特爾宣布與臺(tái)積電攜手打造全球首款符合Chiplet互連產(chǎn)業(yè)聯(lián)盟(UCIe)標(biāo)準(zhǔn)的多芯片封裝芯片,當(dāng)中包含英特爾與臺(tái)積電各自生產(chǎn)的IC。
值得注意的是,英特爾是第一個(gè)主動(dòng)選擇,多源代工業(yè)務(wù)模式的廠商。
04、結(jié)語(yǔ)
Chiplet的探索正在圍繞著CPU和GPU這兩大領(lǐng)域,但從長(zhǎng)遠(yuǎn)來(lái)看,隨著Chiplet產(chǎn)業(yè)鏈更加成熟,Chiplet的發(fā)展將不局限于這類大芯片,而是會(huì)有更廣闊的運(yùn)用空間。
Chiplet的風(fēng)行,也讓半導(dǎo)體產(chǎn)業(yè)必須有所調(diào)整,以建構(gòu)出對(duì)應(yīng)的完善生態(tài)系統(tǒng)。目前市場(chǎng)上的Chiplet產(chǎn)品,是各家大廠自行發(fā)展出來(lái)的成果,故目前半導(dǎo)體業(yè)內(nèi)存在多種不相通的Chiplet互連技術(shù),導(dǎo)致Chiplet生態(tài)系呈現(xiàn)碎片化的局面。
目前在底層封裝層面, 已經(jīng)有臺(tái)積電、英特爾等廠商提供CoWOS、EMIB等先進(jìn)封裝,可以提供超高速、超高密度和超低延時(shí)的Chiplet互聯(lián);在標(biāo)準(zhǔn)協(xié)議層面,也有眾多大廠領(lǐng)銜發(fā)布的UCIe 1.0版本,提供了跨片接口設(shè)計(jì)的指導(dǎo)和約束。
Chiplet的春風(fēng)在吹了。