文 | 偲睿洞察 Renee
編輯 | 孫越
近日,清華大學(xué)發(fā)布的一顆憶阻器存算一體芯片,火了。該芯片的火爆源于一個月前,清華大學(xué)發(fā)的一篇論文:
2023年9月14日,清華大學(xué)吳華強(qiáng)及高濱共同通訊在Science在線發(fā)表題為“Edge learning using a fully integrated neuro-inspired memristor chip”的研究論文,論文顯示,團(tuán)隊(duì)基于存算一體計(jì)算范式,研制出全系統(tǒng)集成、支持高效片上學(xué)習(xí)(機(jī)器學(xué)習(xí)能在硬件端直接完成)的憶阻器存算一體芯片。
“憶阻器存算一體”這一概念瞬間引爆學(xué)界與產(chǎn)業(yè)界,甚至登上了微博高位熱搜。據(jù)筆者獲悉,清華大學(xué)所用的憶阻器件就是RRAM(ReRAM)。
此次清華大學(xué)科研成果的意義,不僅在于研發(fā)出首顆基于憶阻器(RRAM)的片上學(xué)習(xí)存算一體芯片,更在于為產(chǎn)業(yè)界存算一體存儲介質(zhì)的應(yīng)用和發(fā)展給出了更多方向,以及在技術(shù)實(shí)踐上的引導(dǎo)性意見。
本文試圖探究,學(xué)界與產(chǎn)界為何要選擇研發(fā)該路線?該路線的發(fā)展前景如何?
PART-01 憶阻器存算一體是為何物?
無論是從其官方表述,還是論文中“可重構(gòu)的憶阻器存算一體架構(gòu)圖”,我們都能明確知道,清華大學(xué)所說憶阻器便是阻變存儲器RRAM(ReRAM)。
2022年9月,清華大學(xué)集成電路學(xué)院錢鶴、吳華強(qiáng)教授課題組聯(lián)合斯坦福大學(xué)、加州大學(xué)圣地亞哥分校(UCSD)、圣母大學(xué)等在《自然》(Nature)發(fā)表的題為A compute-in-memory chip based on resistive random-access memory研究論文。
該論文報道了一款基于憶阻器(阻變存儲器)的存算一體芯片NeuRRAM。該芯片具有可重新配置的計(jì)算核心(reconfiguring CIM cores),可以兼容不同的模型結(jié)構(gòu)。
(可重構(gòu)的憶阻器存算一體架構(gòu) 圖源:清華大學(xué))
專家表示,從定義來看,憶阻器(英文:memristor)為電阻受先前通過電荷量控制的電子器件,其特點(diǎn)為通常具有電流電壓蝴蝶形回滯曲線。憶阻器的概念最早由蔡少棠教授提出,最早由阻變存儲器,即RRAM實(shí)驗(yàn)驗(yàn)證,因此經(jīng)常以RRAM作為憶阻器的代表。
當(dāng)然,嚴(yán)格來說,根據(jù)材料和物理機(jī)制,憶阻器件可分為阻變存儲器(Resistive Random-Access Memory, 簡稱RRAM或ReRAM),相變存儲器(PCRAM),磁隨機(jī)存儲器(MRAM)和鐵電隨機(jī)存儲器(FeRAM)等不同種類。此外還有光電憶阻器、有機(jī)材料憶阻器、流體憶阻器等。也就是說,憶阻器有著諸多選項(xiàng),那么為何要選擇阻變存儲器RRAM?
我們都知道的是,傳統(tǒng)馮·諾依曼結(jié)構(gòu)下,數(shù)據(jù)的存儲和計(jì)算相互分離,即數(shù)據(jù)存儲在儲存器中,需要計(jì)算時再把它搬運(yùn)到運(yùn)算器里。然而,AI類應(yīng)用(例如大模型)需要對大量數(shù)據(jù)進(jìn)行矩陣運(yùn)算,其核心是乘法和加法,在此情形下算力是比較吃緊的,面臨著很大挑戰(zhàn)。
如何拉近“存”“算”距離,即打破存儲墻,成為AI計(jì)算的當(dāng)務(wù)之急,清華大學(xué)給的解決方案便是基于憶阻器(RRAM)的存算一體。
具體來說,如果用交叉陣列的方式做憶阻器,就可獲得一種與矩陣很類似的結(jié)構(gòu),這種結(jié)構(gòu)既可以存數(shù)據(jù),也可以做計(jì)算。需要存儲時,憶阻器本身就是存儲器;而需要運(yùn)算時,也無需把數(shù)據(jù)從存儲器中搬到運(yùn)算器里,因?yàn)閼涀杵骺芍苯佑脷W姆定律來做乘法運(yùn)算。
如此,數(shù)據(jù)便能“原地”計(jì)算,大大降低了由于數(shù)據(jù)“跑來跑去”所帶來的消耗。
除此之外,憶阻器(RRAM)還有著其他優(yōu)點(diǎn):比如尺寸小、速度快、與 CMOS(互補(bǔ)式金氧半導(dǎo)體)工藝可兼容等。
于是,又能算又能存的憶阻器(RRAM)成了緩解算力焦慮的良藥,引得包括清華大學(xué)在內(nèi)的多方精英競相布局。
PART-02 憶阻器(RRAM),學(xué)界與產(chǎn)界公認(rèn)的存算一體最佳器件
盡管有著諸多好處,憶阻器(RRAM)作為存儲器的發(fā)展卻十分坎坷。
2000年便有企業(yè)著手研發(fā)——夏普購買了美國休斯敦大學(xué)憶阻器(RRAM)的相關(guān)專利進(jìn)行相關(guān)布局,但到了去年才真正在業(yè)內(nèi)迎來應(yīng)用的爆發(fā)。那么,為何憶阻器(RRAM)在去年才迎來爆發(fā)時刻?
這是因?yàn)?,根?jù)以往經(jīng)驗(yàn),找到合適的賽道,往往是存儲器大放光彩的轉(zhuǎn)折點(diǎn)?,F(xiàn)如今,憶阻器(RRAM)作為存算一體AI計(jì)算的存儲介質(zhì),在AI大算力場景發(fā)光發(fā)熱。
例如NOR Flash,便是憑借更快的讀取速度、可隨機(jī)訪問等特點(diǎn),在功能機(jī)時代奪得一席之地;所以,當(dāng)功能機(jī)時代過去后,NOR Flash一度低迷。而當(dāng)外掛一個高可靠性、快速讀取的存儲器又成為解決AMOLED面板的藍(lán)色光會隨時間消退的問題的最優(yōu)解,NOR Flash,又隨著AMOLED的需求迎來自己的第二春。
而在存算一體芯片的存儲器件選擇中,基于憶阻器(RRAM)設(shè)計(jì)的存算一體芯片具有非易失性、讀寫速度快、穩(wěn)定性強(qiáng)、功耗低、 CMOS工藝兼容、微縮化發(fā)展天花板高等優(yōu)勢,相比于SRAM、Flash,憶阻器(RRAM)更適用于存算一體AI大算力賽道。
不過,據(jù)EETOP表示,憶阻器依然面臨著嚴(yán)峻的挑戰(zhàn),其中一個關(guān)鍵挑戰(zhàn)就是模擬計(jì)算的誤差累積。
在機(jī)器之心有關(guān)清華大學(xué)可重構(gòu)數(shù)字存算一體架構(gòu)主題的文章中提到,模擬計(jì)算由于工藝偏差、信號噪聲等因素容易產(chǎn)生計(jì)算誤差,通常最高只能支持INT8數(shù)據(jù)格式,難以支持更高位寬計(jì)算。
這就導(dǎo)致當(dāng)前的模擬存算一體AI芯片通常只能同時激活很小部分存儲器陣列。這限制了它們單位面積下的計(jì)算能力,使得兼顧能效和精度變得更加困難。
而數(shù)字存算一體并不受信噪比影響,精度可以達(dá)32bit甚至更高,且可支持浮點(diǎn)計(jì)算。同時,數(shù)字存算一體對于不同制造工藝、電源電壓和溫度的變化呈現(xiàn)很強(qiáng)的魯棒性。
故,相比于模擬存算,數(shù)字存算的方式可以實(shí)現(xiàn)更高的運(yùn)算精度以及更好的可靠性。據(jù)筆者對國內(nèi)存算一體項(xiàng)目的了解,現(xiàn)階段僅有億鑄科技基于憶阻器(RRAM)實(shí)現(xiàn)了數(shù)字存算一體POC芯片的回片及成功驗(yàn)證。
現(xiàn)如今,隨著工藝的不斷成熟,學(xué)界關(guān)于憶阻器(RRAM)存算一體的研究正愈發(fā)積極:在2022年度ISSCC會議上,臺積電發(fā)表六篇關(guān)于存內(nèi)計(jì)算存儲器IP的論文,大力推進(jìn)基于憶阻器(RRAM)的存內(nèi)計(jì)算方案。
盡管過去業(yè)內(nèi)對憶阻器(RRAM)有著“不夠成熟、主要面向小算力應(yīng)用場景”等誤解,不過自2023年始,多家存算一體AI芯片初創(chuàng)公司也紛紛公開表示,未來將布局基于憶阻器(RRAM)的存算一體產(chǎn)品。
在2023 AI芯片峰會上,同樣是以研發(fā)SRAM存算芯片為主的千芯科技董事長陳巍直言憶阻器(RRAM)存算一體的好處:以RRAM為代表的存算一體方案的存儲架構(gòu)縮短為兩層,幾乎是大模型運(yùn)算的極限,因此更有助于進(jìn)行大模型的運(yùn)算。
現(xiàn)如今,基于馮諾依曼傳統(tǒng)架構(gòu)的摩爾定律走向物理極限,“算力焦慮”無法再通過提升先進(jìn)制程緩解。以憶阻器(RRAM)存算一體等為代表的一系列新技術(shù),才是真正的“對癥下藥”。
越來越多的AI芯片廠商們,正通過硬件層面的革新,把AI技術(shù),帶進(jìn)數(shù)據(jù)中心、自動駕駛等大算力場景之中。憶阻器(RRAM)存算一體,終于迎來自己的“美麗人生”。