文|半導(dǎo)體產(chǎn)業(yè)縱橫
Trainium3 專為滿足下一代生成式 AI 工作負(fù)載的高性能需求而設(shè)計(jì)。
12月3日,亞馬遜旗下AWS CEO Matt Garman宣布,將推出全新 Trainium3,這是自家首款采用3nm制程的芯片,與上代 Trainium2 相比,計(jì)算能力增加2倍,能源效率提升40%,預(yù)計(jì)2025年底問世。
Matt Garman 指出,Trainium3 專為滿足下一代生成式 AI 工作負(fù)載的高性能需求而設(shè)計(jì),有助客戶更快地建立更大的模型,并在部署模型時(shí)提供卓越的效能,且由 Trainium3 驅(qū)動(dòng)的 UltraServers 預(yù)計(jì)將比 Trn2 UltraServers 的效能高出四倍。
據(jù)Garman透露,目前包括Adobe、AI新創(chuàng)公司Poolside、數(shù)據(jù)平臺(tái)服務(wù)Databricks以及芯片大廠高通都通過Trainium2處理器訓(xùn)練其AI模型,其中,高通在云端計(jì)算AI模型后再將其傳送至邊緣端。
此前有報(bào)道稱,亞馬遜云計(jì)算部門的高管正在大舉投資定制芯片,希望提高其數(shù)十個(gè)數(shù)據(jù)中心的效率,最終降低其自身以及亞馬遜AWS客戶的成本。亞馬遜AWS目標(biāo)是與英偉達(dá)競爭,后者憑借在AI芯片市場的主導(dǎo)地位,成為全球最有價(jià)值的公司之一。
TechInsights分析師G Dan Hutcheson曾表示:“AWS的一大優(yōu)勢是他們的芯片可以使用更少的電量,他們的數(shù)據(jù)中心可能可以更高效”,從而降低成本。他說,如果英偉達(dá)的圖形處理單元(GPU)是強(qiáng)大的通用工具,那么亞馬遜可以針對(duì)特定任務(wù)和服務(wù)優(yōu)化其芯片。
蘋果開始使用亞馬遜的定制人工智能芯片
蘋果目前使用亞馬遜網(wǎng)絡(luò)服務(wù)的定制人工智能芯片進(jìn)行搜索等服務(wù),并將評(píng)估該公司的最新人工智能芯片是否可以用于預(yù)訓(xùn)練其模型,如蘋果智能。
近日,蘋果在一年一度的AWS Reinvent大會(huì)上披露了其對(duì)亞馬遜專有芯片的使用。蘋果機(jī)器學(xué)習(xí)與人工智能高級(jí)總監(jiān)Benoit Dupin上臺(tái)介紹了蘋果是如何使用云服務(wù)的。這是公司正式允許供應(yīng)商將他們標(biāo)榜為客戶的罕見例子。
蘋果的Dupin說:“我們有很強(qiáng)的關(guān)系,基礎(chǔ)設(shè)施既可靠,又能為全球客戶服務(wù)。”
蘋果在亞馬遜的會(huì)議上亮相,并擁抱該公司的芯片,是在與微軟Azure和谷歌云爭奪人工智能支出之際,對(duì)云服務(wù)的大力支持。蘋果也使用這些云服務(wù)。
Dupin說,蘋果已經(jīng)使用AWS服務(wù)超過十年了,包括Siri,Apple Maps和Apple Music。例如,蘋果使用亞馬遜的Inferentia和Graviton芯片來服務(wù)搜索服務(wù),Dupin表示亞馬遜芯片提高了40%的效率。
但Dupin也暗示,蘋果將使用亞馬遜的Trainium2芯片對(duì)其專有車型進(jìn)行預(yù)訓(xùn)練。這表明,與英特爾和AMD的x86中央處理器相比,亞馬遜的處理器不僅是一種成本效益高的推理AI模型的方式,而且還可以用于開發(fā)新的AI。亞馬遜宣布,其Trainium2芯片一般可供租賃。
Dupin說:“在評(píng)估Trainium2的早期階段,我們預(yù)計(jì)早期人數(shù)在預(yù)訓(xùn)練時(shí)效率會(huì)提高多達(dá)50%?!?/p>
AWS首席執(zhí)行官M(fèi)att Garman在周二接受CNBC采訪時(shí)表示,蘋果一直是該公司Trainium芯片的早期采用者和測試者。
AWS首席執(zhí)行官馬特·加曼告訴CNBC的凱特·魯尼說:“蘋果來找我們,對(duì)我們說,‘你們能幫助我們實(shí)現(xiàn)生成式人工智能的能力嗎?我們需要基礎(chǔ)設(shè)施來構(gòu)建’,他們對(duì)構(gòu)建蘋果智能有著這樣的愿景?!?/p>
今年早些時(shí)候,蘋果在一份研究論文中表示,它已經(jīng)使用谷歌云TPU芯片來訓(xùn)練其iPhone人工智能服務(wù),它稱之為蘋果智能。
大多數(shù)人工智能訓(xùn)練都是在昂貴的英偉達(dá)圖形處理器上完成的。云提供商和初創(chuàng)公司正在競相開發(fā)降低成本的替代方案,并探索可能帶來更高處理效率的不同方法。蘋果使用定制芯片可能向其他公司發(fā)出信號(hào),表明非英偉達(dá)的培訓(xùn)方法可以奏效。
預(yù)計(jì) AWS 將在周二宣布有關(guān)提供基于 Nvidia Blackwell 的 AI 服務(wù)器以供出租的新細(xì)節(jié)。
今年秋天,蘋果發(fā)布了其首個(gè)主要生成式人工智能產(chǎn)品。Apple Intelligence是一系列服務(wù),可以匯總通知、重寫電子郵件和生成新的表情符號(hào)。該公司表示,本月晚些時(shí)候,它將與OpenAI的ChatGPT集成,明年,Siri將獲得控制應(yīng)用程序和自然說話的新能力。
與領(lǐng)先的聊天機(jī)器人,如OpenAI的ChatGPT不同,蘋果的人工智能方法不是基于云中的大量基于Nvidia的服務(wù)器。相反,蘋果使用iPhone、iPad或Mac芯片來盡可能多地完成處理,然后將復(fù)雜的查詢發(fā)送給使用其M系列芯片的蘋果操作服務(wù)器。