2月21日消息,華泰證券研究認(rèn)為,DeepSeek在V3中使用了相比CUDA更底層的PTX 來(lái)優(yōu)化硬件算法,PTX是CUDA編譯的中間代碼,在CUDA和最終機(jī)器碼之間起到橋梁作用。而NSA則使用了OpenAl提出的Triton編程語(yǔ)言高效編寫(xiě)GPU代碼,Triton的底層可調(diào)用CUDA,也可調(diào)用其他GPU語(yǔ)言,包括AMD的rocm以及國(guó)產(chǎn)算力芯片語(yǔ)言,如寒武紀(jì)的思元590芯片和海光信息的深算一號(hào)(DCU)內(nèi)置的HYGON ISA指令集。LLM的訓(xùn)練短期內(nèi)雖未完全脫離CUDA 生態(tài),但DeepSeek NSA的推出使其初步呈現(xiàn)出與CUDA解耦的趨勢(shì),并為后續(xù)適配更多類(lèi)型的算力芯片奠定基礎(chǔ)。以異騰為代表的國(guó)產(chǎn)算力已經(jīng)很好的適配了DeepSeek-R1 等國(guó)產(chǎn)模型,并取得了高效推理的效果,華泰證券認(rèn)為,伴隨海外算力的受限,針對(duì)國(guó)產(chǎn)算力的優(yōu)化或?qū)⒂谐掷m(xù)進(jìn)展,值得重視。
華泰證券:DeepSeek有望加速模型訓(xùn)練與CUDA解耦
界面快報(bào) · 2025年02月20日 23:57浏览 2.5w來(lái)源:界面新聞
華泰證券
4.4k
- 華泰證券:險(xiǎn)資繼續(xù)增配紅利股
- 華泰證券(601688.SH):2024年年報(bào)凈利潤(rùn)為153.51億元、同比較去年同期上漲20.40%
下一篇
熱門(mén)排行April 03
- 嚴(yán)查留學(xué)簽證申請(qǐng)人社交媒體發(fā)帖,美國(guó)入境審查再加碼
- 緬甸地震已致超3000人死亡
- 一季度交付量遠(yuǎn)不及預(yù)期,特斯拉盤(pán)前跳水跌超4%
- 稅率或達(dá)20%、沖擊全球經(jīng)濟(jì),歐洲對(duì)美國(guó)“對(duì)等關(guān)稅”發(fā)警告
- 小米車(chē)主行駛中酣睡引爭(zhēng)議,客服稱(chēng)智駕也需手握方向盤(pán)
- 直通部委 | 國(guó)家將建拖欠中小企業(yè)款項(xiàng)投訴平臺(tái) 有關(guān)部門(mén)嚴(yán)打網(wǎng)上體育“飯圈”
- 每年補(bǔ)貼高于丹麥的6億美元,美國(guó)要“砸重金”拿下格陵蘭島
- 不排除二季度工業(yè)利潤(rùn)在量?jī)r(jià)層面進(jìn)一步承壓|宏觀(guān)晚6點(diǎn)
- 新版安責(zé)險(xiǎn)實(shí)施辦法發(fā)布,臨時(shí)聘用人員等被納入保障范圍
- 劉畊宏cos海王遭強(qiáng)制斷播,抖音:不當(dāng)著裝博眼球