文 | 動脈網(wǎng)
沒有什么技術能像大語言模型一般,能在破圈之后如此迅速地接入各行各業(yè)。但未等到他們找到合適的商業(yè)路徑,行業(yè)已圍繞參數(shù)、成本、性能等要素開始內(nèi)卷,深陷算力“堆積”。
今年1月,橫空出世的DeepSeek-R1改寫了過去一年由GPT們主導的游戲規(guī)則。創(chuàng)新的模型架構與訓練優(yōu)化策略之下,DeepSeek向業(yè)界證實:有限規(guī)模的參數(shù)也能創(chuàng)造高性能的通用模型。
除了打破“算力壟斷”,DeepSeek參數(shù)高效微調(diào)(PEFT)、混合專家架構(MoE)等創(chuàng)新設計還成功降低了大模型的“入場門檻”。
低成本疊加“國產(chǎn)”標簽,國內(nèi)大量頂級醫(yī)院,前沿醫(yī)療科技企業(yè)迅速展開部署,甚至是醫(yī)保局都在高調(diào)宣布接入DeepSeek,將大模型再度推至風口浪尖。
究竟跟風還是新的路徑?動脈網(wǎng)近日與已接入DeepSeek的科技醫(yī)療企業(yè)們進行了對話,逐一回答“DeepSeek在醫(yī)療領域的真實價值”“DeepSeek在醫(yī)院的應用方式”及“基于DeepSeek-R1的醫(yī)療場景應用開發(fā)現(xiàn)狀”三個問題。
低成本算力需求下,基層醫(yī)療成為新落地可能?
遠在DeepSeek-R1誕生之前,國內(nèi)已有醫(yī)院部署通用模型,主動開啟了生成式AI的探索之旅。
由于臨床相關的數(shù)據(jù)不能脫離院區(qū),當時的大模型只能通過封裝入院。這里問題在于:大部分醫(yī)院擁有的資源環(huán)境基本是面向通用計算的CPU,少有醫(yī)院有面向圖形處理和并行計算的GPU資源,很難提供充足算力。
算力的困境緊扣成本。眾多醫(yī)院中,佼佼者有能力花大價錢上全套的GPU,將通用模型完整搬入院內(nèi),服務全院系統(tǒng);少部分能對模型進行精簡,使其特定的科室受益。
當絕大部分醫(yī)療機構不能自由配置大模型、開發(fā)相關臨床應用時,醫(yī)療大模型的從業(yè)公司也不過好過。缺乏充足的買方,他們很難在大模型方向上進行持續(xù)的高額研發(fā)投入。
DeepSeek-R1的出現(xiàn)打破了這一現(xiàn)狀。借助創(chuàng)新架構與開源代碼,它從根本上解決了通用模型的部署、運行產(chǎn)生的成本問題。
福鑫科創(chuàng)CEO吳笛表示:由于DeepSeek-R1采用的是混合專家架構(MoE),每次推理時僅激活約370億參數(shù)(總參數(shù)6710億),避免了傳統(tǒng)稠密模型必須全參數(shù)激活的高昂計算成本,理論上能在節(jié)省40%以上算力消耗的前提下保持推理的精度。若企業(yè)需要擴展模型規(guī)模,也無需線性增加算力投入即可補全模型能力。
DeepSeek、GPT o1 、GPT o3 mini能力對比
(輸入價格僅統(tǒng)計Cache Hit下標準時段的價格,數(shù)據(jù)來源:動脈網(wǎng)、深透智醫(yī))
更為重要的是,DeepSeek擁有非常友善的MIT license協(xié)議,允許用戶本地化部署,自由使用、復制、修改和分發(fā)軟件,也鼓勵了企業(yè)在產(chǎn)品中采用和集成,鼓勵合作和創(chuàng)新,從而推動整個生態(tài)系統(tǒng)的發(fā)展。
這種開放的生態(tài)系統(tǒng)使得普通醫(yī)療機構能夠根據(jù)自身的業(yè)務需求,開發(fā)出更符合實際應用場景的醫(yī)療大模型。若只是部署一些蒸餾得到的100B參數(shù)量以內(nèi)的小模型,不少基層醫(yī)療手中的集成顯卡都能帶動模型順利運行。
“在我們同區(qū)域型醫(yī)療機構的溝通中發(fā)現(xiàn),他們的訴求其實更加明確,希望能將DeepSeek的推理能力用在基層,因為那里最缺能夠處理復雜能力的醫(yī)生。”
總的來說,DeepSeek-R1的價值在于降低了大模型應用的門檻,開辟了新的落地市場,同時加速了垂直應用的誕生。這個過程中,這一新興模型給予了醫(yī)療大模型走向商業(yè)化的可能。
醫(yī)療機構如何用好DeepSeek?
當計劃部署大模型的醫(yī)院及從事大模型開發(fā)的醫(yī)生個體日趨增多,醫(yī)療IT產(chǎn)業(yè)中處于上游位置的眾多企業(yè)也隨之活躍了起來。
據(jù)衛(wèi)寧健康CTO趙大平介紹,DeepSeek-R1出現(xiàn)后,國內(nèi)的主流部署模式可簡單劃分為三種。首先他們可以快速從云端、源端下載模型,快速完成部署,主要適用于已有顯卡設備的大型醫(yī)院。若醫(yī)院沒有運算需要的顯卡,他們可以去云端租用設備。同時,也有部分民營醫(yī)院選擇訂閱的方式實現(xiàn)部署,主要服務于特定科室。
此外,風口之下亦催生了不少制造大模型一體機的企業(yè)。但在趙大平看來,醫(yī)院要想實現(xiàn)大模型的有效運行,首先要將其與醫(yī)院信息系統(tǒng)本身進行融合,其次信息系統(tǒng)本身要盡量使用支持AI運行的智能架構。
畢竟,大模型一體機雖然能夠通過外掛的方式實現(xiàn)一部分交互能力,但很難與醫(yī)院已有的幾十套系統(tǒng)進行充分數(shù)據(jù)交換。除非能夠?qū)崿F(xiàn)“模型+應用”的一體式解決方案,否則很難滿足醫(yī)院多元的需求。
那么,理想狀態(tài)下醫(yī)院應該如何部署大模型?趙大平認為:伴隨大模型的不斷深入,未來醫(yī)院的配置方式一定是多元混合的?!搬t(yī)院可能會配置一個大模型及一些服務細分科室的小模型。大模型用于需要推理、思考、診斷的大型交互場景,小模型用于強調(diào)規(guī)則、強調(diào)判斷、矯正以及簡單生成的場景,在滿足需求的同時實現(xiàn)最經(jīng)濟最高效的應用?!?/p>
“進一步延伸,醫(yī)院中存在很多移動化的場景,如果我們能將手機上的小模型建立起來,那么現(xiàn)有醫(yī)療流程中的大量工作可以向移動端轉(zhuǎn)移,極大提升醫(yī)療效率。”
再談醫(yī)生及其他試圖主動開發(fā)臨床應用的個體。
DeepSeek爆火的同時,各式教程順勢而出,鋪天蓋地,鼓勵用戶獨立配置、訓練模型。但在醫(yī)療領域,DeepSeek的出現(xiàn)雖然降低了模型訓練的各項門檻,但本地化訓練私有模型需要經(jīng)過數(shù)據(jù)準備與處理、模型選擇與配置、模型訓練、模型評估與調(diào)優(yōu)、模型部署與集成五個步驟,仍需要研究人員具備一定的技術功底。
“現(xiàn)在的很多大模型的應用開發(fā)程度不高,很多醫(yī)院的研究機構在買了卡配置了模型之后都想立馬搭建一個特定場景的應用,但在實際操作時會發(fā)現(xiàn)不具備相應的開發(fā)能力。要實現(xiàn)醫(yī)生個體的廣泛使用,并以此取得研究成果,我們還需等待服務方對UI進行升級,進一步簡化大模型應用的開發(fā)路徑?!?/p>
換句話說,企業(yè)與醫(yī)療機構共同進行垂直模型開發(fā),仍是醫(yī)療AI的主旋律。
DeepSeek下,醫(yī)療場景應用開啟革新?
DeepSeek-R1雖在醫(yī)療領域?qū)崿F(xiàn)了大規(guī)模部署,但上線時間較短,在應用場景的開拓方面,它暫未突破大模型已有應用范疇,更加聚焦于部署訓練成本的降低與文本處理效率的提升。最初階段中,著力于互聯(lián)網(wǎng)醫(yī)療的一批大模型企業(yè)最先受益。
譬如,騰訊健康通過騰訊云接入DeepSeek系列,再結合自研的混元大模型,迅速完成了對智能導診、預問診、健康問答、影像報告解讀及質(zhì)控等醫(yī)療服務的迭代,并加速幫助全國超過1000家醫(yī)院快速升級智能應用。
目前,騰訊的“深圳醫(yī)?!睉闷渲悄芸头汛钶d了最新AI大模型。用戶可以自由地選擇擅長推理的DeepSeek,或者可以多維度理解問題的騰訊混元,無論是咨詢"生育津貼怎么算"這類復雜政策,還是詢問"門診特定病種如何認定"等專業(yè)問題,融合后的大模型都能結合具體參保情況,給出精準到位且具備“Think”的解答,在回復用戶的同時幫助用戶理解問題。
當DeepSeek積累的醫(yī)療數(shù)據(jù)日益增多,它在醫(yī)院場景中的應用優(yōu)勢也開始逐步顯露。得益于在提示詞方面的要求顯著降低與思維鏈技術賦能,DeepSeek有效提升了AI在臨床診斷中的透明度與可解釋性,并能幫助醫(yī)生更為高效地與模型溝通。
舉個例子,醫(yī)生過去使用大模型生成手術方案,需要完整清晰地寫明過往病史、手術情況等信息,而使用DeepSeek時只用輸入一些關鍵信息,模型會在“Think”的過程中自主填補相關信息。
此外,醫(yī)療推理講究循證過程,DeepSeek不僅能夠提供有效的診療建議,更能詳細闡明其背后的推理過程,包括診斷依據(jù)、用藥選擇和檢查項目等。這種透明化極大化解了醫(yī)生對AI系統(tǒng)的猜忌,為醫(yī)患溝通提供了清晰的依據(jù),進而促進了AI技術在臨床中的更廣泛應用。
“很多醫(yī)生都非常關注模型‘think’的過程,他們會大致掃一眼Deepseek的邏輯,這是一種重要的交互,能讓醫(yī)生產(chǎn)生信任。”
到目前為止,已有不少醫(yī)院上線了大模型相關應用。以醫(yī)療文書書寫為例,福鑫科創(chuàng)、衛(wèi)寧健康等企業(yè)都開發(fā)了類似應用。以福鑫科創(chuàng)為例,該公司與武漢協(xié)和醫(yī)院、武漢大學中南醫(yī)院等醫(yī)院落地門診、住院多個場景的AI生成式電子病歷系統(tǒng),嘗試提高醫(yī)生的書寫病歷效率。
傳統(tǒng)的醫(yī)生在門診看診場景中,單個患者就診時長按照10分鐘計算,一般用于書寫電子病歷的時間在5分鐘,開藥、開檢查的時間在3分鐘,真正用于問診的時間也平均只有2分鐘。有了AI之后,AI會實時記錄醫(yī)患的對話,并將其轉(zhuǎn)化為醫(yī)學術語,按照門診電子病歷模板自動書寫電子病歷,省下電子病歷的書寫時間。
“按照一個醫(yī)生每天看診50個病人計算,每天可以至少節(jié)省1個多小時的書寫病歷時間,若醫(yī)院將節(jié)省的時間用于看診更多的患者,那大模型可以為醫(yī)院創(chuàng)造實實在在的經(jīng)濟價值?!币蚨趨堑芽磥?,這是目前價值最高,相對容易落地的場景。
由于DeepSeek模型本身沒有投喂過CT、MR相關影像數(shù)據(jù),企業(yè)開發(fā)相關應用時需要自行建立影像數(shù)據(jù)集并構建模型。因而相較于各類文本工具,醫(yī)學影像領域展開基于DeepSeek大模型研究相對較少。
目前,深智透醫(yī)在內(nèi)部工具層面對DeepSeek進行了部分探索。譬如,他們將DeepSeek用于影像數(shù)據(jù)多模態(tài)標準化和增強,利用圖像數(shù)據(jù)+meta data非圖像數(shù)據(jù)(EMR、HIS\RIS、DICOM header等有大量語言信息)提高成像內(nèi)容及命名的一致性,優(yōu)化下游應用(例如hanging protocol等更準確一致可以提高醫(yī)生效率)。
而在質(zhì)控數(shù)據(jù)分析方面,深智透醫(yī)則在嘗試借助大模型提升醫(yī)學影像質(zhì)量控制、異常識別能力、工作流問題交互能力。
需要注意的是,雖然基于DeepSeek進行的影像學研究頗為有限,但行業(yè)對于影像大模型已實現(xiàn)大量研究成果。部分企業(yè)基于GPT等模型建立起了影像基座模型,并在臨床試驗中證實了LLM對于醫(yī)學影像診斷的準確率、效率提升。伴隨DeepSeek能力的進一步增強,這些企業(yè)亦有可能慢慢轉(zhuǎn)至國產(chǎn)通用模型。
再談醫(yī)院場景之外的藥物研發(fā),這里同樣是各類大模型的重要競技場。
目前,深智透醫(yī)已在嘗試使用DeepSeek處理醫(yī)學影像標準化問題,進而在醫(yī)藥研發(fā)試驗中更好地解決影像數(shù)據(jù)質(zhì)控等問題。據(jù)深智透醫(yī)CEO宮恩浩透露,該企業(yè)已簽約一批國際藥廠,優(yōu)化他們已有研發(fā)中的影像試驗數(shù)據(jù)。
還有一些模型雖然沒用DeepSeek,但也采用了類似的創(chuàng)新技術。
例如,百圖生科的xTrimo系列大模型同樣采用了Moe框架,其V3版本可處理DNA、RNA、蛋白質(zhì)、細胞、化合物-蛋白互作、蛋白-蛋白互作及生命系統(tǒng)等七大模態(tài)數(shù)據(jù),可實現(xiàn)從堿基對到細胞集群的全尺度建模,進而賦能抗體和細胞基因療法藥物領域、靶點發(fā)現(xiàn)方面、微生物等領域的科學研究。
不過也需注意,無論是醫(yī)療機構相關的賦能,還是藥物研發(fā)的前沿探索,開發(fā)者們使用DeepSeek等大模型幾乎都是在原有場景中進行升級,尚未能開發(fā)出顛覆已有場景的應用,談不上革新。好在DeepSeek- R1的上線僅有不足兩個月的時間,伴隨時間的推移,我們很有可能目睹來自醫(yī)療AI的驚喜。
無遠弗屆
雖說DeepSeek-R1的出現(xiàn)極大程度推進了醫(yī)療領域?qū)τ诖竽P偷膽蒙疃?,但理性來講,要在醫(yī)院日常之中用上大模型,仍然需要等待不少時日。
首先,解決復雜問題需要大模型像醫(yī)生一樣結合患者的各模態(tài)數(shù)據(jù),進行綜合推斷。但在“Think”過程中,DeepSeek時常會陷入一種可能無限循環(huán)的情況,導致出現(xiàn)大量無關于問題本身的答案。對醫(yī)療這樣嚴肅、高頻的領域,必須消除這些場景幻覺才能有望規(guī)?;涞亍?/p>
其二,DeepSeek擁有的“國產(chǎn)”身份證明使其更受國內(nèi)醫(yī)療機構的青睞,但要規(guī)模應用,仍需符合醫(yī)學數(shù)據(jù)隱私與安全合規(guī)。因而需要DeepSeek出臺更完善的數(shù)據(jù)脫敏、加密技術,確?;颊邤?shù)據(jù)安全。
其三,DeepSeek解決的是過往大模型欠缺的產(chǎn)品質(zhì)量和性能問題,未能找到“殺手級應用”推動醫(yī)療機構主動付費。就目前來看,AI的付費邏輯還是和用戶認知及產(chǎn)品本身方向是否能真實降本增效創(chuàng)收賦能有關。因此,DeepSeek要想規(guī)模落地,一是提升醫(yī)院與醫(yī)生的接受度,二是要在傳統(tǒng)AI的基礎上進一步提升。至于誰付費這一問題,從AI近十年的發(fā)展看,基層醫(yī)療比等級醫(yī)院更為需要大模型的支持。
第四,DeepSeek的技術突破并非不可復制。如今,GPT的部分版本已將模型訓練成本大幅壓縮,逼近DeepSeek水平,且在邏輯推理能力方面不斷提升。這需要DeepSeek進一步鞏固優(yōu)勢,在實際臨床問題方面做出成果。
盡管挑戰(zhàn)重重,我們依然能夠從中看到很多積極的東西。畢竟,大量醫(yī)療企業(yè)與醫(yī)療機構的加入必將生成更多的垂直應用,拓寬大模型商業(yè)化的可能。
同時,DeepSeek等模型自身的潛力也不容忽視。按照現(xiàn)有大模型的迭代速度,每三個月通用模型都將完成一波全面迭代?;蛟S在2025年之中,我們便能目睹某一大模型脫穎而出,逐一攻克上述問題,與眾多醫(yī)療科技企業(yè)一同開啟醫(yī)療大模型的新圖景。