正在閱讀:

金融大模型應(yīng)用面臨三大挑戰(zhàn),聯(lián)邦學(xué)習(xí)是否是破局關(guān)鍵?

掃一掃下載界面新聞APP

金融大模型應(yīng)用面臨三大挑戰(zhàn),聯(lián)邦學(xué)習(xí)是否是破局關(guān)鍵?

聯(lián)邦學(xué)習(xí)解決大模型應(yīng)用落地的技術(shù)難題提供了創(chuàng)新路徑

圖片來源:圖蟲創(chuàng)意

界面新聞記者 | 劉晨光

近年來,以大模型為代表的AI技術(shù)進(jìn)入發(fā)展快車道,成為當(dāng)下最受大眾矚目的熱點(diǎn)話題。

伴隨大模型技術(shù)的飛速發(fā)展,全球人工智能技術(shù)發(fā)展和應(yīng)用迭代速度都得到了極大提升,大模型技術(shù)也被認(rèn)為是通用人工智能技術(shù)的核心引擎。

工信部發(fā)布的數(shù)據(jù)顯示,截至2023年6月,我國人工智能核心產(chǎn)業(yè)規(guī)模已經(jīng)達(dá)到5000億,人工智能企業(yè)數(shù)量超過4400家。

7月2日,“大模型時代AI前沿與金融應(yīng)用”為主題的微眾媒體學(xué)院會議上,業(yè)內(nèi)專家普遍認(rèn)為,以金融為代表的大模型技術(shù)在發(fā)展應(yīng)用中顯現(xiàn)三大挑戰(zhàn):一是從算力角度,大模型的訓(xùn)練過程中需要龐大的硬件算力資源支撐,大模型參數(shù)規(guī)模呈持續(xù)擴(kuò)張趨勢,對算力提出了更高要求;二是從算法角度,大模型生成內(nèi)容可能存在安全風(fēng)險,同時廣泛存在隱形偏見的可能性;三從數(shù)據(jù)角度,近年來各項法律法規(guī)對私域數(shù)據(jù)的使用有數(shù)據(jù)可用不可見的要求,在醫(yī)療、金融等行業(yè)都存在海量自治的高質(zhì)量數(shù)據(jù),但受限于隱私無法共享利用。

事實(shí)上,在大模型的實(shí)踐應(yīng)用中,金融行業(yè)由于具備數(shù)字化程度高、商業(yè)化應(yīng)用場景潛在價值高等優(yōu)勢,成為了AI大模型落地應(yīng)用的最佳場景之一。

微眾銀行首席人工智能官楊強(qiáng)指出,大模型的應(yīng)用落地涉及數(shù)據(jù)管理、算法優(yōu)化、系統(tǒng)設(shè)計和成本控制等多方面的綜合挑戰(zhàn),需要持續(xù)的技術(shù)創(chuàng)新和策略調(diào)整,以推動AI技術(shù)更加成熟、高效地服務(wù)于社會各個領(lǐng)域?!癆I Agent(人工智能業(yè)務(wù)助理)是大模型面向應(yīng)用端發(fā)展的下一階段,其基于大模型的通用能力,并結(jié)合相關(guān)領(lǐng)域知識適應(yīng)不同場景需求?!?/span>

此外,在楊強(qiáng)看來,隨著大模型的發(fā)展,如果面臨數(shù)據(jù)缺乏的問題,會衍生出一個概念即聯(lián)邦大模型這個聯(lián)邦的概念實(shí)際上是一個分布式概念?,F(xiàn)在的大模型基本上都是一個中心化訓(xùn)練出來的結(jié)果,會利用大量算力數(shù)據(jù)和電力來做訓(xùn)練。

楊強(qiáng)認(rèn)為,當(dāng)大模型的數(shù)據(jù)載量大到一定程度,社會就沒辦法承擔(dān)相關(guān)成本,最好是分解成一些分布式的算力中心,這些小的算力中心可以來訓(xùn)練一個小的大模型。“他們之間的連接幫助形成一個全局的大模型。這個全局大模型,第一個是具有分布式的能力,第二個是可以在保護(hù)隱私的前提下,利用好每一個地點(diǎn)的數(shù)據(jù)?!睏顝?qiáng)分析說。

楊強(qiáng)認(rèn)為,未來每一個人的手機(jī)都是一個算力中心。陌生人之間也可以合作,聯(lián)成一個網(wǎng)絡(luò),共同訓(xùn)練在某個領(lǐng)域的大模型。這些模型都是在本地訓(xùn)練、本地使用,通過聯(lián)網(wǎng)的方式,這個分布式網(wǎng)絡(luò)叫聯(lián)邦網(wǎng)絡(luò),既能保護(hù)隱私,又能夠做到分布式訓(xùn)練。

楊強(qiáng)指出,通過縱向聯(lián)邦學(xué)習(xí),可以幫助企業(yè)之間解決數(shù)據(jù)合作的問題使用各自的特有數(shù)據(jù),共同建立更加強(qiáng)大的模型

“比方說一方是金融機(jī)構(gòu),一方是非金融機(jī)構(gòu)。非金融機(jī)構(gòu)豐富的數(shù)據(jù),由于企業(yè)用戶數(shù)據(jù)隱私安全的要求無法直接互通數(shù)據(jù)。這種情況下兩邊可以合作,形成一個全局模型,來幫助金融機(jī)構(gòu)建立更好的風(fēng)控模型或者營銷模型?!?/span>

楊強(qiáng)坦言,如何最好地保護(hù)隱私,如何能夠把算法效率給提升到最高,并且讓這個模型最準(zhǔn),這三個目標(biāo)是互相牽制的。因此需要通過研究不同的聯(lián)邦學(xué)習(xí)范式來解決這三個目標(biāo)的協(xié)調(diào)問題。

“聯(lián)邦學(xué)習(xí)就像是讓模型去作為溝通的方式,而不是利用數(shù)據(jù)作為溝通的方式,這樣原始數(shù)據(jù)可以不出本域也可以把模型給做出來?!睏顝?qiáng)說。

微眾銀行人工智能首席科學(xué)家范力欣認(rèn)為,聯(lián)邦學(xué)習(xí)作為一種先進(jìn)的分布式機(jī)器學(xué)習(xí)范式,允許參與方在不直接共享原始數(shù)據(jù)的情況下協(xié)作訓(xùn)練模型,為解決大模型應(yīng)用落地的技術(shù)難題提供了創(chuàng)新路徑。

“聯(lián)邦大模型技術(shù)路線通過其獨(dú)特的設(shè)計,不僅解決了數(shù)據(jù)時效性、模型幻覺、專業(yè)知識融合及算力資源消耗等挑戰(zhàn),而且在保護(hù)數(shù)據(jù)隱私和促進(jìn)AI技術(shù)公平性方面邁出了重要一步,為大模型在以金融為代表的各領(lǐng)域的廣泛應(yīng)用開辟了新的可能?!狈读π辣硎尽?/span>

未經(jīng)正式授權(quán)嚴(yán)禁轉(zhuǎn)載本文,侵權(quán)必究。

評論

暫無評論哦,快來評價一下吧!

下載界面新聞

微信公眾號

微博

金融大模型應(yīng)用面臨三大挑戰(zhàn),聯(lián)邦學(xué)習(xí)是否是破局關(guān)鍵?

聯(lián)邦學(xué)習(xí)解決大模型應(yīng)用落地的技術(shù)難題提供了創(chuàng)新路徑

圖片來源:圖蟲創(chuàng)意

界面新聞記者 | 劉晨光

近年來,以大模型為代表的AI技術(shù)進(jìn)入發(fā)展快車道,成為當(dāng)下最受大眾矚目的熱點(diǎn)話題。

伴隨大模型技術(shù)的飛速發(fā)展,全球人工智能技術(shù)發(fā)展和應(yīng)用迭代速度都得到了極大提升,大模型技術(shù)也被認(rèn)為是通用人工智能技術(shù)的核心引擎。

工信部發(fā)布的數(shù)據(jù)顯示,截至2023年6月,我國人工智能核心產(chǎn)業(yè)規(guī)模已經(jīng)達(dá)到5000億,人工智能企業(yè)數(shù)量超過4400家。

7月2日,“大模型時代AI前沿與金融應(yīng)用”為主題的微眾媒體學(xué)院會議上業(yè)內(nèi)專家普遍認(rèn)為,以金融為代表的大模型技術(shù)在發(fā)展應(yīng)用中顯現(xiàn)三大挑戰(zhàn):一是從算力角度,大模型的訓(xùn)練過程中需要龐大的硬件算力資源支撐,大模型參數(shù)規(guī)模呈持續(xù)擴(kuò)張趨勢,對算力提出了更高要求;二是從算法角度,大模型生成內(nèi)容可能存在安全風(fēng)險,同時廣泛存在隱形偏見的可能性;三從數(shù)據(jù)角度,近年來各項法律法規(guī)對私域數(shù)據(jù)的使用有數(shù)據(jù)可用不可見的要求,在醫(yī)療、金融等行業(yè)都存在海量自治的高質(zhì)量數(shù)據(jù),但受限于隱私無法共享利用。

事實(shí)上,在大模型的實(shí)踐應(yīng)用中,金融行業(yè)由于具備數(shù)字化程度高、商業(yè)化應(yīng)用場景潛在價值高等優(yōu)勢,成為了AI大模型落地應(yīng)用的最佳場景之一。

微眾銀行首席人工智能官楊強(qiáng)指出,大模型的應(yīng)用落地涉及數(shù)據(jù)管理、算法優(yōu)化、系統(tǒng)設(shè)計和成本控制等多方面的綜合挑戰(zhàn),需要持續(xù)的技術(shù)創(chuàng)新和策略調(diào)整,以推動AI技術(shù)更加成熟、高效地服務(wù)于社會各個領(lǐng)域。“AI Agent(人工智能業(yè)務(wù)助理)是大模型面向應(yīng)用端發(fā)展的下一階段,其基于大模型的通用能力,并結(jié)合相關(guān)領(lǐng)域知識適應(yīng)不同場景需求?!?/span>

此外,在楊強(qiáng)看來,隨著大模型的發(fā)展,如果面臨數(shù)據(jù)缺乏的問題,會衍生出一個概念即聯(lián)邦大模型這個聯(lián)邦的概念實(shí)際上是一個分布式概念?,F(xiàn)在的大模型基本上都是一個中心化訓(xùn)練出來的結(jié)果,會利用大量算力、數(shù)據(jù)和電力來做訓(xùn)練。

楊強(qiáng)認(rèn)為,當(dāng)大模型的數(shù)據(jù)載量大到一定程度,社會就沒辦法承擔(dān)相關(guān)成本最好是分解成一些分布式的算力中心,這些小的算力中心可以來訓(xùn)練一個小的大模型。“他們之間的連接幫助形成一個全局的大模型。這個全局大模型,第一個是具有分布式的能力,第二個是可以在保護(hù)隱私的前提下,利用好每一個地點(diǎn)的數(shù)據(jù)?!睏顝?qiáng)分析說。

楊強(qiáng)認(rèn)為,未來每一個人的手機(jī)都是一個算力中心。陌生人之間也可以合作,聯(lián)成一個網(wǎng)絡(luò),共同訓(xùn)練在某個領(lǐng)域的大模型。這些模型都是在本地訓(xùn)練、本地使用,通過聯(lián)網(wǎng)的方式,這個分布式網(wǎng)絡(luò)叫聯(lián)邦網(wǎng)絡(luò),既能保護(hù)隱私,又能夠做到分布式訓(xùn)練。

楊強(qiáng)指出,通過縱向聯(lián)邦學(xué)習(xí),可以幫助企業(yè)之間解決數(shù)據(jù)合作的問題,使用各自的特有數(shù)據(jù),共同建立更加強(qiáng)大的模型

“比方說一方是金融機(jī)構(gòu),一方是非金融機(jī)構(gòu)。非金融機(jī)構(gòu)豐富的數(shù)據(jù),由于企業(yè)用戶數(shù)據(jù)隱私安全的要求無法直接互通數(shù)據(jù)這種情況下兩邊可以合作,形成一個全局模型,來幫助金融機(jī)構(gòu)建立更好的風(fēng)控模型或者營銷模型?!?/span>

楊強(qiáng)坦言,如何最好地保護(hù)隱私,如何能夠把算法效率給提升到最高,并且讓這個模型最準(zhǔn),這三個目標(biāo)是互相牽制的。因此需要通過研究不同的聯(lián)邦學(xué)習(xí)范式來解決這三個目標(biāo)的協(xié)調(diào)問題。

“聯(lián)邦學(xué)習(xí)就像是讓模型去作為溝通的方式,而不是利用數(shù)據(jù)作為溝通的方式,這樣原始數(shù)據(jù)可以不出本域也可以把模型給做出來?!睏顝?qiáng)說。

微眾銀行人工智能首席科學(xué)家范力欣認(rèn)為,聯(lián)邦學(xué)習(xí)作為一種先進(jìn)的分布式機(jī)器學(xué)習(xí)范式,允許參與方在不直接共享原始數(shù)據(jù)的情況下協(xié)作訓(xùn)練模型,為解決大模型應(yīng)用落地的技術(shù)難題提供了創(chuàng)新路徑。

“聯(lián)邦大模型技術(shù)路線通過其獨(dú)特的設(shè)計,不僅解決了數(shù)據(jù)時效性、模型幻覺、專業(yè)知識融合及算力資源消耗等挑戰(zhàn),而且在保護(hù)數(shù)據(jù)隱私和促進(jìn)AI技術(shù)公平性方面邁出了重要一步,為大模型在以金融為代表的各領(lǐng)域的廣泛應(yīng)用開辟了新的可能?!狈读π辣硎?。

未經(jīng)正式授權(quán)嚴(yán)禁轉(zhuǎn)載本文,侵權(quán)必究。