正在閱讀:

馬上消金CTO蔣寧:金融大模型向智能體、輕量化、全價值鏈創(chuàng)新演進(jìn)

掃一掃下載界面新聞APP

馬上消金CTO蔣寧:金融大模型向智能體、輕量化、全價值鏈創(chuàng)新演進(jìn)

金融大模型正在演進(jìn)成為“智能體”。

界面新聞記者 | 苗藝偉

界面新聞編輯 | 江怡曼

在大模型火爆的兩年內(nèi),馬上消費金融正在實踐中不斷通過 “小步快跑”,實現(xiàn)金融大模型的快速演進(jìn)。

11月28日,在重慶舉辦的數(shù)字生態(tài)伙伴創(chuàng)新大會上,馬上消費金融CTO蔣寧在接受采訪時表示,經(jīng)過年多以來的探索實踐,對大模型的認(rèn)識更加深刻,原本業(yè)界普遍認(rèn)為大模型必須滿足巨大的參數(shù),有著高昂訓(xùn)練成本,然而實踐得出的結(jié)論卻并非如此。

他表示,金融大模型可以實現(xiàn)“輕量化應(yīng)用”,降低成本與提高效率之間尋求最優(yōu)解,也可以將金融大模型從單場景創(chuàng)新演進(jìn)成為零售金融全價值鏈大模型乃至應(yīng)用于更廣泛社會生活的領(lǐng)域;最后,金融大模型正在演進(jìn)成為“智能體”,推理能力而非數(shù)據(jù)訓(xùn)練,將成為大模型具備的更重要的能力。

金融大模型“溢出效應(yīng)”

蔣寧表示,1.0版本的天鏡大模型是一個局部的創(chuàng)新,是由場景驅(qū)動的,主要訓(xùn)練了人機(jī)交互來解決金融客服、營銷等場景的應(yīng)用。當(dāng)時是基于2億用戶,訓(xùn)練了約100P數(shù)據(jù),實現(xiàn)了100億的交易額。

他稱,但在1.0以后,一直在思考在金融這個長價值鏈的產(chǎn)業(yè)中,大模型是否能包括營銷、風(fēng)控、消費者權(quán)益保護(hù),甚至客戶體驗、合規(guī)等場景進(jìn)行應(yīng)用,因此做了深度探索

蔣寧表示,例如,在反金融黑灰產(chǎn)領(lǐng)域,馬上消金應(yīng)用了多項大模型技術(shù)來進(jìn)行高效反黑。可以在貸款人允許下記錄聲紋,如果后續(xù)交互過程中,發(fā)現(xiàn)他的聲音發(fā)生變化的時候,就有理由懷疑,這可能不是他本人的意思表達(dá)從而識別黑灰產(chǎn)。此外,整合多模態(tài)大模型還可以識別借款人的周邊的環(huán)境、地址、網(wǎng)絡(luò)地址等,再結(jié)合復(fù)雜網(wǎng)絡(luò)技術(shù),隱私計算技術(shù),多種技術(shù)結(jié)合,就形成了打擊黑產(chǎn)的科技能力。

除了金融領(lǐng)域,馬上消費人工智能研究院院長陸全也表示,馬上消金也把在金融領(lǐng)域積累的能力又反哺到國家重大項目里,通過參與社會生態(tài)建設(shè),讓人工智能團(tuán)隊的知識、經(jīng)驗?zāi)茉诟鼜V泛的領(lǐng)域得到鍛煉提升機(jī)會。

馬上消費人工智能研究院鄧偉洪也表示,目前,公司在養(yǎng)老機(jī)器人上做了比較大的投入,可以滿足老年人在社交、康養(yǎng)方面的需求。他表示,養(yǎng)老機(jī)器人未來應(yīng)用場景豐富,一是社交陪伴場景,可以做一個數(shù)字人跟老年人進(jìn)行心理疏導(dǎo)。二是游戲娛樂場景,可以給老人開發(fā)認(rèn)知小游戲,鍛煉他們的認(rèn)知功能,也可以給他們放一些好看的電影。三是安全觀察場景,老年人摔倒是一個很大的風(fēng)險,可以做一些監(jiān)護(hù)。四是未來當(dāng)機(jī)器人可以做到自由運動,可以給老人做一些家務(wù),給老人送藥。

從單體大模型到“智能體”

在采訪中,馬上消費金融人工智能研究院院長陸全表示,在過去兩年的金融大模型實踐過程中,第一個發(fā)現(xiàn)就是光靠單一、單體基礎(chǔ)大模型,或者說單體大模型不能適應(yīng)產(chǎn)業(yè)界絕大多數(shù)應(yīng)用,因此,馬上的天鏡從單體大模型,也逐漸變成了目前的“邏輯”與“記憶”分離的“智能體”。

陸全表示,所謂“智能體”,其背后包括了多個大模型和小模型,通過把這些模型組合在一起,多個模型之間互相協(xié)作,完成一連串的復(fù)雜任務(wù)。

表示,發(fā)現(xiàn)金融多個領(lǐng)域的應(yīng)用都需要多智能體系統(tǒng)來處理,這是因為單體大模型能力相當(dāng)有限,就像一個人不可能是文科狀元,還是理科狀元,還懂管理。而在智能體情況下,大模型就可以相互配合,把邏輯和數(shù)據(jù)分析分離,讓大模型做專業(yè)上最擅長的事情。

陸全稱,這意味著,智能體在某些價值鏈上天然就具備泛化能力,可以移植到類似場景,比如防偽,可能所有場景的要求是一致的。當(dāng)智能體掌握了某個邏輯,且在業(yè)務(wù)形態(tài)比較接近的情況下,就會更具備泛化應(yīng)用的能力。

高成本到“輕量化”

蔣寧表示,在實踐中,對大模型的認(rèn)知也在逐步深入。在天鏡大模型1.0時代,普遍認(rèn)為需要建設(shè)一個高成本、參數(shù)巨大的大模型來訓(xùn)練,才能讓模型能夠發(fā)揮效力。然而,當(dāng)大模型應(yīng)用從單場景向全價值鏈演進(jìn),就發(fā)現(xiàn)可能有些場景參數(shù)沒有那么大的時候,也可以保證在很短時間內(nèi)可以得出正確答案,而有些場景非常注重嚴(yán)密的邏輯,就可能需要更大的參數(shù)。因此,2.0版本的天鏡大模型正在向更輕量,更小型化發(fā)展,根據(jù)不同場景選擇能夠起效的最小參數(shù),來實現(xiàn)對成本的有效地控制。

他還表示,此前,大模型創(chuàng)新成本比較貴,一張算力卡初始階段只能支持50個機(jī)器人和人的交互,而現(xiàn)在通過大模型各種調(diào)優(yōu)技術(shù)輕量化,一張同樣的卡可以支持10倍以上的交互。

陸全也表示,過去大家一直把更多的算力都關(guān)注在基礎(chǔ)大模型的訓(xùn)練上,而現(xiàn)在,馬上消費金融的大模型絕大部分算力都消耗在推理上,其次才是消耗在持續(xù)訓(xùn)練上。目前,一些基礎(chǔ)開源大模型發(fā)展得很快,金融垂類模型只需要在它的基礎(chǔ)上做微調(diào)可以快速吃到紅利;另一方面,發(fā)現(xiàn)在實際過程中,并沒有那么大的必要來做基礎(chǔ)模型的精益求精。

陸全表示,目前,公司的金融大模型天鏡在銷售上已經(jīng)為公司帶來了盈利,而且還在探索建立一商業(yè)模式。目前,天鏡大模型正在通過“小步快跑”,不斷證明自身的盈利能力。

未經(jīng)正式授權(quán)嚴(yán)禁轉(zhuǎn)載本文,侵權(quán)必究。

評論

暫無評論哦,快來評價一下吧!

下載界面新聞

微信公眾號

微博

馬上消金CTO蔣寧:金融大模型向智能體、輕量化、全價值鏈創(chuàng)新演進(jìn)

金融大模型正在演進(jìn)成為“智能體”。

界面新聞記者 | 苗藝偉

界面新聞編輯 | 江怡曼

在大模型火爆的兩年內(nèi),馬上消費金融正在實踐中不斷通過 “小步快跑”,實現(xiàn)金融大模型的快速演進(jìn)。

11月28日,在重慶舉辦的數(shù)字生態(tài)伙伴創(chuàng)新大會上,馬上消費金融CTO蔣寧在接受采訪時表示,經(jīng)過年多以來的探索實踐對大模型的認(rèn)識更加深刻,原本業(yè)界普遍認(rèn)為大模型必須滿足巨大的參數(shù),有著高昂訓(xùn)練成本,然而實踐得出的結(jié)論卻并非如此。

他表示,金融大模型可以實現(xiàn)“輕量化應(yīng)用”,降低成本與提高效率之間尋求最優(yōu)解,也可以將金融大模型從單場景創(chuàng)新演進(jìn)成為零售金融全價值鏈大模型,乃至應(yīng)用于更廣泛社會生活的領(lǐng)域;最后,金融大模型正在演進(jìn)成為“智能體”,推理能力而非數(shù)據(jù)訓(xùn)練,將成為大模型具備的更重要的能力。

金融大模型“溢出效應(yīng)”

蔣寧表示,1.0版本的天鏡大模型是一個局部的創(chuàng)新,是由場景驅(qū)動的,主要訓(xùn)練了人機(jī)交互來解決金融客服、營銷等場景的應(yīng)用。當(dāng)時是基于2億用戶,訓(xùn)練了約100P數(shù)據(jù),實現(xiàn)了100億的交易額。

他稱,但在1.0以后,一直在思考在金融這個長價值鏈的產(chǎn)業(yè)中,大模型是否能包括營銷、風(fēng)控、消費者權(quán)益保護(hù),甚至客戶體驗、合規(guī)等場景進(jìn)行應(yīng)用,因此做了深度探索。

蔣寧表示,例如,在反金融黑灰產(chǎn)領(lǐng)域,馬上消金應(yīng)用了多項大模型技術(shù)來進(jìn)行高效反黑。可以在貸款人允許下記錄聲紋,如果后續(xù)交互過程中,發(fā)現(xiàn)他的聲音發(fā)生變化的時候,就有理由懷疑,這可能不是他本人的意思表達(dá)從而識別黑灰產(chǎn)。此外,整合多模態(tài)大模型還可以識別借款人的周邊的環(huán)境、地址、網(wǎng)絡(luò)地址等,再結(jié)合復(fù)雜網(wǎng)絡(luò)技術(shù),隱私計算技術(shù),多種技術(shù)結(jié)合,就形成了打擊黑產(chǎn)的科技能力。

除了金融領(lǐng)域,馬上消費人工智能研究院院長陸全也表示,馬上消金也把在金融領(lǐng)域積累的能力又反哺到國家重大項目里,通過參與社會生態(tài)建設(shè),讓人工智能團(tuán)隊的知識、經(jīng)驗?zāi)茉诟鼜V泛的領(lǐng)域得到鍛煉提升機(jī)會。

馬上消費人工智能研究院鄧偉洪也表示,目前,公司在養(yǎng)老機(jī)器人上做了比較大的投入,可以滿足老年人在社交、康養(yǎng)方面的需求。他表示,養(yǎng)老機(jī)器人未來應(yīng)用場景豐富,一是社交陪伴場景,可以做一個數(shù)字人跟老年人進(jìn)行心理疏導(dǎo)。二是游戲娛樂場景,可以給老人開發(fā)認(rèn)知小游戲,鍛煉他們的認(rèn)知功能,也可以給他們放一些好看的電影。三是安全觀察場景,老年人摔倒是一個很大的風(fēng)險,可以做一些監(jiān)護(hù)。四是未來當(dāng)機(jī)器人可以做到自由運動,可以給老人做一些家務(wù),給老人送藥。

從單體大模型到“智能體”

在采訪中,馬上消費金融人工智能研究院院長陸全表示,在過去兩年的金融大模型實踐過程中,第一個發(fā)現(xiàn)就是光靠單一、單體基礎(chǔ)大模型,或者說單體大模型不能適應(yīng)產(chǎn)業(yè)界絕大多數(shù)應(yīng)用,因此,馬上的天鏡從單體大模型,也逐漸變成了目前的“邏輯”與“記憶”分離的“智能體”。

陸全表示,所謂“智能體”,其背后包括了多個大模型和小模型,通過把這些模型組合在一起,多個模型之間互相協(xié)作,完成一連串的復(fù)雜任務(wù)。

表示,發(fā)現(xiàn)金融多個領(lǐng)域的應(yīng)用都需要多智能體系統(tǒng)來處理,這是因為單體大模型能力相當(dāng)有限,就像一個人不可能是文科狀元,還是理科狀元,還懂管理。而在智能體情況下,大模型就可以相互配合,把邏輯和數(shù)據(jù)分析分離,讓大模型做專業(yè)上最擅長的事情。

陸全稱,這意味著,智能體在某些價值鏈上天然就具備泛化能力,可以移植到類似場景,比如防偽,可能所有場景的要求是一致的。當(dāng)智能體掌握了某個邏輯,且在業(yè)務(wù)形態(tài)比較接近的情況下,就會更具備泛化應(yīng)用的能力。

高成本到“輕量化”

蔣寧表示,在實踐中,對大模型的認(rèn)知也在逐步深入。在天鏡大模型1.0時代,普遍認(rèn)為需要建設(shè)一個高成本、參數(shù)巨大的大模型來訓(xùn)練,才能讓模型能夠發(fā)揮效力。然而,當(dāng)大模型應(yīng)用從單場景向全價值鏈演進(jìn),就發(fā)現(xiàn)可能有些場景參數(shù)沒有那么大的時候,也可以保證在很短時間內(nèi)可以得出正確答案,而有些場景非常注重嚴(yán)密的邏輯,就可能需要更大的參數(shù)。因此,2.0版本的天鏡大模型正在向更輕量,更小型化發(fā)展,根據(jù)不同場景選擇能夠起效的最小參數(shù),來實現(xiàn)對成本的有效地控制。

他還表示,此前,大模型創(chuàng)新成本比較貴,一張算力卡初始階段只能支持50個機(jī)器人和人的交互,而現(xiàn)在通過大模型各種調(diào)優(yōu)技術(shù)輕量化,一張同樣的卡可以支持10倍以上的交互。

陸全也表示,過去大家一直把更多的算力都關(guān)注在基礎(chǔ)大模型的訓(xùn)練上,而現(xiàn)在,馬上消費金融的大模型絕大部分算力都消耗在推理上,其次才是消耗在持續(xù)訓(xùn)練上。目前,一些基礎(chǔ)開源大模型發(fā)展得很快,金融垂類模型只需要在它的基礎(chǔ)上做微調(diào)可以快速吃到紅利;另一方面,發(fā)現(xiàn)在實際過程中,并沒有那么大的必要來做基礎(chǔ)模型的精益求精。

陸全表示,目前,公司的金融大模型天鏡在銷售上已經(jīng)為公司帶來了盈利,而且還在探索建立一商業(yè)模式。目前,天鏡大模型正在通過“小步快跑”,不斷證明自身的盈利能力。

未經(jīng)正式授權(quán)嚴(yán)禁轉(zhuǎn)載本文,侵權(quán)必究。