正在閱讀:

對話微博COO王?。簝?nèi)容平臺如何解決“大模型幻覺”?|REAL大會

掃一掃下載界面新聞APP

對話微博COO王巍:內(nèi)容平臺如何解決“大模型幻覺”?|REAL大會

王巍表示,AIGC所產(chǎn)生的回答,本質(zhì)上是一個文字生成概率問題,因此AI回答內(nèi)容時,必然需要關(guān)注到由概率帶來的不確定風(fēng)險甚至謬誤。

圖片來源:界面新聞

界面新聞記者 | 彭新

今年ChatGPT的爆火,讓AI技術(shù)走入了大眾視野。在輿論普遍關(guān)注討論的潮流之下,圍繞AI開發(fā)拓展的各類應(yīng)用,也給各行各業(yè)的產(chǎn)業(yè)流程再造和格局重塑帶來深層涌動。

對于微博等內(nèi)容平臺而言,AIGC技術(shù)帶來的沖擊更為深刻廣泛,是大模型前期的典型應(yīng)用方向,AI聊天機器人給用戶帶來更真實的社交體驗,而文生圖、文生文等AIGC應(yīng)用,也大幅降低了內(nèi)容創(chuàng)業(yè)者的創(chuàng)作門檻,有利于內(nèi)容快速制作,進一步提高效率。

1026日,在由界面新聞主辦的2023 REAL科技大會上,微博COO、新浪移動CEO王巍稱,在AIGC布局上,微博目前已實現(xiàn)利用AIGC輔助高效內(nèi)容生產(chǎn)、替代部分專業(yè)內(nèi)容生產(chǎn)者角色、根據(jù)用戶需求生成個性化定制內(nèi)容、提升商業(yè)運營效率,AIGC在微博多場景中的應(yīng)用較大提升了內(nèi)容生產(chǎn)效率,并陸續(xù)推出了覆蓋明星、情感等方向的多垂類“AI伴聊”功能。

王巍介紹稱,微博從目前用戶反饋來看,這些功能得到用戶以及藝人工作室的認可,很多用戶在超話、評論區(qū)等地方形成自發(fā)性討論與宣傳。王巍認為,此類垂類“AI伴聊”可以利用垂類博主在不同領(lǐng)域的專業(yè)知識,通過風(fēng)格化、專業(yè)化聊天互動,為用戶提供信息價值并優(yōu)化用戶社交體驗,同時提升粉絲與博主的互動粘性,功能也得到了用戶的認可。

作為內(nèi)容平臺, 從目前國內(nèi)外的AIGC技術(shù)在內(nèi)容社區(qū)的實踐來看,相關(guān)應(yīng)用均存在一定爭議,比如版權(quán)所有方對于數(shù)據(jù)集訓(xùn)練和標注的爭議,近期包括社交平臺X(原推特)、OpenAI均受到相關(guān)版權(quán)方法律爭議。

對此王巍坦言,內(nèi)容平臺的版權(quán)爭議將長期存在,但核心問題可能是AIGC及其應(yīng)用的發(fā)展速度太快,社會影響面太大,這造成對之前大家都比較習(xí)慣的傳統(tǒng)方式帶來很大沖擊,包括觀念方面的以及使用習(xí)慣方面的。

“當人們在擁抱技術(shù)的時候,你肯定是先擁抱技術(shù)的機會,然后再考慮其他挑戰(zhàn),而挑戰(zhàn)所帶來的社會問題,隨之而來需要解決?!蓖跷「嬖V界面新聞記者,AIGC來得太快,對于很多新現(xiàn)象、新問題,人們各方面,包括心理上還沒準備好,就像汽車剛面世的時候,人們對于汽車、馬車哪個更好存在爭議,但這并不能阻止汽車快速普及。

不過,盡管AIGC帶來了內(nèi)容創(chuàng)作進入下一個階段的曙光。王巍看到,在有了底層大模型生態(tài),以及微博這樣的終端應(yīng)用場景平臺情況下,仍有三大問題制約AIGC應(yīng)用實現(xiàn)爆發(fā)性增長:首先是大模型推理成本居高不下。目前結(jié)論是模型規(guī)模越大效果越好,但是這帶來推理成本很高的問題,一旦使用應(yīng)用的用戶規(guī)模上來,成本之高很難承受;

其次是大模型幻覺問題。在很多嚴肅商業(yè)應(yīng)用環(huán)境下,不允許大模型輸出“幻覺”內(nèi)容,所以這嚴重約束并減少了大模型的應(yīng)用場景。

最后,大模型在生成內(nèi)容可控性方面仍然有缺陷,這體現(xiàn)出技術(shù)仍然不夠成熟。比如很多文生圖模型,在正確生成圖片中的漢字或者精細內(nèi)容可控生成方面仍顯不足。這制約了大模型的應(yīng)用效果和應(yīng)用范圍。

所謂“大模型幻覺”,通俗來說就是AI會“一本正經(jīng)地胡說八道”,如ChatGPT在聊天中輸出與常識不符的聊天內(nèi)容。該如何解決大模型幻覺問題?對此王巍表示,AIGC所產(chǎn)生的回答,本質(zhì)上是一個文字生成概率問題,因此AI回答內(nèi)容時,必然需要關(guān)注到由概率帶來的不確定風(fēng)險甚至謬誤。但從技術(shù)角度來看,內(nèi)容平臺上可以通過調(diào)整某些模型參數(shù)來對AI模型進行一個文字輸出概率上的調(diào)整,如AI在回答醫(yī)療等需要嚴謹答案的問題時,就可通過設(shè)置合適的溫度超參系數(shù),強制讓AI不要過于自由發(fā)揮,給出更精確更可信的答案。

王巍介紹,在解決大模型中的幻覺時,微博主要有兩點考慮:一方面,微博利用現(xiàn)有相對成熟的技術(shù)方案緩解幻覺問題。比如采用Langchain+向量知識庫的方案,將很多背景事實信息存入向量數(shù)據(jù)庫中,通過搜索增強的方式來盡量減少大模型幻覺。另外一方面,微博也會探索一些對于大模型幻覺不敏感的應(yīng)用方向,比如虛擬角色或類似Character.ai的場景,對此類應(yīng)用而言,大模型產(chǎn)生幻覺不是大問題,甚至有時候還是好事情,比如幻覺內(nèi)容會讓用戶覺得回答更有趣或者更有創(chuàng)意。

未經(jīng)正式授權(quán)嚴禁轉(zhuǎn)載本文,侵權(quán)必究。

新浪微博

3.4k
  • 羅永浩再談“真還傳”:已經(jīng)還了8.24億
  • 極越第二款車將于9月10日上市

評論

暫無評論哦,快來評價一下吧!

下載界面新聞

微信公眾號

微博

對話微博COO王?。簝?nèi)容平臺如何解決“大模型幻覺”?|REAL大會

王巍表示,AIGC所產(chǎn)生的回答,本質(zhì)上是一個文字生成概率問題,因此AI回答內(nèi)容時,必然需要關(guān)注到由概率帶來的不確定風(fēng)險甚至謬誤。

圖片來源:界面新聞

界面新聞記者 | 彭新

今年ChatGPT的爆火,讓AI技術(shù)走入了大眾視野。在輿論普遍關(guān)注討論的潮流之下,圍繞AI開發(fā)拓展的各類應(yīng)用,也給各行各業(yè)的產(chǎn)業(yè)流程再造和格局重塑帶來深層涌動。

對于微博等內(nèi)容平臺而言,AIGC技術(shù)帶來的沖擊更為深刻廣泛,是大模型前期的典型應(yīng)用方向,AI聊天機器人給用戶帶來更真實的社交體驗,而文生圖、文生文等AIGC應(yīng)用,也大幅降低了內(nèi)容創(chuàng)業(yè)者的創(chuàng)作門檻,有利于內(nèi)容快速制作,進一步提高效率。

1026日,在由界面新聞主辦的2023 REAL科技大會上,微博COO、新浪移動CEO王巍稱,在AIGC布局上,微博目前已實現(xiàn)利用AIGC輔助高效內(nèi)容生產(chǎn)、替代部分專業(yè)內(nèi)容生產(chǎn)者角色、根據(jù)用戶需求生成個性化定制內(nèi)容、提升商業(yè)運營效率,AIGC在微博多場景中的應(yīng)用較大提升了內(nèi)容生產(chǎn)效率,并陸續(xù)推出了覆蓋明星、情感等方向的多垂類“AI伴聊”功能。

王巍介紹稱,微博從目前用戶反饋來看,這些功能得到用戶以及藝人工作室的認可,很多用戶在超話、評論區(qū)等地方形成自發(fā)性討論與宣傳。王巍認為,此類垂類“AI伴聊”可以利用垂類博主在不同領(lǐng)域的專業(yè)知識,通過風(fēng)格化、專業(yè)化聊天互動,為用戶提供信息價值并優(yōu)化用戶社交體驗,同時提升粉絲與博主的互動粘性,功能也得到了用戶的認可。

作為內(nèi)容平臺, 從目前國內(nèi)外的AIGC技術(shù)在內(nèi)容社區(qū)的實踐來看,相關(guān)應(yīng)用均存在一定爭議,比如版權(quán)所有方對于數(shù)據(jù)集訓(xùn)練和標注的爭議,近期包括社交平臺X(原推特)、OpenAI均受到相關(guān)版權(quán)方法律爭議。

對此王巍坦言,內(nèi)容平臺的版權(quán)爭議將長期存在,但核心問題可能是AIGC及其應(yīng)用的發(fā)展速度太快,社會影響面太大,這造成對之前大家都比較習(xí)慣的傳統(tǒng)方式帶來很大沖擊,包括觀念方面的以及使用習(xí)慣方面的。

“當人們在擁抱技術(shù)的時候,你肯定是先擁抱技術(shù)的機會,然后再考慮其他挑戰(zhàn),而挑戰(zhàn)所帶來的社會問題,隨之而來需要解決?!蓖跷「嬖V界面新聞記者,AIGC來得太快,對于很多新現(xiàn)象、新問題,人們各方面,包括心理上還沒準備好,就像汽車剛面世的時候,人們對于汽車、馬車哪個更好存在爭議,但這并不能阻止汽車快速普及。

不過,盡管AIGC帶來了內(nèi)容創(chuàng)作進入下一個階段的曙光。王巍看到,在有了底層大模型生態(tài),以及微博這樣的終端應(yīng)用場景平臺情況下,仍有三大問題制約AIGC應(yīng)用實現(xiàn)爆發(fā)性增長:首先是大模型推理成本居高不下。目前結(jié)論是模型規(guī)模越大效果越好,但是這帶來推理成本很高的問題,一旦使用應(yīng)用的用戶規(guī)模上來,成本之高很難承受;

其次是大模型幻覺問題。在很多嚴肅商業(yè)應(yīng)用環(huán)境下,不允許大模型輸出“幻覺”內(nèi)容,所以這嚴重約束并減少了大模型的應(yīng)用場景。

最后,大模型在生成內(nèi)容可控性方面仍然有缺陷,這體現(xiàn)出技術(shù)仍然不夠成熟。比如很多文生圖模型,在正確生成圖片中的漢字或者精細內(nèi)容可控生成方面仍顯不足。這制約了大模型的應(yīng)用效果和應(yīng)用范圍。

所謂“大模型幻覺”,通俗來說就是AI會“一本正經(jīng)地胡說八道”,如ChatGPT在聊天中輸出與常識不符的聊天內(nèi)容。該如何解決大模型幻覺問題?對此王巍表示,AIGC所產(chǎn)生的回答,本質(zhì)上是一個文字生成概率問題,因此AI回答內(nèi)容時,必然需要關(guān)注到由概率帶來的不確定風(fēng)險甚至謬誤。但從技術(shù)角度來看,內(nèi)容平臺上可以通過調(diào)整某些模型參數(shù)來對AI模型進行一個文字輸出概率上的調(diào)整,如AI在回答醫(yī)療等需要嚴謹答案的問題時,就可通過設(shè)置合適的溫度超參系數(shù),強制讓AI不要過于自由發(fā)揮,給出更精確更可信的答案。

王巍介紹,在解決大模型中的幻覺時,微博主要有兩點考慮:一方面,微博利用現(xiàn)有相對成熟的技術(shù)方案緩解幻覺問題。比如采用Langchain+向量知識庫的方案,將很多背景事實信息存入向量數(shù)據(jù)庫中,通過搜索增強的方式來盡量減少大模型幻覺。另外一方面,微博也會探索一些對于大模型幻覺不敏感的應(yīng)用方向,比如虛擬角色或類似Character.ai的場景,對此類應(yīng)用而言,大模型產(chǎn)生幻覺不是大問題,甚至有時候還是好事情,比如幻覺內(nèi)容會讓用戶覺得回答更有趣或者更有創(chuàng)意。

未經(jīng)正式授權(quán)嚴禁轉(zhuǎn)載本文,侵權(quán)必究。