正在閱讀:

騰訊云發(fā)布AI原生向量數(shù)據(jù)庫(kù),提供10億級(jí)向量檢索能力

掃一掃下載界面新聞APP

騰訊云發(fā)布AI原生向量數(shù)據(jù)庫(kù),提供10億級(jí)向量檢索能力

企業(yè)接入大模型需要花費(fèi)的時(shí)間,能從一個(gè)月降低至三天左右

圖片來源:視覺中國(guó)

界面新聞?dòng)浾?| 崔鵬

74日下午,騰訊云正式發(fā)布AI原生(AI Native)向量數(shù)據(jù)庫(kù)Tencent Cloud VectorDB,該數(shù)據(jù)庫(kù)能夠被廣泛應(yīng)用于大模型的訓(xùn)練、推理和知識(shí)庫(kù)補(bǔ)充等場(chǎng)景。騰訊方面表示,它是國(guó)內(nèi)首個(gè)從接入層、計(jì)算層、到存儲(chǔ)層提供全生命周期AI化的向量數(shù)據(jù)庫(kù)。

根據(jù)官方公開的數(shù)據(jù)信息,騰訊云向量數(shù)據(jù)庫(kù)最高支持10億級(jí)向量檢索規(guī)模,延遲控制在毫秒級(jí);它相比傳統(tǒng)單機(jī)插件式數(shù)據(jù)庫(kù)檢索規(guī)模提升10倍,同時(shí)具備百萬(wàn)級(jí)每秒查詢(QPS)的峰值能力。

如果你看好AI大模型,就應(yīng)該看好向量數(shù)據(jù)庫(kù),騰訊云數(shù)據(jù)庫(kù)副總經(jīng)理羅云表示,隨著大模型的不斷發(fā)展和普及,AI Native向量數(shù)據(jù)庫(kù)將成為企業(yè)數(shù)據(jù)處理的標(biāo)配。

向量數(shù)據(jù)庫(kù)通過把數(shù)據(jù)向量化然后進(jìn)行存儲(chǔ)和查詢,能極大提升效率和降低成本。它能解決大模型預(yù)訓(xùn)練成本高、沒有長(zhǎng)期記憶、知識(shí)更新不足、提示詞工程復(fù)雜等問題,突破大模型在時(shí)間和空間上的限制,加速大模型落地行業(yè)場(chǎng)景。

騰訊官方的數(shù)據(jù)顯示,將騰訊云向量數(shù)據(jù)庫(kù)用于大模型預(yù)訓(xùn)練數(shù)據(jù)的分類、去重和清洗相比傳統(tǒng)方式可以實(shí)現(xiàn)10倍效率的提升,如果將向量數(shù)據(jù)庫(kù)作為外部知識(shí)庫(kù)用于模型推理,則可以將成本降低2-4個(gè)數(shù)量級(jí)。

羅云稱,騰訊云重新定義了AI Native的開發(fā)范式,提供了接入層、計(jì)算層、存儲(chǔ)層的全面AI化解決方案,使用戶在使用向量數(shù)據(jù)庫(kù)的全生命周期,都能應(yīng)用到AI能力。

具體而言,在接入層,騰訊云向量數(shù)據(jù)庫(kù)支持自然語(yǔ)言文本的輸入,同時(shí)采用標(biāo)量+向量的查詢方式,支持全內(nèi)存索引;在計(jì)算層,AI Native開發(fā)范式能實(shí)現(xiàn)全量數(shù)據(jù)AI計(jì)算,一站解決企業(yè)在搭建私域知識(shí)庫(kù)時(shí)的文本切分(segment)、向量化(embedding)等難題;在存儲(chǔ)層,騰訊云向量數(shù)據(jù)庫(kù)支持?jǐn)?shù)據(jù)智能存儲(chǔ)分布,讓企業(yè)存儲(chǔ)成本降低50%

騰訊官方信息稱,使用騰訊云向量數(shù)據(jù)庫(kù)后,企業(yè)接入大模型需要花費(fèi)的時(shí)間,能從一個(gè)月降低至三天左右,極大降低企業(yè)的接入成本。

對(duì)于產(chǎn)品的商業(yè)化問題,羅云表示,目前向量數(shù)據(jù)庫(kù)可以單獨(dú)對(duì)外提供,未來也不排除把向量數(shù)據(jù)庫(kù)和其它相關(guān)產(chǎn)品打包售賣的可能性。

在具體落地應(yīng)用層面,騰訊方面表示,該向量數(shù)據(jù)庫(kù)基于騰訊每日處理千億次檢索的向量引擎(OLAMA),數(shù)據(jù)接入AI的效率比傳統(tǒng)方案提升10倍,運(yùn)行穩(wěn)定性達(dá)到99.99%,目前已經(jīng)應(yīng)用在騰訊視頻、QQ瀏覽器、QQ音樂等30多款騰訊內(nèi)部產(chǎn)品之中。

以騰訊視頻的應(yīng)用為例,視頻庫(kù)中的圖片、音頻、標(biāo)題文本等內(nèi)容使用騰訊云向量數(shù)據(jù)庫(kù),月均完成的檢索和計(jì)算量高達(dá)200億次,能夠滿足版權(quán)保護(hù)、原創(chuàng)識(shí)別、相似性檢索等場(chǎng)景需求。

從使用結(jié)果來看,向量數(shù)據(jù)庫(kù)能直接提升運(yùn)營(yíng)效率。官方信息顯示,使用騰訊云向量數(shù)據(jù)庫(kù)后,QQ音樂人均聽歌時(shí)長(zhǎng)提升3.2%、騰訊視頻有效曝光人均時(shí)長(zhǎng)提升1.74%、QQ瀏覽器成本降低了37.9%。

未經(jīng)正式授權(quán)嚴(yán)禁轉(zhuǎn)載本文,侵權(quán)必究。

評(píng)論

暫無(wú)評(píng)論哦,快來評(píng)價(jià)一下吧!

下載界面新聞

微信公眾號(hào)

微博

騰訊云發(fā)布AI原生向量數(shù)據(jù)庫(kù),提供10億級(jí)向量檢索能力

企業(yè)接入大模型需要花費(fèi)的時(shí)間,能從一個(gè)月降低至三天左右

圖片來源:視覺中國(guó)

界面新聞?dòng)浾?| 崔鵬

74日下午,騰訊云正式發(fā)布AI原生(AI Native)向量數(shù)據(jù)庫(kù)Tencent Cloud VectorDB,該數(shù)據(jù)庫(kù)能夠被廣泛應(yīng)用于大模型的訓(xùn)練、推理和知識(shí)庫(kù)補(bǔ)充等場(chǎng)景。騰訊方面表示,它是國(guó)內(nèi)首個(gè)從接入層、計(jì)算層、到存儲(chǔ)層提供全生命周期AI化的向量數(shù)據(jù)庫(kù)。

根據(jù)官方公開的數(shù)據(jù)信息,騰訊云向量數(shù)據(jù)庫(kù)最高支持10億級(jí)向量檢索規(guī)模,延遲控制在毫秒級(jí);它相比傳統(tǒng)單機(jī)插件式數(shù)據(jù)庫(kù)檢索規(guī)模提升10倍,同時(shí)具備百萬(wàn)級(jí)每秒查詢(QPS)的峰值能力。

如果你看好AI大模型,就應(yīng)該看好向量數(shù)據(jù)庫(kù),騰訊云數(shù)據(jù)庫(kù)副總經(jīng)理羅云表示,隨著大模型的不斷發(fā)展和普及,AI Native向量數(shù)據(jù)庫(kù)將成為企業(yè)數(shù)據(jù)處理的標(biāo)配。

向量數(shù)據(jù)庫(kù)通過把數(shù)據(jù)向量化然后進(jìn)行存儲(chǔ)和查詢,能極大提升效率和降低成本。它能解決大模型預(yù)訓(xùn)練成本高、沒有長(zhǎng)期記憶、知識(shí)更新不足、提示詞工程復(fù)雜等問題,突破大模型在時(shí)間和空間上的限制,加速大模型落地行業(yè)場(chǎng)景。

騰訊官方的數(shù)據(jù)顯示,將騰訊云向量數(shù)據(jù)庫(kù)用于大模型預(yù)訓(xùn)練數(shù)據(jù)的分類、去重和清洗相比傳統(tǒng)方式可以實(shí)現(xiàn)10倍效率的提升,如果將向量數(shù)據(jù)庫(kù)作為外部知識(shí)庫(kù)用于模型推理,則可以將成本降低2-4個(gè)數(shù)量級(jí)。

羅云稱,騰訊云重新定義了AI Native的開發(fā)范式,提供了接入層、計(jì)算層、存儲(chǔ)層的全面AI化解決方案,使用戶在使用向量數(shù)據(jù)庫(kù)的全生命周期,都能應(yīng)用到AI能力。

具體而言,在接入層,騰訊云向量數(shù)據(jù)庫(kù)支持自然語(yǔ)言文本的輸入,同時(shí)采用標(biāo)量+向量的查詢方式,支持全內(nèi)存索引;在計(jì)算層,AI Native開發(fā)范式能實(shí)現(xiàn)全量數(shù)據(jù)AI計(jì)算,一站解決企業(yè)在搭建私域知識(shí)庫(kù)時(shí)的文本切分(segment)、向量化(embedding)等難題;在存儲(chǔ)層,騰訊云向量數(shù)據(jù)庫(kù)支持?jǐn)?shù)據(jù)智能存儲(chǔ)分布,讓企業(yè)存儲(chǔ)成本降低50%。

騰訊官方信息稱,使用騰訊云向量數(shù)據(jù)庫(kù)后,企業(yè)接入大模型需要花費(fèi)的時(shí)間,能從一個(gè)月降低至三天左右,極大降低企業(yè)的接入成本。

對(duì)于產(chǎn)品的商業(yè)化問題,羅云表示,目前向量數(shù)據(jù)庫(kù)可以單獨(dú)對(duì)外提供,未來也不排除把向量數(shù)據(jù)庫(kù)和其它相關(guān)產(chǎn)品打包售賣的可能性。

在具體落地應(yīng)用層面,騰訊方面表示,該向量數(shù)據(jù)庫(kù)基于騰訊每日處理千億次檢索的向量引擎(OLAMA),數(shù)據(jù)接入AI的效率比傳統(tǒng)方案提升10倍,運(yùn)行穩(wěn)定性達(dá)到99.99%,目前已經(jīng)應(yīng)用在騰訊視頻、QQ瀏覽器、QQ音樂等30多款騰訊內(nèi)部產(chǎn)品之中。

以騰訊視頻的應(yīng)用為例,視頻庫(kù)中的圖片、音頻、標(biāo)題文本等內(nèi)容使用騰訊云向量數(shù)據(jù)庫(kù),月均完成的檢索和計(jì)算量高達(dá)200億次,能夠滿足版權(quán)保護(hù)、原創(chuàng)識(shí)別、相似性檢索等場(chǎng)景需求。

從使用結(jié)果來看,向量數(shù)據(jù)庫(kù)能直接提升運(yùn)營(yíng)效率。官方信息顯示,使用騰訊云向量數(shù)據(jù)庫(kù)后,QQ音樂人均聽歌時(shí)長(zhǎng)提升3.2%、騰訊視頻有效曝光人均時(shí)長(zhǎng)提升1.74%、QQ瀏覽器成本降低了37.9%

未經(jīng)正式授權(quán)嚴(yán)禁轉(zhuǎn)載本文,侵權(quán)必究。