正在閱讀:

海天瑞聲(688787.SH):大模型強(qiáng)化學(xué)習(xí)環(huán)節(jié)的整體數(shù)據(jù)需求在逐漸攀升,逐漸向更多垂類(lèi)拓展

掃一掃下載界面新聞APP

海天瑞聲(688787.SH):大模型強(qiáng)化學(xué)習(xí)環(huán)節(jié)的整體數(shù)據(jù)需求在逐漸攀升,逐漸向更多垂類(lèi)拓展

2024年6月6日海天瑞聲接受華夏基金等機(jī)構(gòu)調(diào)研,證券事務(wù)代表:張哲參與接待,并回答了調(diào)研機(jī)構(gòu)提出的問(wèn)題。

圖片來(lái)源: 圖蟲(chóng)創(chuàng)意

海天瑞聲(688787.SH)2024年6月11日發(fā)布消息稱(chēng),2024年6月6日海天瑞聲接受華夏基金等機(jī)構(gòu)調(diào)研,證券事務(wù)代表:張哲參與接待,并回答了調(diào)研機(jī)構(gòu)提出的問(wèn)題。

調(diào)研機(jī)構(gòu)詳情如下:

賈靜雯/華夏基金;白海波/樂(lè)正資本;張宸/銀河證券;王霆/國(guó)華興盛資產(chǎn);楊子平/川流資本;范明/國(guó)泰君安證券資產(chǎn)管理;許斐/霽峰資本;錢(qián)小英/上海鍇量。

調(diào)研主要內(nèi)容:

1、請(qǐng)問(wèn)公司2023年收入下滑的原因是什么?

2023年,公司營(yíng)業(yè)收入為1.70億元,較去年同期下降35.33%,主要系受境外部分客戶(hù)進(jìn)行階段性裁員、業(yè)務(wù)方向及研發(fā)節(jié)奏周期性調(diào)整等影響,部分客戶(hù)2023年預(yù)算釋放進(jìn)度放緩,同時(shí)疊加2023年上半年數(shù)據(jù)出境相關(guān)法規(guī)落地實(shí)施的階段性影響,公司境外收入同比大幅下滑。境內(nèi)業(yè)務(wù)方面,雖然宏觀穩(wěn)經(jīng)濟(jì)政策已初見(jiàn)成效,但國(guó)內(nèi)仍面臨復(fù)雜嚴(yán)峻的內(nèi)外部環(huán)境考驗(yàn),部分境內(nèi)客戶(hù)對(duì)集中性研發(fā)投入仍持謹(jǐn)慎態(tài)度,基礎(chǔ)數(shù)據(jù)服務(wù)領(lǐng)域客戶(hù)預(yù)算及需求釋放出現(xiàn)階段性減緩,疊加行業(yè)內(nèi)競(jìng)爭(zhēng)加劇,綜合導(dǎo)致境內(nèi)收入同比下滑。

2、公司2024年第一季度收入同比增長(zhǎng)的原因是什么?

公司2024年第一季度收入增長(zhǎng)主要系在大模型技術(shù)的逐步發(fā)展和應(yīng)用領(lǐng)域不斷拓展的帶動(dòng)下,全球各類(lèi)型科技公司對(duì)人工智能領(lǐng)域的研發(fā)投入呈現(xiàn)出復(fù)蘇并增長(zhǎng)的趨勢(shì),帶動(dòng)以多語(yǔ)言智能語(yǔ)音、文本為代表的數(shù)據(jù)需求快速增加,整體拉動(dòng)公司第一季度營(yíng)業(yè)收入同比大幅提升。

3、公司政企類(lèi)項(xiàng)目目前有哪些進(jìn)展?

目前,公司正在與北京、安徽、山東、河北等地進(jìn)行對(duì)接。若相關(guān)合作達(dá)到信息披露要求,公司將及時(shí)履行信息披露義務(wù)。

4、大模型范式下的預(yù)訓(xùn)練階段數(shù)據(jù)需求和傳統(tǒng)的數(shù)據(jù)需求有什么區(qū)別?

大模型預(yù)訓(xùn)練階段的數(shù)據(jù)需求和深度學(xué)習(xí)技術(shù)路線(xiàn)下的傳統(tǒng)訓(xùn)練數(shù)據(jù)需求,兩者在形態(tài)上基本一致,都是文本、語(yǔ)音和圖像,但在數(shù)據(jù)規(guī)模、質(zhì)量、來(lái)源等方面,預(yù)訓(xùn)練數(shù)據(jù)較傳統(tǒng)訓(xùn)練數(shù)據(jù)會(huì)存在一定差異。例如,規(guī)模上,預(yù)訓(xùn)練數(shù)據(jù)的token量普遍在萬(wàn)億量級(jí),而傳統(tǒng)模型數(shù)量則大約在10億量級(jí)。從數(shù)據(jù)來(lái)源的角度看,由于大模型所需數(shù)據(jù)規(guī)模遠(yuǎn)超傳統(tǒng)模型,因此其數(shù)據(jù)來(lái)源將更加豐富以滿(mǎn)足規(guī)模化、多元化數(shù)據(jù)需求。具體來(lái)說(shuō),大模型數(shù)據(jù)來(lái)源除了來(lái)自傳統(tǒng)的定向采集外,還將涉及版權(quán)數(shù)據(jù)、公共數(shù)據(jù)等新型海量高質(zhì)量數(shù)據(jù)來(lái)源。

此外,數(shù)據(jù)處理的核心技術(shù)也存在一定差異。例如,由于大模型預(yù)訓(xùn)練階段的原料數(shù)據(jù)規(guī)模更大,因此大模型預(yù)訓(xùn)練數(shù)據(jù)更加注重?cái)?shù)據(jù)清洗的工程化能力,在預(yù)訓(xùn)練階段需要結(jié)合原料數(shù)據(jù)特點(diǎn)以及所涉及的主題、領(lǐng)域等,對(duì)海量數(shù)據(jù)完成高質(zhì)量清洗,這對(duì)數(shù)據(jù)服務(wù)商的工程化數(shù)據(jù)處理能力以及過(guò)往服務(wù)經(jīng)驗(yàn)的積累都提出了更高要求。

5、目前已經(jīng)有很多大模型陸續(xù)發(fā)布,未來(lái)數(shù)據(jù)需求是會(huì)持續(xù)增長(zhǎng)還是下降?原因是什么?

隨著更多大模型產(chǎn)品面向公眾推出上線(xiàn)、以及不斷進(jìn)行版本迭代,未來(lái)的大模型相關(guān)數(shù)據(jù)需求會(huì)持續(xù)、顯著增長(zhǎng),這符合當(dāng)AI進(jìn)行應(yīng)用側(cè)后,對(duì)數(shù)據(jù)的需求才會(huì)規(guī)模性增長(zhǎng)的規(guī)律。預(yù)期該類(lèi)增長(zhǎng)將主要體現(xiàn)在預(yù)訓(xùn)練階段對(duì)高質(zhì)量、大規(guī)模的版權(quán)數(shù)據(jù)、公共數(shù)據(jù)、多模態(tài)數(shù)據(jù)、垂直領(lǐng)域的實(shí)際場(chǎng)景數(shù)據(jù)等方面的需求,以及不斷提升其交互精準(zhǔn)度的強(qiáng)化學(xué)習(xí)階段各類(lèi)數(shù)據(jù)需求等。例如,若某大模型應(yīng)用領(lǐng)域?yàn)槲膶W(xué)創(chuàng)作,就會(huì)需要來(lái)自版權(quán)方的散文、小說(shuō)、詩(shī)詞等數(shù)據(jù)進(jìn)行創(chuàng)作能力訓(xùn)練;若某大模型擬提升其在民生政務(wù)領(lǐng)域的客服能力,則來(lái)自民生政務(wù)服務(wù)平臺(tái)的此類(lèi)對(duì)話(huà)數(shù)據(jù)將產(chǎn)生重要價(jià)值。未來(lái),隨著大模型向更高級(jí)、更多維、更廣泛垂向拓展,大模型數(shù)據(jù)需求將呈現(xiàn)快速增長(zhǎng)趨勢(shì)。

6、強(qiáng)化學(xué)習(xí)階段的數(shù)據(jù)服務(wù),今年有何進(jìn)展或者變化?

目前來(lái)看,隨著各大模型的陸續(xù)上線(xiàn),強(qiáng)化學(xué)習(xí)環(huán)節(jié)的整體數(shù)據(jù)需求在逐漸攀升,并在具體標(biāo)注任務(wù)上呈現(xiàn)如下趨勢(shì):

(1)逐漸向更多垂類(lèi)拓展(例如,法律、金融、醫(yī)療);(2)強(qiáng)化學(xué)習(xí)標(biāo)注的評(píng)價(jià)/評(píng)分指標(biāo)變得更為豐富,會(huì)要求標(biāo)注人員從更多維度對(duì)模型的問(wèn)答進(jìn)行評(píng)判和打分;(3)由單模態(tài)向多模態(tài)轉(zhuǎn)變:23年主要的標(biāo)注需求集中在文本類(lèi)標(biāo)注,今年開(kāi)始逐步向多模態(tài)拓展(例如,文本-視頻、文本-圖像等)。


未經(jīng)正式授權(quán)嚴(yán)禁轉(zhuǎn)載本文,侵權(quán)必究。如需轉(zhuǎn)載請(qǐng)聯(lián)系:youlianyunpindao@163.com

海天瑞聲

159
  • 機(jī)構(gòu)風(fēng)向標(biāo) | 海天瑞聲(688787)2024年二季度前十大機(jī)構(gòu)持股比例合計(jì)下跌了0.06個(gè)百分點(diǎn)
  • 海天瑞聲(688787.SH):2024年中報(bào)凈利潤(rùn)為41.64萬(wàn)元,同比扭虧為盈

華夏基金

2.6k
  • 華夏基金華潤(rùn)有巢REIT2024年中報(bào):保持穩(wěn)健底色 積極回饋投資者
  • 8月逾900億資金凈買(mǎi)入ETF,黃金相關(guān)ETF遇冷

評(píng)論

暫無(wú)評(píng)論哦,快來(lái)評(píng)價(jià)一下吧!

下載界面新聞

微信公眾號(hào)

微博

海天瑞聲(688787.SH):大模型強(qiáng)化學(xué)習(xí)環(huán)節(jié)的整體數(shù)據(jù)需求在逐漸攀升,逐漸向更多垂類(lèi)拓展

2024年6月6日海天瑞聲接受華夏基金等機(jī)構(gòu)調(diào)研,證券事務(wù)代表:張哲參與接待,并回答了調(diào)研機(jī)構(gòu)提出的問(wèn)題。

圖片來(lái)源: 圖蟲(chóng)創(chuàng)意

海天瑞聲(688787.SH)2024年6月11日發(fā)布消息稱(chēng),2024年6月6日海天瑞聲接受華夏基金等機(jī)構(gòu)調(diào)研,證券事務(wù)代表:張哲參與接待,并回答了調(diào)研機(jī)構(gòu)提出的問(wèn)題。

調(diào)研機(jī)構(gòu)詳情如下:

賈靜雯/華夏基金;白海波/樂(lè)正資本;張宸/銀河證券;王霆/國(guó)華興盛資產(chǎn);楊子平/川流資本;范明/國(guó)泰君安證券資產(chǎn)管理;許斐/霽峰資本;錢(qián)小英/上海鍇量。

調(diào)研主要內(nèi)容:

1、請(qǐng)問(wèn)公司2023年收入下滑的原因是什么?

2023年,公司營(yíng)業(yè)收入為1.70億元,較去年同期下降35.33%,主要系受境外部分客戶(hù)進(jìn)行階段性裁員、業(yè)務(wù)方向及研發(fā)節(jié)奏周期性調(diào)整等影響,部分客戶(hù)2023年預(yù)算釋放進(jìn)度放緩,同時(shí)疊加2023年上半年數(shù)據(jù)出境相關(guān)法規(guī)落地實(shí)施的階段性影響,公司境外收入同比大幅下滑。境內(nèi)業(yè)務(wù)方面,雖然宏觀穩(wěn)經(jīng)濟(jì)政策已初見(jiàn)成效,但國(guó)內(nèi)仍面臨復(fù)雜嚴(yán)峻的內(nèi)外部環(huán)境考驗(yàn),部分境內(nèi)客戶(hù)對(duì)集中性研發(fā)投入仍持謹(jǐn)慎態(tài)度,基礎(chǔ)數(shù)據(jù)服務(wù)領(lǐng)域客戶(hù)預(yù)算及需求釋放出現(xiàn)階段性減緩,疊加行業(yè)內(nèi)競(jìng)爭(zhēng)加劇,綜合導(dǎo)致境內(nèi)收入同比下滑。

2、公司2024年第一季度收入同比增長(zhǎng)的原因是什么?

公司2024年第一季度收入增長(zhǎng)主要系在大模型技術(shù)的逐步發(fā)展和應(yīng)用領(lǐng)域不斷拓展的帶動(dòng)下,全球各類(lèi)型科技公司對(duì)人工智能領(lǐng)域的研發(fā)投入呈現(xiàn)出復(fù)蘇并增長(zhǎng)的趨勢(shì),帶動(dòng)以多語(yǔ)言智能語(yǔ)音、文本為代表的數(shù)據(jù)需求快速增加,整體拉動(dòng)公司第一季度營(yíng)業(yè)收入同比大幅提升。

3、公司政企類(lèi)項(xiàng)目目前有哪些進(jìn)展?

目前,公司正在與北京、安徽、山東、河北等地進(jìn)行對(duì)接。若相關(guān)合作達(dá)到信息披露要求,公司將及時(shí)履行信息披露義務(wù)。

4、大模型范式下的預(yù)訓(xùn)練階段數(shù)據(jù)需求和傳統(tǒng)的數(shù)據(jù)需求有什么區(qū)別?

大模型預(yù)訓(xùn)練階段的數(shù)據(jù)需求和深度學(xué)習(xí)技術(shù)路線(xiàn)下的傳統(tǒng)訓(xùn)練數(shù)據(jù)需求,兩者在形態(tài)上基本一致,都是文本、語(yǔ)音和圖像,但在數(shù)據(jù)規(guī)模、質(zhì)量、來(lái)源等方面,預(yù)訓(xùn)練數(shù)據(jù)較傳統(tǒng)訓(xùn)練數(shù)據(jù)會(huì)存在一定差異。例如,規(guī)模上,預(yù)訓(xùn)練數(shù)據(jù)的token量普遍在萬(wàn)億量級(jí),而傳統(tǒng)模型數(shù)量則大約在10億量級(jí)。從數(shù)據(jù)來(lái)源的角度看,由于大模型所需數(shù)據(jù)規(guī)模遠(yuǎn)超傳統(tǒng)模型,因此其數(shù)據(jù)來(lái)源將更加豐富以滿(mǎn)足規(guī)模化、多元化數(shù)據(jù)需求。具體來(lái)說(shuō),大模型數(shù)據(jù)來(lái)源除了來(lái)自傳統(tǒng)的定向采集外,還將涉及版權(quán)數(shù)據(jù)、公共數(shù)據(jù)等新型海量高質(zhì)量數(shù)據(jù)來(lái)源。

此外,數(shù)據(jù)處理的核心技術(shù)也存在一定差異。例如,由于大模型預(yù)訓(xùn)練階段的原料數(shù)據(jù)規(guī)模更大,因此大模型預(yù)訓(xùn)練數(shù)據(jù)更加注重?cái)?shù)據(jù)清洗的工程化能力,在預(yù)訓(xùn)練階段需要結(jié)合原料數(shù)據(jù)特點(diǎn)以及所涉及的主題、領(lǐng)域等,對(duì)海量數(shù)據(jù)完成高質(zhì)量清洗,這對(duì)數(shù)據(jù)服務(wù)商的工程化數(shù)據(jù)處理能力以及過(guò)往服務(wù)經(jīng)驗(yàn)的積累都提出了更高要求。

5、目前已經(jīng)有很多大模型陸續(xù)發(fā)布,未來(lái)數(shù)據(jù)需求是會(huì)持續(xù)增長(zhǎng)還是下降?原因是什么?

隨著更多大模型產(chǎn)品面向公眾推出上線(xiàn)、以及不斷進(jìn)行版本迭代,未來(lái)的大模型相關(guān)數(shù)據(jù)需求會(huì)持續(xù)、顯著增長(zhǎng),這符合當(dāng)AI進(jìn)行應(yīng)用側(cè)后,對(duì)數(shù)據(jù)的需求才會(huì)規(guī)模性增長(zhǎng)的規(guī)律。預(yù)期該類(lèi)增長(zhǎng)將主要體現(xiàn)在預(yù)訓(xùn)練階段對(duì)高質(zhì)量、大規(guī)模的版權(quán)數(shù)據(jù)、公共數(shù)據(jù)、多模態(tài)數(shù)據(jù)、垂直領(lǐng)域的實(shí)際場(chǎng)景數(shù)據(jù)等方面的需求,以及不斷提升其交互精準(zhǔn)度的強(qiáng)化學(xué)習(xí)階段各類(lèi)數(shù)據(jù)需求等。例如,若某大模型應(yīng)用領(lǐng)域?yàn)槲膶W(xué)創(chuàng)作,就會(huì)需要來(lái)自版權(quán)方的散文、小說(shuō)、詩(shī)詞等數(shù)據(jù)進(jìn)行創(chuàng)作能力訓(xùn)練;若某大模型擬提升其在民生政務(wù)領(lǐng)域的客服能力,則來(lái)自民生政務(wù)服務(wù)平臺(tái)的此類(lèi)對(duì)話(huà)數(shù)據(jù)將產(chǎn)生重要價(jià)值。未來(lái),隨著大模型向更高級(jí)、更多維、更廣泛垂向拓展,大模型數(shù)據(jù)需求將呈現(xiàn)快速增長(zhǎng)趨勢(shì)。

6、強(qiáng)化學(xué)習(xí)階段的數(shù)據(jù)服務(wù),今年有何進(jìn)展或者變化?

目前來(lái)看,隨著各大模型的陸續(xù)上線(xiàn),強(qiáng)化學(xué)習(xí)環(huán)節(jié)的整體數(shù)據(jù)需求在逐漸攀升,并在具體標(biāo)注任務(wù)上呈現(xiàn)如下趨勢(shì):

(1)逐漸向更多垂類(lèi)拓展(例如,法律、金融、醫(yī)療);(2)強(qiáng)化學(xué)習(xí)標(biāo)注的評(píng)價(jià)/評(píng)分指標(biāo)變得更為豐富,會(huì)要求標(biāo)注人員從更多維度對(duì)模型的問(wèn)答進(jìn)行評(píng)判和打分;(3)由單模態(tài)向多模態(tài)轉(zhuǎn)變:23年主要的標(biāo)注需求集中在文本類(lèi)標(biāo)注,今年開(kāi)始逐步向多模態(tài)拓展(例如,文本-視頻、文本-圖像等)。

未經(jīng)正式授權(quán)嚴(yán)禁轉(zhuǎn)載本文,侵權(quán)必究。