零一萬物發(fā)布首個(gè)大模型Yi-34B,李開復(fù)稱可處理200K上下文窗口

11月6日消息,界面新聞獲悉,成立僅5個(gè)月后,李開復(fù)的大模型初創(chuàng)公司零一萬物發(fā)布了其首個(gè)模型Yi-34B,這是一個(gè)雙語(yǔ)基礎(chǔ)模型,訓(xùn)練參數(shù)達(dá)到340億,顯著小于其他開源模型,如Falcon-180B和Meta LlaMa2-70B,根據(jù)Hugging Face的排名,Yi-34B在預(yù)訓(xùn)練LLM模型中名列前茅。據(jù)李開復(fù)所述,Yi-34B可以處理上下文窗口長(zhǎng)度達(dá)200K,這意味著40萬字的文本處理量,是目前全球最長(zhǎng)。李開復(fù)解釋稱,盡管更大的模型需要大量高質(zhì)量數(shù)據(jù)的良好訓(xùn)練,但他們?nèi)匀幌嘈?,?xùn)練得當(dāng)?shù)母竽P蛯⑹冀K明顯優(yōu)于質(zhì)量和技術(shù)相當(dāng)?shù)妮^小模型。

未經(jīng)正式授權(quán)嚴(yán)禁轉(zhuǎn)載本文,侵權(quán)必究。

李開復(fù)

  • 零一萬物完成數(shù)億美元融資,某國(guó)際戰(zhàn)投、東南亞財(cái)團(tuán)加盟
  • 李開復(fù)AI大模型公司零一萬物面向OpenAI用戶推出遷移服務(wù)

評(píng)論

暫無評(píng)論哦,快來評(píng)價(jià)一下吧!