界面新聞?dòng)浾?| 慕澤
11月2日晚間,知名私募巨頭幻方量化宣布,公司旗下的DeepSeek已經(jīng)發(fā)布第一代大模型DeepSeed Coder,免費(fèi)商用,完全開源。
據(jù)介紹,DeepSeek Coder已開源1B,7B,33B 全系列模型,包含Base模型和指令調(diào)優(yōu)模型。在國(guó)際權(quán)威數(shù)據(jù)集HumanEval編程多語(yǔ)言測(cè)試上,DeepSeek Coder在各個(gè)語(yǔ)言上的表現(xiàn)都領(lǐng)先已有的開源模型。
與之前最好的開源大模型CodeLlama相比,DeepSeek Coder在代碼生成任務(wù)上(使用標(biāo)準(zhǔn)數(shù)據(jù)集HumanEval、MBPP和DS-1000進(jìn)行評(píng)測(cè))分別領(lǐng)先 9.3%、10.8% 和 5.9%。其中DeepSeek Coder的70億參數(shù)版本在代碼能力上達(dá)到了CodeLlama的340億參數(shù)水平。經(jīng)過指令調(diào)優(yōu)后的DeepSeek Coder模型更是全面超越了GPT3.5-Turbo。
除了代碼能力以外,DeepSeek Coder也展現(xiàn)了極強(qiáng)的數(shù)學(xué)和推理能力,不通過任何指令微調(diào),在數(shù)學(xué)推理評(píng)測(cè)上展現(xiàn)了極佳的性能。
此前,幻方量化曾在4月中旬宣布將集中資源和力量,全力投身到服務(wù)于全人類共同利益的人工智能技術(shù)之中,成立新的獨(dú)立的研究組織探索AGI的本質(zhì)。
隨后,北京深度求索人工智能基礎(chǔ)技術(shù)研究有限公司(以下簡(jiǎn)稱“北京深度求索”)和杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司(以下簡(jiǎn)稱“杭州深度求索”)分別于5月中旬和7月中旬成立。
天眼查APP數(shù)據(jù)顯示,截至目前,北京深度求索由杭州深度求索100%控股,而幻方量化的實(shí)際控制人梁文鋒在杭州深度求索最終受益的股份比例達(dá)84.29%。
幻方量化是國(guó)內(nèi)最為知名的量化私募巨頭之一,旗下?lián)碛姓憬耪沦Y產(chǎn)和寧波幻方量化兩大百億私募平臺(tái),目前總管理規(guī)模超過400億元。
事實(shí)上,幻方量化在AI領(lǐng)域布局已久。公開資料顯示,早在2016年10月公司第一個(gè)由深度學(xué)習(xí)算法模型生成的股票倉(cāng)位便已上線實(shí)盤交易,至2017年底公司幾乎所有的量化策略都已經(jīng)采用AI模型計(jì)算。2019年12月,幻方AI即杭州幻方人工智能基礎(chǔ)研究有限公司正式成立,致力于AI的算法與基礎(chǔ)應(yīng)用研究,隨后公司斥巨資打造的「螢火一號(hào)」和「螢火二號(hào)」陸續(xù)交付。
今年4月幻方量化宣布成立新的獨(dú)立的研究組織探索AGI的本質(zhì)時(shí),一度被外界解讀為要用AI來炒股,不過相關(guān)猜想隨后被幻方量化CEO陸政哲否認(rèn)。陸政哲回應(yīng)稱,“我們探索AGI不是用來炒股的,是做GTP相關(guān)的大模型,與金融無(wú)關(guān)。我們獨(dú)立于投資新成立了一個(gè)團(tuán)隊(duì),相當(dāng)于二次創(chuàng)業(yè),從事的是科技方向,只是大家習(xí)慣把我們局限在投資領(lǐng)域?!?/p>
如今,DeepSeek Coder大模型的發(fā)布,意味著幻方量化探索AGI本質(zhì)的計(jì)劃在官宣半年之后已經(jīng)取得了階段性的成果。不過,幻方量化在這條路上最終究竟能夠走到哪里,目前尚未可知。
值得一提的是,除了在大模型領(lǐng)域的進(jìn)展以外,近期幻方量化還有其他兩件事引起了市場(chǎng)的關(guān)注。
其一是作為公司股東之一的徐進(jìn)被爆出“婚外情”風(fēng)波,對(duì)此幻方量化發(fā)布情況說明稱,公司團(tuán)隊(duì)成員徐進(jìn)對(duì)于個(gè)人家庭事務(wù)處理不當(dāng),引發(fā)負(fù)面輿論,對(duì)公司聲譽(yù)造成不良影響。經(jīng)團(tuán)隊(duì)討論,決定對(duì)徐進(jìn)作出停職處理。以上處理決定不影響公司基金正常運(yùn)作。
其二是有消息稱“當(dāng)前幻方量化已經(jīng)暫停渠道募資”。對(duì)此,幻方量化市場(chǎng)人士曾回應(yīng)稱,幻方量化當(dāng)前的基金管理規(guī)模是400多億元,這個(gè)規(guī)模目前來看是策略比較合適的規(guī)模。