正在閱讀:

私募巨頭幻方量化又有新動作,第一代大模型DeepSeek Coder已經開源

掃一掃下載界面新聞APP

私募巨頭幻方量化又有新動作,第一代大模型DeepSeek Coder已經開源

DeepSeek Coder已開源1B,7B,33B?全系列模型,包含Base模型和指令調優(yōu)模型

圖片來源:圖蟲創(chuàng)意

界面新聞記者 | 慕澤

11月2日晚間,知名私募巨頭幻方量化宣布,公司旗下的DeepSeek已經發(fā)布第一代大模型DeepSeed Coder,免費商用,完全開源。

據(jù)介紹,DeepSeek Coder已開源1B,7B,33B 全系列模型,包含Base模型和指令調優(yōu)模型。在國際權威數(shù)據(jù)集HumanEval編程多語言測試上,DeepSeek Coder在各個語言上的表現(xiàn)都領先已有的開源模型。

與之前最好的開源大模型CodeLlama相比,DeepSeek Coder在代碼生成任務上(使用標準數(shù)據(jù)集HumanEval、MBPP和DS-1000進行評測)分別領先 9.3%、10.8% 和 5.9%。其中DeepSeek Coder的70億參數(shù)版本在代碼能力上達到了CodeLlama的340億參數(shù)水平。經過指令調優(yōu)后的DeepSeek Coder模型更是全面超越了GPT3.5-Turbo。

除了代碼能力以外,DeepSeek Coder也展現(xiàn)了極強的數(shù)學和推理能力,不通過任何指令微調,在數(shù)學推理評測上展現(xiàn)了極佳的性能。

此前,幻方量化曾在4月中旬宣布將集中資源和力量,全力投身到服務于全人類共同利益的人工智能技術之中,成立新的獨立的研究組織探索AGI的本質。

隨后,北京深度求索人工智能基礎技術研究有限公司(以下簡稱“北京深度求索”)和杭州深度求索人工智能基礎技術研究有限公司(以下簡稱“杭州深度求索”)分別于5月中旬和7月中旬成立。

天眼查APP數(shù)據(jù)顯示,截至目前,北京深度求索由杭州深度求索100%控股,而幻方量化的實際控制人梁文鋒在杭州深度求索最終受益的股份比例達84.29%。

幻方量化是國內最為知名的量化私募巨頭之一,旗下?lián)碛姓憬耪沦Y產和寧波幻方量化兩大百億私募平臺,目前總管理規(guī)模超過400億元。

事實上,幻方量化在AI領域布局已久。公開資料顯示,早在2016年10月公司第一個由深度學習算法模型生成的股票倉位便已上線實盤交易,至2017年底公司幾乎所有的量化策略都已經采用AI模型計算。2019年12月,幻方AI即杭州幻方人工智能基礎研究有限公司正式成立,致力于AI的算法與基礎應用研究,隨后公司斥巨資打造的「螢火一號」和「螢火二號」陸續(xù)交付。

今年4月幻方量化宣布成立新的獨立的研究組織探索AGI的本質時,一度被外界解讀為要用AI來炒股,不過相關猜想隨后被幻方量化CEO陸政哲否認。陸政哲回應稱,“我們探索AGI不是用來炒股的,是做GTP相關的大模型,與金融無關。我們獨立于投資新成立了一個團隊,相當于二次創(chuàng)業(yè),從事的是科技方向,只是大家習慣把我們局限在投資領域?!?/p>

如今,DeepSeek Coder大模型的發(fā)布,意味著幻方量化探索AGI本質的計劃在官宣半年之后已經取得了階段性的成果。不過,幻方量化在這條路上最終究竟能夠走到哪里,目前尚未可知。

值得一提的是,除了在大模型領域的進展以外,近期幻方量化還有其他兩件事引起了市場的關注。

其一是作為公司股東之一的徐進被爆出“婚外情”風波,對此幻方量化發(fā)布情況說明稱,公司團隊成員徐進對于個人家庭事務處理不當,引發(fā)負面輿論,對公司聲譽造成不良影響。經團隊討論,決定對徐進作出停職處理。以上處理決定不影響公司基金正常運作。

其二是有消息稱“當前幻方量化已經暫停渠道募資”。對此,幻方量化市場人士曾回應稱,幻方量化當前的基金管理規(guī)模是400多億元,這個規(guī)模目前來看是策略比較合適的規(guī)模。

未經正式授權嚴禁轉載本文,侵權必究。

幻方量化

940
  • 幻方量化旗下大模型廠商DeepSeek啟用硬盤緩存技術
  • 幻方量化旗下DeepSeek發(fā)布第二代MoE模型

評論

暫無評論哦,快來評價一下吧!

下載界面新聞

微信公眾號

微博

私募巨頭幻方量化又有新動作,第一代大模型DeepSeek Coder已經開源

DeepSeek Coder已開源1B,7B,33B?全系列模型,包含Base模型和指令調優(yōu)模型

圖片來源:圖蟲創(chuàng)意

界面新聞記者 | 慕澤

11月2日晚間,知名私募巨頭幻方量化宣布,公司旗下的DeepSeek已經發(fā)布第一代大模型DeepSeed Coder,免費商用,完全開源。

據(jù)介紹,DeepSeek Coder已開源1B,7B,33B 全系列模型,包含Base模型和指令調優(yōu)模型。在國際權威數(shù)據(jù)集HumanEval編程多語言測試上,DeepSeek Coder在各個語言上的表現(xiàn)都領先已有的開源模型。

與之前最好的開源大模型CodeLlama相比,DeepSeek Coder在代碼生成任務上(使用標準數(shù)據(jù)集HumanEval、MBPP和DS-1000進行評測)分別領先 9.3%、10.8% 和 5.9%。其中DeepSeek Coder的70億參數(shù)版本在代碼能力上達到了CodeLlama的340億參數(shù)水平。經過指令調優(yōu)后的DeepSeek Coder模型更是全面超越了GPT3.5-Turbo。

除了代碼能力以外,DeepSeek Coder也展現(xiàn)了極強的數(shù)學和推理能力,不通過任何指令微調,在數(shù)學推理評測上展現(xiàn)了極佳的性能。

此前,幻方量化曾在4月中旬宣布將集中資源和力量,全力投身到服務于全人類共同利益的人工智能技術之中,成立新的獨立的研究組織探索AGI的本質。

隨后,北京深度求索人工智能基礎技術研究有限公司(以下簡稱“北京深度求索”)和杭州深度求索人工智能基礎技術研究有限公司(以下簡稱“杭州深度求索”)分別于5月中旬和7月中旬成立。

天眼查APP數(shù)據(jù)顯示,截至目前,北京深度求索由杭州深度求索100%控股,而幻方量化的實際控制人梁文鋒在杭州深度求索最終受益的股份比例達84.29%。

幻方量化是國內最為知名的量化私募巨頭之一,旗下?lián)碛姓憬耪沦Y產和寧波幻方量化兩大百億私募平臺,目前總管理規(guī)模超過400億元。

事實上,幻方量化在AI領域布局已久。公開資料顯示,早在2016年10月公司第一個由深度學習算法模型生成的股票倉位便已上線實盤交易,至2017年底公司幾乎所有的量化策略都已經采用AI模型計算。2019年12月,幻方AI即杭州幻方人工智能基礎研究有限公司正式成立,致力于AI的算法與基礎應用研究,隨后公司斥巨資打造的「螢火一號」和「螢火二號」陸續(xù)交付。

今年4月幻方量化宣布成立新的獨立的研究組織探索AGI的本質時,一度被外界解讀為要用AI來炒股,不過相關猜想隨后被幻方量化CEO陸政哲否認。陸政哲回應稱,“我們探索AGI不是用來炒股的,是做GTP相關的大模型,與金融無關。我們獨立于投資新成立了一個團隊,相當于二次創(chuàng)業(yè),從事的是科技方向,只是大家習慣把我們局限在投資領域?!?/p>

如今,DeepSeek Coder大模型的發(fā)布,意味著幻方量化探索AGI本質的計劃在官宣半年之后已經取得了階段性的成果。不過,幻方量化在這條路上最終究竟能夠走到哪里,目前尚未可知。

值得一提的是,除了在大模型領域的進展以外,近期幻方量化還有其他兩件事引起了市場的關注。

其一是作為公司股東之一的徐進被爆出“婚外情”風波,對此幻方量化發(fā)布情況說明稱,公司團隊成員徐進對于個人家庭事務處理不當,引發(fā)負面輿論,對公司聲譽造成不良影響。經團隊討論,決定對徐進作出停職處理。以上處理決定不影響公司基金正常運作。

其二是有消息稱“當前幻方量化已經暫停渠道募資”。對此,幻方量化市場人士曾回應稱,幻方量化當前的基金管理規(guī)模是400多億元,這個規(guī)模目前來看是策略比較合適的規(guī)模。

未經正式授權嚴禁轉載本文,侵權必究。