正在閱讀:

盤前機(jī)會前瞻|OpenAI壓軸大作o3模型亮相,算力需求有望快速釋放,這幾家公司在智算中心和AIDC領(lǐng)域國內(nèi)領(lǐng)先(附概念股)

掃一掃下載界面新聞APP

盤前機(jī)會前瞻|OpenAI壓軸大作o3模型亮相,算力需求有望快速釋放,這幾家公司在智算中心和AIDC領(lǐng)域國內(nèi)領(lǐng)先(附概念股)

o3模型最高測試成績達(dá)到類人水平。

近日,在為期12個工作日的線上新品發(fā)布活動最后一日,OpenAI宣布了“壓軸大作”:o1的下一代模型o3,而且一開始就要推出兩個版本,一個正式的o3,還有一個相對較小的精簡版o3-mini。o3在OpenAI實現(xiàn)通用人工智能(AGI)這一奮斗目標(biāo)上取得了突破,最高的測試成績達(dá)到了類人水平。經(jīng)過2024年AIME數(shù)學(xué)競賽的題目測試,o3的準(zhǔn)確度得分為96.7、即準(zhǔn)確率96.7%,大幅度超過了o1預(yù)覽版的56.7和o1的83.3%,僅錯了一道題,相當(dāng)于一名頂級數(shù)學(xué)家的水平。

【機(jī)會前瞻】

近日,OpenAI在為期12個工作日的線上新品發(fā)布活動最后一日,發(fā)布了其壓軸大作o3和o3-mini在內(nèi)的o3模型系列,這是AI領(lǐng)域又一重要里程碑。

OpenAI的o3模型在多個基準(zhǔn)測試中超越了前代o1模型。在推理能力方面,o3模型在ARC-AGI基準(zhǔn)測試中取得了突破性成績,最高得分達(dá)到87.5%,遠(yuǎn)超o1模型的25%,甚至超過了人類平均水平的85%。這表明o3在處理復(fù)雜問題時,能夠像人類一樣進(jìn)行邏輯推理和抽象思考,具備更強(qiáng)的解決問題能力。

編碼能力方面,在編碼測試SWE-Bench Verified中,o3性能比o1高出22.8%,在CodeForces中o3評分高達(dá)2727,超越了大部分人類程序員。它不僅能生成準(zhǔn)確的代碼,還能提供有見地的解釋,幫助開發(fā)人員更好地理解和完善項目,極大地提高了軟件開發(fā)的效率和質(zhì)量。

在2024年AIME 數(shù)學(xué)競賽題目測試中,o3的準(zhǔn)確度得分為96.7%,而o1為83.3%。在Epoch AI Frontier Math測試中,o3解決了25.2%的問題,而其他模型的得分均未超過2%,展現(xiàn)了其在數(shù)學(xué)推理和處理高度復(fù)雜抽象問題方面的巨大潛力。

其中o3-mini作為更經(jīng)濟(jì)高效的版本,預(yù)計將于明年1月底發(fā)布,其在成本和延遲方面比o1-mini更低,有望進(jìn)一步推動人工智能技術(shù)的普及和應(yīng)用。

可以看出,OpenAI此次發(fā)布的o3模型系列,擁有強(qiáng)大性能和復(fù)雜任務(wù)處理能力,作為行業(yè)標(biāo)桿,o3模型的發(fā)布將進(jìn)一步激發(fā)國內(nèi)對AI算力的需求,推動國內(nèi)算力市場規(guī)模的持續(xù)擴(kuò)大。

未經(jīng)正式授權(quán)嚴(yán)禁轉(zhuǎn)載本文,侵權(quán)必究。

寶信軟件

2.1k
  • 寶信軟件(600845.SH)2月17日解禁上市1228.59萬股,為股權(quán)激勵股份
  • 寶信軟件:擬公開掛牌轉(zhuǎn)讓參股公司地鐵電科15%股權(quán)

潤澤科技

  • 知名游資湖里大道1.76億主封,機(jī)構(gòu)賣出,20CM的潤澤科技成色如何?
  • 算力概念股午后沖高,潤澤科技20CM漲停

評論

暫無評論哦,快來評價一下吧!

下載界面新聞

微信公眾號

微博

盤前機(jī)會前瞻|OpenAI壓軸大作o3模型亮相,算力需求有望快速釋放,這幾家公司在智算中心和AIDC領(lǐng)域國內(nèi)領(lǐng)先(附概念股)

o3模型最高測試成績達(dá)到類人水平。

近日,在為期12個工作日的線上新品發(fā)布活動最后一日,OpenAI宣布了“壓軸大作”:o1的下一代模型o3,而且一開始就要推出兩個版本,一個正式的o3,還有一個相對較小的精簡版o3-mini。o3在OpenAI實現(xiàn)通用人工智能(AGI)這一奮斗目標(biāo)上取得了突破,最高的測試成績達(dá)到了類人水平。經(jīng)過2024年AIME數(shù)學(xué)競賽的題目測試,o3的準(zhǔn)確度得分為96.7、即準(zhǔn)確率96.7%,大幅度超過了o1預(yù)覽版的56.7和o1的83.3%,僅錯了一道題,相當(dāng)于一名頂級數(shù)學(xué)家的水平。

【機(jī)會前瞻】

近日,OpenAI在為期12個工作日的線上新品發(fā)布活動最后一日,發(fā)布了其壓軸大作o3和o3-mini在內(nèi)的o3模型系列,這是AI領(lǐng)域又一重要里程碑。

OpenAI的o3模型在多個基準(zhǔn)測試中超越了前代o1模型。在推理能力方面,o3模型在ARC-AGI基準(zhǔn)測試中取得了突破性成績,最高得分達(dá)到87.5%,遠(yuǎn)超o1模型的25%,甚至超過了人類平均水平的85%。這表明o3在處理復(fù)雜問題時,能夠像人類一樣進(jìn)行邏輯推理和抽象思考,具備更強(qiáng)的解決問題能力。

編碼能力方面,在編碼測試SWE-Bench Verified中,o3性能比o1高出22.8%,在CodeForces中o3評分高達(dá)2727,超越了大部分人類程序員。它不僅能生成準(zhǔn)確的代碼,還能提供有見地的解釋,幫助開發(fā)人員更好地理解和完善項目,極大地提高了軟件開發(fā)的效率和質(zhì)量。

在2024年AIME 數(shù)學(xué)競賽題目測試中,o3的準(zhǔn)確度得分為96.7%,而o1為83.3%。在Epoch AI Frontier Math測試中,o3解決了25.2%的問題,而其他模型的得分均未超過2%,展現(xiàn)了其在數(shù)學(xué)推理和處理高度復(fù)雜抽象問題方面的巨大潛力。

其中o3-mini作為更經(jīng)濟(jì)高效的版本,預(yù)計將于明年1月底發(fā)布,其在成本和延遲方面比o1-mini更低,有望進(jìn)一步推動人工智能技術(shù)的普及和應(yīng)用。

可以看出,OpenAI此次發(fā)布的o3模型系列,擁有強(qiáng)大性能和復(fù)雜任務(wù)處理能力,作為行業(yè)標(biāo)桿,o3模型的發(fā)布將進(jìn)一步激發(fā)國內(nèi)對AI算力的需求,推動國內(nèi)算力市場規(guī)模的持續(xù)擴(kuò)大。

未經(jīng)正式授權(quán)嚴(yán)禁轉(zhuǎn)載本文,侵權(quán)必究。