正在閱讀:

阿里通義千問主力模型直降97%,大模型賽道也卷起來了

掃一掃下載界面新聞APP

阿里通義千問主力模型直降97%,大模型賽道也卷起來了

價格大戰(zhàn),剩者為王。

圖片來源:界面新聞 匡達

文|雷達財經 肖灑

編輯|深海

大模型賽道,開啟殘酷價格戰(zhàn)。

5月21日,阿里云宣布通義千問GPT-4級主力模型Qwen-Long,API輸入價格從0.02元/千tokens降至0.0005元/千tokens,直降97%。隨后百度智能云也宣布,百度文心大模型的兩款主力模型ENIRE Speed、ENIRE Lite全面免費,立即生效。

此前,字節(jié)跳動已宣布旗下豆包主力模型在企業(yè)市場的定價只有0.0008元/千Tokens,0.8厘就能處理1500多個漢字,比行業(yè)價格便宜99.3%。除此此外,幻方、智譜也官宣了新的價格體系。

這樣的趨勢,同樣也在國外發(fā)生。OpenAI在剛剛結束的春季功能更新會上,宣布了其最新模型GPT-4o,不僅性能有大幅提升,所有用戶均可免費使用。

業(yè)內普遍的認識是,此輪價格戰(zhàn)的主要目的是把“蛋糕做大”,推動大模型使用進入快速增長階段。但對于一些規(guī)模較小、實力較弱的模型提供商來說,價格戰(zhàn)往往會導致利潤空間的壓縮,可能會在這場競賽中被淘汰“出局”。

大模型掀起“價格戰(zhàn)”

經過2023年大模型領域的摸索,由ChatGPT帶熱的AI大模型,在今年走到了終端應用時代。隨著競爭加劇,單純的技術競爭之外,“價格力”成為國內外廠商比拼的關鍵一環(huán)。

其中廣受矚目的是,5月14日OpenAI召開春季發(fā)布會,正式推出新一代旗艦AI模型“GPT-4o”,不僅在功能上大幅超越GPT-4 Turbo,在價格上更是帶來驚喜。

據官方介紹,新模型GPT-4o用戶不用注冊,功能全部免費。在此之前,ChatGPT的免費用戶只能使用GPT-3.5。而更新后,用戶可以免費使用GPT-4o來進行數據分析、圖像分析、互聯(lián)網搜索、訪問應用商店等操作。

當然,免費的前提被限制在一定的消息數量上,一旦超過規(guī)定數量,免費用戶的模型將被切換回GPT-3.5。而付費用戶將獲得更高的消息數量,至少是免費用戶的5倍。

國產大模型在價格競爭方面,也不甘落后。5月6日,私募巨頭幻方量化旗下的AI公司推出了第二代MoE模型DeepSeek-V2,其API(應用程序編程接口)定價為每百萬token輸入1元、輸出2元(32K上下文),僅是GPT-4的近百分之一水平。

5月11日,智譜大模型官宣新的價格體系,入門級產品GLM-3 Turbo模型調用價格從5元/百萬Tokens降至1元/百萬Tokens,降幅高達80%。

隨后的5月15日,首次對外公布大模型產品的字節(jié)跳動,就主動打起了價格戰(zhàn)。據悉,字節(jié)發(fā)布的自研大語言模型“豆包大模型”,其豆包Pro 32k模型正式定價是1千Tokens 0.8厘,比行業(yè)的價格降低99.3%;豆包Pro 128k模型正式定價為是1千Tokens5厘錢,較行業(yè)價格降低了95.8%。

對此,火山引擎總裁譚待解釋稱,一方面,字節(jié)可以在大模型產品上做到低價,在模型結構、訓練、生產等技術層面有很多優(yōu)化手段能夠實現降價,另一方面則是因為市場對降價呼聲比較大。

字節(jié)跳動之后,其他互聯(lián)網大廠紛紛跟進。5月21日,阿里云也加入大模型價格戰(zhàn),宣布通義千問9款商業(yè)化和開源模型降價。

據了解,這9款大模型整體推理輸入價格降幅為67%-97%,有2款開源模型提供七天免費優(yōu)惠。

其中,通義千問GPT-4級主力模型Qwen-Long的API輸入價格,從0.02元每千tokens(大模型文本中的最小單位)降至0.5厘每千tokens,降幅為97%。

這意味著,1塊錢可以買200萬tokens,相當于5本《新華字典》的文字量。此外,不久前發(fā)布的通義千問旗艦款大模型Qwen-Max,API輸入價格降至0.04元/千tokens,降幅達67%。

僅僅數小時之后,5月21日下午,百度在其公眾號發(fā)文稱,文心大模型兩大主力模型ERNIE Speed和ERNIE Lite全面免費。

百度這兩款大模型發(fā)布于今年3月,支持8K和128K上下文長度。按照過去的定價,ERNIE Lite輸入0.003元/千token,輸出0.006元/千token。ERNIE Speed價格為輸入0.004元/千token,輸出0.008元/千token。

至此,群雄競逐的大模型價格戰(zhàn)正式進入白熱化。

廠商忙于“做大蛋糕”

在大模型這樣“燒錢”的行業(yè),偏偏打起了價格戰(zhàn),原因何在?加快商業(yè)化落地或是主要目的。

“池塘有多大,魚就有多大,現在整個池塘還在培養(yǎng)的過程?!弊T待表示,目前大模型仍處于百家爭鳴的狀態(tài),需要大家一起實現應用落地、降低成本,讓更多人受益。

阿里云智能集團資深副總裁、公共云事業(yè)部總裁劉偉光也稱,阿里云這次大幅降低大模型推理價格,目的就是希望加速AI應用的爆發(fā)。阿里云預計未來大模型API的調用量會有成千上萬倍的增長。

目前來看,相比缺乏付費意愿的C端用戶,B端企業(yè)服務仍是大模型目前最主流的商業(yè)化路徑。

國際數據公司IDC曾在2023年四季度開展過一次AI應用調研,結果顯示,在100家受調企業(yè)中,對生成式AI完全沒有規(guī)劃的企業(yè)比例只有7%,這也意味著超九成被調查企業(yè)已布局了AI應用。

5月16日,在百度2024年第一季度財報電話會上,百度創(chuàng)始人、董事長兼首席執(zhí)行官李彥宏透露,繼上季度與中國三星、榮耀合作后,本季度,小米、OPPO、vivo等手機廠商均接入文心大模型API。

李彥宏表示,大模型的合作領域還在從手機向PC和電動汽車領域拓展,聯(lián)想和蔚來汽車也在季度內與達成合作。

其中率先投入使用的生成式AI,已幫助相關企業(yè)實現增收。愛奇藝第一季度在線廣告營收15億元,同比增長6%。其中,效果廣告營收同比兩位數增長。這主要得益于生成式AI賦能廣告提質增效,AI制作廣告素材帶動游戲、短劇等行業(yè)廣告主投資回報率提升超50%。

字節(jié)跳動的AI路線圖一直頗為神秘,從目前披露的信息來看,豆包大模型已經在字節(jié)跳動內部多個業(yè)務場景落地,包括基于豆包大模型打造AI對話助手“豆包”、AI應用開發(fā)平臺“扣子”、互動娛樂應用“貓箱”,以及星繪、即夢等AI創(chuàng)作工具,并把大模型接入抖音、番茄小說、飛書、巨量引擎等50余個業(yè)務。

目前,豆包App已在蘋果APP Store和各大安卓應用市場可下載。

值得一提的是,聲稱性能已居國內第一梯隊的騰訊混元大模型,同樣將“產業(yè)實用”作為發(fā)展大模型的核心戰(zhàn)略。

騰訊集團高級執(zhí)行副總裁、云與智慧產業(yè)事業(yè)群CEO湯道生介紹稱,騰訊發(fā)展大模型的核心戰(zhàn)略是“產業(yè)實用”,“構建起離產業(yè)最近的AI,助力千行百業(yè)智能化升級”。

據了解,騰訊云智能行業(yè)大模型也已在金融、醫(yī)療、教育、汽車、能源等20多個行業(yè)落地。此外,騰訊還將于5月30日發(fā)布基于混元大模型、面向C端的助手APP“騰訊元寶”。

截至目前,騰訊大模型似乎還未參與到眼下的“價格戰(zhàn)”中來。

成本困境仍有待解決

在不斷擊穿底價甚至免費的“激進”策略下,大模型廠商“跑馬圈地”的意圖明顯。但在價格降至“白菜價”后,還能否覆蓋掉昂貴的訓練成本?

從成本的角度來看,大模型的訓練和維護成本非常高昂。據媒體報道,Gemini Ultra的訓練成本高達1.91億美元,而GPT-4的開發(fā)成本估計為7800萬美元。

除此之外,大模型提供服務時還大量消耗其他資源。據《紐約客》雜志引援國外研究機構報告,ChatGPT每天要響應大約2億個請求,在此過程中消耗超過50萬度電力。

加州大學河濱分校研究顯示,ChatGPT每與用戶交流25-50個問題,就可消耗500毫升的水。

毫無疑問,大模型的高昂成本增加變現難度。在行云集成電路創(chuàng)始人季宇看來,大模型的商業(yè)落地與早期互聯(lián)網時代相比區(qū)別很大,邊際成本仍然非常高。大模型每增加一個用戶,基礎設施需增加的成本是肉眼可見的,一個月幾十美元的訂閱費用根本不足以抵消背后高昂的成本。

在此背景下,目前市場上主要的大模型參與者,都在通過技術優(yōu)化等方式不斷推動訓練成本的降低,以加速大模型的商業(yè)化落地。

以字節(jié)豆包大模型為例,譚待坦言降價的背后主要原因是技術上可以實現,未來還有很多手段繼續(xù)降低成本。

據其介紹,火山引擎在技術上有非常多優(yōu)化手段,可以降低大模型成本,此外在工程上可以通過分布式推理的形式將底層算力使用得更好;另外,在混合調度方面,可以把不同負載作為混合調度,這樣的成本也大幅下降。

銀河證券研報認為,DeepSeek-V2提升數據集質量及優(yōu)化架構,大幅提升訓練效率,降低訓練成本,訓練所需計算量約為GPT-4的1/20,但性能上基本相差無幾。

不過,并非所有人都認同簡單粗暴的“價格戰(zhàn)”打法?!按竽P蛷挠柧毜椒斩己馨嘿F,算力緊缺是這一賽道的集體挑戰(zhàn),行業(yè)應當共同避免陷入不理性的ofo式流血燒錢打法,讓大模型能夠健康地蓄能長跑。”零一萬物 CEO 李開復稱。

北京智源人工智能研究院院長王仲遠也認為,大模型卷價格是一把雙刃劍,價格降低有利于產業(yè)普及和推廣,但如果價格低于企業(yè)實際成本,將擾亂市場。

更值得關注的是,對于資金雄厚的大廠而言,降價將能夠擴大用戶群體,從而進一步平衡收入和成本。但對于資金緊張的創(chuàng)業(yè)公司,價格戰(zhàn)可能就是讓企業(yè)淘汰出局的致命一擊。

時至今日,大模型仍屬于新興事物,其商業(yè)化是一個復雜且充滿挑戰(zhàn)的過程,企業(yè)想要跳出“燒錢”的怪圈還需更多的嘗試。

本文為轉載內容,授權事宜請聯(lián)系原著作權人。

阿里巴巴

6.6k
  • 阿里巴巴總市值重返2000億美元上方
  • 阿里巴巴總市值反超拼多多

評論

暫無評論哦,快來評價一下吧!

下載界面新聞

微信公眾號

微博

阿里通義千問主力模型直降97%,大模型賽道也卷起來了

價格大戰(zhàn),剩者為王。

圖片來源:界面新聞 匡達

文|雷達財經 肖灑

編輯|深海

大模型賽道,開啟殘酷價格戰(zhàn)。

5月21日,阿里云宣布通義千問GPT-4級主力模型Qwen-Long,API輸入價格從0.02元/千tokens降至0.0005元/千tokens,直降97%。隨后百度智能云也宣布,百度文心大模型的兩款主力模型ENIRE Speed、ENIRE Lite全面免費,立即生效。

此前,字節(jié)跳動已宣布旗下豆包主力模型在企業(yè)市場的定價只有0.0008元/千Tokens,0.8厘就能處理1500多個漢字,比行業(yè)價格便宜99.3%。除此此外,幻方、智譜也官宣了新的價格體系。

這樣的趨勢,同樣也在國外發(fā)生。OpenAI在剛剛結束的春季功能更新會上,宣布了其最新模型GPT-4o,不僅性能有大幅提升,所有用戶均可免費使用。

業(yè)內普遍的認識是,此輪價格戰(zhàn)的主要目的是把“蛋糕做大”,推動大模型使用進入快速增長階段。但對于一些規(guī)模較小、實力較弱的模型提供商來說,價格戰(zhàn)往往會導致利潤空間的壓縮,可能會在這場競賽中被淘汰“出局”。

大模型掀起“價格戰(zhàn)”

經過2023年大模型領域的摸索,由ChatGPT帶熱的AI大模型,在今年走到了終端應用時代。隨著競爭加劇,單純的技術競爭之外,“價格力”成為國內外廠商比拼的關鍵一環(huán)。

其中廣受矚目的是,5月14日OpenAI召開春季發(fā)布會,正式推出新一代旗艦AI模型“GPT-4o”,不僅在功能上大幅超越GPT-4 Turbo,在價格上更是帶來驚喜。

據官方介紹,新模型GPT-4o用戶不用注冊,功能全部免費。在此之前,ChatGPT的免費用戶只能使用GPT-3.5。而更新后,用戶可以免費使用GPT-4o來進行數據分析、圖像分析、互聯(lián)網搜索、訪問應用商店等操作。

當然,免費的前提被限制在一定的消息數量上,一旦超過規(guī)定數量,免費用戶的模型將被切換回GPT-3.5。而付費用戶將獲得更高的消息數量,至少是免費用戶的5倍。

國產大模型在價格競爭方面,也不甘落后。5月6日,私募巨頭幻方量化旗下的AI公司推出了第二代MoE模型DeepSeek-V2,其API(應用程序編程接口)定價為每百萬token輸入1元、輸出2元(32K上下文),僅是GPT-4的近百分之一水平。

5月11日,智譜大模型官宣新的價格體系,入門級產品GLM-3 Turbo模型調用價格從5元/百萬Tokens降至1元/百萬Tokens,降幅高達80%。

隨后的5月15日,首次對外公布大模型產品的字節(jié)跳動,就主動打起了價格戰(zhàn)。據悉,字節(jié)發(fā)布的自研大語言模型“豆包大模型”,其豆包Pro 32k模型正式定價是1千Tokens 0.8厘,比行業(yè)的價格降低99.3%;豆包Pro 128k模型正式定價為是1千Tokens5厘錢,較行業(yè)價格降低了95.8%。

對此,火山引擎總裁譚待解釋稱,一方面,字節(jié)可以在大模型產品上做到低價,在模型結構、訓練、生產等技術層面有很多優(yōu)化手段能夠實現降價,另一方面則是因為市場對降價呼聲比較大。

字節(jié)跳動之后,其他互聯(lián)網大廠紛紛跟進。5月21日,阿里云也加入大模型價格戰(zhàn),宣布通義千問9款商業(yè)化和開源模型降價。

據了解,這9款大模型整體推理輸入價格降幅為67%-97%,有2款開源模型提供七天免費優(yōu)惠。

其中,通義千問GPT-4級主力模型Qwen-Long的API輸入價格,從0.02元每千tokens(大模型文本中的最小單位)降至0.5厘每千tokens,降幅為97%。

這意味著,1塊錢可以買200萬tokens,相當于5本《新華字典》的文字量。此外,不久前發(fā)布的通義千問旗艦款大模型Qwen-Max,API輸入價格降至0.04元/千tokens,降幅達67%。

僅僅數小時之后,5月21日下午,百度在其公眾號發(fā)文稱,文心大模型兩大主力模型ERNIE Speed和ERNIE Lite全面免費。

百度這兩款大模型發(fā)布于今年3月,支持8K和128K上下文長度。按照過去的定價,ERNIE Lite輸入0.003元/千token,輸出0.006元/千token。ERNIE Speed價格為輸入0.004元/千token,輸出0.008元/千token。

至此,群雄競逐的大模型價格戰(zhàn)正式進入白熱化。

廠商忙于“做大蛋糕”

在大模型這樣“燒錢”的行業(yè),偏偏打起了價格戰(zhàn),原因何在?加快商業(yè)化落地或是主要目的。

“池塘有多大,魚就有多大,現在整個池塘還在培養(yǎng)的過程。”譚待表示,目前大模型仍處于百家爭鳴的狀態(tài),需要大家一起實現應用落地、降低成本,讓更多人受益。

阿里云智能集團資深副總裁、公共云事業(yè)部總裁劉偉光也稱,阿里云這次大幅降低大模型推理價格,目的就是希望加速AI應用的爆發(fā)。阿里云預計未來大模型API的調用量會有成千上萬倍的增長。

目前來看,相比缺乏付費意愿的C端用戶,B端企業(yè)服務仍是大模型目前最主流的商業(yè)化路徑。

國際數據公司IDC曾在2023年四季度開展過一次AI應用調研,結果顯示,在100家受調企業(yè)中,對生成式AI完全沒有規(guī)劃的企業(yè)比例只有7%,這也意味著超九成被調查企業(yè)已布局了AI應用。

5月16日,在百度2024年第一季度財報電話會上,百度創(chuàng)始人、董事長兼首席執(zhí)行官李彥宏透露,繼上季度與中國三星、榮耀合作后,本季度,小米、OPPO、vivo等手機廠商均接入文心大模型API。

李彥宏表示,大模型的合作領域還在從手機向PC和電動汽車領域拓展,聯(lián)想和蔚來汽車也在季度內與達成合作。

其中率先投入使用的生成式AI,已幫助相關企業(yè)實現增收。愛奇藝第一季度在線廣告營收15億元,同比增長6%。其中,效果廣告營收同比兩位數增長。這主要得益于生成式AI賦能廣告提質增效,AI制作廣告素材帶動游戲、短劇等行業(yè)廣告主投資回報率提升超50%。

字節(jié)跳動的AI路線圖一直頗為神秘,從目前披露的信息來看,豆包大模型已經在字節(jié)跳動內部多個業(yè)務場景落地,包括基于豆包大模型打造AI對話助手“豆包”、AI應用開發(fā)平臺“扣子”、互動娛樂應用“貓箱”,以及星繪、即夢等AI創(chuàng)作工具,并把大模型接入抖音、番茄小說、飛書、巨量引擎等50余個業(yè)務。

目前,豆包App已在蘋果APP Store和各大安卓應用市場可下載。

值得一提的是,聲稱性能已居國內第一梯隊的騰訊混元大模型,同樣將“產業(yè)實用”作為發(fā)展大模型的核心戰(zhàn)略。

騰訊集團高級執(zhí)行副總裁、云與智慧產業(yè)事業(yè)群CEO湯道生介紹稱,騰訊發(fā)展大模型的核心戰(zhàn)略是“產業(yè)實用”,“構建起離產業(yè)最近的AI,助力千行百業(yè)智能化升級”。

據了解,騰訊云智能行業(yè)大模型也已在金融、醫(yī)療、教育、汽車、能源等20多個行業(yè)落地。此外,騰訊還將于5月30日發(fā)布基于混元大模型、面向C端的助手APP“騰訊元寶”。

截至目前,騰訊大模型似乎還未參與到眼下的“價格戰(zhàn)”中來。

成本困境仍有待解決

在不斷擊穿底價甚至免費的“激進”策略下,大模型廠商“跑馬圈地”的意圖明顯。但在價格降至“白菜價”后,還能否覆蓋掉昂貴的訓練成本?

從成本的角度來看,大模型的訓練和維護成本非常高昂。據媒體報道,Gemini Ultra的訓練成本高達1.91億美元,而GPT-4的開發(fā)成本估計為7800萬美元。

除此之外,大模型提供服務時還大量消耗其他資源。據《紐約客》雜志引援國外研究機構報告,ChatGPT每天要響應大約2億個請求,在此過程中消耗超過50萬度電力。

加州大學河濱分校研究顯示,ChatGPT每與用戶交流25-50個問題,就可消耗500毫升的水。

毫無疑問,大模型的高昂成本增加變現難度。在行云集成電路創(chuàng)始人季宇看來,大模型的商業(yè)落地與早期互聯(lián)網時代相比區(qū)別很大,邊際成本仍然非常高。大模型每增加一個用戶,基礎設施需增加的成本是肉眼可見的,一個月幾十美元的訂閱費用根本不足以抵消背后高昂的成本。

在此背景下,目前市場上主要的大模型參與者,都在通過技術優(yōu)化等方式不斷推動訓練成本的降低,以加速大模型的商業(yè)化落地。

以字節(jié)豆包大模型為例,譚待坦言降價的背后主要原因是技術上可以實現,未來還有很多手段繼續(xù)降低成本。

據其介紹,火山引擎在技術上有非常多優(yōu)化手段,可以降低大模型成本,此外在工程上可以通過分布式推理的形式將底層算力使用得更好;另外,在混合調度方面,可以把不同負載作為混合調度,這樣的成本也大幅下降。

銀河證券研報認為,DeepSeek-V2提升數據集質量及優(yōu)化架構,大幅提升訓練效率,降低訓練成本,訓練所需計算量約為GPT-4的1/20,但性能上基本相差無幾。

不過,并非所有人都認同簡單粗暴的“價格戰(zhàn)”打法?!按竽P蛷挠柧毜椒斩己馨嘿F,算力緊缺是這一賽道的集體挑戰(zhàn),行業(yè)應當共同避免陷入不理性的ofo式流血燒錢打法,讓大模型能夠健康地蓄能長跑。”零一萬物 CEO 李開復稱。

北京智源人工智能研究院院長王仲遠也認為,大模型卷價格是一把雙刃劍,價格降低有利于產業(yè)普及和推廣,但如果價格低于企業(yè)實際成本,將擾亂市場。

更值得關注的是,對于資金雄厚的大廠而言,降價將能夠擴大用戶群體,從而進一步平衡收入和成本。但對于資金緊張的創(chuàng)業(yè)公司,價格戰(zhàn)可能就是讓企業(yè)淘汰出局的致命一擊。

時至今日,大模型仍屬于新興事物,其商業(yè)化是一個復雜且充滿挑戰(zhàn)的過程,企業(yè)想要跳出“燒錢”的怪圈還需更多的嘗試。

本文為轉載內容,授權事宜請聯(lián)系原著作權人。