文 | 伯虎財(cái)經(jīng) 楷楷
近日,大模型行業(yè)再掀“價(jià)格戰(zhàn)”,阿里云宣布旗下通義千,問的多款商業(yè)化再次大幅降價(jià),早在今年5月,大模型行業(yè)已經(jīng)進(jìn)行了一輪降幅接近90%的價(jià)格戰(zhàn)?!鞍倌4髴?zhàn)”行至此處,大家都清楚最終能夠留下來的通用大模型或不超過5個(gè)。
對于字節(jié)跳動(以下簡稱“字節(jié)”)這一“新晉”互聯(lián)網(wǎng)大廠而言,其在大模型領(lǐng)域的布局并不算早,其他大廠的大模型紛紛面世,字節(jié)的AI智能助手“豆包”才姍姍來遲,但憑著“大力出奇跡”的拼勁,“豆包”已經(jīng)成為了國內(nèi)用戶最多的原生 AI 應(yīng)用。
近日,字節(jié)再帶來了兩大新動作,一則,其在近日的AI創(chuàng)新巡展中一口氣發(fā)布了視頻生成模型、音樂模型和同聲傳譯模型,全面覆蓋語言、語音、圖像、視頻等全模態(tài);另外,字節(jié)正在探索自己開發(fā) AI 硬件,首款產(chǎn)品或是智能耳機(jī)。
從大模型B端的價(jià)格戰(zhàn),到大模型C端的應(yīng)用創(chuàng)新,再到大模型生態(tài)的流量戰(zhàn),字節(jié)在大模型行業(yè)不曾錯過任何一個(gè)“可能”,在大模型卷向下半場之際,字節(jié)手里還有哪些“好牌”?
01 視頻生成賽道,字節(jié)后發(fā)而至
今年6月,快手自研的視頻生成大模型“可靈”正式上線;8月,字節(jié)旗下文生視頻應(yīng)用“即夢”也后發(fā)而至。
9 月,字節(jié)旗下火山引擎更一舉發(fā)布了豆包視頻生成-PixelDance、豆包視頻生成-Seaweed 兩款大模型,這兩款模型目前已在即夢 AI 內(nèi)測版小范圍測試。
不過,從目前的輿論偏向來看,“即夢”生成的內(nèi)容在某些特定的底圖和描述詞之下表現(xiàn)更佳,但更多時(shí)候,“可靈”視頻中的物體動態(tài)和光影會更自然。另外,二者生成的AI視頻風(fēng)格顯然有著差別, “即夢”更擅長動畫風(fēng),而“可靈”則更影像風(fēng)。
兩種風(fēng)格孰優(yōu)孰劣目前還不好說,但造成這種差異背后,并不只是大模型的技術(shù)原因,還跟字節(jié)與快手平臺的布局有關(guān)。
一方面,快手在視頻生成模型有先發(fā)優(yōu)勢。雖然“可靈”、“即夢”都是受到了SORA的啟發(fā)而“匆忙”面世,推出時(shí)間也相差不遠(yuǎn),但兩者在集團(tuán)中的地位卻并不相同。
“可靈”源于快手于2023年10月就籌備的靜態(tài)圖片生成Gif表情包的工具,而快手董事長程一笑也將其上升為集團(tuán)戰(zhàn)略項(xiàng)目,并給予了最大支持。相較之下,在快手推出“可靈”時(shí),字節(jié)還在忙著進(jìn)行大模型價(jià)格戰(zhàn),彼時(shí)其最重要的對手是阿里、騰訊、百度。
今年5月,字節(jié)率先宣布旗下豆包通用模型的輸入價(jià)格降至最低為0.0008元/千tokens,并聲稱已經(jīng)擊穿了大模型行業(yè)的最低價(jià),隨后,阿里、百度、騰訊紛紛跟隨,帶動大模型行業(yè)卷向“價(jià)格戰(zhàn)”。
幾家大廠官宣“降價(jià)”幾乎沒有太多時(shí)間差,《市界》曾透露,率先降價(jià)后火山引擎的銷售人員便開始積極接觸客戶、推介產(chǎn)品,由此可以推測,爭奪B端市場才是字節(jié)彼時(shí)的最高級別戰(zhàn)略。
而且,彼時(shí)豆包的勢頭也很好。根據(jù)QuestMobile數(shù)據(jù),2024年6月在中國大語言模型應(yīng)用中,豆包APP月活用戶達(dá)到2,750萬,排名第一,相較之下,字節(jié)應(yīng)用層的其他AI應(yīng)用如貓箱、星繪等均存在感不高,誰是戰(zhàn)略重點(diǎn)也一目了然。
另一方面,兩者對視頻生成模型的布局有所不同。字節(jié)將“即夢”作為一個(gè)單獨(dú)的移動應(yīng)用,獨(dú)立于視頻編輯工具剪影之外;而快手則選擇直接將“可靈”搭載于其視頻剪輯平臺快影上,兩者使用的便捷程度有所不同,在用戶積累、生成視頻數(shù)量上自然也有差異。
據(jù)快手高級副總裁蓋坤披露,目前已有超過 260 萬人使用過快手的視頻生成大模型可靈 AI,并累計(jì)生成超 2700 萬個(gè)視頻。
而字節(jié)“即夢”目前尚未公布相關(guān)的用戶數(shù)據(jù),不過在蘋果App Store的“攝影與錄像”下載量排行榜中,“即夢”排在第33,“快影”則排在第11。從生成視頻質(zhì)量來看,根據(jù)博主闌夕的分享,在Meta的AI視頻論文里,快手的可靈在主流競品的雙盲測試對比中基本是表現(xiàn)最好的那個(gè),甚至好過了還沒公開的Sora。
但字節(jié)看起來似乎不算太著急,“可靈”在3個(gè)月內(nèi)已經(jīng)進(jìn)行了9次迭代,而字節(jié)旗下火山引擎現(xiàn)在才帶來了兩款全新的視頻生產(chǎn)模型。
字節(jié)的“淡定”,或是因?yàn)榘茨壳翱萍脊颈旧淼乃懔渑c資金實(shí)力來看,發(fā)布一個(gè)大模型的難度并沒有想象中那么高,關(guān)鍵是能否擁有高質(zhì)量數(shù)據(jù)場景,以及能否擁有足夠的差異化。
從這點(diǎn)來看,快手與字節(jié)同為短視頻平臺,兩者在文生視頻賽道都有著相同的視頻數(shù)據(jù)優(yōu)勢。此外,字節(jié)還具有更龐大的短視頻用戶規(guī)模以及更多待挖掘的應(yīng)用場景,因此,推動AI生態(tài)構(gòu)建與擴(kuò)容才是字節(jié)的當(dāng)務(wù)之急。
02 AI+硬件,字節(jié)布局流量通道
近日,字節(jié)的另一新動作便是探索AI硬件。據(jù)《晚點(diǎn)LatePost》報(bào)道,字節(jié)正在探索將大模型與硬件結(jié)合,第一款產(chǎn)品或?yàn)橹悄芏鷻C(jī)。
早在今年5月,《36氪》曾報(bào)道稱字節(jié)正在加速AI硬件方向的探索,其中一條產(chǎn)品線為智能耳機(jī),在此之前,字節(jié)已經(jīng)收購了耳機(jī)品牌Oladance。
字節(jié)在硬件方面的探索已是駕輕就熟。早在2018年,字節(jié)便收購了錘子科技堅(jiān)果手機(jī)團(tuán)隊(duì)和部分專利使用權(quán),并發(fā)布了堅(jiān)果手機(jī)、TNT顯示器以及音箱等周邊產(chǎn)品。
不過,辦公硬件市場強(qiáng)敵環(huán)伺,于是字節(jié)從2020年開始聚焦教育硬件賽道,啟動了動“大力教育”品牌,并發(fā)布了智能學(xué)習(xí)燈、教育平板、詞典筆等多款產(chǎn)品。
只是,即便字節(jié)曾計(jì)劃以每年百億元的規(guī)模投資教育行業(yè),但盲目跟風(fēng)再加上“雙減”政策的影響,這次字節(jié)依然沒能“大力出奇跡”,目前大力教育官網(wǎng)也僅剩智能學(xué)習(xí)燈一款產(chǎn)品的身影。
2021年,字節(jié)斥資90億元收購國內(nèi)VR出貨量第一的廠商PICO,并在研發(fā)、營銷、運(yùn)營等方面投入數(shù)百億元,但字節(jié)的“硬件野望”再一次破滅,去年P(guān)ICO多次裁員,目前僅保留少部分硬件團(tuán)隊(duì)。
但即便如此,字節(jié)還是“屢敗屢戰(zhàn)”,旗下豆包大模型目前已經(jīng)與眾多硬件廠商展開合作,在5月的2024春季火山引擎 FORCE 原動力大會上,其展示了機(jī)器狗、學(xué)習(xí)機(jī)、學(xué)習(xí)機(jī)器人三款與 AI 硬件合作的產(chǎn)品。
在智能終端方面,榮耀、OPPO等均宣布與豆包大模型達(dá)成合作;在智能汽車聯(lián)盟方面,豆包大模型也先后與吉利、長城、蔚來、廣汽等多家車企達(dá)成深度合作。
事實(shí)上,“軟硬件協(xié)同”已在互聯(lián)網(wǎng)行業(yè)發(fā)展中經(jīng)歷過數(shù)次輪回,比如PC電腦、智能手機(jī)、智能穿戴、智能家居等。在萬物互聯(lián)的趨勢下,硬件是軟件落地的載體,也是用戶流量通向生態(tài)的通道,而AI硬件的發(fā)展路徑,也不過是軟件側(cè)的平移。
因此,相中AI硬件的大廠也并不只有字節(jié)。據(jù)悉,美團(tuán)正在研發(fā)一款名為“俏魚”的AI業(yè)務(wù),并和兒童穿戴設(shè)備廠商“小天才”達(dá)成合作;科大訊飛發(fā)布了三款A(yù)I耳機(jī),加碼AI辦公;百度、華為等在智能終端早有布局的大廠,也在積極構(gòu)建自己的AI硬件生態(tài)。
目前來看,各大模型廠商在AI硬件的布局還是略有雷同,教育、辦公、生活依然是AI硬件落地的主要場景。但對于大廠們來說,有了連接物理世界的入口,才能形成從內(nèi)容到流量,到應(yīng)用和硬件的閉環(huán),這也是AI生態(tài)發(fā)展的基礎(chǔ)。
只不過,這一發(fā)展路徑也并非“萬試萬靈”,字節(jié)此前多次在硬件層面折戟,意味著硬件雖然是個(gè)“筐”,但不能什么都往里裝。
一方面,硬件的發(fā)展往往有自己的節(jié)奏,更容易受到市場成熟度的挑戰(zhàn),單純通過軟件業(yè)務(wù)恐怕難以在短期內(nèi)催熟硬件產(chǎn)品。以PICO為例,AR頭顯固然有足夠噱頭,但在穿戴不便、不適的問題難以解決之前,還是很難做到大量普及。
另一方面,硬件是服務(wù)于功能的,但在當(dāng)前大模型應(yīng)用拉不開差距的前提下,即便大量補(bǔ)貼硬件,用戶也不見得愿意只為“某個(gè)軟件”付費(fèi),這也意味著大模型企業(yè)必須要把應(yīng)用打磨得足夠差異化,才能跑通AI+硬件的模式。
所以,硬件雖然是流量的載體,但也不僅只是“載體”,硬件要能夠?yàn)榇竽P吞峁└憬莸恼{(diào)用觸點(diǎn),給用戶帶來更便捷的調(diào)用形式,這才是“軟硬融合”的契合點(diǎn)。
03 虎口奪食,字節(jié)也在整合生態(tài)
當(dāng)然,字節(jié)能否在AI硬件領(lǐng)域上再進(jìn)一步,目前仍有待市場測試,但可以肯定的是,字節(jié)的野心并不只在此處,目前,其也試圖與阿里、百度等大廠短兵相接,搶奪AI生態(tài)話語權(quán)。
除了進(jìn)一步提升大模型能力、打磨AI應(yīng)用,以及推出AI硬件之外,字節(jié)還推出了智能體開發(fā)平臺“扣子”以及 AI 編程助手“豆包MarsCode”。
在B端市場,火山引擎總裁譚待表示,豆包大模型已經(jīng)在其內(nèi)部的50多個(gè)業(yè)務(wù)中進(jìn)行了真實(shí)的實(shí)踐驗(yàn)證,同時(shí)還在30多個(gè)行業(yè)外部企業(yè)實(shí)現(xiàn)深度共創(chuàng),自今年7月發(fā)布以來,平均每家企業(yè)客戶日均Tokens使用量呈22倍的速度增長
雖然,字節(jié)并非傳統(tǒng)的“BAT”巨頭,甚至旗下豆包大模型還比其他大廠的模型晚到了幾個(gè)月,但如今字節(jié)也在按照自己的節(jié)奏布局AI生態(tài),其也有自己的牌面。
首先,得益于字節(jié)豐富的業(yè)務(wù)場景積累,其能夠更好打磨大模型應(yīng)用。目前,字節(jié)的業(yè)務(wù)場景涵蓋了短視頻、社交媒體、在線教育、電商等眾多領(lǐng)域,這些多元化的業(yè)務(wù)場景為豆包大模型的研發(fā)和訓(xùn)練提供了海量的數(shù)據(jù)和豐富的應(yīng)用場景。
事實(shí)上,字節(jié)在大模型領(lǐng)域的打法策略也與其他大廠略有不同,其更看重C端的體驗(yàn),更傾向先打磨C端產(chǎn)品,等到模型能力具備競爭優(yōu)勢后再拓展B端市場。
這或許也跟字節(jié)在C端場景的布局有關(guān),畢竟旗下的大模型乃至AI產(chǎn)品,終究要優(yōu)先服務(wù)于旗下的抖音、今日頭條等流量型APP,但這也讓字節(jié)在多模態(tài)大模型領(lǐng)域走得更快。
其次,流量也是字節(jié)的優(yōu)勢。如果說AI生態(tài)的構(gòu)建需要創(chuàng)作者和使用者雙方流量的共同注入,那么字節(jié)的AI生態(tài)在使用場景和流量引入方面顯然也更具優(yōu)勢。
據(jù)Unique Capital報(bào)告顯示,今年7月,字節(jié)旗下CapCut和Doubao在全球人工智能應(yīng)用下載超越了OpenAI的ChatGPT,斬獲全球第一。
字節(jié)旗下抖音、今日頭條等明星產(chǎn)品已經(jīng)成為流量的重要入口,通過龐大的用戶規(guī)模和精準(zhǔn)的數(shù)據(jù)分析能力,字節(jié)也能進(jìn)一步提升大模型的使用體驗(yàn),并進(jìn)一步發(fā)展多模態(tài)大模型。
近日,字節(jié)旗下火山引擎除了發(fā)布了視頻生成模型、音樂模型、同聲傳譯模型三款新模型外,還對通用語言模型、文生圖模型、語音模型進(jìn)行了全面升級。
不過,字節(jié)充沛流量支持背后,其也要付出不少代價(jià)。有業(yè)內(nèi)人士透露,豆包大模型僅在6月上旬,就投放了超過一億元的廣告,而且在大模型的廣告戰(zhàn)中,抖音完全傾向了自家大模型,這意味著字節(jié)也在用抖音的廣告收入來換取豆包的用戶增長。
“流量”固然是字節(jié)獨(dú)有的“好牌”,但“燒錢換增長”這樣的套路卻難以持續(xù),字節(jié)在跑馬圈地后如何快速轉(zhuǎn)化并找到能落地的商業(yè)模式,將會成為字節(jié)AI生態(tài)發(fā)展的關(guān)鍵。因此,火山引起發(fā)布兩款豆包視頻生成模型時(shí),譚待才會表示“從一落地就開始考慮商業(yè)化”。
最后,則是在“云服務(wù)”市場的加速發(fā)力。對于深入B端服務(wù)市場的企業(yè)而言,云服務(wù)無疑是互聯(lián)網(wǎng)行業(yè)最為重要的賽道之一。據(jù)Canalys預(yù)計(jì),2026年中國的云基礎(chǔ)設(shè)施市場規(guī)模將達(dá)到850億美元,五年復(fù)合年增長率為25%。
但在B端市場,字節(jié)要面對的則是阿里云、騰訊云、華為云等主流云廠商,僅這三大云服務(wù)商所占的市場份額就已經(jīng)過半。
而且,阿里、騰訊、華為等早已經(jīng)找到各自擅長的細(xì)分市場,比如阿里的零售行業(yè);騰訊的文娛、金融行業(yè),字節(jié)想在其中占據(jù)一席之地并不容易。
所以,字節(jié)當(dāng)前“C端強(qiáng),B端弱”的現(xiàn)狀,也會成為其在AI生態(tài)中快速落子的障礙,相較于阿里、騰訊等大廠,字節(jié)很難依托現(xiàn)有業(yè)務(wù)領(lǐng)域在商用領(lǐng)域形成大模型應(yīng)用的規(guī)模效應(yīng)。
或是因?yàn)槿绱?,字?jié)才會在近年通過硬件拓展教育、辦公的不同垂直賽道,希望能夠找到新的突破點(diǎn)。
但如果字節(jié)想要繼續(xù)“大力出奇跡”,打破業(yè)界及客戶對于大廠生態(tài)的固有認(rèn)知,光成為“實(shí)用主義者”還不夠,字節(jié)還需要找到屬于自己的應(yīng)用賽道,拿出具有競爭力的優(yōu)勢,成為更專業(yè)的大模型方案解決者,方能實(shí)現(xiàn)彎道超車。
在當(dāng)下的大模型市場,無論是B端還是C端,每一條賽道都擠滿了競爭對手,“流量”這一招雖然厲害,但也不是無所不能,回歸到產(chǎn)品應(yīng)用和生態(tài)建設(shè)之上,能否讓垂直行業(yè)開發(fā)者和應(yīng)用者以更低成本、更低門檻獲得更接地氣的產(chǎn)品和服務(wù),才是關(guān)鍵。