正在閱讀:

字節(jié)跳動的AI野心

掃一掃下載界面新聞APP

字節(jié)跳動的AI野心

字節(jié)跳動想建立一個以C端應用為基礎,橫跨C端和B端的“大而全”AI應用體系。

圖片來源:界面新聞 匡達

文|互聯網怪盜團

在5月15日的火山引擎大會上,字節(jié)跳動將自研的“云雀”大模型統一改名為“豆包”大模型,并一次發(fā)布了9個大模型產品。毫無疑問,當前的國內生成式AI行業(yè)還處于群雄逐鹿的混亂狀態(tài),競爭格局高度不穩(wěn)定,字節(jié)跳動在技術上并不屬于最領先的(就連是否屬于第一集團都還有爭議);但是,憑借自己的消費端產品開發(fā)經驗、內容數據儲備、以及管理層的重視,它已經在國內生成式AI市場占據了舉足輕重的地位。

我認為字節(jié)跳動的AI野心相當龐大:它想建立一個以消費端(C端)應用為基礎,橫跨C端和B端(企業(yè)端)的“大而全”的體系,然后以此為支點,進一步打入云計算等技術基建生態(tài)。相比之下,阿里是希望以云計算為基礎、以B端為突破口,對C端不是特別重視;百度是搖擺于B端和C端之間,兩邊好像都取得了一些成果,但兩邊都沒有做好;騰訊則尚未形成清晰統一的AI戰(zhàn)略,或許形成了但是沒有對外公開;至于華為的主要精力則是集中在硬件相關生態(tài),對于AI應用層的實際投入有限。

基于從各種渠道獲得的信息,我們可以確信,字節(jié)跳動賦予了AI相當高的戰(zhàn)略定位,聚集了很多資源,并確定了未來一段時間的打法:

字節(jié)跳動在AI技術及產品方面聚集了大批精兵強將,其中包括抖音和TikTok當年的一些靈魂人物,這是它所能拿出的最強有力的陣容了。

字節(jié)跳動的AI業(yè)務可以說是應用驅動的,其C端應用發(fā)展非??欤瑪盗慷?、垂類覆蓋廣,大有當年做“移動APP工廠”的架勢。

豆包大模型設置了極低的價格,對于國內所有大模型創(chuàng)業(yè)公司而言是一個嚴峻沖擊,不過我們尚不知道這種沖擊的實際效果如何。

字節(jié)跳動大模型的負責人是朱文佳,曾任TikTok產品技術負責人。2023年11月成立的Flow(AI應用)部門負責人是朱駿,是原Music.ly創(chuàng)始人、原TikTok負責人;Flow移動產品負責人是陸游,曾任抖音社交負責人。不久前從抖音調任剪映的張楠(女),其重要任務也是依托AI去改造剪映產品。上述陣容不僅是字節(jié)跳動最拿得出手的精兵強將,在整個中國互聯網行業(yè)也堪稱豪華。對于其他互聯網大廠而言,派出一線大將主管AI大模型是常見的,但是在AI應用層堆積這么多大將就顯得太奢侈了。

有人會問:為什么不把這些大將用于抖音等“旗艦業(yè)務”,而要用于前途未卜的AI業(yè)務?答案很簡單:因為抖音不再需要那么多人了,對于業(yè)務領導者的素質要求也有很大改變。上面列舉的張楠、朱駿、朱文佳、陸游等人,幾乎全是產品向人才,即所謂“打江山的人”;現在抖音大局已定,沒什么江山可以打了,要打也是作為防御一方而不是進攻一方。在用戶滲透率見頂、產品功能和技術不需要激進迭代的情況下,抖音最需要的是商業(yè)化人才,即“從打下的江山上收錢的人”。

過去一年多在抖音內部地位上升的人,例如新任本地生活業(yè)務負責人浦燕子,基本都來自張利東麾下,而張利東是整個中國互聯網行業(yè)最成功的商業(yè)化負責人之一。抖音的商業(yè)化已經非常成功了,在此基礎上若還想深挖,就要對領導團隊進行改組,使其從“產品驅動”進一步轉向“商業(yè)化驅動”。AI技術及其應用,恰恰是吸納那些從抖音退下來的“產品型人才”的最佳場所。

字節(jié)跳動的生成式AI業(yè)務從一開始就是應用驅動的。作為大模型負責人,朱文佳對朱駿雖然沒有實線匯報關系,但仍然存在虛擬匯報關系(這在字節(jié)跳動內部相當常見);在大模型統一改名“豆包”之后,Flow應用部門對AI大模型開發(fā)的影響力可能進一步加強。在其他互聯網大廠,大模型研發(fā)團隊可能具備相當高的自主性,乃至“自下而上”推動應用建設;在字節(jié)跳動,“自上而下”的邏輯則占據主導地位,應用團隊獎其需求傳導到了基礎研發(fā)團隊,由此形成高度實用的組織決策模式。

迄今為止,字節(jié)跳動已經推出了11款AI應用;其中,豆包是國內用戶最多的AI獨立應用,其MAU可能已達到2000萬量級。需要指出的是,這并不意味著豆包大模型(原名云雀大模型)的使用量是全國最大的,因為阿里的通義千問、百度的文心一言均通過網頁端和API擁有上億級別的客戶,其API調用次數也遠遠高于豆包。但是如果只比較獨立APP,豆包的用戶優(yōu)勢是無可爭議的——這就是字節(jié)跳動一貫的打法,以高效率的移動應用迭代去占領新興市場。

我們不難看出,同樣是在戰(zhàn)略上高度重視生成式AI的大廠,字節(jié)跳動與阿里的打法完全不同。后者以阿里云為基礎,先建立一個涵蓋閉源和開源大模型、具備成熟開發(fā)環(huán)境和開發(fā)工具的完整生態(tài),以B端客戶為主攻方向,與現有應用融合時也是優(yōu)先考慮釘釘這樣的To B應用。前者則以豆包等C端APP為基礎,先建立一個廣闊的、用戶眾多的、覆蓋各種垂類的AI移動APP生態(tài),然后再逐步擴大對B端的影響力。5月15日的火山引擎發(fā)布會,在一定程度上體現了字節(jié)跳動對目前的C端AI進展比較滿意,計劃加強對B端的進攻了。

豆包大模型最重要的特點是價格低廉:與類似水平的國產通用大模型相比,其Token價格要低95%以上。如果這個價格是真實的、不限量的,那么對于國內大模型創(chuàng)業(yè)公司而言,簡直是滅頂之災!請注意以下事實:

在現有的Token價格水平上,如果考慮到訓練成本攤薄的因素,幾乎所有國產大模型在財務上都是虧損的。

由于國產大模型太多,價格戰(zhàn)愈演愈烈,有的大模型甚至是邊際虧損的:不考慮訓練成本攤薄,只考慮推理成本,毛利率仍然是負數。

受到國內經濟形勢以及人力成本低廉的影響,B端客戶對大模型的價格相當敏感,即使技術水平比較優(yōu)越的大模型也賣不出更高的價格。

雖然AI創(chuàng)投看起來很熱鬧,但是雷聲大雨點小,創(chuàng)業(yè)公司拿到的錢很少(其中很大一部分還以算力形式支付),根本沒有本錢打價格戰(zhàn)。

假如豆包真的打穿了大模型的“地板價”并且堅持執(zhí)行下去,其他互聯網大廠肯定也會跟進,那么國產大模型創(chuàng)業(yè)賽道可能迎來一場浩劫。只有大廠才能在這種不計成本的消耗戰(zhàn)當中幸存,絕大多數創(chuàng)業(yè)公司難逃垮掉或被整合的命運!這就是用C端應用思維做B端產品的可怕之處,至于這套思維在長期是不是可持續(xù),那又是另一個問題了。反正字節(jié)跳動燒得起錢,其他大廠也跟得起,只有小公司受傷的世界達成了?

至于豆包大模型的技術水平如何,倒不是一個特別重要的問題。很多人會疑惑,字節(jié)跳動生成式AI部門的人員背景相當龐雜,其中僅有極少數具備真正的AI技術背景,而且是“應用驅動”的——這是否天然不利于大模型技術開發(fā)?不過,在國內現有環(huán)境下,哪怕豆包大模型的技術水平不領先,也不影響其業(yè)務應用在短期的蓬勃發(fā)展。我們需要意識到:

與國內最先進的一些大模型(名字就不點了)相比,豆包的最新版本可能有10%左右的效率差距。但是對于C端用戶而言,這種差距不太明顯;對于B端用戶而言,巨大的價格優(yōu)勢足以彌補這一點技術差距。

國內大模型創(chuàng)業(yè)公司在產品、商務、二次開發(fā)等層面上,普遍處于“草臺班子”階段,能夠把大模型研發(fā)做好已屬不易。無論面向C端還是B端用戶,與字節(jié)跳動等武裝到牙齒的大廠相比,它們的天然劣勢十分明顯。

國內部分大模型的領先,并不是OpenAI那種劃時代意義的領先,而是在小地方當老大而已。與GPT-4相比,國產大模型作為一個整體的落后幅度很大。既然如此,豆包與它們的短期技術差距也不是什么大不了的事情。

字節(jié)跳動的AI野心能否成功,取決于國內生成式AI應用的發(fā)展大勢:它最早取得突破、實現良性循環(huán)的領域,如果是B端,那么阿里無疑將取得較大優(yōu)勢,百度也有機會;如果是C端,那么字節(jié)跳動的優(yōu)勢將相當明顯。在前一種場景下,國內大模型創(chuàng)業(yè)公司或許還能通過對垂直應用的理解和定制開發(fā)能力,占據一席之地;在后一種場景下,成熟的互聯網大廠將會一手遮天,AI將不會促進行業(yè)“再平衡”,而只會加固極少數巨頭的地位。

還有一個問題,不僅對字節(jié)跳動很重要,對整個行業(yè)都很重要,那就是算力問題。我在上文刻意忽略了這個問題,因為我不知道怎么解答。所有國內互聯網大廠都儲備了一定量級的AI訓練及推理算力;具體到字節(jié)跳動,不僅自身有較大的算力儲備,還從阿里云租用了大量算力??墒侨绻鸄I應用真能取得上億級別的MAU,乃至像抖音那樣成為頭部C端應用,目前全國的算力儲備都是遠遠不夠的。許多用戶已經注意到了,一些國內AI聊天應用經常出現提問需要排隊的現象,這就是算力不足的一個體現。這種算力瓶頸是不能依靠砸錢去解決的,因為供應商已經不再收錢了。

在可見的未來,如果我們還是無法以合理的成本解決算力問題,那么生成式AI在國內的C端應用的道路將會很窄,因為推理算力可能只夠滿足少數專業(yè)化的B端客戶的需求(價格也會被推得很高)。這樣的問題顯然不是字節(jié)跳動或任何一家互聯網大廠所能解決、所應該考慮的。我希望它能得到妥善解決,盡管我完全不知道怎么解決。

本文為轉載內容,授權事宜請聯系原著作權人。

字節(jié)跳動

4.1k
  • 李開復最新預測中國大模型終局,DeepSeek目前勢頭最強
  • 李開復:中國大模型未來大概率只剩下DeepSeek、阿里和字節(jié)跳動三家主要公司

評論

暫無評論哦,快來評價一下吧!

下載界面新聞

微信公眾號

微博

字節(jié)跳動的AI野心

字節(jié)跳動想建立一個以C端應用為基礎,橫跨C端和B端的“大而全”AI應用體系。

圖片來源:界面新聞 匡達

文|互聯網怪盜團

在5月15日的火山引擎大會上,字節(jié)跳動將自研的“云雀”大模型統一改名為“豆包”大模型,并一次發(fā)布了9個大模型產品。毫無疑問,當前的國內生成式AI行業(yè)還處于群雄逐鹿的混亂狀態(tài),競爭格局高度不穩(wěn)定,字節(jié)跳動在技術上并不屬于最領先的(就連是否屬于第一集團都還有爭議);但是,憑借自己的消費端產品開發(fā)經驗、內容數據儲備、以及管理層的重視,它已經在國內生成式AI市場占據了舉足輕重的地位。

我認為字節(jié)跳動的AI野心相當龐大:它想建立一個以消費端(C端)應用為基礎,橫跨C端和B端(企業(yè)端)的“大而全”的體系,然后以此為支點,進一步打入云計算等技術基建生態(tài)。相比之下,阿里是希望以云計算為基礎、以B端為突破口,對C端不是特別重視;百度是搖擺于B端和C端之間,兩邊好像都取得了一些成果,但兩邊都沒有做好;騰訊則尚未形成清晰統一的AI戰(zhàn)略,或許形成了但是沒有對外公開;至于華為的主要精力則是集中在硬件相關生態(tài),對于AI應用層的實際投入有限。

基于從各種渠道獲得的信息,我們可以確信,字節(jié)跳動賦予了AI相當高的戰(zhàn)略定位,聚集了很多資源,并確定了未來一段時間的打法:

字節(jié)跳動在AI技術及產品方面聚集了大批精兵強將,其中包括抖音和TikTok當年的一些靈魂人物,這是它所能拿出的最強有力的陣容了。

字節(jié)跳動的AI業(yè)務可以說是應用驅動的,其C端應用發(fā)展非???,數量多、垂類覆蓋廣,大有當年做“移動APP工廠”的架勢。

豆包大模型設置了極低的價格,對于國內所有大模型創(chuàng)業(yè)公司而言是一個嚴峻沖擊,不過我們尚不知道這種沖擊的實際效果如何。

字節(jié)跳動大模型的負責人是朱文佳,曾任TikTok產品技術負責人。2023年11月成立的Flow(AI應用)部門負責人是朱駿,是原Music.ly創(chuàng)始人、原TikTok負責人;Flow移動產品負責人是陸游,曾任抖音社交負責人。不久前從抖音調任剪映的張楠(女),其重要任務也是依托AI去改造剪映產品。上述陣容不僅是字節(jié)跳動最拿得出手的精兵強將,在整個中國互聯網行業(yè)也堪稱豪華。對于其他互聯網大廠而言,派出一線大將主管AI大模型是常見的,但是在AI應用層堆積這么多大將就顯得太奢侈了。

有人會問:為什么不把這些大將用于抖音等“旗艦業(yè)務”,而要用于前途未卜的AI業(yè)務?答案很簡單:因為抖音不再需要那么多人了,對于業(yè)務領導者的素質要求也有很大改變。上面列舉的張楠、朱駿、朱文佳、陸游等人,幾乎全是產品向人才,即所謂“打江山的人”;現在抖音大局已定,沒什么江山可以打了,要打也是作為防御一方而不是進攻一方。在用戶滲透率見頂、產品功能和技術不需要激進迭代的情況下,抖音最需要的是商業(yè)化人才,即“從打下的江山上收錢的人”。

過去一年多在抖音內部地位上升的人,例如新任本地生活業(yè)務負責人浦燕子,基本都來自張利東麾下,而張利東是整個中國互聯網行業(yè)最成功的商業(yè)化負責人之一。抖音的商業(yè)化已經非常成功了,在此基礎上若還想深挖,就要對領導團隊進行改組,使其從“產品驅動”進一步轉向“商業(yè)化驅動”。AI技術及其應用,恰恰是吸納那些從抖音退下來的“產品型人才”的最佳場所。

字節(jié)跳動的生成式AI業(yè)務從一開始就是應用驅動的。作為大模型負責人,朱文佳對朱駿雖然沒有實線匯報關系,但仍然存在虛擬匯報關系(這在字節(jié)跳動內部相當常見);在大模型統一改名“豆包”之后,Flow應用部門對AI大模型開發(fā)的影響力可能進一步加強。在其他互聯網大廠,大模型研發(fā)團隊可能具備相當高的自主性,乃至“自下而上”推動應用建設;在字節(jié)跳動,“自上而下”的邏輯則占據主導地位,應用團隊獎其需求傳導到了基礎研發(fā)團隊,由此形成高度實用的組織決策模式。

迄今為止,字節(jié)跳動已經推出了11款AI應用;其中,豆包是國內用戶最多的AI獨立應用,其MAU可能已達到2000萬量級。需要指出的是,這并不意味著豆包大模型(原名云雀大模型)的使用量是全國最大的,因為阿里的通義千問、百度的文心一言均通過網頁端和API擁有上億級別的客戶,其API調用次數也遠遠高于豆包。但是如果只比較獨立APP,豆包的用戶優(yōu)勢是無可爭議的——這就是字節(jié)跳動一貫的打法,以高效率的移動應用迭代去占領新興市場。

我們不難看出,同樣是在戰(zhàn)略上高度重視生成式AI的大廠,字節(jié)跳動與阿里的打法完全不同。后者以阿里云為基礎,先建立一個涵蓋閉源和開源大模型、具備成熟開發(fā)環(huán)境和開發(fā)工具的完整生態(tài),以B端客戶為主攻方向,與現有應用融合時也是優(yōu)先考慮釘釘這樣的To B應用。前者則以豆包等C端APP為基礎,先建立一個廣闊的、用戶眾多的、覆蓋各種垂類的AI移動APP生態(tài),然后再逐步擴大對B端的影響力。5月15日的火山引擎發(fā)布會,在一定程度上體現了字節(jié)跳動對目前的C端AI進展比較滿意,計劃加強對B端的進攻了。

豆包大模型最重要的特點是價格低廉:與類似水平的國產通用大模型相比,其Token價格要低95%以上。如果這個價格是真實的、不限量的,那么對于國內大模型創(chuàng)業(yè)公司而言,簡直是滅頂之災!請注意以下事實:

在現有的Token價格水平上,如果考慮到訓練成本攤薄的因素,幾乎所有國產大模型在財務上都是虧損的。

由于國產大模型太多,價格戰(zhàn)愈演愈烈,有的大模型甚至是邊際虧損的:不考慮訓練成本攤薄,只考慮推理成本,毛利率仍然是負數。

受到國內經濟形勢以及人力成本低廉的影響,B端客戶對大模型的價格相當敏感,即使技術水平比較優(yōu)越的大模型也賣不出更高的價格。

雖然AI創(chuàng)投看起來很熱鬧,但是雷聲大雨點小,創(chuàng)業(yè)公司拿到的錢很少(其中很大一部分還以算力形式支付),根本沒有本錢打價格戰(zhàn)。

假如豆包真的打穿了大模型的“地板價”并且堅持執(zhí)行下去,其他互聯網大廠肯定也會跟進,那么國產大模型創(chuàng)業(yè)賽道可能迎來一場浩劫。只有大廠才能在這種不計成本的消耗戰(zhàn)當中幸存,絕大多數創(chuàng)業(yè)公司難逃垮掉或被整合的命運!這就是用C端應用思維做B端產品的可怕之處,至于這套思維在長期是不是可持續(xù),那又是另一個問題了。反正字節(jié)跳動燒得起錢,其他大廠也跟得起,只有小公司受傷的世界達成了?

至于豆包大模型的技術水平如何,倒不是一個特別重要的問題。很多人會疑惑,字節(jié)跳動生成式AI部門的人員背景相當龐雜,其中僅有極少數具備真正的AI技術背景,而且是“應用驅動”的——這是否天然不利于大模型技術開發(fā)?不過,在國內現有環(huán)境下,哪怕豆包大模型的技術水平不領先,也不影響其業(yè)務應用在短期的蓬勃發(fā)展。我們需要意識到:

與國內最先進的一些大模型(名字就不點了)相比,豆包的最新版本可能有10%左右的效率差距。但是對于C端用戶而言,這種差距不太明顯;對于B端用戶而言,巨大的價格優(yōu)勢足以彌補這一點技術差距。

國內大模型創(chuàng)業(yè)公司在產品、商務、二次開發(fā)等層面上,普遍處于“草臺班子”階段,能夠把大模型研發(fā)做好已屬不易。無論面向C端還是B端用戶,與字節(jié)跳動等武裝到牙齒的大廠相比,它們的天然劣勢十分明顯。

國內部分大模型的領先,并不是OpenAI那種劃時代意義的領先,而是在小地方當老大而已。與GPT-4相比,國產大模型作為一個整體的落后幅度很大。既然如此,豆包與它們的短期技術差距也不是什么大不了的事情。

字節(jié)跳動的AI野心能否成功,取決于國內生成式AI應用的發(fā)展大勢:它最早取得突破、實現良性循環(huán)的領域,如果是B端,那么阿里無疑將取得較大優(yōu)勢,百度也有機會;如果是C端,那么字節(jié)跳動的優(yōu)勢將相當明顯。在前一種場景下,國內大模型創(chuàng)業(yè)公司或許還能通過對垂直應用的理解和定制開發(fā)能力,占據一席之地;在后一種場景下,成熟的互聯網大廠將會一手遮天,AI將不會促進行業(yè)“再平衡”,而只會加固極少數巨頭的地位。

還有一個問題,不僅對字節(jié)跳動很重要,對整個行業(yè)都很重要,那就是算力問題。我在上文刻意忽略了這個問題,因為我不知道怎么解答。所有國內互聯網大廠都儲備了一定量級的AI訓練及推理算力;具體到字節(jié)跳動,不僅自身有較大的算力儲備,還從阿里云租用了大量算力。可是如果AI應用真能取得上億級別的MAU,乃至像抖音那樣成為頭部C端應用,目前全國的算力儲備都是遠遠不夠的。許多用戶已經注意到了,一些國內AI聊天應用經常出現提問需要排隊的現象,這就是算力不足的一個體現。這種算力瓶頸是不能依靠砸錢去解決的,因為供應商已經不再收錢了。

在可見的未來,如果我們還是無法以合理的成本解決算力問題,那么生成式AI在國內的C端應用的道路將會很窄,因為推理算力可能只夠滿足少數專業(yè)化的B端客戶的需求(價格也會被推得很高)。這樣的問題顯然不是字節(jié)跳動或任何一家互聯網大廠所能解決、所應該考慮的。我希望它能得到妥善解決,盡管我完全不知道怎么解決。

本文為轉載內容,授權事宜請聯系原著作權人。