文|深燃 鄒帥
編輯|唐亞華
AI也能瘦臉、祛痘、加濾鏡之后,“美圖秀秀們”的飯碗要被搶了?
近期,有傳言稱某頭部修圖APP“因為AI(的沖擊)正處于生死存亡之際”。雖未指名道姓,但行業(yè)內(nèi)給出的反應(yīng)大多是:AI在“無差別攻擊”各個行業(yè)的時候,修圖APP也難逃一劫,因為目前AIGC以圖像生成方面的應(yīng)用相對最為廣泛。
從C端使用來看,目前國內(nèi)手機美顏修圖類APP以美圖秀秀、醒圖、輕顏相機等為主流,抖音、快手等社交工具也有類似功能。無論受眾是誰,功能方向大體一致,即美顏、濾鏡、特效三種。業(yè)內(nèi)人士表示,AI技術(shù)早在2015年之后就迎來了第一次爆發(fā),當(dāng)時就對這類圖像處理軟件形成了革命性的顛覆,因為AI能做出以前做不了的事,比如換臉、加面部“返老還童”特效,增加發(fā)量、改變發(fā)色等等。
如今,生成式AI成為焦點,再一次給修圖類APP帶來了機會和沖擊。技術(shù)開源,壁壘消失,新玩家任何時刻都可能入局搶飯碗。同時,內(nèi)部如何應(yīng)用技術(shù),如何成功落地,又是新的課題。“美圖秀秀們”多年以來積累的用戶基數(shù),在美顏修圖上建立起的用戶心智,也許會給其筑起護城河,但在今天,技術(shù)祛魅,流量的走向誰都難以預(yù)估。真正的較量,不在于技術(shù),而在于運用技術(shù),在于審美的獨特性,在于更懂用戶。
01 AI早就在幫我瘦臉了
市面上,主要面向C端用戶的圖像處理軟件,大致分為幾類。一種是以美圖秀秀為代表的,專門拍攝美顏照片,或處理用戶照片的軟件,包含瘦臉、祛痘、磨皮、美白等基礎(chǔ)功能。另一種是社交軟件中的拍攝功能,抖音、快手、小紅書、微博等都可以直接拍照、處理并發(fā)布,也能完成基礎(chǔ)的美顏,還能加濾鏡,加貓耳朵、搞怪臉等特效。此外,還有專門做面向影樓等專業(yè)攝影師的軟件,包括小型創(chuàng)業(yè)公司,以及美圖也有toB的產(chǎn)品。更專業(yè)化的,還有圖像處理行業(yè)鼻祖Photoshop、Blender等。
本文將著重討論美圖秀秀這類C端用戶比較熟知的軟件。這類公司的梯隊劃分很清晰。行業(yè)第一是創(chuàng)立于2008年的美圖秀秀,最開始做PC端,2011年做APP,2016年上市。第二梯隊里,2015年前后,騰訊推出天天P圖,今日頭條臉萌團隊先后推出Faceu激萌、輕顏相機,那一波也有不少小而美的創(chuàng)業(yè)公司推出的產(chǎn)品出現(xiàn),如B612咔嘰、黃油相機等。2020年之后,字節(jié)跳動推出醒圖,快手推出原片。該行業(yè)的特點就是向頭部集中,要么是美圖這樣贏在入局早的公司,要么就是背靠互聯(lián)網(wǎng)大廠。
美圖是一家完成了圖像處理產(chǎn)品閉環(huán),并以相關(guān)業(yè)務(wù)獲得收入的公司。以它的財報為參考,美圖主要靠VIP用戶收入、廣告、toB業(yè)務(wù)等賺錢,近五年的總營收在10億元左右,其中去年獲得了20.85億元的總營收,付費會員數(shù)560萬。
美圖自稱是一家以人工智能為驅(qū)動的科技公司,在國內(nèi)某大廠從事美顏技術(shù)工作的高廣也告訴深燃,業(yè)內(nèi)大多數(shù)公司早已能成熟地將AI應(yīng)用到自己的業(yè)務(wù)中。AI進入到圖像處理軟件中,主要帶來兩方面的改變。
一是傳統(tǒng)修圖功能的“AI化”。美顏和濾鏡是圖像處理軟件最傳統(tǒng)的兩項功能,高廣解釋,在AI出現(xiàn)之前,在圖片上加濾鏡的技術(shù)原理是,做一個濾波,把圖片整體修改成“黃昏”、“陽光”、“油畫”等效果,“人還是人,植物還是植物,只有整張照片的調(diào)性發(fā)生了改變?!睘V波的作用就是把信號中的噪聲和雜波進行過濾,留下有用的信號,這也是長久以來,美顏類軟件的底層技術(shù)邏輯。而磨皮就是把分辨率降低,用高斯模糊把細(xì)節(jié)抹掉。
讓AI來做同樣的事情,邏輯就變了。“用AI來做美顏,原理是訓(xùn)練各種各樣的模型,把各種數(shù)據(jù)拿進去處理,然后調(diào)參數(shù),調(diào)到一個比較合理的數(shù)值?!备邚V說,用以前的技術(shù),則要建立一個映射,設(shè)置好一套顏色的轉(zhuǎn)換關(guān)系,“比如亞洲人皮膚本來是偏黃色的,要美白,那就要設(shè)置好,是把黃色映射到偏暗還是偏亮?!痹趥鹘y(tǒng)的技術(shù)下,針對不同人種的需求,就要設(shè)置多個映射。對比之下,讓AI技術(shù)來處理照片,好處在于,不同用戶的需求,只要用一個模型就可以了。
二是純粹基于AI技術(shù)的新功能。早年間,用戶瘦臉的操作方式是自行在人臉上定點向內(nèi)推。原理也很簡單,圖片中的人臉有基本的像素位置,構(gòu)成一個坐標(biāo),用戶拉動原有的像素位置,坐標(biāo)由此發(fā)生變形,也就完成了臉部的放大和縮小。
2017年之后,“面部重塑”問世,這也就是在AI技術(shù)下的新功能。修圖時系統(tǒng)先識別臉部信息,點擊放大雙眼、眼瞼下至、縮小鼻頭等指令,就可以完成自然的修圖。
高廣說,類似面部重塑、增加發(fā)量等功能,一般都是用AI完成的。面部重塑功能,就需要首先訓(xùn)練AI什么是人臉部,包括什么是眼睛、鼻子、嘴巴,位置分布在何處,他表示,這些功能在AI出現(xiàn)之前很難實現(xiàn)?!耙驗橐?xùn)練AI,一是頭發(fā)的定義,二是頭發(fā)的準(zhǔn)確性,讓發(fā)絲順著自然的紋理向下走,然后在上面著色。傳統(tǒng)方法是做不到的,最多能拿個照片過來做一個濾波,但還是達不到AI的效果?!?/p>
從傳統(tǒng)的美顏技術(shù),過渡到AI主導(dǎo)下的產(chǎn)品時代,核心的改變在于識別和內(nèi)容理解。AI出現(xiàn)之前,顏色轉(zhuǎn)換、臉部位置的移動、磨皮祛痘,都需要經(jīng)過前期復(fù)雜的設(shè)置,而AI只需要接受訓(xùn)練,就能“一勞永逸”。可以說,AI把傳統(tǒng)的修圖重做了一遍,而且做得更好。
02 AI修圖,還能怎么進化?
最新一波的AI熱潮涌來,行業(yè)玩家也在急著找新的機會。
基于指令生成、基于圖片處理,是AI應(yīng)用在這一行業(yè)的主要技術(shù)方向。3月末,Adobe發(fā)布了AI模型Firefly,可以用文字生成圖像,微軟、Meta、Google等國際巨頭也都有AI圖像生成業(yè)務(wù)的布局。
回到C端用戶使用的APP,美圖、醒圖、天天P圖等APP不敢掉以輕心?!拔覀儸F(xiàn)在基本是按周甚至天為單位在進化?!泵缊D公司方面向深燃表示,最近他們密集推出了基于AI技術(shù)的圖片和視頻方向的功能。
深燃在各大修圖軟件上看到,生成式AI的運用早已細(xì)分為幾個功能掛上了首頁供使用。用戶可以上傳一張照片,AI將其轉(zhuǎn)換為卡通、CG、復(fù)古形象,或者完成增加笑容、頭部放大、路人消除等功能。也可以上傳幾張自己的照片,AI可以依照這幾張照片,抓取用戶不同角度的面貌特征,生成不同風(fēng)格的畫像。甚至還有Midjourney暫時都無法完成的工作,即導(dǎo)入一張簡筆草圖,生成多張完善的圖片。
高廣表示,2015年前后,手機APP的創(chuàng)業(yè)熱潮涌來,也是那時,AI也開始大規(guī)模地應(yīng)用到修圖行業(yè)。能給人臉加上各種豐富的特效、能近乎無痕地完成美顏的修圖APP,在當(dāng)年收割了一波年輕用戶。
當(dāng)下最新的AI技術(shù),也給行業(yè)帶來了新的增量,兩個趨勢出現(xiàn)了。
一是個性化的訓(xùn)練?,F(xiàn)在AI修臉一般是經(jīng)過大量的模型訓(xùn)練之后,得出最折中的經(jīng)驗值,給用戶一個相對普適的修圖方案。C端用戶也可以感覺到,例如在進行面部重塑的時候,可以選擇向內(nèi)收下頜線,問題在于,圓臉型和方臉型的下頜走向不同,都由統(tǒng)一的AI識別和面部處理,效果大相徑庭,因此也有很多用戶覺得AI修的臉很怪異。
“做得好一點的話,就是給每個用戶建立數(shù)據(jù)庫,下發(fā)固定的參數(shù)模型,針對性地解決每個用戶的需求。”高廣說,用戶也只需要導(dǎo)入一些照片訓(xùn)練APP,APP就能收集數(shù)值,進行分析。美圖方面對深燃表示,從技術(shù)上講,讓AI記住用戶特征并不難,原理和美顏參數(shù)的設(shè)定差不多。
要完成足夠精準(zhǔn)的個性化訓(xùn)練,同時也讓APP在理解大眾需求時更加精準(zhǔn),需要技術(shù)和訓(xùn)練集的加持。在這一點上,用戶規(guī)模龐大的頭部修圖類公司,具備一定優(yōu)勢。
二是理解指令。此前,GAN模型(生成對抗網(wǎng)絡(luò))已經(jīng)得到了廣泛應(yīng)用,精準(zhǔn)識別面部,以及圖片中包含的要素。下一步,從業(yè)者要做的是,如何基于新一代的擴散模型,充分理解自然語義,給出具體的修圖執(zhí)行。高廣表示,擴散模型應(yīng)用的原理差不多,“用戶給出prompt(提示詞),我們可以根據(jù)NLP理解指令,之后把它們分化成一個個參數(shù)下發(fā)并執(zhí)行?!?/p>
長期關(guān)注AI領(lǐng)域的從業(yè)者Elsa也認(rèn)可這一趨勢?!癆I修圖可能改變的是人機交互模式,現(xiàn)在還停留在自己手動拉一拉點一點的階段,等到AI對自然語義的理解更進一步后,修圖時只要說一句‘我要瘦臉’就可以了。”Elsa說,“AI現(xiàn)在依賴的是低語境,它需要用戶表達得更精準(zhǔn),而中文是一種高語境的表達,習(xí)慣模糊、習(xí)慣意會。以后的趨勢是指令的可量化,想象一個人在幫你修圖,你要怎么精確簡潔地讓它理解你所說的是哪一種瘦臉。”
也就是說,AI用于圖像生成和圖像處理,都要建立在對文字和圖片的理解上。AI已經(jīng)可以幫助修圖軟件更好地瘦臉、祛痘、加濾鏡、換背景,也可以生成多種風(fēng)格的圖片。而未來的趨勢,在于如何在普適完美的基礎(chǔ)上,做到個性化的精準(zhǔn)匹配,以及減少用戶自主操作的步驟,聽懂指令,準(zhǔn)確執(zhí)行。
從業(yè)者認(rèn)為,這會帶來未來修圖行業(yè)的用戶分化。理解直白指令,修圖過程完全讓AI代勞,這往往是小白用戶的需求,這部分用戶潛力是巨大的,美圖這類公司會獲得新的用戶增量。而對修圖的自主性要求較高的用戶,如B端用戶等,則會慢慢向更專業(yè)的軟件涌去,即便Photoshop等軟件也有AI技術(shù)的加碼,但這類用戶需要的是“你得懂我,但不能完全幫我做事”。
另一個新的機遇在于,AI還能幫助修圖軟件自身提高生產(chǎn)效率。高廣說,“特效這種功能是需要設(shè)計師自己畫圖的,生成式AI可以在這一部分高效地給出解決方案?!彼硎?,現(xiàn)在AI也可以完善草圖,給一個隨手畫的素描上色、加五官和風(fēng)格,成稿直接可以用。
03 AI來了,“美圖秀秀們”為什么顫抖?
傳言中的“生死存亡之際”或許有些夸張,但這一波AIGC對修圖軟件行業(yè)的沖擊是事實。技術(shù)的發(fā)展,讓創(chuàng)業(yè)的門檻降低,想要入局“搶飯碗”的人不少。
Tori以前在北美做前端工程師,她剛剛回國,正尋找生成式AI在應(yīng)用層面的機會?!扒岸螘r間有個很火的產(chǎn)品叫Lensa,最高峰時期,一天之內(nèi)的流水接近100萬美元。它的原理現(xiàn)在看非常簡單,就是設(shè)置了幾組固定的prompt,把用戶照片導(dǎo)進去,生成一個圖片。當(dāng)時收費2-10美元不等,它其實并沒有用到高級的圖像處理技術(shù),只是用了一個API call,在外面綁了一個應(yīng)用的UI?!盩ori的感知是,亙古不變的信息差面前,能踩到風(fēng)口,就能賺到錢。
AI領(lǐng)域資深從業(yè)者趙洋告訴深燃,“中國市場永遠(yuǎn)會有這類APP的存在?!壁w洋表示,技術(shù)是開源的,且可能長時間固化,靠同一種技術(shù)吃飯的人會越來越多,而正在吃飯的人,手里的飯碗隨時會被砸。
高廣也認(rèn)為,“市面上的公司,技術(shù)和產(chǎn)品也都大差不差?!奔夹g(shù)壁壘不在了,理論上講,誰都有可能造出下一個“美圖秀秀”。說白了,所有修圖軟件,用戶幾乎都是同一撥人,用戶能為一個軟件的濾鏡付費,就也能為另一個軟件更具特點的濾鏡付費。
目前,美圖的第一大收入來源是VIP訂閱。2018年-2021年,美圖公司連續(xù)虧損,2022年才扭虧為盈。最新的動態(tài)中看,美圖公司極其重視AIGC給其帶來的增長,尤其是在訂閱用戶上的增長。深燃注意到,美圖秀秀APP中涉及AI作圖的幾項功能,大多需要單獨付費,是其拉高收入的重要“武器”。未來在競爭壓力之下,美圖秀秀們在AI上的投入只能多不能少。
當(dāng)然,對于頭部企業(yè)來說,最大的護城河是用戶規(guī)模。
有從業(yè)者分析,美圖自身坐擁上億用戶,醒圖、天天P圖背靠大廠,有抖音和騰訊的導(dǎo)流,短期內(nèi)受到的影響或許不太明顯,但怎樣擁抱AI,留住手里的用戶,是企業(yè)需要面對的問題。
AI的到來,對修圖行業(yè)的設(shè)計師提出了更高的要求。高廣認(rèn)為,圖像處理這一行歸根結(jié)底還是視覺和創(chuàng)意行業(yè),未來的競爭點在于審美和品位?!癆I可以幫忙解決掉最耗時的那一個步驟。以前可能要做兩周,現(xiàn)在幾天就完成了?!彼?,企業(yè)端可能也更要考量,什么樣的設(shè)計師更吃市場,什么樣的設(shè)計師更具審美上的優(yōu)勢。
另一個是技術(shù)落地的難度?!癆I的上限比較高,下限比較低?!备邚V表示,在修圖中,如果使用傳統(tǒng)的CV算法,會比較穩(wěn)定,“但AI是通過拓展大量的數(shù)據(jù)標(biāo)注進行模型訓(xùn)練的,會導(dǎo)致它在一些情況下應(yīng)用得比較差?!彼e例,比如瘦臉,“可能會識別錯人臉,或在人臉重疊時只識別部分?!?/p>
所以,AI技術(shù)很難完全應(yīng)用于一個包含多項功能的修圖軟件。一方面模型訓(xùn)練需要時間,另一方面即使完全訓(xùn)練好,它也會對手機性能產(chǎn)生極大的耗損。高廣表示,“一些低端機型可能會出現(xiàn)卡頓等問題,如果很長時間加載不出來,也會影響APP打開率。”回到企業(yè)層面,這對團隊?wèi)?yīng)用AI技術(shù)的能力、訓(xùn)練集的質(zhì)量都提出了高要求。
在技術(shù)迭代的過程中,新老玩家之間的基礎(chǔ)差距在逐漸消失。像美圖秀秀這樣坐擁強大用戶基數(shù)的公司,短期內(nèi)也許不會受到顛覆性的影響,能做的只有在變化中保持清醒,接受變化,甚至主動帶來變化。
應(yīng)受訪者要求,高廣、Elsa、Tori、趙洋為化名。