文|互聯(lián)網(wǎng)怪盜團(tuán)
有一種流傳很廣的看法:互聯(lián)網(wǎng)公司做的是“流量生意”,沒(méi)有什么技術(shù)含量;互聯(lián)網(wǎng)公司的研發(fā),其實(shí)就是產(chǎn)品迭代而已,算不上真正的基礎(chǔ)研發(fā);如果互聯(lián)網(wǎng)公司有技術(shù)含量,那也只可能存在于云計(jì)算這樣的To B業(yè)務(wù)當(dāng)中,而不可能存在于消費(fèi)業(yè)務(wù)當(dāng)中。
在這些人心目中,“消費(fèi)互聯(lián)網(wǎng)公司”與“硬科技公司”是天然對(duì)立的——如果你運(yùn)營(yíng)一個(gè)龐大的互聯(lián)網(wǎng)平臺(tái),擁有數(shù)以億計(jì)的個(gè)人用戶,那你就不可能通過(guò)基礎(chǔ)研發(fā)取得任何“硬科技”成果。
我必須嚴(yán)肅指出,上述觀點(diǎn)是片面的。面向消費(fèi)者的互聯(lián)網(wǎng)平臺(tái)業(yè)務(wù),當(dāng)然是需要技術(shù)含量的,而且技術(shù)含量不能低,否則會(huì)迅速在激烈競(jìng)爭(zhēng)中被用戶拋棄。(參考閱讀:一個(gè)嚴(yán)肅的問(wèn)題:究竟什么是“硬科技”公司?)畢竟一個(gè)幾億人使用的應(yīng)用,可能出現(xiàn)的問(wèn)題之多,非從業(yè)者難以想象,需要依靠“硬科技”去提升用戶體驗(yàn)、保證用戶安全及合規(guī)等。可以說(shuō),復(fù)雜、多變的To C業(yè)務(wù),是培育“硬科技”的試煉場(chǎng)。
另一方面,在粗放式增長(zhǎng)階段結(jié)束之后,互聯(lián)網(wǎng)公司都意識(shí)到了技術(shù)的重要性和可拓展性,投入大量資源做自研技術(shù),已經(jīng)是領(lǐng)先互聯(lián)網(wǎng)企業(yè)的新常態(tài)。
舉一個(gè)例子:根據(jù)谷歌2021年財(cái)報(bào),谷歌搜索引擎每天要處理數(shù)萬(wàn)億個(gè)搜索請(qǐng)求,其中15%是全新的、前所未見的。谷歌需要在幾十到幾百毫秒之內(nèi),從浩如煙海的互聯(lián)網(wǎng)公開信息(包括文本、圖片、視頻等多種不同格式)當(dāng)中,找到用戶想要的信息。因此,谷歌一直在大力發(fā)展人工智能和機(jī)器學(xué)習(xí)技術(shù),從而不斷提升其核心搜索功能的效率。其中一個(gè)最重要的成果,就是2021年5月發(fā)布的“多任務(wù)統(tǒng)一模型”(Multitask Unified Model)——能夠讓用戶以自然語(yǔ)言提出開放式問(wèn)題,以對(duì)話的方式獲得類似人工專家的解答。可以想象,這個(gè)模型很快成為了國(guó)際人工智能研究領(lǐng)域的熱門話題,很可能也會(huì)成為人工智能歷史上最重要的應(yīng)用之一。
事實(shí)上,在消費(fèi)互聯(lián)網(wǎng)領(lǐng)域,搜索引擎已經(jīng)算是一個(gè)比較“簡(jiǎn)單”的業(yè)務(wù)了。更復(fù)雜、更敏感、對(duì)研發(fā)要求更高的業(yè)務(wù)還有很多,例如第三方支付。當(dāng)你走進(jìn)一家便利店,打開支付寶掃碼,整個(gè)支付過(guò)程大概還花不了一秒鐘。可是就在這一瞬間,支付寶的APP端和云端進(jìn)行了涉及海量數(shù)據(jù)的計(jì)算和判定:
用戶有沒(méi)有被盜號(hào)?移動(dòng)設(shè)備有沒(méi)有失竊?換句話說(shuō),這個(gè)支付請(qǐng)求真的是出自用戶本人嗎?
收款的商戶是合法的嗎?它是否具備基本的資質(zhì),有沒(méi)有釣魚詐騙的嫌疑?
這會(huì)不會(huì)是刷單,或者其他類型的虛假交易?
這一切都發(fā)生在你掃碼和聽到“支付完成!”之間,在這短短的間隙,支付寶使用了全圖風(fēng)控、交互式主動(dòng)風(fēng)控、多方安全計(jì)算、端邊云協(xié)同……等一批人工智能、隱私計(jì)算等“硬科技”,從而在你甚至感知不到的消費(fèi)體驗(yàn)下,確保你的財(cái)產(chǎn)安全。要知道,國(guó)內(nèi)互聯(lián)網(wǎng)黑產(chǎn)的從業(yè)人員很可能超過(guò)了200萬(wàn)人(數(shù)據(jù)來(lái)源:《2019年中國(guó)數(shù)字反欺詐全景報(bào)告》),而支付寶的風(fēng)控資損率僅為億分之0.98。
公允地說(shuō),國(guó)內(nèi)主流第三方支付平臺(tái)的風(fēng)控普遍做的都還不錯(cuò)。除了支付寶,微信支付、京東支付、美團(tuán)支付的風(fēng)控資損率都很低。它們能做到這一點(diǎn),當(dāng)然不是靠堆砌人力,更不是出于黑產(chǎn)集團(tuán)手下留情;而是靠在消費(fèi)場(chǎng)景對(duì)前沿技術(shù)的應(yīng)用,以及多年來(lái)持續(xù)更新技術(shù)。
另一些因素也在倒逼互聯(lián)網(wǎng)公司加快技術(shù)創(chuàng)新。近幾年數(shù)據(jù)安全和隱私日益受到重視,無(wú)論是合規(guī)還是社會(huì)層面都對(duì)互聯(lián)網(wǎng)公司的服務(wù)提出了更高要求——既保護(hù)用戶隱私,又要保證安全和流暢。這基本相當(dāng)于“既要馬兒跑,又要馬兒不吃草”,可是互聯(lián)網(wǎng)公司居然真的能做到,這應(yīng)當(dāng)歸功于對(duì)機(jī)器學(xué)習(xí)技術(shù)的深度應(yīng)用。
還是拿谷歌做例子。今年早些時(shí)候,谷歌推出了“隱私沙盒”(Privacy Sandbox)技術(shù)框架,意在實(shí)現(xiàn)不跟蹤用戶設(shè)備ID、不使用第三方Cookies的情況下,仍能精準(zhǔn)地推送廣告?!半[私沙盒”的基礎(chǔ)是一種名為“群組聯(lián)邦學(xué)習(xí)”(Federal Learning of Cohorts)的算法,也就是聚焦于具備相似行為的一組用戶,而不需要去獲取每個(gè)用戶的私人信息。
螞蟻集團(tuán)也推出了國(guó)內(nèi)首個(gè)“可信隱私沙盒”(AntDTX),目前已經(jīng)在vivo、榮耀等廠商的手機(jī)等設(shè)備中得到應(yīng)用?!翱尚烹[私沙盒”基于端邊云協(xié)同風(fēng)控技術(shù),可以在減少手機(jī)端內(nèi)數(shù)據(jù)向云端流動(dòng)的情況下,升級(jí)手機(jī)的風(fēng)險(xiǎn)感知能力,提升支付安全性。
這些技術(shù)都是基于消費(fèi)端的真實(shí)需求而開發(fā)出來(lái)的,其適用范圍又遠(yuǎn)遠(yuǎn)超過(guò)了廣告、支付等消費(fèi)業(yè)務(wù)本身。當(dāng)代科學(xué)技術(shù)的發(fā)展,早已超越了少數(shù)天才坐在實(shí)驗(yàn)室里所能達(dá)到的水平,進(jìn)入了“產(chǎn)學(xué)研”高度一體化的時(shí)代。很多人的認(rèn)知還沒(méi)有更新,以為只有航空航天領(lǐng)域里的高精尖技術(shù)可以“降維”用在消費(fèi)領(lǐng)域,沒(méi)想過(guò)反過(guò)來(lái)的情況也存在。美國(guó)的“機(jī)器學(xué)習(xí)四強(qiáng)”——亞馬遜、谷歌、微軟、Meta,都是從海量用戶的平臺(tái)場(chǎng)景當(dāng)中鍛煉出了強(qiáng)大的機(jī)器學(xué)習(xí)技術(shù),然后將其用于醫(yī)療、現(xiàn)代制造、航空航天等尖端場(chǎng)景,乃至以“機(jī)器學(xué)習(xí)即服務(wù)”(Machine Learning as a Servicce)的方式輸出給海量的企業(yè)用戶,潛移默化地實(shí)現(xiàn)對(duì)傳統(tǒng)行業(yè)的賦能。
在國(guó)內(nèi)何嘗不是如此?阿里、騰訊、螞蟻、字節(jié)跳動(dòng)、百度、美團(tuán)……均在人工智能、機(jī)器學(xué)習(xí)、計(jì)算機(jī)圖形技術(shù)、VR/AR等領(lǐng)域進(jìn)行著持續(xù)的研發(fā)。阿里早在2019年就將首款自研人工智能芯片運(yùn)用于阿里云的數(shù)據(jù)中心。騰訊于2018年成立了量子實(shí)驗(yàn)室,迄今已經(jīng)發(fā)表了十余篇關(guān)于量子預(yù)算的學(xué)術(shù)論文。百度是全球最先進(jìn)的智能駕駛解決方案供應(yīng)商之一,而且具備平臺(tái)、整車、服務(wù)三位一體的開發(fā)能力。相信凡是熟悉中國(guó)互聯(lián)網(wǎng)行業(yè)的人,都對(duì)此有所耳聞。
或許有人會(huì)認(rèn)為,上述技術(shù)還是太偏“應(yīng)用層”了,不夠“基礎(chǔ)”。那我們看看螞蟻集團(tuán)投入大量資源在研發(fā)的“圖計(jì)算”(Graph Processing)技術(shù)。圖計(jì)算基于數(shù)學(xué)中的“圖論”(Graph Theory),將各種類型的復(fù)雜數(shù)據(jù)融合到一個(gè)“圖”里進(jìn)行分析,從而更好地描述和理解事物之間的聯(lián)系。例如用圖計(jì)算對(duì)海量的金融交易行為進(jìn)行分析,可以大幅增進(jìn)對(duì)可疑交易、可疑團(tuán)伙的辨識(shí)度,從根本上提升風(fēng)控效率——也就是螞蟻的“全圖風(fēng)控”。這就是螞蟻多年一直不懈提升圖計(jì)算技術(shù)水平的直接原因。
但是,圖計(jì)算的技術(shù)能力一旦培養(yǎng)出來(lái),應(yīng)用范圍將大大超過(guò)金融支付風(fēng)控的范圍。Gartner預(yù)測(cè),到了2025年,圖計(jì)算將應(yīng)用于80%的數(shù)據(jù)和分析創(chuàng)新工作。從電網(wǎng)等復(fù)雜基礎(chǔ)設(shè)施的故障診斷,到重大公共衛(wèi)生事件的防范,都可以深入應(yīng)用圖計(jì)算技術(shù)。按照中國(guó)工程院院士鄭緯民的說(shuō)法:“現(xiàn)在布局高性能圖計(jì)算恰逢其時(shí),就相當(dāng)于抓住了未來(lái)大數(shù)據(jù)、人工智能和高性能計(jì)算產(chǎn)業(yè)發(fā)展的牛鼻子?!?/p>
騰訊的微信事業(yè)部也研發(fā)了Plato開源圖計(jì)算平臺(tái),并且成為了GitHub的高星開源項(xiàng)目。一些讓我們?nèi)粘YI個(gè)菜更便利的技術(shù),最終能夠應(yīng)用于廣闊的星辰大海,這大概是絕大部分用戶難以想象的。
即便與發(fā)達(dá)國(guó)家的互聯(lián)網(wǎng)巨頭相比,國(guó)內(nèi)互聯(lián)網(wǎng)公司的技術(shù)實(shí)力往往也不落下風(fēng)。就拿前面提到過(guò)第三方支付而言,支付寶、微信等國(guó)內(nèi)主流支付平臺(tái),在用戶數(shù)量巨大、黑產(chǎn)層出不窮的情況下,仍能實(shí)現(xiàn)全球領(lǐng)先的風(fēng)控資損率,而作為全球最大跨境支付巨頭的PayPal,直到2021年才在激增的釣魚詐騙壓力之下,推出了“增強(qiáng)欺詐防護(hù)系統(tǒng)”,達(dá)到了支付寶和微信早已提供的防護(hù)水平。這個(gè)案例充分說(shuō)明,所謂“國(guó)內(nèi)互聯(lián)網(wǎng)公司研發(fā)水平遠(yuǎn)遜于國(guó)內(nèi)同行”,僅僅是以偏概全罷了。
根據(jù)官方數(shù)據(jù),“2021年中國(guó)的全社會(huì)科研投入約為2.79萬(wàn)億元,比上年增長(zhǎng)17.9%”,而領(lǐng)先的消費(fèi)互聯(lián)網(wǎng)公司的增幅更大,比如美團(tuán)2021年科研投入上漲53.1%,達(dá)到167億元;螞蟻連續(xù)三年平均增長(zhǎng)39%,去年投入了188億。比起商湯、蔚來(lái)等更接近大眾認(rèn)知中的“硬科技公司”,這些消費(fèi)互聯(lián)網(wǎng)公司在科研上的投入完全不落下風(fēng),體量上反而領(lǐng)先不少。這么多錢在做什么?拿螞蟻來(lái)說(shuō),除了前面提到的“圖計(jì)算”,還有隱私計(jì)算、云原生技術(shù)、分布式數(shù)據(jù)庫(kù)等等等等。其中有許多研發(fā)項(xiàng)目,并不單純是為了眼前的業(yè)務(wù)發(fā)展;還有很多技術(shù),經(jīng)歷了消費(fèi)端的歷練之后,必將成為下一代尖端技術(shù)的基礎(chǔ)或催化劑。
其他領(lǐng)先的互聯(lián)網(wǎng)公司也是如此,從人工智能到區(qū)塊鏈,從芯片設(shè)計(jì)到無(wú)人機(jī),在外界能想象的一切“硬科技”門類,我們都能看到不同規(guī)模、不同類型的互聯(lián)網(wǎng)公司,在進(jìn)行著規(guī)模巨大、曠日持久的投入。
誰(shuí)說(shuō)互聯(lián)網(wǎng)公司沒(méi)有硬科技?我恰恰看到,中國(guó)硬科技研發(fā)之光,很可能在于那些消費(fèi)互聯(lián)網(wǎng)公司。