文|另鏡 劉雨婷 謝涵
編輯|陳彥旭
科技技術(shù)在改變?nèi)伺c工具的交互方式。PC時(shí)代的Apple Lisa電腦,是首次采用圖形用戶(hù)界面和鼠標(biāo)的個(gè)人電腦;到智能手機(jī)時(shí)代,iPhone定義了觸控交互。下一步,ChatGPT類(lèi)的多模態(tài)大模型又將影響未來(lái)AI的發(fā)展方向和人類(lèi)的工作方式。
未來(lái)科技產(chǎn)業(yè)注定是變革和顛覆的一年,新時(shí)代屬于造夢(mèng)者、勇闖者,甚至是孤獨(dú)者。在外界看來(lái),新的科技也許在不久的將來(lái)會(huì)打破現(xiàn)有的商業(yè)格局。大浪淘沙,敢為者先。
新浪潮下,另鏡推出「Tech潮向」專(zhuān)題系列報(bào)道,洞察當(dāng)下前沿科技新變革和發(fā)展趨勢(shì),報(bào)道前沿科技企業(yè)新戰(zhàn)略、新思維,提供更多具有前瞻思考的價(jià)值信息。此篇為該系列報(bào)道第五篇,聚焦新一輪新科技ChatGPT開(kāi)啟。
4月11日上午,在2023年阿里云峰會(huì)上,阿里董事會(huì)主席兼CEO、阿里云智能集團(tuán)CEO張勇正式宣布,阿里所有產(chǎn)品未來(lái)將接入“通義千問(wèn)”大模型,進(jìn)行全面升級(jí)。
在他看來(lái),智能化時(shí)代,大家都站在同一條起跑線(xiàn)上。面向AI大模型時(shí)代,所有的應(yīng)用、軟件以及服務(wù)都值得“重做一遍”。
阿里發(fā)布的通義千問(wèn)是達(dá)摩院自主研發(fā)的超大規(guī)模語(yǔ)言模型,可以回答問(wèn)題、創(chuàng)作文字,以及表達(dá)觀點(diǎn)、撰寫(xiě)代碼。
在登陸“通義千問(wèn)”后,其主頁(yè)頁(yè)面主要突出了四個(gè)功能:職場(chǎng)助理、撰寫(xiě)短文、寫(xiě)封郵件和電影腳本。另鏡拿到“通義千問(wèn)”首批邀測(cè)資格,并進(jìn)行測(cè)試。
從OpenAI發(fā)布GPT-4,到百度發(fā)布文心一言、微軟將GPT-4接入自己全套辦公軟件Microsoft 365 Copilot、谷歌開(kāi)放 Bard,再到最近一周阿里、華為、商湯紛紛發(fā)布AI大模型、更新最新進(jìn)展,互聯(lián)網(wǎng)大廠都在“爭(zhēng)分奪秒”進(jìn)軍未來(lái)。
在前一日,搜狗創(chuàng)始人王小川宣布成立人工智能公司百川智能,旨在打造中國(guó)版的OpenAI,研發(fā)并提供通用AI服務(wù)、基礎(chǔ)大模型及上層應(yīng)用。
作為在ChatGPT背后提供最底層GPU支持的硬件銷(xiāo)售公司,英偉達(dá)今年股價(jià)隨著AI行情一路水漲船高,開(kāi)年至今,股價(jià)已大漲超90%。
英偉達(dá)CEO黃仁勛在今年3月的GTC開(kāi)發(fā)者大會(huì)上發(fā)表了主題演講,“我們正處于AI的iPhone時(shí)刻,”黃仁勛興奮地表示,“初創(chuàng)公司正在競(jìng)相打造顛覆性產(chǎn)品和商業(yè)模式,科技巨頭也在尋求突破?!?/p>
面向AI大模型時(shí)代,各行各業(yè)將迎來(lái)顛覆性的改變。在ChatGPT引領(lǐng)的AI賽道上,科技公司將面對(duì)的是全方位競(jìng)爭(zhēng):從技術(shù)研究、底層算力、AI算法、數(shù)據(jù)處理訓(xùn)練,最終推進(jìn)至大模型迭代的速度與質(zhì)量。
阿里全線(xiàn)產(chǎn)品接入大模型
4月11日,2023阿里云峰會(huì)現(xiàn)場(chǎng),阿里詳細(xì)展現(xiàn)了通義千問(wèn)大語(yǔ)言模型(LLM),該模型支持多輪交互及復(fù)雜指令理解、多模態(tài)融合、外部增強(qiáng) API 等功能;同時(shí),阿里云推出企業(yè)專(zhuān)屬大模型產(chǎn)品,國(guó)內(nèi)云大廠大模型之戰(zhàn)正式打響。
從2019年開(kāi)始,阿里就在嘗試訓(xùn)練各式大模型,StructBERT、M6,再到PLUG、Composer等等。去年9月2日,達(dá)摩院副院長(zhǎng)周靖人就在“2022世界人工智能大會(huì)”上發(fā)布阿里巴巴最新“通義”大模型,并宣布相關(guān)核心模型向全球開(kāi)發(fā)者開(kāi)源開(kāi)放。
近期發(fā)布的通義千問(wèn)是基于“通義”這一系列,展現(xiàn)其“千問(wèn)”的對(duì)話(huà)形態(tài)。
阿里董事會(huì)主席兼首席執(zhí)行官、阿里云智能集團(tuán)CEO張勇表示,目前阿里云已形成了全棧的技術(shù)服務(wù),搭建了模型即服務(wù)(MaaS)、平臺(tái)即服務(wù)(PaaS)、基礎(chǔ)設(shè)施即服務(wù)(IaaS)三層架構(gòu)。
同時(shí)他透露,阿里內(nèi)部已明確提出,未來(lái)天貓、淘寶、盒馬、飛豬等阿里所有產(chǎn)品都要接入阿里大模型進(jìn)行全面升級(jí)。
據(jù)張勇介紹,阿里云的模型即服務(wù)包括API服務(wù)、基礎(chǔ)大模型/通義大模型、企業(yè)專(zhuān)屬大模型、魔搭社區(qū),平臺(tái)即服務(wù)包括模型開(kāi)發(fā)、模型推理與部署、模型訓(xùn)練、大數(shù)據(jù)平臺(tái)等;基礎(chǔ)設(shè)施即服務(wù)包括靈駿智能計(jì)算集群、彈性計(jì)算ECS集群等。通過(guò)這三層架構(gòu),能夠讓阿里云全身心擁抱智能化時(shí)代。
張勇強(qiáng)調(diào),不論是現(xiàn)在數(shù)智化時(shí)代還是未來(lái)的智能化時(shí)代,阿里云追求的基本目標(biāo)和價(jià)值,總結(jié)概括就是兩句話(huà):讓算力更普惠、讓AI更普及。在算力普惠方面,阿里云已經(jīng)覆蓋1000萬(wàn)開(kāi)發(fā)者,且跟十年前比,目前的單位算力成本降了80%、存儲(chǔ)成本降了90%。
在AI普及方面,阿里云致力于做基礎(chǔ)大模型,核心是支撐各行業(yè)開(kāi)發(fā)者,讓屬于各行業(yè)、各企業(yè)的模型能夠做得更好、門(mén)檻更低,這不僅包括阿里的通義千問(wèn),還包括阿里和其他企業(yè)及高校合作的大模型。
商湯發(fā)布B2B大模型
4月10日,商湯科技發(fā)布自研大模型體系“日日新SenseNova”,以及自研的中文語(yǔ)言大模型應(yīng)用平臺(tái)“商量”(SenseChat),參數(shù)量達(dá)千億。日日新大模型并未對(duì)外開(kāi)放測(cè)試,主要對(duì)to B端的政企客戶(hù)開(kāi)放。
在商湯技術(shù)交流日活動(dòng)上,商湯科技董事長(zhǎng)兼首席執(zhí)行官徐立介紹,“商湯日日新大模型”包括自然語(yǔ)言生成、文生圖、感知模型標(biāo)注、以及模型研發(fā)功能,并在現(xiàn)場(chǎng)展示了語(yǔ)言大模型應(yīng)用平臺(tái)“商量”的多輪對(duì)話(huà)和超長(zhǎng)文本的理解能力,以及在編程、健康咨詢(xún)等領(lǐng)域應(yīng)用。
商湯科技聯(lián)合創(chuàng)始人、首席科學(xué)家王曉剛表示,目前已經(jīng)有一些合作伙伴和客戶(hù)開(kāi)始內(nèi)測(cè)其產(chǎn)品。
未來(lái),商湯版的GPT主要面向企業(yè)端(B2B)業(yè)務(wù)?!叭杖招耂enseNova”為政企客戶(hù)提供多種API接口和服務(wù),包括圖片生成,自然語(yǔ)言生成,視覺(jué)感知通用任務(wù)與標(biāo)注服務(wù)??蛻?hù)可根據(jù)實(shí)際應(yīng)用需求,調(diào)用“日日新SenseNova”大模型的各項(xiàng)AI技術(shù)能力,低門(mén)檻、低成本、高效率地實(shí)現(xiàn)各類(lèi)AI應(yīng)用。
例如在智能駕駛領(lǐng)域,基于視覺(jué)大模型,商湯實(shí)現(xiàn)了可識(shí)別3000類(lèi)物體的BEV環(huán)視通用感知算法的實(shí)車(chē)量產(chǎn),也構(gòu)建了感知決策一體化的自動(dòng)駕駛多模態(tài)模型,帶來(lái)更強(qiáng)的環(huán)境、行為、動(dòng)機(jī)解碼能力。
商湯還展示了“日日新SenseNova”的各種AI文生圖創(chuàng)作、2D/3D數(shù)字人生成、大場(chǎng)景/小物體生成等一系列生成式AI模型及應(yīng)用:
——“秒畫(huà)SenseMirage”文生圖創(chuàng)作平臺(tái),展現(xiàn)了光影真實(shí)、細(xì)節(jié)豐富、風(fēng)格多變的強(qiáng)大的文生圖能力,可支持6K高清圖的生成;客戶(hù)還可根據(jù)自身需求訓(xùn)練生成模型。
——“如影SenseAvatar”AI數(shù)字人視頻生成平臺(tái),僅需一段5分鐘的真人視頻素材,就可以生成出來(lái)聲音及動(dòng)作自然、口型準(zhǔn)確、多語(yǔ)種精通的數(shù)字人分身。
——“瓊宇SenseSpace”和“格物SenseThings”3D內(nèi)容生成平臺(tái),可以高效低成本生成大規(guī)模三維場(chǎng)景和精細(xì)化的物件,為元宇宙、虛實(shí)融合應(yīng)用打開(kāi)新的想象空間。
AI面臨安全危機(jī)
隨著ChatGPT的廣泛應(yīng)用,圍繞人工智能語(yǔ)言模型的技術(shù)迭代一直在持續(xù)發(fā)展。
近期,來(lái)自加州大學(xué)圣迭戈分校、中山大學(xué)和微軟亞研的研究者提出了“白澤(Baize)模型”,讓ChatGPT通過(guò)自我對(duì)話(huà)生成多輪對(duì)話(huà)的“數(shù)據(jù)集”,最終用于訓(xùn)練模型;
Meta發(fā)布史上首個(gè)圖像分割基礎(chǔ)模型SAM,能從照片和視頻中實(shí)現(xiàn)“一鍵摳圖”,即能夠根據(jù)文本指令即分離出想要的圖像內(nèi)容;
谷歌計(jì)劃計(jì)劃在搜索引擎中添加對(duì)話(huà)式人工智能功能,以應(yīng)對(duì)來(lái)自ChatGPT等聊天機(jī)器人的競(jìng)爭(zhēng)以及更廣泛的商業(yè)壓力;
AI繪畫(huà)神器MidJourney推出圖生文功能,可以讓用戶(hù)上傳任意圖片,MidJourney通過(guò)分析圖片內(nèi)容生成4條適合的Prompt,用戶(hù)可根據(jù)這些Promp生成更多圖片;
谷歌助手團(tuán)隊(duì)和哥倫比亞大學(xué)教授合作推出PRESTO 多語(yǔ)言大數(shù)據(jù)集,該數(shù)據(jù)集涉及6種語(yǔ)言,涵蓋了用戶(hù)與虛擬助理的日常對(duì)話(huà)中的各種真實(shí)痛點(diǎn),可以有效解決一些虛擬助理對(duì)話(huà)的難題。
在AI技術(shù)如火如荼的發(fā)展時(shí),ChatGPT卻因隱私保護(hù)問(wèn)題遭遇抵制。
今年3月29日,埃隆·馬斯克(Elon Musk)等千名業(yè)界和學(xué)界人士聯(lián)署公開(kāi)信,呼吁所有AI實(shí)驗(yàn)室立即暫停訓(xùn)練比GPT-4更強(qiáng)大的AI系統(tǒng),暫停至少6個(gè)月,以便制定和實(shí)施安全協(xié)議。
美國(guó)參議院Lindsey Graham接受媒體采訪時(shí)表示,ChatGPT被濫用的可能性很高,需要指導(dǎo)和監(jiān)督。就在3月31日,意大利個(gè)人數(shù)據(jù)保護(hù)局宣布禁止使用聊天機(jī)器人ChatGPT,并開(kāi)始立案調(diào)查,德國(guó)、加拿大相關(guān)機(jī)構(gòu)也紛紛表示對(duì)于數(shù)據(jù)隱私的擔(dān)憂(yōu)。
據(jù)媒體最新報(bào)道,拜登政府已開(kāi)始研究是否需要對(duì)ChatGPT等人工智能工具進(jìn)行審查。
面對(duì)外界對(duì)于AI數(shù)據(jù)安全的質(zhì)疑,4月12日,OpenAI、微軟、谷歌、蘋(píng)果、英偉達(dá)、Stability AI、Hugging Face、Anthropic等公司的高管與政策代表將出席該會(huì)議,討論如何負(fù)責(zé)任地開(kāi)發(fā)AI、分享最好的實(shí)踐案例,并商討相關(guān)的公共政策框架和標(biāo)準(zhǔn)。
寫(xiě)在最后
在OpenAI、微軟、谷歌開(kāi)啟AI軍備賽后,百度、阿里、華為、商湯大模型已顯露雛形,更多參與者還在路上。
4月17日,昆侖萬(wàn)維將發(fā)布“天工”大模型,并啟動(dòng)邀請(qǐng)測(cè)試。
搜狗創(chuàng)始人、前CEO王小川也在4月10日宣布,與COO茹立云聯(lián)合成立公司“百川智能”,開(kāi)啟AI大模型領(lǐng)域創(chuàng)業(yè)。
根據(jù)公開(kāi)信,百川智能早前已獲得5000萬(wàn)美元啟動(dòng)資金,初步搭建起包括搜狗、百度等技術(shù)骨干在內(nèi)的團(tuán)隊(duì)。王小川表示,面向機(jī)構(gòu)的融資會(huì)在近期啟動(dòng),該公司將會(huì)在年底發(fā)布面向ToB(企業(yè)端)領(lǐng)域的大模型產(chǎn)品。
“追上ChatGPT水平,我覺(jué)得今年內(nèi)可能就能夠?qū)崿F(xiàn),但對(duì)于GPT-4或者GPT-5,我認(rèn)為可能需要3年左右的時(shí)間,應(yīng)該不會(huì)低于兩年。”王小川表示。
雖然承受著監(jiān)管壓力與輿論質(zhì)疑,但人工智能已經(jīng)成為當(dāng)今社會(huì)的一個(gè)重要趨勢(shì),并已經(jīng)開(kāi)始廣泛應(yīng)用于各個(gè)行業(yè),這已是可預(yù)見(jiàn)的未來(lái)。