正在閱讀:

4萬(wàn)字告訴你ChatGPT到底是什么?(下)

掃一掃下載界面新聞APP

4萬(wàn)字告訴你ChatGPT到底是什么?(下)

人工智能系統(tǒng)開發(fā)是一個(gè)系統(tǒng)工程,需要協(xié)同各個(gè)方面的資源共同發(fā)力,才能在產(chǎn)業(yè)發(fā)展中占有制高點(diǎn)。

文 | 星船知造 錢鴻生

編輯 | 唐曉園

上周我們發(fā)布了報(bào)告上篇 《4萬(wàn)字告訴你ChatGPT到底是什么(上)》,今天的下篇我們將繼續(xù)節(jié)選報(bào)告第三章中的“我國(guó)人工智能發(fā)展中存在的主要問(wèn)題”、第四章《ChatGPT對(duì)資本市場(chǎng)影響的分析與研判》和第五章《我國(guó)未來(lái)人工智能發(fā)展的展望》中部分核心內(nèi)容和觀點(diǎn)。

OpenAI推出ChatGPT后不久,微軟宣布將ChatGPT與搜索引擎Bing整合,谷歌宣布推出Bard應(yīng)對(duì)挑戰(zhàn),接著Meta官網(wǎng)公布了一款新的人工智能大型語(yǔ)言模型LLaMA。

此時(shí),人們自然而然把目光轉(zhuǎn)向了中國(guó)相關(guān)企業(yè),他們何時(shí)宣布推出類似于ChatGPT人工智能發(fā)展的時(shí)間表。

人們特別關(guān)注的企業(yè)有百度、阿里巴巴以及人工智能企業(yè)科大訊飛等等一大批中國(guó)與人工智能有關(guān)聯(lián)企業(yè)的動(dòng)向。

3.4.3 我國(guó)人工智能發(fā)展中存在的主要問(wèn)題

我國(guó)發(fā)展人工智能面臨三方面技術(shù)難點(diǎn)如下:

第一,人工智能的AI算法

人工智能常見(jiàn)的算法技術(shù)的基礎(chǔ)性研究主要集中于國(guó)內(nèi)各大高校團(tuán)隊(duì),但在科研成果轉(zhuǎn)化領(lǐng)域一直發(fā)展比較緩慢,較難實(shí)現(xiàn)從理論和技術(shù)向生產(chǎn)力的轉(zhuǎn)化。

目前以華為、阿里、騰訊等公司主導(dǎo)的人工智能技術(shù)研發(fā)團(tuán)隊(duì)迅速崛起,將科研產(chǎn)品開發(fā)與算法技術(shù)結(jié)合,從產(chǎn)業(yè)領(lǐng)域?qū)崿F(xiàn)人工智能算法的技術(shù)成果轉(zhuǎn)化。

但是在算法的基礎(chǔ)理論研究層面,一直以來(lái)是我們發(fā)展人工智能技術(shù)的短板。沒(méi)有對(duì)大規(guī)模機(jī)器學(xué)習(xí)場(chǎng)景中強(qiáng)化學(xué)習(xí)算法模型、生成性預(yù)訓(xùn)練變換模型、分布式并行的研發(fā)投入,或者說(shuō)由于受到資金投入與人才缺乏的影響,研究成果與世界發(fā)達(dá)企業(yè)還有很大的差距。

美國(guó)現(xiàn)有的人工智能系統(tǒng)的關(guān)鍵技術(shù)都是不開源的,系統(tǒng)深度學(xué)習(xí)框架、數(shù)據(jù)庫(kù)和工具集,均限內(nèi)部使用,部分僅對(duì)系統(tǒng)的應(yīng)用接口持開源的態(tài)度,使我們無(wú)法在短時(shí)間內(nèi)掌握世界最先進(jìn)的人工智能系統(tǒng)的開發(fā)經(jīng)驗(yàn)。

從市場(chǎng)的角度來(lái)看,我國(guó)目前的人工智能系統(tǒng)都是一些比較初級(jí)的數(shù)據(jù)采集與分析應(yīng)用系統(tǒng),類似于ChatGPT高度智能化的AI產(chǎn)品的研發(fā)還處于摸索與初級(jí)階段,在性能和穩(wěn)定性方面改善空間潛力巨大。

早在20世紀(jì)80年代,我國(guó)學(xué)術(shù)界就提出了相當(dāng)完善的AI算法模型,中國(guó)多家高校有從事算法模型的研究,但大多都將算法模型應(yīng)用在人臉識(shí)別系統(tǒng),提高圖像識(shí)別精度方面。到目前為止算法模型在AI領(lǐng)域的價(jià)值還沒(méi)有被真正體現(xiàn),這可能受限于我們的芯片制造水平難以提供支撐深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練和預(yù)訓(xùn)練需要的算力。

科研領(lǐng)域需要更大投入,要針對(duì)目前的已有算法進(jìn)行深度優(yōu)化,或者另辟蹊徑,提出更為先進(jìn)的算法理論。要打造出符合世界產(chǎn)業(yè)發(fā)展最新技術(shù)水平,具有全球市場(chǎng)競(jìng)爭(zhēng)力的人工智能產(chǎn)品,看來(lái)有相當(dāng)長(zhǎng)的一段路要走。但也不排除彎道超車或換道超車奇跡的發(fā)生。

我國(guó)AI發(fā)展現(xiàn)狀任重而道遠(yuǎn)。

第二,人工智能AI模型軟件

國(guó)內(nèi)的人工智能模型軟件開發(fā)已經(jīng)起步,開始對(duì)標(biāo)世界先進(jìn)的人工智能模型,培育自己的發(fā)展環(huán)境。人工智能模型是人工智能生態(tài)中最重要的因素之一,我國(guó)需要促進(jìn)國(guó)產(chǎn)模型軟件的發(fā)展和推廣,擺脫國(guó)外的標(biāo)準(zhǔn)制約。ChatGPT就是基于“生成型預(yù)訓(xùn)練變換模型”開發(fā)出來(lái)的自然語(yǔ)言聊天機(jī)器人。

第三,人工智能開發(fā)環(huán)境

人工智能開發(fā)環(huán)境是指相關(guān)算法、數(shù)據(jù)庫(kù)、軟件開發(fā)工具、高性能的人工智能AI計(jì)算機(jī)芯片、云計(jì)算網(wǎng)絡(luò)的集合。國(guó)產(chǎn)AI模型開發(fā)需要和國(guó)產(chǎn)AI智能芯片及硬件進(jìn)行相互適配、性能優(yōu)化和應(yīng)用推廣,才能夠形成面向行業(yè)應(yīng)用的軟硬件一體化人工智能平臺(tái)。

國(guó)際人工智能巨頭掌控著人工智能開發(fā)環(huán)境的關(guān)鍵技術(shù),我們目前還較難在短時(shí)間內(nèi)在AI芯片、算法、模型軟件、云數(shù)據(jù)庫(kù)服務(wù)等人工智能開發(fā)環(huán)境上有十分大的突破。

人工智能系統(tǒng)開發(fā)是一個(gè)系統(tǒng)工程,需要協(xié)同各個(gè)方面的資源共同發(fā)力,才能在產(chǎn)業(yè)發(fā)展中占有制高點(diǎn)。

3.4.4 AI芯片,人工智能繞不過(guò)去的坎

人工智能AI芯片是技術(shù)發(fā)展的關(guān)鍵之一,它是提供人工智能算力的靈魂和大腦,承載了為各種終端提供強(qiáng)大算力的重要任務(wù)。人工智能AI 芯片的出現(xiàn),極大提高數(shù)據(jù)處理的能力,尤其在處理海量數(shù)據(jù)時(shí)明顯優(yōu)于傳統(tǒng)CPU。

從技術(shù)架構(gòu)來(lái)看,AI芯片一般可以分為GPU、FPGA、ASIC和類腦芯片四大類——

GPU(Graphics Processing Unit,圖形處理器)

GPU是利用處理圖形任務(wù)的圖形處理器來(lái)計(jì)算原本由中央處理器CPU的通用計(jì)算任務(wù)。

GPU的關(guān)鍵性能是矩形并行計(jì)算,主流的GPU具有強(qiáng)大的計(jì)算能力,無(wú)論性能還是內(nèi)存帶寬均遠(yuǎn)大于同代的CPU。CPU 由專為順序串行處理而優(yōu)化組成,而 GPU 則擁有一個(gè)由數(shù)以千計(jì)的更小、更高效的核心(專為同時(shí)處理多重任務(wù)而設(shè)計(jì))組成的大規(guī)模并行計(jì)算架構(gòu)。同時(shí)CPU相當(dāng)一部分時(shí)間在執(zhí)行外設(shè)的中斷、進(jìn)程的切換等任務(wù),而GPU有更多的時(shí)間用于并行計(jì)算。

英偉達(dá)是AI芯片GPU(圖形處理器單元)的主要生產(chǎn)廠商,無(wú)論是OpenAI的ChatGPT、還是微軟的搜索引擎Bing、谷歌的人工智能系統(tǒng)LaMDA,都離不開英偉達(dá)提供的底層芯片GPU的算力支持,英偉達(dá)系列的A100和H100系列占全球AI芯片市場(chǎng)的80%以上的份額。

除了英偉達(dá),還有AMD,ARM家的Mali,Imagination的PowerVR,Qualcomm的Adreno等。

基于FPGA現(xiàn)場(chǎng)可編程門陣列

FPGA(Field Programmable Gate Array)現(xiàn)場(chǎng)可編程門陣列,或稱半定制化芯片。它是在PAL、GAL、CPLD等可編程器件的基礎(chǔ)上進(jìn)一步發(fā)展的產(chǎn)物,可以根據(jù)算法需求,動(dòng)態(tài)重構(gòu)計(jì)算架構(gòu)。它是作為專用集成電路(ASIC)領(lǐng)域中的一種半定制電路而出現(xiàn)的,既解決了定制電路的不足,又克服了原有可編程器件門電路數(shù)有限的缺點(diǎn)。

全球知名的FPGA生產(chǎn)廠商有:Altera,Xilinx,Actel,Lattice,Atmel,我國(guó)廠商代表有深鑒科技DPU、百度XPU等。

ASIC(Application Specific Integrated Circuit)

ASIC專用集成電路是針對(duì)特定用戶要求定制設(shè)計(jì)、制造的專門的應(yīng)用程序芯片。ASIC芯片廣泛應(yīng)用于人工智能設(shè)備、虛擬貨幣挖礦設(shè)備、耗材打印設(shè)備、軍事國(guó)防設(shè)備等智慧終端。

ASIC芯片還可以細(xì)分為全定制ASIC芯片、半定制ASIC芯片及可編程ASIC芯片。ASIC芯片擁有面積小、集成度高等優(yōu)勢(shì),被廣泛應(yīng)用于人工智能終端和網(wǎng)絡(luò)系統(tǒng)中。

類腦計(jì)算芯片(Brain-Inspired Chip)

類腦計(jì)算芯片是人工智能AI的一個(gè)重要組成部分,類腦芯片可模擬人類大腦信息處理方式,能以極低的功耗對(duì)信息進(jìn)行并行和分布式處理,類腦計(jì)算芯片就是把微電子技術(shù)和新型神經(jīng)形態(tài)器件結(jié)合,突破傳統(tǒng)計(jì)算架構(gòu),實(shí)現(xiàn)存儲(chǔ)與計(jì)算的深度融合,大幅提升計(jì)算性能、提高集成度、降低能耗。對(duì)于現(xiàn)有的計(jì)算體系與系統(tǒng)做出變革,并實(shí)現(xiàn)在計(jì)算能耗、計(jì)算能力與計(jì)算效率等方面的大幅改進(jìn)。

IBM已經(jīng)開始進(jìn)行類腦智能算法與技術(shù)的探索,并已成功研制出TrueNorth芯片。

中國(guó)目前有清華大學(xué)的天機(jī)芯,浙江大學(xué)的Darwin2 (55nm)等一批研制類腦計(jì)算芯片機(jī)構(gòu)和企業(yè)。

ChatGPT對(duì)資本市場(chǎng)影響的研判

4.2 ChatGPT背后的技術(shù)壁壘和文化控制權(quán)

ChatGPT是一種自然語(yǔ)言處理技術(shù),一旦ChatGPT能從目前的實(shí)驗(yàn)階段走向應(yīng)用成熟階段,將這標(biāo)志著在人類活動(dòng)中,人工智能將開始扮演重要角色并占據(jù)優(yōu)勢(shì)地位。

我們知道,在自然語(yǔ)言處理大模型技術(shù)上,由于受到各種因素的影響,我國(guó)的人工智能相比國(guó)外發(fā)展有一定的差距。

但在局部技術(shù)領(lǐng)域,我們還是具有很大優(yōu)勢(shì)的,比如在優(yōu)化大模型中的數(shù)據(jù)庫(kù),在某些特定領(lǐng)域進(jìn)行模型優(yōu)化和云數(shù)據(jù)庫(kù)建設(shè),以及在一些與自然語(yǔ)言處理關(guān)系密切的學(xué)科。在國(guó)家宏觀政策的指導(dǎo)下,發(fā)揮社會(huì)市場(chǎng)經(jīng)濟(jì)體制的優(yōu)勢(shì),能集中力量辦大事的原則,完全可以進(jìn)行基于大模型處理方法模型的應(yīng)用性研究,以適應(yīng)人工智能發(fā)展對(duì)拉動(dòng)國(guó)家經(jīng)濟(jì)上行,滿足人們追求豐富多彩生活?yuàn)蕵?lè)的需求。

4.3 ChatGPT可能引發(fā)的機(jī)遇與風(fēng)險(xiǎn)

我們對(duì)ChatGPT要時(shí)刻保持清醒的認(rèn)知,每一次技術(shù)迭代,都將改變?nèi)祟惿畹膬?nèi)涵和方式。ChatGPT是否屬于一次新的技術(shù)迭代這個(gè)問(wèn)題還有進(jìn)一步觀察,可是以ChatGPT為代表的人工智能技術(shù)的發(fā)展和自然語(yǔ)言處理技術(shù)的突破,一定會(huì)對(duì)現(xiàn)有產(chǎn)業(yè)發(fā)展格局帶來(lái)前所未有的重要影響。

從正面影響來(lái)看,ChatGPT可以幫助人們快速獲取信息和提高工作效率,擴(kuò)展知識(shí)面,提供發(fā)展AI 產(chǎn)業(yè)新的思路和方法。 另一方面,某些低端和重復(fù)的工作可能被ChatGPT和 AI代替,導(dǎo)致勞動(dòng)力市場(chǎng)的階段性動(dòng)蕩和變化。

如果人們過(guò)度依賴AI,可能會(huì)降低人們一部分的操作技能水平和創(chuàng)新精神。某些行業(yè)可能會(huì)發(fā)生重組甚至消失,有可能在變化過(guò)程中引發(fā)社會(huì)矛盾等。

顛覆性創(chuàng)新理論的提出者克里斯滕森在《創(chuàng)新者的窘境》這本書中,將創(chuàng)新分為了延續(xù)性創(chuàng)新和破壞性創(chuàng)新兩種:破壞性創(chuàng)新難以評(píng)估市場(chǎng)規(guī)模增長(zhǎng)的需求和未來(lái)的發(fā)展路徑;延續(xù)性創(chuàng)新則會(huì)將資源推向更容易帶來(lái)增長(zhǎng)的方向。

總體而言,以ChatGPT為代表的人工智能的發(fā)展, 可能對(duì)人類的未來(lái)產(chǎn)生重要影響,需要積極開展相關(guān)的研究和管理,以確保國(guó)家經(jīng)濟(jì)技術(shù)發(fā)展不受制于人,保持社會(huì)的穩(wěn)定發(fā)展和保護(hù)大多數(shù)人的共同利益。  

人工智能解決方案可以為企業(yè)和公民提供巨大的機(jī)會(huì),但也可能帶來(lái)風(fēng)險(xiǎn),這就需要一個(gè)堅(jiān)實(shí)的監(jiān)管框架來(lái)確保人工智能技術(shù)的健康發(fā)展。

4.4 ChatGPT的隱患與潛在危機(jī)

盡管目前的ChatGPT還是一個(gè)驗(yàn)證的版本,強(qiáng)大的文本處理與聊天能力十分強(qiáng)大,但ChatGPT在短短的幾個(gè)月試運(yùn)行中也暴露出了很多缺陷,甚至可能會(huì)引發(fā)危機(jī)。這些問(wèn)題正隨著以ChatGPT為代表的生成型AI系統(tǒng)的推進(jìn)逐漸浮出水面。人們也會(huì)更關(guān)注這些問(wèn)題,并迅速采取防范措施。ChatGPT存在的缺陷與風(fēng)險(xiǎn)主要體現(xiàn)在以下幾個(gè)方面:

4.1.1 ChatGPT在道德和法律方面的違規(guī)行為

人們?cè)谑褂弥邪l(fā)現(xiàn),ChatGPT對(duì)信息、數(shù)據(jù)來(lái)源無(wú)法進(jìn)行核實(shí)、核查和驗(yàn)證,可能存在個(gè)人數(shù)據(jù)與商業(yè)秘密被泄露,引起竊取他人信息的道德問(wèn)題和提供虛假信息兩大隱患。

ChatGPT從網(wǎng)絡(luò)中獲取大量信息,依托海量數(shù)據(jù)庫(kù)分析運(yùn)行,其中包括大量的互聯(lián)網(wǎng)用戶自行輸入的信息,比如新聞工作者編寫的稿子,ChatGPT目前無(wú)法追溯到文字的來(lái)源,因此當(dāng)用戶輸入提問(wèn)時(shí),ChatGPT可能產(chǎn)生泄露個(gè)人數(shù)據(jù)或商業(yè)秘密等的風(fēng)險(xiǎn)。

ChatGPT涉及的法律風(fēng)險(xiǎn)不限于以下幾種:

著作權(quán):生成的內(nèi)容可能會(huì)侵犯他人的著作權(quán)。

隱私權(quán):使用ChatGPT 可能需要提供一些個(gè)人信息,因此存在泄露個(gè)人隱私的風(fēng)險(xiǎn)。

信息誤導(dǎo):生成的內(nèi)容可能不準(zhǔn)確或有誤導(dǎo)性和歧視性。

侵權(quán)違規(guī):ChatGPT生成的內(nèi)容可能侵犯他人的合法權(quán)益,如商標(biāo)權(quán)、出版權(quán)、著作權(quán)、專利權(quán)等。

商標(biāo)侵權(quán):ChatGPT 生成的圖像和視頻內(nèi)容可能涉及商標(biāo)侵權(quán)。

人身攻擊:ChatGPT 生成的內(nèi)容可能涉及對(duì)宗教和人身攻擊,違反社會(huì)倫理道德。

侮辱誹謗:使用 ChatGPT 生成的內(nèi)容可能侮辱他人,可能涉及誹謗等法律問(wèn)題。

最近,OpenAI表示,正考慮在ChatGPT中添加模型水印,即監(jiān)測(cè)模型可以識(shí)別的特殊標(biāo)記,以降低信息濫用的問(wèn)題。

4.1.2 ChatGPT提供虛假信息

ChatGPT常常出現(xiàn)“一本正經(jīng)的胡說(shuō)八道’”,這是ChatGPT目前被人詬病的一個(gè)主要缺點(diǎn)。對(duì)于有些虛假信息,需要具備一定專業(yè)知識(shí)的人才能辨別真?zhèn)?,這就為不法分子惡意“訓(xùn)練”或“誤導(dǎo)”人工智能,使其提供詐騙信息、釣魚網(wǎng)站等內(nèi)容,損害公民人身和財(cái)產(chǎn)安全創(chuàng)造了有利條件。

4.1.3. ChatGPT信息監(jiān)管迫在眉睫

ChatGPT在建立語(yǔ)料庫(kù)、生成文本時(shí),大量使用并非公開的開源代碼,或未辦理許可證申請(qǐng),可能會(huì)導(dǎo)致侵權(quán)。對(duì)于一些受著作權(quán)或版權(quán)保護(hù)的文本、視頻、軟件代碼等,如果沒(méi)有經(jīng)過(guò)權(quán)利人的授權(quán),直接復(fù)制到自己的數(shù)據(jù)庫(kù)中,在此基礎(chǔ)上修改、拼湊,極有可能侵害他人的著作權(quán),因此對(duì)ChatGPT必須要考慮建立相關(guān)的監(jiān)管機(jī)制,防止產(chǎn)生不良的社會(huì)影響。

4.1.4. ChatGPT提供侵權(quán)信息

一位美國(guó)眾議院科學(xué)委員議員表示:“我對(duì)人工智能以及人工智能推動(dòng)的社會(huì)進(jìn)步感到興奮,但也為其不受限制和不受監(jiān)管感到擔(dān)憂。”

紐約大學(xué)認(rèn)知科學(xué)名譽(yù)教授Gary Marcus對(duì)以深度學(xué)習(xí)為中心的 AI 持懷疑態(tài)度,他認(rèn)為:“生成式 AI 對(duì)社會(huì)結(jié)構(gòu)構(gòu)成了真實(shí)而迫在眉睫的威脅”。

各國(guó)監(jiān)管機(jī)構(gòu)要有切實(shí)可行的風(fēng)險(xiǎn)評(píng)估框架,并任命一個(gè)負(fù)責(zé)任的機(jī)構(gòu)。此外,人工智能倫理框架的建立將為所有部門創(chuàng)造一個(gè)良好的創(chuàng)新環(huán)境。

一位資深的網(wǎng)絡(luò)安全公司管理者認(rèn)為:她的團(tuán)隊(duì)能夠讓 ChatGPT 編寫網(wǎng)絡(luò)攻擊的程序,ChatGPT從編寫網(wǎng)絡(luò)釣魚電子郵件到編寫惡意代碼,再到規(guī)避常見(jiàn)的網(wǎng)絡(luò)安全檢查,實(shí)施對(duì)其他系統(tǒng)的攻擊,ChatGPT幾乎可以成為讓沒(méi)有軟件編碼技能的人成為網(wǎng)絡(luò)罪犯。  

無(wú)數(shù)的教育工作者譴責(zé)有人使用 ChatGPT考試作弊,美國(guó)的多所學(xué)校已經(jīng)禁止學(xué)生用 ChatGPT聊天機(jī)器人答題,拒絕采用ChatGPT編寫的論文和答卷。

由于ChatGPT是一種人工智能工具,只要輸入提問(wèn),點(diǎn)擊鼠標(biāo),就可以完成任何的主題文章、詩(shī)歌和電子郵件。特別是學(xué)生用ChatGPT完成試題應(yīng)答和論文撰寫。在國(guó)外教育界引起了軒然大波。

為此OpenAI迫于社會(huì)壓力,趕緊開發(fā)出了防作弊應(yīng)用軟件,可以審查哪些試卷和論文是由ChatGPT提供的,以此防止學(xué)生作弊。

但是,這種新的檢測(cè)工具并沒(méi)有消除教師們的恐懼,反而讓科技界和教育界有些失望。據(jù)測(cè)試,該系統(tǒng)大約只有20%的準(zhǔn)確性,不能完全檢出作弊的試卷答題。

2023年1月初,美國(guó)普林斯頓大學(xué)的學(xué)生愛(ài)德華·田(Edward Tian)開發(fā)了GPTZero工具,該工具的標(biāo)語(yǔ)是“人類應(yīng)該知道真相”,該工具可以更準(zhǔn)確鑒別由ChatGPT提供的文檔,相信不久國(guó)內(nèi)也會(huì)催生出這類的應(yīng)用軟件和工具。

人工智能領(lǐng)域的競(jìng)爭(zhēng)焦點(diǎn)與差距

在以ChatGPT為代表的生成類AI大模型中,對(duì)于AI芯片的要求更高,包括要求更高速的內(nèi)存帶寬、更大的內(nèi)存容量以及更加高效的數(shù)據(jù)通信帶寬。

以O(shè)penAI的ChatGPT-3.5模型訓(xùn)練為例,微軟公司專門為Open AI 開發(fā)了一款定制的超級(jí)計(jì)算機(jī),使用了上萬(wàn)顆英偉達(dá)A100的AI芯片。

在國(guó)產(chǎn)AI芯片自主研發(fā)領(lǐng)域,國(guó)內(nèi)多家廠商奮起直追,成果喜人,為我國(guó)的人工智能發(fā)展奠定了堅(jiān)實(shí)基礎(chǔ),令世界刮目相看。

OpenAI公司發(fā)展人工智能,在微軟投資100億美元拿到49%的股權(quán)之前,OpenAI在成立的七年多的時(shí)間里,總共收到了大約40億美元的風(fēng)險(xiǎn)投資,就是在這樣巨額投資的情況下,根據(jù)OpenAI公司2022年財(cái)報(bào)顯示虧損仍高達(dá)5.45億美元(折合人民幣虧損額達(dá)到將近40億人民幣)。

微軟在入股OpenAI 后,為OpenAI部署了一個(gè)超級(jí)計(jì)算機(jī),按照算力來(lái)說(shuō),該超級(jí)計(jì)算機(jī)可以進(jìn)入全球超計(jì)算機(jī)的前五名。

2023年1月,微軟還承諾將繼續(xù)為OpenAI提供更多的超算中心的部署,讓它能夠更加高效完成下一代ChatGPT模型的訓(xùn)練。

根據(jù)OpenAI測(cè)算,目前訓(xùn)練一次ChatGPT模型的算力成本在450萬(wàn)美元左右,這里還只是計(jì)算硬件投入的成本,還不包括人工成本、網(wǎng)絡(luò)寬帶成本、數(shù)據(jù)儲(chǔ)存、固定資產(chǎn)折舊等的綜合成本。

實(shí)際上訓(xùn)練一次ChatGPT模型,有時(shí)候人力成本和運(yùn)維成本支出要占據(jù)總成本很大一部分,因此Open AI雇傭了第三世界國(guó)家的低成本外來(lái)外包員工來(lái)完成指定的優(yōu)化任務(wù),從而降低人工成本。

目前ChatGPT-3參數(shù)量在1750億參數(shù)左右。而以O(shè)penAI發(fā)布最新的ChatGPT-3.5B模型為例,數(shù)量將達(dá)到1.7萬(wàn)億。預(yù)測(cè)成本就更夸張了,訓(xùn)練時(shí)間也將從之前的幾周變?yōu)閿?shù)月甚至幾個(gè)月的周期。

目前OpenAI公司有1000多名正式員工,人力成本也是非常龐大的一筆支出。因此AI產(chǎn)業(yè)研發(fā)成本支出是非常燒錢的行業(yè),對(duì)于一般發(fā)展中國(guó)家來(lái)說(shuō)這是一筆巨資。同樣我們國(guó)家人工智能系統(tǒng)還處在研發(fā)階段,資本投入也是當(dāng)下面臨的一個(gè)重要課題。

隨著大模型訓(xùn)練體量的不斷增加,未來(lái)算力資源、人才資源、數(shù)據(jù)資源三者的投入不可小覷。

 ChatGPT引爆全球互聯(lián)網(wǎng)入口爭(zhēng)奪戰(zhàn)

從ChatGPT功能來(lái)看,還處在聯(lián)網(wǎng)驗(yàn)證階段,就是在基本的功能方面還存在很多問(wèn)題和不確定性,在有些功能上更是漏洞百出,在軟件編程方面還遠(yuǎn)遠(yuǎn)沒(méi)有達(dá)到顛覆軟件編程產(chǎn)業(yè)的程度。

但是全網(wǎng)熱潮背后一定有深層次的原因:經(jīng)過(guò)深度分析不難看出,其實(shí)ChatGPT引爆的不完全是AI里程碑式的技術(shù)革命,而是引爆一場(chǎng)全球互聯(lián)網(wǎng)入口的爭(zhēng)奪戰(zhàn)。

全球互聯(lián)網(wǎng)入口長(zhǎng)期被谷歌占據(jù),谷歌的搜索引擎業(yè)務(wù)占到全球市場(chǎng)份額的97%,谷歌內(nèi)部有一個(gè)商業(yè)警戒系統(tǒng),只要公司業(yè)務(wù)受到威脅就會(huì)觸發(fā),其中最高級(jí)別是紅色告警。

谷歌(Google)公司1998年9月創(chuàng)立,自從公司成立以來(lái),這個(gè)紅色警戒系統(tǒng)就從來(lái)沒(méi)有觸發(fā)過(guò)。然而2023年2月,谷歌瀏覽器的下載量從全球第一降到了第二,谷歌傳統(tǒng)的搜索引擎業(yè)務(wù)首次被微軟反超,系統(tǒng)自動(dòng)觸發(fā)了紅色警戒系統(tǒng)。

微軟公司從誕生以來(lái),從未在任何產(chǎn)品上投資超過(guò)100億,這次對(duì)Open AI 投資超過(guò)100個(gè)億,目的就是要把ChatGPT整合到微軟公司的所有產(chǎn)品中去。

微軟近期已經(jīng)宣布將ChatGPT整合入微軟的搜索引擎Bing,沒(méi)過(guò)幾天,又宣布會(huì)將ChatGPT整合進(jìn)Office辦公套件中去。用戶使用Office時(shí)就能體驗(yàn)ChatGPT的對(duì)話功能。很明顯微軟就是要利用ChatGPT先入為主的優(yōu)勢(shì),爭(zhēng)奪谷歌搜索引擎的市場(chǎng)份額,目前第一階段目標(biāo)已經(jīng)圓滿達(dá)到。

微軟一直都在厲兵秣馬,以前一直被谷歌、蘋果、亞馬遜壓得喘不動(dòng)氣,現(xiàn)在終于開始了在全球互聯(lián)網(wǎng)入口的爭(zhēng)奪戰(zhàn)中的絕地反擊戰(zhàn)。

同樣的情況,在我國(guó)的互聯(lián)網(wǎng)企業(yè)中也有發(fā)生。在ChatGPT成功的示范效應(yīng)帶動(dòng)下,以及國(guó)家支持?jǐn)?shù)字經(jīng)濟(jì)發(fā)展兩個(gè)強(qiáng)力點(diǎn)的支撐下,相信不遠(yuǎn)的將來(lái),中國(guó)的AI 產(chǎn)品將像雨后春筍一樣拔地而起。

淺談未來(lái)我國(guó)人工智能發(fā)展趨勢(shì)

隨著科學(xué)技術(shù)的飛速發(fā)展,國(guó)家已經(jīng)把人工智能作為戰(zhàn)略性新興產(chǎn)業(yè),作為新增長(zhǎng)引擎加以扶持和培養(yǎng),人工智能的未來(lái)發(fā)展將會(huì)帶來(lái)更多的驚喜和機(jī)遇,下面就讓我們淺談一下我國(guó)人工智能發(fā)展趨勢(shì)。

在國(guó)家宏觀政策的大力支持下,我國(guó)的人工智能將迎來(lái)重大的發(fā)展機(jī)遇期,國(guó)內(nèi)的人工智能企業(yè),互聯(lián)網(wǎng)企業(yè),科研機(jī)構(gòu)應(yīng)當(dāng)抓住這個(gè)難得的機(jī)遇,為國(guó)家的數(shù)字經(jīng)濟(jì)轉(zhuǎn)型發(fā)展作出應(yīng)有的貢獻(xiàn)。

特別是華為、阿里巴巴,騰訊、百度、科大訊飛、字節(jié)跳動(dòng)等等大型企業(yè)和科研單位,應(yīng)該發(fā)揮各自優(yōu)勢(shì)強(qiáng)強(qiáng)聯(lián)手,他們有義務(wù)、有責(zé)任,承擔(dān)起這個(gè)時(shí)代賦予的歷史使命。

強(qiáng)化企業(yè)在研發(fā)投入中的主體地位,繼續(xù)加大企業(yè)研發(fā)費(fèi)用,建立起金融支持企業(yè)在AI領(lǐng)域的創(chuàng)新工作機(jī)制,打通科技、產(chǎn)業(yè)、金融的全產(chǎn)業(yè)鏈條。

人工智能產(chǎn)業(yè)屬于新型的高科領(lǐng)域,目前世界上尚未形成占絕對(duì)主導(dǎo)的技術(shù)路徑依賴。

在世界產(chǎn)業(yè)生態(tài)也沒(méi)有形成絕對(duì)壁壘的人工智能開創(chuàng)初期,我們要結(jié)合國(guó)情把軟硬件協(xié)同發(fā)展,作為提升人工智能發(fā)展的主要手段,單純的數(shù)據(jù)與算法優(yōu)化已不能滿足我國(guó)人工智能產(chǎn)業(yè)發(fā)展需求。

面對(duì)這一發(fā)展契機(jī),我國(guó)應(yīng)強(qiáng)化人工智能產(chǎn)業(yè)發(fā)展的頂層設(shè)計(jì),加強(qiáng)人工智能軟硬件協(xié)同布局。重點(diǎn)布局具有我國(guó)自主知識(shí)產(chǎn)權(quán)的“框架軟件+AI芯片”架構(gòu),構(gòu)建起有利于我國(guó)人工智能發(fā)展的生態(tài)環(huán)境,力爭(zhēng)在人工智能領(lǐng)域取得主導(dǎo)優(yōu)勢(shì)。

類腦芯片研發(fā)屬于AI芯片的前瞻性領(lǐng)域,我國(guó)類腦芯片的研究尚處于理論階段,涉及的企業(yè)不多,應(yīng)充分發(fā)揮國(guó)內(nèi)高校以及科研院所力量進(jìn)行前沿布局。

國(guó)際龍頭企業(yè)還沒(méi)有形成明確的技術(shù)及知識(shí)產(chǎn)權(quán)壁壘,IBM研制的TrueNorth類人腦計(jì)算有突破性進(jìn)展,隨著存儲(chǔ)、邏輯、傳感技術(shù)的改進(jìn),將來(lái)類腦計(jì)算芯片有望取得更大的發(fā)展,在AI領(lǐng)域?qū)l(fā)揮更大的作用。

結(jié)束語(yǔ)

總之,人工智能的未來(lái)發(fā)展將會(huì)是一個(gè)充滿機(jī)遇和挑戰(zhàn)的過(guò)程,隨著技術(shù)的不斷發(fā)展和成熟,人工智能已經(jīng)開始滲透到我們?nèi)粘I畹母鱾€(gè)方面,人工智能不僅可以幫助改善人們的生活品質(zhì)、豐富人們的娛樂(lè)生活,也將會(huì)在工業(yè)自動(dòng)化、軍事裝備現(xiàn)代化、提高醫(yī)療診斷水平、提升教育能力,拓展學(xué)生的知識(shí)面等各個(gè)領(lǐng)域得到更加廣泛的應(yīng)用,從而幫助我們更好地解決問(wèn)題、提高效率、改善生活。

我們也需要保持警惕,推動(dòng)建立人工智能安全可控的治理體系,積極面對(duì)技術(shù)發(fā)展中出現(xiàn)的各種問(wèn)題和挑戰(zhàn)。

讓我們以開放的心態(tài)迎接新技術(shù)的出現(xiàn),寬容新技術(shù)存在的不足之處,在國(guó)家宏觀政策的大力支持下,發(fā)揮舉國(guó)體制的優(yōu)勢(shì),積極推動(dòng)人工智能與經(jīng)濟(jì)社會(huì)深度融合,在重大應(yīng)用場(chǎng)景中錘煉技術(shù)、升級(jí)迭代、培育市場(chǎng),從而使我國(guó)的人工智能技術(shù)能夠?yàn)槿祟惿鐣?huì)的進(jìn)步和發(fā)展做出更加積極的貢獻(xiàn)。

參考資料:

[1].ChatGPT翻開了硬幣的哪一面?北京郵電大學(xué)人工智能學(xué)院教授鄧偉洪、中國(guó)信通院云大所內(nèi)容科技部副主任石霖

[2].采訪報(bào)道ChatGPT“火出圈”我們?cè)摗凹毖邸眴幔恐袊?guó)經(jīng)濟(jì)網(wǎng)2023年2月20日

[3].OpenAI官網(wǎng)(ChatGPT:優(yōu)化對(duì)話的語(yǔ)言模型 (OpenAI.com))

[4].Interactive Learning from Policy-Dependent Human Feedback (MacGlashan et al. 2017)

[5].Deep Reinforcement Learning from Human Preferences (Christiano et al. 2017)

[6].ChatGPT: Optimizing Language Models for Dialogue (OpenAI 2022)

[7].Scaling Laws for Reward Model Overoptimization (Gao et al. 2022)

[8].Training a Helpful and Harmless Assistant with Reinforcement Learning from Human Feedback (Anthropic, 2022)

[9].Red Teaming Language Models to Reduce Harms: Methods, Scaling Behaviors, and Lessons Learned (Ganguli et al. 2022)

[10].Dynamic Planning in Open-Ended Dialogue using Reinforcement Learning (Cohen at al. 2022)

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。

評(píng)論

暫無(wú)評(píng)論哦,快來(lái)評(píng)價(jià)一下吧!

下載界面新聞

微信公眾號(hào)

微博

4萬(wàn)字告訴你ChatGPT到底是什么?(下)

人工智能系統(tǒng)開發(fā)是一個(gè)系統(tǒng)工程,需要協(xié)同各個(gè)方面的資源共同發(fā)力,才能在產(chǎn)業(yè)發(fā)展中占有制高點(diǎn)。

文 | 星船知造 錢鴻生

編輯 | 唐曉園

上周我們發(fā)布了報(bào)告上篇 《4萬(wàn)字告訴你ChatGPT到底是什么(上)》,今天的下篇我們將繼續(xù)節(jié)選報(bào)告第三章中的“我國(guó)人工智能發(fā)展中存在的主要問(wèn)題”、第四章《ChatGPT對(duì)資本市場(chǎng)影響的分析與研判》和第五章《我國(guó)未來(lái)人工智能發(fā)展的展望》中部分核心內(nèi)容和觀點(diǎn)。

OpenAI推出ChatGPT后不久,微軟宣布將ChatGPT與搜索引擎Bing整合,谷歌宣布推出Bard應(yīng)對(duì)挑戰(zhàn),接著Meta官網(wǎng)公布了一款新的人工智能大型語(yǔ)言模型LLaMA。

此時(shí),人們自然而然把目光轉(zhuǎn)向了中國(guó)相關(guān)企業(yè),他們何時(shí)宣布推出類似于ChatGPT人工智能發(fā)展的時(shí)間表。

人們特別關(guān)注的企業(yè)有百度、阿里巴巴以及人工智能企業(yè)科大訊飛等等一大批中國(guó)與人工智能有關(guān)聯(lián)企業(yè)的動(dòng)向。

3.4.3 我國(guó)人工智能發(fā)展中存在的主要問(wèn)題

我國(guó)發(fā)展人工智能面臨三方面技術(shù)難點(diǎn)如下:

第一,人工智能的AI算法

人工智能常見(jiàn)的算法技術(shù)的基礎(chǔ)性研究主要集中于國(guó)內(nèi)各大高校團(tuán)隊(duì),但在科研成果轉(zhuǎn)化領(lǐng)域一直發(fā)展比較緩慢,較難實(shí)現(xiàn)從理論和技術(shù)向生產(chǎn)力的轉(zhuǎn)化。

目前以華為、阿里、騰訊等公司主導(dǎo)的人工智能技術(shù)研發(fā)團(tuán)隊(duì)迅速崛起,將科研產(chǎn)品開發(fā)與算法技術(shù)結(jié)合,從產(chǎn)業(yè)領(lǐng)域?qū)崿F(xiàn)人工智能算法的技術(shù)成果轉(zhuǎn)化。

但是在算法的基礎(chǔ)理論研究層面,一直以來(lái)是我們發(fā)展人工智能技術(shù)的短板。沒(méi)有對(duì)大規(guī)模機(jī)器學(xué)習(xí)場(chǎng)景中強(qiáng)化學(xué)習(xí)算法模型、生成性預(yù)訓(xùn)練變換模型、分布式并行的研發(fā)投入,或者說(shuō)由于受到資金投入與人才缺乏的影響,研究成果與世界發(fā)達(dá)企業(yè)還有很大的差距。

美國(guó)現(xiàn)有的人工智能系統(tǒng)的關(guān)鍵技術(shù)都是不開源的,系統(tǒng)深度學(xué)習(xí)框架、數(shù)據(jù)庫(kù)和工具集,均限內(nèi)部使用,部分僅對(duì)系統(tǒng)的應(yīng)用接口持開源的態(tài)度,使我們無(wú)法在短時(shí)間內(nèi)掌握世界最先進(jìn)的人工智能系統(tǒng)的開發(fā)經(jīng)驗(yàn)。

從市場(chǎng)的角度來(lái)看,我國(guó)目前的人工智能系統(tǒng)都是一些比較初級(jí)的數(shù)據(jù)采集與分析應(yīng)用系統(tǒng),類似于ChatGPT高度智能化的AI產(chǎn)品的研發(fā)還處于摸索與初級(jí)階段,在性能和穩(wěn)定性方面改善空間潛力巨大。

早在20世紀(jì)80年代,我國(guó)學(xué)術(shù)界就提出了相當(dāng)完善的AI算法模型,中國(guó)多家高校有從事算法模型的研究,但大多都將算法模型應(yīng)用在人臉識(shí)別系統(tǒng),提高圖像識(shí)別精度方面。到目前為止算法模型在AI領(lǐng)域的價(jià)值還沒(méi)有被真正體現(xiàn),這可能受限于我們的芯片制造水平難以提供支撐深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練和預(yù)訓(xùn)練需要的算力。

科研領(lǐng)域需要更大投入,要針對(duì)目前的已有算法進(jìn)行深度優(yōu)化,或者另辟蹊徑,提出更為先進(jìn)的算法理論。要打造出符合世界產(chǎn)業(yè)發(fā)展最新技術(shù)水平,具有全球市場(chǎng)競(jìng)爭(zhēng)力的人工智能產(chǎn)品,看來(lái)有相當(dāng)長(zhǎng)的一段路要走。但也不排除彎道超車或換道超車奇跡的發(fā)生。

我國(guó)AI發(fā)展現(xiàn)狀任重而道遠(yuǎn)。

第二,人工智能AI模型軟件

國(guó)內(nèi)的人工智能模型軟件開發(fā)已經(jīng)起步,開始對(duì)標(biāo)世界先進(jìn)的人工智能模型,培育自己的發(fā)展環(huán)境。人工智能模型是人工智能生態(tài)中最重要的因素之一,我國(guó)需要促進(jìn)國(guó)產(chǎn)模型軟件的發(fā)展和推廣,擺脫國(guó)外的標(biāo)準(zhǔn)制約。ChatGPT就是基于“生成型預(yù)訓(xùn)練變換模型”開發(fā)出來(lái)的自然語(yǔ)言聊天機(jī)器人。

第三,人工智能開發(fā)環(huán)境

人工智能開發(fā)環(huán)境是指相關(guān)算法、數(shù)據(jù)庫(kù)、軟件開發(fā)工具、高性能的人工智能AI計(jì)算機(jī)芯片、云計(jì)算網(wǎng)絡(luò)的集合。國(guó)產(chǎn)AI模型開發(fā)需要和國(guó)產(chǎn)AI智能芯片及硬件進(jìn)行相互適配、性能優(yōu)化和應(yīng)用推廣,才能夠形成面向行業(yè)應(yīng)用的軟硬件一體化人工智能平臺(tái)。

國(guó)際人工智能巨頭掌控著人工智能開發(fā)環(huán)境的關(guān)鍵技術(shù),我們目前還較難在短時(shí)間內(nèi)在AI芯片、算法、模型軟件、云數(shù)據(jù)庫(kù)服務(wù)等人工智能開發(fā)環(huán)境上有十分大的突破。

人工智能系統(tǒng)開發(fā)是一個(gè)系統(tǒng)工程,需要協(xié)同各個(gè)方面的資源共同發(fā)力,才能在產(chǎn)業(yè)發(fā)展中占有制高點(diǎn)。

3.4.4 AI芯片,人工智能繞不過(guò)去的坎

人工智能AI芯片是技術(shù)發(fā)展的關(guān)鍵之一,它是提供人工智能算力的靈魂和大腦,承載了為各種終端提供強(qiáng)大算力的重要任務(wù)。人工智能AI 芯片的出現(xiàn),極大提高數(shù)據(jù)處理的能力,尤其在處理海量數(shù)據(jù)時(shí)明顯優(yōu)于傳統(tǒng)CPU。

從技術(shù)架構(gòu)來(lái)看,AI芯片一般可以分為GPU、FPGA、ASIC和類腦芯片四大類——

GPU(Graphics Processing Unit,圖形處理器)

GPU是利用處理圖形任務(wù)的圖形處理器來(lái)計(jì)算原本由中央處理器CPU的通用計(jì)算任務(wù)。

GPU的關(guān)鍵性能是矩形并行計(jì)算,主流的GPU具有強(qiáng)大的計(jì)算能力,無(wú)論性能還是內(nèi)存帶寬均遠(yuǎn)大于同代的CPU。CPU 由專為順序串行處理而優(yōu)化組成,而 GPU 則擁有一個(gè)由數(shù)以千計(jì)的更小、更高效的核心(專為同時(shí)處理多重任務(wù)而設(shè)計(jì))組成的大規(guī)模并行計(jì)算架構(gòu)。同時(shí)CPU相當(dāng)一部分時(shí)間在執(zhí)行外設(shè)的中斷、進(jìn)程的切換等任務(wù),而GPU有更多的時(shí)間用于并行計(jì)算。

英偉達(dá)是AI芯片GPU(圖形處理器單元)的主要生產(chǎn)廠商,無(wú)論是OpenAI的ChatGPT、還是微軟的搜索引擎Bing、谷歌的人工智能系統(tǒng)LaMDA,都離不開英偉達(dá)提供的底層芯片GPU的算力支持,英偉達(dá)系列的A100和H100系列占全球AI芯片市場(chǎng)的80%以上的份額。

除了英偉達(dá),還有AMD,ARM家的Mali,Imagination的PowerVR,Qualcomm的Adreno等。

基于FPGA現(xiàn)場(chǎng)可編程門陣列

FPGA(Field Programmable Gate Array)現(xiàn)場(chǎng)可編程門陣列,或稱半定制化芯片。它是在PAL、GAL、CPLD等可編程器件的基礎(chǔ)上進(jìn)一步發(fā)展的產(chǎn)物,可以根據(jù)算法需求,動(dòng)態(tài)重構(gòu)計(jì)算架構(gòu)。它是作為專用集成電路(ASIC)領(lǐng)域中的一種半定制電路而出現(xiàn)的,既解決了定制電路的不足,又克服了原有可編程器件門電路數(shù)有限的缺點(diǎn)。

全球知名的FPGA生產(chǎn)廠商有:Altera,Xilinx,Actel,Lattice,Atmel,我國(guó)廠商代表有深鑒科技DPU、百度XPU等。

ASIC(Application Specific Integrated Circuit)

ASIC專用集成電路是針對(duì)特定用戶要求定制設(shè)計(jì)、制造的專門的應(yīng)用程序芯片。ASIC芯片廣泛應(yīng)用于人工智能設(shè)備、虛擬貨幣挖礦設(shè)備、耗材打印設(shè)備、軍事國(guó)防設(shè)備等智慧終端。

ASIC芯片還可以細(xì)分為全定制ASIC芯片、半定制ASIC芯片及可編程ASIC芯片。ASIC芯片擁有面積小、集成度高等優(yōu)勢(shì),被廣泛應(yīng)用于人工智能終端和網(wǎng)絡(luò)系統(tǒng)中。

類腦計(jì)算芯片(Brain-Inspired Chip)

類腦計(jì)算芯片是人工智能AI的一個(gè)重要組成部分,類腦芯片可模擬人類大腦信息處理方式,能以極低的功耗對(duì)信息進(jìn)行并行和分布式處理,類腦計(jì)算芯片就是把微電子技術(shù)和新型神經(jīng)形態(tài)器件結(jié)合,突破傳統(tǒng)計(jì)算架構(gòu),實(shí)現(xiàn)存儲(chǔ)與計(jì)算的深度融合,大幅提升計(jì)算性能、提高集成度、降低能耗。對(duì)于現(xiàn)有的計(jì)算體系與系統(tǒng)做出變革,并實(shí)現(xiàn)在計(jì)算能耗、計(jì)算能力與計(jì)算效率等方面的大幅改進(jìn)。

IBM已經(jīng)開始進(jìn)行類腦智能算法與技術(shù)的探索,并已成功研制出TrueNorth芯片。

中國(guó)目前有清華大學(xué)的天機(jī)芯,浙江大學(xué)的Darwin2 (55nm)等一批研制類腦計(jì)算芯片機(jī)構(gòu)和企業(yè)。

ChatGPT對(duì)資本市場(chǎng)影響的研判

4.2 ChatGPT背后的技術(shù)壁壘和文化控制權(quán)

ChatGPT是一種自然語(yǔ)言處理技術(shù),一旦ChatGPT能從目前的實(shí)驗(yàn)階段走向應(yīng)用成熟階段,將這標(biāo)志著在人類活動(dòng)中,人工智能將開始扮演重要角色并占據(jù)優(yōu)勢(shì)地位。

我們知道,在自然語(yǔ)言處理大模型技術(shù)上,由于受到各種因素的影響,我國(guó)的人工智能相比國(guó)外發(fā)展有一定的差距。

但在局部技術(shù)領(lǐng)域,我們還是具有很大優(yōu)勢(shì)的,比如在優(yōu)化大模型中的數(shù)據(jù)庫(kù),在某些特定領(lǐng)域進(jìn)行模型優(yōu)化和云數(shù)據(jù)庫(kù)建設(shè),以及在一些與自然語(yǔ)言處理關(guān)系密切的學(xué)科。在國(guó)家宏觀政策的指導(dǎo)下,發(fā)揮社會(huì)市場(chǎng)經(jīng)濟(jì)體制的優(yōu)勢(shì),能集中力量辦大事的原則,完全可以進(jìn)行基于大模型處理方法模型的應(yīng)用性研究,以適應(yīng)人工智能發(fā)展對(duì)拉動(dòng)國(guó)家經(jīng)濟(jì)上行,滿足人們追求豐富多彩生活?yuàn)蕵?lè)的需求。

4.3 ChatGPT可能引發(fā)的機(jī)遇與風(fēng)險(xiǎn)

我們對(duì)ChatGPT要時(shí)刻保持清醒的認(rèn)知,每一次技術(shù)迭代,都將改變?nèi)祟惿畹膬?nèi)涵和方式。ChatGPT是否屬于一次新的技術(shù)迭代這個(gè)問(wèn)題還有進(jìn)一步觀察,可是以ChatGPT為代表的人工智能技術(shù)的發(fā)展和自然語(yǔ)言處理技術(shù)的突破,一定會(huì)對(duì)現(xiàn)有產(chǎn)業(yè)發(fā)展格局帶來(lái)前所未有的重要影響。

從正面影響來(lái)看,ChatGPT可以幫助人們快速獲取信息和提高工作效率,擴(kuò)展知識(shí)面,提供發(fā)展AI 產(chǎn)業(yè)新的思路和方法。 另一方面,某些低端和重復(fù)的工作可能被ChatGPT和 AI代替,導(dǎo)致勞動(dòng)力市場(chǎng)的階段性動(dòng)蕩和變化。

如果人們過(guò)度依賴AI,可能會(huì)降低人們一部分的操作技能水平和創(chuàng)新精神。某些行業(yè)可能會(huì)發(fā)生重組甚至消失,有可能在變化過(guò)程中引發(fā)社會(huì)矛盾等。

顛覆性創(chuàng)新理論的提出者克里斯滕森在《創(chuàng)新者的窘境》這本書中,將創(chuàng)新分為了延續(xù)性創(chuàng)新和破壞性創(chuàng)新兩種:破壞性創(chuàng)新難以評(píng)估市場(chǎng)規(guī)模增長(zhǎng)的需求和未來(lái)的發(fā)展路徑;延續(xù)性創(chuàng)新則會(huì)將資源推向更容易帶來(lái)增長(zhǎng)的方向。

總體而言,以ChatGPT為代表的人工智能的發(fā)展, 可能對(duì)人類的未來(lái)產(chǎn)生重要影響,需要積極開展相關(guān)的研究和管理,以確保國(guó)家經(jīng)濟(jì)技術(shù)發(fā)展不受制于人,保持社會(huì)的穩(wěn)定發(fā)展和保護(hù)大多數(shù)人的共同利益。  

人工智能解決方案可以為企業(yè)和公民提供巨大的機(jī)會(huì),但也可能帶來(lái)風(fēng)險(xiǎn),這就需要一個(gè)堅(jiān)實(shí)的監(jiān)管框架來(lái)確保人工智能技術(shù)的健康發(fā)展。

4.4 ChatGPT的隱患與潛在危機(jī)

盡管目前的ChatGPT還是一個(gè)驗(yàn)證的版本,強(qiáng)大的文本處理與聊天能力十分強(qiáng)大,但ChatGPT在短短的幾個(gè)月試運(yùn)行中也暴露出了很多缺陷,甚至可能會(huì)引發(fā)危機(jī)。這些問(wèn)題正隨著以ChatGPT為代表的生成型AI系統(tǒng)的推進(jìn)逐漸浮出水面。人們也會(huì)更關(guān)注這些問(wèn)題,并迅速采取防范措施。ChatGPT存在的缺陷與風(fēng)險(xiǎn)主要體現(xiàn)在以下幾個(gè)方面:

4.1.1 ChatGPT在道德和法律方面的違規(guī)行為

人們?cè)谑褂弥邪l(fā)現(xiàn),ChatGPT對(duì)信息、數(shù)據(jù)來(lái)源無(wú)法進(jìn)行核實(shí)、核查和驗(yàn)證,可能存在個(gè)人數(shù)據(jù)與商業(yè)秘密被泄露,引起竊取他人信息的道德問(wèn)題和提供虛假信息兩大隱患。

ChatGPT從網(wǎng)絡(luò)中獲取大量信息,依托海量數(shù)據(jù)庫(kù)分析運(yùn)行,其中包括大量的互聯(lián)網(wǎng)用戶自行輸入的信息,比如新聞工作者編寫的稿子,ChatGPT目前無(wú)法追溯到文字的來(lái)源,因此當(dāng)用戶輸入提問(wèn)時(shí),ChatGPT可能產(chǎn)生泄露個(gè)人數(shù)據(jù)或商業(yè)秘密等的風(fēng)險(xiǎn)。

ChatGPT涉及的法律風(fēng)險(xiǎn)不限于以下幾種:

著作權(quán):生成的內(nèi)容可能會(huì)侵犯他人的著作權(quán)。

隱私權(quán):使用ChatGPT 可能需要提供一些個(gè)人信息,因此存在泄露個(gè)人隱私的風(fēng)險(xiǎn)。

信息誤導(dǎo):生成的內(nèi)容可能不準(zhǔn)確或有誤導(dǎo)性和歧視性。

侵權(quán)違規(guī):ChatGPT生成的內(nèi)容可能侵犯他人的合法權(quán)益,如商標(biāo)權(quán)、出版權(quán)、著作權(quán)、專利權(quán)等。

商標(biāo)侵權(quán):ChatGPT 生成的圖像和視頻內(nèi)容可能涉及商標(biāo)侵權(quán)。

人身攻擊:ChatGPT 生成的內(nèi)容可能涉及對(duì)宗教和人身攻擊,違反社會(huì)倫理道德。

侮辱誹謗:使用 ChatGPT 生成的內(nèi)容可能侮辱他人,可能涉及誹謗等法律問(wèn)題。

最近,OpenAI表示,正考慮在ChatGPT中添加模型水印,即監(jiān)測(cè)模型可以識(shí)別的特殊標(biāo)記,以降低信息濫用的問(wèn)題。

4.1.2 ChatGPT提供虛假信息

ChatGPT常常出現(xiàn)“一本正經(jīng)的胡說(shuō)八道’”,這是ChatGPT目前被人詬病的一個(gè)主要缺點(diǎn)。對(duì)于有些虛假信息,需要具備一定專業(yè)知識(shí)的人才能辨別真?zhèn)?,這就為不法分子惡意“訓(xùn)練”或“誤導(dǎo)”人工智能,使其提供詐騙信息、釣魚網(wǎng)站等內(nèi)容,損害公民人身和財(cái)產(chǎn)安全創(chuàng)造了有利條件。

4.1.3. ChatGPT信息監(jiān)管迫在眉睫

ChatGPT在建立語(yǔ)料庫(kù)、生成文本時(shí),大量使用并非公開的開源代碼,或未辦理許可證申請(qǐng),可能會(huì)導(dǎo)致侵權(quán)。對(duì)于一些受著作權(quán)或版權(quán)保護(hù)的文本、視頻、軟件代碼等,如果沒(méi)有經(jīng)過(guò)權(quán)利人的授權(quán),直接復(fù)制到自己的數(shù)據(jù)庫(kù)中,在此基礎(chǔ)上修改、拼湊,極有可能侵害他人的著作權(quán),因此對(duì)ChatGPT必須要考慮建立相關(guān)的監(jiān)管機(jī)制,防止產(chǎn)生不良的社會(huì)影響。

4.1.4. ChatGPT提供侵權(quán)信息

一位美國(guó)眾議院科學(xué)委員議員表示:“我對(duì)人工智能以及人工智能推動(dòng)的社會(huì)進(jìn)步感到興奮,但也為其不受限制和不受監(jiān)管感到擔(dān)憂。”

紐約大學(xué)認(rèn)知科學(xué)名譽(yù)教授Gary Marcus對(duì)以深度學(xué)習(xí)為中心的 AI 持懷疑態(tài)度,他認(rèn)為:“生成式 AI 對(duì)社會(huì)結(jié)構(gòu)構(gòu)成了真實(shí)而迫在眉睫的威脅”。

各國(guó)監(jiān)管機(jī)構(gòu)要有切實(shí)可行的風(fēng)險(xiǎn)評(píng)估框架,并任命一個(gè)負(fù)責(zé)任的機(jī)構(gòu)。此外,人工智能倫理框架的建立將為所有部門創(chuàng)造一個(gè)良好的創(chuàng)新環(huán)境。

一位資深的網(wǎng)絡(luò)安全公司管理者認(rèn)為:她的團(tuán)隊(duì)能夠讓 ChatGPT 編寫網(wǎng)絡(luò)攻擊的程序,ChatGPT從編寫網(wǎng)絡(luò)釣魚電子郵件到編寫惡意代碼,再到規(guī)避常見(jiàn)的網(wǎng)絡(luò)安全檢查,實(shí)施對(duì)其他系統(tǒng)的攻擊,ChatGPT幾乎可以成為讓沒(méi)有軟件編碼技能的人成為網(wǎng)絡(luò)罪犯。  

無(wú)數(shù)的教育工作者譴責(zé)有人使用 ChatGPT考試作弊,美國(guó)的多所學(xué)校已經(jīng)禁止學(xué)生用 ChatGPT聊天機(jī)器人答題,拒絕采用ChatGPT編寫的論文和答卷。

由于ChatGPT是一種人工智能工具,只要輸入提問(wèn),點(diǎn)擊鼠標(biāo),就可以完成任何的主題文章、詩(shī)歌和電子郵件。特別是學(xué)生用ChatGPT完成試題應(yīng)答和論文撰寫。在國(guó)外教育界引起了軒然大波。

為此OpenAI迫于社會(huì)壓力,趕緊開發(fā)出了防作弊應(yīng)用軟件,可以審查哪些試卷和論文是由ChatGPT提供的,以此防止學(xué)生作弊。

但是,這種新的檢測(cè)工具并沒(méi)有消除教師們的恐懼,反而讓科技界和教育界有些失望。據(jù)測(cè)試,該系統(tǒng)大約只有20%的準(zhǔn)確性,不能完全檢出作弊的試卷答題。

2023年1月初,美國(guó)普林斯頓大學(xué)的學(xué)生愛(ài)德華·田(Edward Tian)開發(fā)了GPTZero工具,該工具的標(biāo)語(yǔ)是“人類應(yīng)該知道真相”,該工具可以更準(zhǔn)確鑒別由ChatGPT提供的文檔,相信不久國(guó)內(nèi)也會(huì)催生出這類的應(yīng)用軟件和工具。

人工智能領(lǐng)域的競(jìng)爭(zhēng)焦點(diǎn)與差距

在以ChatGPT為代表的生成類AI大模型中,對(duì)于AI芯片的要求更高,包括要求更高速的內(nèi)存帶寬、更大的內(nèi)存容量以及更加高效的數(shù)據(jù)通信帶寬。

以O(shè)penAI的ChatGPT-3.5模型訓(xùn)練為例,微軟公司專門為Open AI 開發(fā)了一款定制的超級(jí)計(jì)算機(jī),使用了上萬(wàn)顆英偉達(dá)A100的AI芯片。

在國(guó)產(chǎn)AI芯片自主研發(fā)領(lǐng)域,國(guó)內(nèi)多家廠商奮起直追,成果喜人,為我國(guó)的人工智能發(fā)展奠定了堅(jiān)實(shí)基礎(chǔ),令世界刮目相看。

OpenAI公司發(fā)展人工智能,在微軟投資100億美元拿到49%的股權(quán)之前,OpenAI在成立的七年多的時(shí)間里,總共收到了大約40億美元的風(fēng)險(xiǎn)投資,就是在這樣巨額投資的情況下,根據(jù)OpenAI公司2022年財(cái)報(bào)顯示虧損仍高達(dá)5.45億美元(折合人民幣虧損額達(dá)到將近40億人民幣)。

微軟在入股OpenAI 后,為OpenAI部署了一個(gè)超級(jí)計(jì)算機(jī),按照算力來(lái)說(shuō),該超級(jí)計(jì)算機(jī)可以進(jìn)入全球超計(jì)算機(jī)的前五名。

2023年1月,微軟還承諾將繼續(xù)為OpenAI提供更多的超算中心的部署,讓它能夠更加高效完成下一代ChatGPT模型的訓(xùn)練。

根據(jù)OpenAI測(cè)算,目前訓(xùn)練一次ChatGPT模型的算力成本在450萬(wàn)美元左右,這里還只是計(jì)算硬件投入的成本,還不包括人工成本、網(wǎng)絡(luò)寬帶成本、數(shù)據(jù)儲(chǔ)存、固定資產(chǎn)折舊等的綜合成本。

實(shí)際上訓(xùn)練一次ChatGPT模型,有時(shí)候人力成本和運(yùn)維成本支出要占據(jù)總成本很大一部分,因此Open AI雇傭了第三世界國(guó)家的低成本外來(lái)外包員工來(lái)完成指定的優(yōu)化任務(wù),從而降低人工成本。

目前ChatGPT-3參數(shù)量在1750億參數(shù)左右。而以O(shè)penAI發(fā)布最新的ChatGPT-3.5B模型為例,數(shù)量將達(dá)到1.7萬(wàn)億。預(yù)測(cè)成本就更夸張了,訓(xùn)練時(shí)間也將從之前的幾周變?yōu)閿?shù)月甚至幾個(gè)月的周期。

目前OpenAI公司有1000多名正式員工,人力成本也是非常龐大的一筆支出。因此AI產(chǎn)業(yè)研發(fā)成本支出是非常燒錢的行業(yè),對(duì)于一般發(fā)展中國(guó)家來(lái)說(shuō)這是一筆巨資。同樣我們國(guó)家人工智能系統(tǒng)還處在研發(fā)階段,資本投入也是當(dāng)下面臨的一個(gè)重要課題。

隨著大模型訓(xùn)練體量的不斷增加,未來(lái)算力資源、人才資源、數(shù)據(jù)資源三者的投入不可小覷。

 ChatGPT引爆全球互聯(lián)網(wǎng)入口爭(zhēng)奪戰(zhàn)

從ChatGPT功能來(lái)看,還處在聯(lián)網(wǎng)驗(yàn)證階段,就是在基本的功能方面還存在很多問(wèn)題和不確定性,在有些功能上更是漏洞百出,在軟件編程方面還遠(yuǎn)遠(yuǎn)沒(méi)有達(dá)到顛覆軟件編程產(chǎn)業(yè)的程度。

但是全網(wǎng)熱潮背后一定有深層次的原因:經(jīng)過(guò)深度分析不難看出,其實(shí)ChatGPT引爆的不完全是AI里程碑式的技術(shù)革命,而是引爆一場(chǎng)全球互聯(lián)網(wǎng)入口的爭(zhēng)奪戰(zhàn)。

全球互聯(lián)網(wǎng)入口長(zhǎng)期被谷歌占據(jù),谷歌的搜索引擎業(yè)務(wù)占到全球市場(chǎng)份額的97%,谷歌內(nèi)部有一個(gè)商業(yè)警戒系統(tǒng),只要公司業(yè)務(wù)受到威脅就會(huì)觸發(fā),其中最高級(jí)別是紅色告警。

谷歌(Google)公司1998年9月創(chuàng)立,自從公司成立以來(lái),這個(gè)紅色警戒系統(tǒng)就從來(lái)沒(méi)有觸發(fā)過(guò)。然而2023年2月,谷歌瀏覽器的下載量從全球第一降到了第二,谷歌傳統(tǒng)的搜索引擎業(yè)務(wù)首次被微軟反超,系統(tǒng)自動(dòng)觸發(fā)了紅色警戒系統(tǒng)。

微軟公司從誕生以來(lái),從未在任何產(chǎn)品上投資超過(guò)100億,這次對(duì)Open AI 投資超過(guò)100個(gè)億,目的就是要把ChatGPT整合到微軟公司的所有產(chǎn)品中去。

微軟近期已經(jīng)宣布將ChatGPT整合入微軟的搜索引擎Bing,沒(méi)過(guò)幾天,又宣布會(huì)將ChatGPT整合進(jìn)Office辦公套件中去。用戶使用Office時(shí)就能體驗(yàn)ChatGPT的對(duì)話功能。很明顯微軟就是要利用ChatGPT先入為主的優(yōu)勢(shì),爭(zhēng)奪谷歌搜索引擎的市場(chǎng)份額,目前第一階段目標(biāo)已經(jīng)圓滿達(dá)到。

微軟一直都在厲兵秣馬,以前一直被谷歌、蘋果、亞馬遜壓得喘不動(dòng)氣,現(xiàn)在終于開始了在全球互聯(lián)網(wǎng)入口的爭(zhēng)奪戰(zhàn)中的絕地反擊戰(zhàn)。

同樣的情況,在我國(guó)的互聯(lián)網(wǎng)企業(yè)中也有發(fā)生。在ChatGPT成功的示范效應(yīng)帶動(dòng)下,以及國(guó)家支持?jǐn)?shù)字經(jīng)濟(jì)發(fā)展兩個(gè)強(qiáng)力點(diǎn)的支撐下,相信不遠(yuǎn)的將來(lái),中國(guó)的AI 產(chǎn)品將像雨后春筍一樣拔地而起。

淺談未來(lái)我國(guó)人工智能發(fā)展趨勢(shì)

隨著科學(xué)技術(shù)的飛速發(fā)展,國(guó)家已經(jīng)把人工智能作為戰(zhàn)略性新興產(chǎn)業(yè),作為新增長(zhǎng)引擎加以扶持和培養(yǎng),人工智能的未來(lái)發(fā)展將會(huì)帶來(lái)更多的驚喜和機(jī)遇,下面就讓我們淺談一下我國(guó)人工智能發(fā)展趨勢(shì)。

在國(guó)家宏觀政策的大力支持下,我國(guó)的人工智能將迎來(lái)重大的發(fā)展機(jī)遇期,國(guó)內(nèi)的人工智能企業(yè),互聯(lián)網(wǎng)企業(yè),科研機(jī)構(gòu)應(yīng)當(dāng)抓住這個(gè)難得的機(jī)遇,為國(guó)家的數(shù)字經(jīng)濟(jì)轉(zhuǎn)型發(fā)展作出應(yīng)有的貢獻(xiàn)。

特別是華為、阿里巴巴,騰訊、百度、科大訊飛、字節(jié)跳動(dòng)等等大型企業(yè)和科研單位,應(yīng)該發(fā)揮各自優(yōu)勢(shì)強(qiáng)強(qiáng)聯(lián)手,他們有義務(wù)、有責(zé)任,承擔(dān)起這個(gè)時(shí)代賦予的歷史使命。

強(qiáng)化企業(yè)在研發(fā)投入中的主體地位,繼續(xù)加大企業(yè)研發(fā)費(fèi)用,建立起金融支持企業(yè)在AI領(lǐng)域的創(chuàng)新工作機(jī)制,打通科技、產(chǎn)業(yè)、金融的全產(chǎn)業(yè)鏈條。

人工智能產(chǎn)業(yè)屬于新型的高科領(lǐng)域,目前世界上尚未形成占絕對(duì)主導(dǎo)的技術(shù)路徑依賴。

在世界產(chǎn)業(yè)生態(tài)也沒(méi)有形成絕對(duì)壁壘的人工智能開創(chuàng)初期,我們要結(jié)合國(guó)情把軟硬件協(xié)同發(fā)展,作為提升人工智能發(fā)展的主要手段,單純的數(shù)據(jù)與算法優(yōu)化已不能滿足我國(guó)人工智能產(chǎn)業(yè)發(fā)展需求。

面對(duì)這一發(fā)展契機(jī),我國(guó)應(yīng)強(qiáng)化人工智能產(chǎn)業(yè)發(fā)展的頂層設(shè)計(jì),加強(qiáng)人工智能軟硬件協(xié)同布局。重點(diǎn)布局具有我國(guó)自主知識(shí)產(chǎn)權(quán)的“框架軟件+AI芯片”架構(gòu),構(gòu)建起有利于我國(guó)人工智能發(fā)展的生態(tài)環(huán)境,力爭(zhēng)在人工智能領(lǐng)域取得主導(dǎo)優(yōu)勢(shì)。

類腦芯片研發(fā)屬于AI芯片的前瞻性領(lǐng)域,我國(guó)類腦芯片的研究尚處于理論階段,涉及的企業(yè)不多,應(yīng)充分發(fā)揮國(guó)內(nèi)高校以及科研院所力量進(jìn)行前沿布局。

國(guó)際龍頭企業(yè)還沒(méi)有形成明確的技術(shù)及知識(shí)產(chǎn)權(quán)壁壘,IBM研制的TrueNorth類人腦計(jì)算有突破性進(jìn)展,隨著存儲(chǔ)、邏輯、傳感技術(shù)的改進(jìn),將來(lái)類腦計(jì)算芯片有望取得更大的發(fā)展,在AI領(lǐng)域?qū)l(fā)揮更大的作用。

結(jié)束語(yǔ)

總之,人工智能的未來(lái)發(fā)展將會(huì)是一個(gè)充滿機(jī)遇和挑戰(zhàn)的過(guò)程,隨著技術(shù)的不斷發(fā)展和成熟,人工智能已經(jīng)開始滲透到我們?nèi)粘I畹母鱾€(gè)方面,人工智能不僅可以幫助改善人們的生活品質(zhì)、豐富人們的娛樂(lè)生活,也將會(huì)在工業(yè)自動(dòng)化、軍事裝備現(xiàn)代化、提高醫(yī)療診斷水平、提升教育能力,拓展學(xué)生的知識(shí)面等各個(gè)領(lǐng)域得到更加廣泛的應(yīng)用,從而幫助我們更好地解決問(wèn)題、提高效率、改善生活。

我們也需要保持警惕,推動(dòng)建立人工智能安全可控的治理體系,積極面對(duì)技術(shù)發(fā)展中出現(xiàn)的各種問(wèn)題和挑戰(zhàn)。

讓我們以開放的心態(tài)迎接新技術(shù)的出現(xiàn),寬容新技術(shù)存在的不足之處,在國(guó)家宏觀政策的大力支持下,發(fā)揮舉國(guó)體制的優(yōu)勢(shì),積極推動(dòng)人工智能與經(jīng)濟(jì)社會(huì)深度融合,在重大應(yīng)用場(chǎng)景中錘煉技術(shù)、升級(jí)迭代、培育市場(chǎng),從而使我國(guó)的人工智能技術(shù)能夠?yàn)槿祟惿鐣?huì)的進(jìn)步和發(fā)展做出更加積極的貢獻(xiàn)。

參考資料:

[1].ChatGPT翻開了硬幣的哪一面?北京郵電大學(xué)人工智能學(xué)院教授鄧偉洪、中國(guó)信通院云大所內(nèi)容科技部副主任石霖

[2].采訪報(bào)道ChatGPT“火出圈”我們?cè)摗凹毖邸眴??中?guó)經(jīng)濟(jì)網(wǎng)2023年2月20日

[3].OpenAI官網(wǎng)(ChatGPT:優(yōu)化對(duì)話的語(yǔ)言模型 (OpenAI.com))

[4].Interactive Learning from Policy-Dependent Human Feedback (MacGlashan et al. 2017)

[5].Deep Reinforcement Learning from Human Preferences (Christiano et al. 2017)

[6].ChatGPT: Optimizing Language Models for Dialogue (OpenAI 2022)

[7].Scaling Laws for Reward Model Overoptimization (Gao et al. 2022)

[8].Training a Helpful and Harmless Assistant with Reinforcement Learning from Human Feedback (Anthropic, 2022)

[9].Red Teaming Language Models to Reduce Harms: Methods, Scaling Behaviors, and Lessons Learned (Ganguli et al. 2022)

[10].Dynamic Planning in Open-Ended Dialogue using Reinforcement Learning (Cohen at al. 2022)

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。