編輯|適道
本期內(nèi)容摘要:
1. 人人都有私人助理Agent
2. Agent將如何影響四大領(lǐng)域?
3. Agent對(duì)科技行業(yè)帶來(lái)何種沖擊波?
4. 距離實(shí)現(xiàn)還有哪些技術(shù)挑戰(zhàn)?
5. 隱私和其他重大問(wèn)題
上周,比爾·蓋茨在他的官方博客上發(fā)布長(zhǎng)文,表示五年內(nèi)每個(gè)人都將擁有AI私人助理Agent——無(wú)論你是否在辦公室工作,并稱“它們將徹底改變我們的生活方式”。
比爾·蓋茨提到的AI私人助理,能響應(yīng)自然語(yǔ)言,根據(jù)其對(duì)用戶的深度了解完成各種任務(wù),被稱為“代理”(Agent)。
和Inflection AI推出的聊天機(jī)器人Pi不同,Agent可以在不同應(yīng)用程序中執(zhí)行不同任務(wù),它們會(huì)不斷了解用戶,從而不斷改進(jìn)。
如果你想計(jì)劃一次旅行,現(xiàn)有的聊天機(jī)器人只能找出符合預(yù)算的酒店,但Agent不僅了解你的旅行時(shí)間,還能推測(cè)出你的喜好,并做出深度個(gè)性化方案,像一家專業(yè)的旅行社。
如果你想和大學(xué)室友見面,你不需要檢查自己的Schedule,也不用和其他幾位室友反復(fù)約時(shí)間,因?yàn)槟愕腁gent會(huì)和你大學(xué)室友們的Agents一起商量。
如果你想做一個(gè)APP,你不需要寫代碼,學(xué)設(shè)計(jì)。只需要告訴Agent你想要什么,它就能編寫代碼,進(jìn)行UI設(shè)計(jì),并將APP發(fā)布到在線商店。
“誰(shuí)能贏得個(gè)人助理Agent,那才是大事。因?yàn)槟銓⒂肋h(yuǎn)不會(huì)再去搜索網(wǎng)站,永遠(yuǎn)不會(huì)再去生產(chǎn)力網(wǎng)站,你永遠(yuǎn)不會(huì)再去亞馬遜?!?/p>
實(shí)際上,比爾·蓋茨在博文中提到,他已經(jīng)“思考Agent近30年了,并在1995年的《未來(lái)之路》一書中寫到過(guò)它們,但由于AI的進(jìn)步,它們直到最近才變得實(shí)際可行”。
以下是全文翻譯:
AI即將徹底改變你使用電腦的方式
時(shí)至今日,我仍然像當(dāng)初和保羅·艾倫剛創(chuàng)立微軟時(shí)那樣熱愛軟件。盡管幾十年來(lái)軟件已經(jīng)取得了很大改進(jìn),但在許多方面它仍然相當(dāng)愚蠢。
無(wú)論在電腦上完成何種任務(wù),你都必須告訴設(shè)備,它應(yīng)該使用哪個(gè)應(yīng)用程序。雖然你可以用Microsoft Word和Google Docs起草商業(yè)提案,但它們不能幫你發(fā)送電子郵件、分享自拍、分析數(shù)據(jù)、安排聚會(huì)或購(gòu)買電影票。
即便是最好的網(wǎng)站也不能完全了解你的工作、個(gè)人生活、興趣和人際關(guān)系,而且軟件的能力有限,無(wú)法像親密朋友或私人助理那樣為你做事。
在未來(lái)的五年內(nèi),這種情況將徹底改變。你不必再為不同的任務(wù)而使用不同的應(yīng)用程序。你只需用日常語(yǔ)言告訴你的設(shè)備你想要做什么。根據(jù)你選擇與軟件分享多少信息,基于對(duì)你生活的豐富了解,軟件能夠做出個(gè)性化的回應(yīng)。在不久的將來(lái),任何上網(wǎng)的人都能擁有一個(gè)遠(yuǎn)超今天技術(shù)水平的人工智能助手(Personal Assistant Powered by Artificial Intelligence)。
這種類型的軟件,能回應(yīng)自然語(yǔ)言并根據(jù)對(duì)用戶的了解完成許多不同的任務(wù),被稱為Agent(代理)。我對(duì)Agent進(jìn)行了近30年的思考,并在我1995年的書The Road Ahead(《通往未來(lái)之路》)中提及,但由于人工智能的進(jìn)步,Agent直到最近才變得實(shí)用起來(lái)。
Agent不僅會(huì)改變每個(gè)人與計(jì)算機(jī)的交互方式,還將顛覆軟件行業(yè),引領(lǐng)我們從鍵入命令到點(diǎn)擊圖標(biāo)以來(lái)計(jì)算機(jī)領(lǐng)域最大的革命。
01 人人都有私人助理Agent
一些批評(píng)者指出,軟件公司以前也做過(guò)這種東西,但用戶并不怎么接受它們。(大家仍拿 Clippy 開玩笑,Clippy 是我們?cè)?Microsoft Office 中提供的數(shù)字助理,后來(lái)被棄置一邊。)
那么,為什么人們會(huì)使用Agent?
答案是,Agent會(huì)變得更好。你能和它們進(jìn)行細(xì)致入微的對(duì)話。它們更加個(gè)性化,不局限于寫一封信這樣的簡(jiǎn)單任務(wù)。Clippy與Agent的關(guān)系就像旋轉(zhuǎn)號(hào)盤電話和移動(dòng)設(shè)備的關(guān)系一樣。
如果你愿意,Agent能幫助你做任何事。例如只要你授權(quán)同意,它會(huì)深入了解你參與的活動(dòng)、交往的人物、所在地點(diǎn)。它會(huì)了解你的私人關(guān)系、工作關(guān)系、愛好偏好和日程安排。你可以選擇Agent在何時(shí),以何種方式幫助你做某事或讓你做決定。
“Clippy是一個(gè)機(jī)器人,而不是Agent?!?/p>
我們現(xiàn)在用的人工智能工具大部分都只是機(jī)器人而已。它們僅限于一個(gè)應(yīng)用程序,并且通常只在你寫入特定單詞或請(qǐng)求幫助時(shí)才會(huì)介入。這是因?yàn)樗鼈儾挥浀媚愕氖褂昧?xí)慣,也就不會(huì)變得更好,不會(huì)學(xué)習(xí)你的任何偏好。Clippy是一個(gè)機(jī)器人,而不是Agent。
Agent更加智能。它們是主動(dòng)的,能夠在你提出請(qǐng)求之前就提供建議;能夠跨應(yīng)用程序執(zhí)行任務(wù);能夠隨著時(shí)間推移而改進(jìn)。這是因?yàn)锳gent記住了你的活動(dòng),能夠識(shí)別你的行為意圖和模式?;谶@些信息,Agent會(huì)提供它們認(rèn)為你需要的東西,盡管最終決策始終由你來(lái)做。
想象一下,如果你想計(jì)劃一次旅行。一個(gè)聊天機(jī)器人只能找到符合你預(yù)算的酒店,而一個(gè)Agent不僅知道你旅行的時(shí)間,還會(huì)基于對(duì)你需求的了解,例如你更想去新目的地或喜歡故地重游,給出建議的旅游地點(diǎn)。當(dāng)被詢問(wèn)時(shí),Agent也會(huì)根據(jù)你的興趣和冒險(xiǎn)傾向?yàn)槟阃扑]可以做的事情,預(yù)訂你喜歡的餐廳。而如果現(xiàn)在你想要這種深度個(gè)性化的旅游規(guī)劃,你不僅要付費(fèi)給旅行社,并花時(shí)間告訴旅行社你的需求。
02 Agent將如何影響四大領(lǐng)域?
Agent最激動(dòng)人心的地方是它會(huì)讓如今過(guò)于昂貴的服務(wù)變得平民化,例如醫(yī)療健康、教育、生產(chǎn)力、娛樂(lè)與購(gòu)物等四個(gè)領(lǐng)域。
醫(yī)療健康
如今,人工智能在醫(yī)療保健領(lǐng)域主要是處理一些行政任務(wù)。例如,Abridge、Nuance DAX和Nabla Copilot可以在醫(yī)生就診期間幫助記錄音頻,并撰寫筆記供醫(yī)生審閱。
真正的轉(zhuǎn)變將在Agent能夠幫助患者進(jìn)行基本分診、就處理健康問(wèn)題提供建議,并決定是否需要求診時(shí)出現(xiàn)。
這些臨床醫(yī)生Agent還會(huì)幫助醫(yī)護(hù)人員做出決策,提高工作效率。(例如,像Glass Health這樣的應(yīng)用程序可以分析患者摘要并為醫(yī)生提出診斷建議。)貧困國(guó)家人民將尤其受益,因?yàn)槟抢锏脑S多人根本沒(méi)有機(jī)會(huì)看醫(yī)生。
畢竟醫(yī)療事關(guān)生死,臨床醫(yī)生Agent的推廣速度會(huì)比較慢。人們也需要看到醫(yī)療Agent總體是好的,盡管它們不完美無(wú)缺,也會(huì)犯錯(cuò)誤。當(dāng)然,人類也會(huì)犯錯(cuò)誤。
目前,患者能否獲得醫(yī)療保健也是一個(gè)問(wèn)題。
如今,每周一次的心理治療似乎是一種奢侈服務(wù)。但實(shí)際上仍有許多需求未得到滿足,許多本可以從心理療法中獲益的患者卻沒(méi)有機(jī)會(huì)得到治療。例如,RAND公司發(fā)現(xiàn),在所有需要心理健康護(hù)理的美國(guó)退伍軍人中,有一半沒(méi)有得到治療。
而訓(xùn)練有素的Agent將使心理療法更加實(shí)惠、易獲。例如,比起Wysa和Youper這兩個(gè)早期聊天機(jī)器人,Agent的影響會(huì)更深入。只要你愿意和心理保健Agent分享足夠的信息,它就會(huì)了解你的生活經(jīng)歷和人際關(guān)系。它會(huì)在你需要時(shí)出現(xiàn),而且永遠(yuǎn)保持耐心。
在你允許的情況下,它還可以通過(guò)你的智能手表監(jiān)測(cè)你的身體反應(yīng)——比如當(dāng)你和老板談?wù)搯?wèn)題時(shí)你的心臟是否開始加速跳動(dòng)——并建議你什么時(shí)候應(yīng)該去看人類心理治療師。
教育
幾十年來(lái),我一直對(duì)軟件給教師減負(fù)、幫學(xué)生學(xué)習(xí)的方方面面感到振奮。軟件不會(huì)取代教師,但它會(huì)補(bǔ)充他們的工作——為學(xué)生提供個(gè)性化的服務(wù),將教師從文書工作和其他任務(wù)中解放出來(lái),讓他們有更多時(shí)間從事最重要的工作。這些變化終于開始以戲劇性的方式發(fā)生了。
目前最先進(jìn)的技術(shù)是Khan Academy創(chuàng)建的基于文本的機(jī)器人Khanmigo。它可以輔導(dǎo)學(xué)生的數(shù)學(xué)、科學(xué)和人文學(xué)科。例如,Khanmigo可以解二次方程式并創(chuàng)建數(shù)學(xué)問(wèn)題,供學(xué)生練習(xí)。它還可以幫教師編教案。我一直以來(lái)都是Sal Khan的粉絲和支持者,最近他還參加了我的播客節(jié)目,談?wù)摻逃腿斯ぶ悄堋?/p>
但文本機(jī)器人只是第一階段——Agent將開辟更多的學(xué)習(xí)機(jī)會(huì)。
例如,很少有家庭負(fù)擔(dān)得起1v1家教。如果輔導(dǎo)Agent能捕捉到1v1家教的有用之處,它將為每個(gè)學(xué)生提供針對(duì)性指導(dǎo)。例如,當(dāng)輔導(dǎo)Agent知道一個(gè)孩子喜歡Minecraft和Taylor Swift,它將用Minecraft來(lái)教學(xué)生計(jì)算幾何的體積和面積,用Taylor Swif的歌詞教他們講故事和押韻。這種學(xué)習(xí)體驗(yàn)將更加豐富——例如,有圖形和聲音——而且比現(xiàn)在的文字輔導(dǎo)更加個(gè)性化。
生產(chǎn)力
這個(gè)領(lǐng)域的競(jìng)爭(zhēng)已經(jīng)進(jìn)入了白熱化。微軟正在將Copilot作為Word、Excel、Outlook和其他服務(wù)的一部分。谷歌也在用Assistant with Bard和其生產(chǎn)力工具做類似的工作。這些類似Copilot的協(xié)助工具可以做很多事情,比如把書面文件變成幻燈片,用自然語(yǔ)言回答電子表格的問(wèn)題,并從每個(gè)人的觀點(diǎn)里總結(jié)郵件主題。
而Agent能做更多。擁有一個(gè)Agent就像有一個(gè)人專門幫你完成各種任務(wù)。如果你愿意,Agent也可以獨(dú)立完成。如果你有一個(gè)商業(yè)想法,Agent會(huì)幫你寫一份商業(yè)計(jì)劃,創(chuàng)建一個(gè)演示文稿,甚至能生成產(chǎn)品的大概圖像。公司會(huì)讓員工直接咨詢Agent,并參與每次會(huì)議,以便回答問(wèn)題。
“如果你的朋友剛做了手術(shù),Agent會(huì)提議送花并幫你訂購(gòu)?!?/p>
無(wú)論你是否在辦公室工作,你的Agent都能像私人助理支持高管一樣幫助你。如果你的朋友剛做了手術(shù),Agent會(huì)提議送花并幫你訂購(gòu)。如果你想和以前的大學(xué)室友見面,Agent會(huì)和你大學(xué)室友們的Agents一起商量見面時(shí)間。就在你到達(dá)之前,它還會(huì)提醒你,他們最大的孩子剛剛在本地大學(xué)入學(xué)。
娛樂(lè)與購(gòu)物
人工智能已經(jīng)可以幫你挑選新電視,推薦電影、書籍、節(jié)目和播客。我投資的Likewise公司最近推出了Pix,它可以讓你提問(wèn)(“我喜歡羅伯特·雷德福的哪部電影,我可以在哪里看?”),然后根據(jù)你過(guò)去的喜好推薦電影。Spotify最近推出了一款人工智能DJ,不僅會(huì)根據(jù)你的喜好播放歌曲,還會(huì)與你交談,甚至能叫出你的名字。
Agent不僅會(huì)提供建議,它們還將幫助你付諸行動(dòng)。如果你想購(gòu)買相機(jī),你的Agent將為你閱讀所有測(cè)評(píng),總結(jié)后給出推薦,并在你決定后為你下單。如果你告訴Agent你想看《星球大戰(zhàn)》,它會(huì)知道你是否已訂閱了合適的流媒體服務(wù)。如果沒(méi)有,它會(huì)主動(dòng)為你注冊(cè)。如果你不知道自己想看什么,它會(huì)給出定制化建議,然后想辦法播放你選擇的電影或節(jié)目。
你還可以獲得根據(jù)你的興趣量身定制的新聞和娛樂(lè)內(nèi)容。CurioAI能就你提出的任何話題創(chuàng)建定制化播客,它是未來(lái)趨勢(shì)的一個(gè)縮影。
03 Agent對(duì)科技行業(yè)帶來(lái)何種沖擊波?
簡(jiǎn)而言之,Agent幾乎可以在任何活動(dòng)和生活領(lǐng)域提供幫助,對(duì)軟件行業(yè)和社會(huì)范圍產(chǎn)生深遠(yuǎn)的影響。
在計(jì)算機(jī)行業(yè),我們聊平臺(tái)——應(yīng)用程序和服務(wù)賴以構(gòu)建的技術(shù)。Android、iOS和Windows都是平臺(tái)。Agent將成為下一個(gè)平臺(tái)。
"要?jiǎng)?chuàng)建一個(gè)新的應(yīng)用程序或服務(wù),你只需要告訴你的Agent你想要什么。"
要?jiǎng)?chuàng)建一個(gè)新的應(yīng)用程序或服務(wù),你不需要知道如何編寫代碼,如何做圖形設(shè)計(jì)。你只要將需求告訴你的Agent。它就能編寫代碼,設(shè)計(jì)應(yīng)用程序的界面外觀,創(chuàng)建徽標(biāo),并將應(yīng)用程序發(fā)布到在線商店。OpenAI本周發(fā)布的GPTs讓我們得以一窺未來(lái),非開發(fā)人員也可以輕松創(chuàng)建和分享他們自己的助手。
Agent將影響我們?nèi)绾问褂密浖?,如何編寫軟件。它們將取代搜索網(wǎng)站,因?yàn)樗鼈兏朴诓檎倚畔?、匯總信息;它們將取代電商網(wǎng)站,因?yàn)樗鼈儗槟阏业阶顑?yōu)惠的價(jià)格,而不僅僅局限于少數(shù)供應(yīng)商;它們將取代很多文字處理軟件、電子表格和其他生產(chǎn)力應(yīng)用程序。讓如今分散的業(yè)務(wù)——搜索廣告、帶廣告的社交網(wǎng)絡(luò)、購(gòu)物、生產(chǎn)力軟件——整合為一項(xiàng)業(yè)務(wù)。
我不認(rèn)為任何一家公司能壟斷Agent業(yè)務(wù)——會(huì)有很多不同的人工智能引擎可供選擇。今天,Agent被嵌入到其他軟件中,如文字處理軟件和電子表格,但最終它們將獨(dú)立運(yùn)行。盡管一些Agent可以免費(fèi)使用(并拉到廣告贊助),但我認(rèn)為你將為大部分Agent付費(fèi),這意味著公司將有動(dòng)機(jī)讓Agent為你工作,而不是為廣告商。如果從今年開始研究人工智能的公司數(shù)量,目測(cè)將會(huì)出現(xiàn)異常激烈的競(jìng)爭(zhēng),這會(huì)使Agent變得很便宜。
04 距離實(shí)現(xiàn)還有哪些技術(shù)挑戰(zhàn)?
但在我所描述的復(fù)雜Agent成為現(xiàn)實(shí)之前,我們需要解決一些關(guān)于這項(xiàng)技術(shù)本身以及我們?nèi)绾问褂眠@項(xiàng)技術(shù)的問(wèn)題。我之前已經(jīng)談到了人工智能引發(fā)的問(wèn)題,所以在這里我將重點(diǎn)關(guān)注Agent。
目前還沒(méi)有人知道Agent的數(shù)據(jù)結(jié)構(gòu)是什么樣的。為了創(chuàng)建私人Agent,我們需要一種新型的數(shù)據(jù)庫(kù),它可以細(xì)膩地捕捉你的興趣和各種關(guān)系,并在保護(hù)隱私的同時(shí)快速檢索信息。我們已經(jīng)看到到了存儲(chǔ)信息的新方式,例如向量數(shù)據(jù)庫(kù),它可能更適合存儲(chǔ)機(jī)器學(xué)習(xí)模型生成的數(shù)據(jù)。
另一個(gè)未解決的問(wèn)題是人們將與多少個(gè)Agent進(jìn)行交互。你的個(gè)人Agent會(huì)與你的心理治療師Agent和數(shù)學(xué)導(dǎo)師Agent分離嗎?如果是這樣的話,你希望它們何時(shí)彼此合作,何時(shí)保持各自獨(dú)立?
"如果你的Agent需要與你聯(lián)系,它將與你交談或在你的手機(jī)上顯示。"
你將如何與你的Agent互動(dòng)呢?公司正在探索各種選擇,包括應(yīng)用程序、眼鏡、吊墜、胸針,甚至是全息影像。所有這些都是可能性,但我認(rèn)為在人與Agent的互動(dòng)方面,首個(gè)重大突破將是耳機(jī)。如果你的Agent需要與你聯(lián)系,它將與你交談或在你的手機(jī)上顯示信息("你的航班延誤了,你想等待還是需要幫助重新預(yù)訂?")。如果你愿意,它會(huì)監(jiān)控進(jìn)入你耳朵的聲音,并通過(guò)屏蔽背景噪音、放大難以聽清的語(yǔ)音、或讓你更容易理解口音重的人說(shuō)話來(lái)增強(qiáng)它的效果。
還有其他挑戰(zhàn)。例如,目前還沒(méi)有一個(gè)標(biāo)準(zhǔn)協(xié)議允許Agent們互相交談;成本需要降低,讓每個(gè)人都能負(fù)擔(dān);如何向Agent發(fā)出簡(jiǎn)單指令的同時(shí)得到正確回答;如何防止出現(xiàn)“幻覺”(即人工智能自信地給出了不符合事實(shí)的回答),尤其是在精確度要求極高的健康領(lǐng)域,還要確保Agent不會(huì)因?yàn)槠姸鴤θ藗?。我們不希望Agent做它們不該做的事。(不過(guò)比起流氓Agent,我更擔(dān)心人類罪犯利用Agent干壞事。)
05 隱私和其他重大問(wèn)題
隨著這一切的出現(xiàn),網(wǎng)絡(luò)隱私和安全問(wèn)題將變得比現(xiàn)在更加緊迫。你會(huì)希望自己掌握Agent訪問(wèn)信息的權(quán)利,這樣你就可以確信你的數(shù)據(jù)只與你選擇的人和公司共享。
但是,你與Agent分享的數(shù)據(jù)歸誰(shuí)所有,如何確保數(shù)據(jù)被安全使用?畢竟沒(méi)人想收到來(lái)自心理治療師Agent的廣告。執(zhí)法機(jī)構(gòu)能否使用你的Agent提交對(duì)你不利的證據(jù)?你的Agent何時(shí)會(huì)拒絕執(zhí)行可能對(duì)你或他人有害的任務(wù)?是誰(shuí)決定了Agent內(nèi)置的價(jià)值觀?
還有一個(gè)問(wèn)題是,你的Agent應(yīng)該分享多少信息。假設(shè)你想去看望一個(gè)朋友:如果你的Agent與他們的Agent交談,你不希望它說(shuō):“哦,她周二要和其他朋友見面,不想邀請(qǐng)你?!比绻愕腁gent幫助你撰寫工作郵件,它應(yīng)該知道自己不該使用你的私人信息或上一份工作的專有數(shù)據(jù)。
很多問(wèn)題已經(jīng)成為科技行業(yè)和立法者關(guān)注的焦點(diǎn)。我最近與其他技術(shù)領(lǐng)導(dǎo)者一起參加了由參議員查克·舒默組織、許多美國(guó)參議員參加的人工智能論壇。我們分享了關(guān)于這些和其他問(wèn)題的想法,并討論了立法者制定強(qiáng)有力法律的必要性。
但有一些問(wèn)題不會(huì)由公司和政府來(lái)決定。例如,Agent可能影響我們與朋友、家人的互動(dòng)方式。今天,你可以通過(guò)記住他們生活的細(xì)節(jié),比如他們的生日,來(lái)表達(dá)你對(duì)他們的關(guān)心。但當(dāng)他們知道是你的Agent提醒你并負(fù)責(zé)送花時(shí),這對(duì)他們來(lái)說(shuō)還有意義嗎?
在遙遠(yuǎn)的未來(lái),Agent甚至可能迫使人類面對(duì)一些關(guān)于意義的深刻問(wèn)題。想象一下,Agent變得如此優(yōu)秀,以至于每個(gè)人都可以在不工作的情況下?lián)碛懈哔|(zhì)量生活。在這樣的未來(lái),人們會(huì)如何利用他們的時(shí)間?當(dāng)Agent知道所有問(wèn)題的答案時(shí),還會(huì)有人愿意接受教育嗎?當(dāng)大多數(shù)人都有很多空閑時(shí)間時(shí),你能擁有一個(gè)安全繁榮的社會(huì)嗎?
但我們離那個(gè)未來(lái)還很遠(yuǎn)。與此同時(shí),Agent時(shí)代正在趕來(lái)。在接下來(lái)的幾年里,它們將徹底改變我們的生活方式,無(wú)論是線上還是線下。