文|鋅財經(jīng) 孫鵬越
編輯|大風
這些天的硅谷,亂成了一鍋粥。
OpenAI CEO山姆-奧特曼直接在社交平臺公開嘲諷谷歌的審美過于差勁,他表示:我努力不去過多思考我們的競爭對手,但我無法不去思考OpenAI和谷歌之間的美學差異。
下面附著的兩張發(fā)布會現(xiàn)場圖,左邊是OpenAI,右邊是谷歌。言下之意,就是OpenAI干凈明了,極具科技感;而谷歌則離人群非常遠,十分過時。
山姆-奧特曼如此氣急敗壞,還是因為在上周,OpenAI和谷歌同時發(fā)布AI新品,雙方打的你來我往:你說GPT-4o全球最先進,我說Gemini家族能覆蓋全生態(tài)全路徑。
兩家硅谷巨頭的直接對抗,把科技競賽的強度拉滿,就連CEO本人都坐不住了。
谷歌AI全家桶上線
山姆-奧特曼嘲諷谷歌并不是無的放矢,這場谷歌I/O大會在觀看性上,確實難以令人滿意。
首先是時間太長,谷歌I/O大會足足有接近兩個小時,主持人連續(xù)提起了121次AI字眼,甚至有觀眾在社交平臺抱怨自己都快睡著了。
然后就是產品太多,比起OpenAI僅有GPT-4o一款新品,谷歌這次則推出了十余種Gemini大模型的升級及新品,可以說是“AI全家桶”。
發(fā)布AI搜索:Google Search;
升級了Gemini大模型:Gemini 1.5 Flash(100 萬上下文)、Gemini Pro(200 萬上下文);
新發(fā)布了手機版Gemini App:以手機應用程序形式,支持和AI視頻對話;
發(fā)布視覺語言模型Project Astra:擁有Imagen3(圖像)、Music AI Sandbox(音樂)、Veo(視頻生成)三種能力。
雖然谷歌AI全家桶看上去格外炫酷,但實際上對比OpenAI的GPT-4o依然差上很多,更多是硬件性升級,單純給大模型升級一下參數(shù)。
最令人印象深刻的兩項功能,是AI搜索Google Search和AI助理Project Astra。
首先是Google Search,搜索作為谷歌起家的根本,這些年遭受到了微軟的重創(chuàng)。微軟的Bing已經(jīng)借助ChatGPT,給傳統(tǒng)搜索引擎帶來了“億點點”AI降維打擊。
甚至就連OpenAI也在盛傳將推出AI搜索類產品,來搶占Google搜索市場。
壓力之下,谷歌推出Google Search來穩(wěn)定自家護城河,下定決心重塑搜索體驗。
據(jù)演示視頻來看,Google Search最核心的功能,就是搜索摘要功能AI Overview。
所謂的“搜索摘要功能”,就是谷歌之前提出來的“搜索生成式體驗(SGE)”。
用戶在搜索框內鍵入文本,直接在最上方跳出AI幫忙整理的信息摘要。其中包含用自然語言對搜索結果的總結和概括,以及推薦的鏈接。
AI Overview還內置了“多步推理功能Multi-Step Reasoning”、“計劃功能Planning in Search”、“視頻提問Ask With Video”。
另外一個發(fā)布會亮點,就是谷歌推出的AI助理Project Astra。
Project Astra就是一個完全對標GPT-4o的產品,產品形態(tài)和使用邏輯基本和ChatGPT無二。用戶可以和它實時對話、視頻聊天。
并且,和GPT-4o一樣,Project Astra也提供文生圖、文生視頻兩項功能。只不過不叫DALL·E和Sora,而是叫做Imagen 3和Veo。
唯一有點不一樣的,就是Project Astra提供了音樂生成模型Music AI Sandbox。
用戶可以上傳一小段音樂demo,Music AI Sandbox能在此基礎上拓展延長。用戶還可以輸入提示詞,進一步調整音樂風格,進行樂曲的二度創(chuàng)作。
總之,用一句話來概括谷歌AI全家桶,就是:東西很多,精品很少。
我們能在一系列AI新產品里,不斷看到ChatGPT的影子,但單純是在GPT-4o做好的框架里縫縫補補,升級一下算力,換個新框架。
能給用戶帶來震撼感的產品呢?
依然沒有看到。
越來越像人類的GPT-4o
比起谷歌的多到凌亂,OpenAI則是簡潔明了。
僅僅只有半個多小時,全程由公司CTO和兩位工程師face to face,以對話形式展示產品,非常具有電影感。
甚至CEO山姆-奧特曼都沒有現(xiàn)身發(fā)布會,完全用產品力來震撼用戶。
現(xiàn)場的演示嘉賓拿著手機攝像頭,讓GPT-4o識別自己的表情,來判斷自己的情緒。
GPT-4o很快識別完成,說:你看起來很開心,帶著燦爛的笑容,甚至有一絲興奮,你能分享你快樂的來源嗎?
演示嘉賓在紙上寫了“i love you”給GPT-4o,GPT-4o用帶有一絲絲嬌羞、熱情四溢的語氣快速回應著人類的“愛意”。
GPT-4o能感受到你的呼吸節(jié)奏、能“看出”你文字當中包含的情緒、甚至可以打斷它的話,重新為話題增加新的語境,它也能作出完美回應……
這樣的人工智能,讓你想到了什么?
是的,一個完美戀人。
就像是2013年上映的好萊塢電影《Her》,斯嘉麗配音的人工智能和人類談起了戀愛。
這一幕,逐漸成為現(xiàn)實。誰會不喜歡一個熱情洋溢、事事有回應、提供豐富情緒價值的伴侶呢?
哪怕它是AI。
GPT-4o給后來者谷歌一個下馬威,也給出未來AI大模型的一個滿分答案:不管是生成式AI大模型也好,聊天機器人也好,不用再去關心什么硬件什么參數(shù),AI的最終方向就是越來越像人類。
OpenAI并沒有過多描述自己的算力、自己的硬件升級,只是由首席技術官穆里·穆拉蒂 (Muri Murati) 表示,GPT-4o將提供與GPT-4同等水平的智能,但在文本、圖像以及語音處理方面均取得了進一步提升,“GPT-4o可以綜合利用語音、文本和視覺信息進行推理。”
現(xiàn)階段的GPT-4o已經(jīng)擺脫了對文本、圖片或語音的束縛,它的識別能力進化到了“聽覺”和“視覺”。
用“聽”來捕捉情緒變化,比如能判斷對方急促的呼吸方式不對;用“看”來識別你寫在紙上的方程式數(shù)學問題,一步步教你解題步驟。
甚至它還可以通過手機攝像頭,回答你“這個人穿什么牌子的襯衫?”
比起谷歌眼花繚亂、不知從哪下手的AI全家桶,GPT-4o已經(jīng)領先到大氣層了。
免費,但又不完全免費
GPT-4o除了在能力上,給了谷歌一個下馬威外,OpenAI還放了大招:
穆里-穆拉蒂表示,GPT-4o將免費提供給所有用戶使用,不但當下免費,甚至以后OpenAI做產品就是要免費優(yōu)先,為的就是讓更多的人能使用。
就連OpenAI CEO山姆奧特曼表示,新的GPT-4o是OpenAI有史以來最好的模型,它可供所有ChatGPT用戶使用,無論是免費版本還是付費GPT-4版。
不得不說,當服務免費時,用戶就是產品。
如果GPT-4o真的能徹底取消付費制度,那么OpenAI獲得的數(shù)據(jù)量會超出想象。
可惜的是,OpenAI還是缺少“用免費改變世界”的魄力,背后還是有不少的貓膩。
首先,OpenA在官網(wǎng)公告上明確說明,免費用戶在使用GPT-4o時,OpenAI做出了權限上的分級。
免費用戶可以使用GPT-4o的分析數(shù)據(jù)、創(chuàng)建報表、處理照片、上傳文件、使用記憶功能等,基本上GPT-4o涵蓋了GPT4所有的付費功能。
但是免費用戶會有消息數(shù)量的限制,PIUS用戶的消息將是免費用戶的5倍,Team和Enterprise用戶限制將會更高。
每天能用多久?每天能發(fā)幾條?GPT-4o并沒有詳細說明。
或許,我們可以參考OpenAI上一代GPT-4,限制每個用戶每天的使用時間在3小時以內,并限制每天生成的信息數(shù)量不超過25條。
雖然說這一限制在一定程度上,提高了信息的質量和用戶的注意力。但還是要感嘆一句,互聯(lián)網(wǎng)的免費,永遠不是真免費。
哪怕到了AI時代,這個法則也同樣適用。