文|硅兔賽跑
這個月初,號稱「人類首個AI軟件工程師」的Devin火爆出圈,給世界帶來了億點點震撼。
它掌握全棧技能,云端部署、底層代碼、改bug、訓練和微調(diào)AI模型,一經(jīng)發(fā)布就掀起業(yè)內(nèi)瘋狂討論,甚至有人說:軟件工程師要失業(yè)了。
圖源:DigiAlps LTD
開發(fā)Devin的初創(chuàng)公司Cognition AI,僅由10人團隊組成,團隊雖小,全是大牛。大多是華人面孔的隊伍,狂攬10 枚IOI(國際信息學奧林匹克競賽)金牌,還有人在DeepMind、Waymo 等大廠的工作經(jīng)歷。
Cognition AI成立才不到兩個月就獲得硅谷投資大佬Peter Thiel的Founders Fund基金領(lǐng)投的2100萬美元A輪融資,以及Google高管Elad Gil、計算機科學家Christopher Re、Strip創(chuàng)始人John Collison的聯(lián)合支持。
01 一個,和無數(shù)個
雖然Devin才上線兩周,且沒有完全對外開放使用,拿到早期測試資格的人和公司并不多,不過還是有不少工程師曬出實測結(jié)果。
只需要自然語言寫的提示詞,接下來的所有工作都可以交給Devin,它會像一個真正的程序員一樣完成工作。
碼農(nóng)的世界已然變了天。Devin的首席執(zhí)行官Scott Wu還在社交媒體發(fā)出現(xiàn)在的Devin還成為Cognition AI的首席執(zhí)行官替身,開始打工了。
最近幾天,AI初創(chuàng)公司Suno AI推出了第一款可制作的音樂生成模型V3,音樂圈炸裂。
圖源:MLWires
此前,Suno AI因爆改的周杰倫的《以父之名》和《夜曲》出圈,當時網(wǎng)友紛紛驚嘆未來AI音樂的可能性。本周發(fā)布的V3,僅用幾秒的時間,便可以創(chuàng)作出2分鐘的完整歌曲。
Air Street Capital預測,今年會有AI生成的歌曲成為 Billboard 或 Spotify 熱門單曲。
今年Y Combinator W24即將在四月如期來到,我們觀察到這個batch里同樣有不少AI to software的初創(chuàng)公司。
Pythagora是一款開發(fā)工具,由 GPT Pilot 和GPT-4支持的 VS Code 擴展,它能通過與用戶對話,從零開始構(gòu)建應(yīng)用程序。非常適用于使用 Node、Express 和 MongoDB 的網(wǎng)絡(luò)應(yīng)用程序項目。
Pythagora在Github上有2.43萬星,由CEO Zvonimir &CPO Leon 聯(lián)合創(chuàng)立。AWW app (1.5M MAU 2016-2021) 被 Miro 收購;CTO Senko與 CEO Zvonimir一起開發(fā)了一個開源的軟件自動測試項目,后來轉(zhuǎn)型到 GPT Pilot 上。
圖源:Linkedln
Fume是一款人工智能軟件開發(fā)工具,用戶可以在開發(fā)周期的任何階段隨時隨地訪問,它類似一個編碼助,但更像是一個團隊成員,你可以從它那里獲得幫助也可以將工作完全委托給它。
每個開發(fā)團隊都有一長串未處理的錯誤報告、生產(chǎn)錯誤日志和功能請求,有些任務(wù)其實無聊又繁瑣,修復他們往往花費了工程師大量的寶貴時間。Fume的用戶只需在 Slack、VSCode、Github 或其他任何地方發(fā)出一個提示,即可在整個代碼庫中更改多個文件。
圖源:Fume
Marblism,一款通過單個提示生成功能齊全的 Web 的應(yīng)用程序。創(chuàng)始人認為每個人都害怕前幾行代碼:選擇框架、設(shè)計 UI/UX、設(shè)置項目、集成前端與后端,用戶只需要描述您想要構(gòu)建的產(chǎn)品,接下來90%的基本網(wǎng)站構(gòu)建工作都可以放手交給Marblism,只需專注于剩下的個性化內(nèi)容即可。
Marblism是兩位聯(lián)合創(chuàng)始人的第二次創(chuàng)業(yè),上一家公司Vauban于2022年被Carta收購。
圖源:Marblism
02 自己卷自己
除了AI+軟件的初創(chuàng),這屆YC出現(xiàn)了很多相同類型產(chǎn)品的不同公司,比如視頻生成領(lǐng)域。
Magic Hour是一款視頻生成工具,由兩個年輕的華人工程師創(chuàng)立,其中聯(lián)合創(chuàng)始人兼CEO曾是Meta的高級數(shù)據(jù)科學家,CTO也有相當長的行業(yè)經(jīng)驗。
Magic Hour使用開源模型,支持AI換臉、視頻to視頻、文字to視頻、圖像to視頻等形式,區(qū)別于寫實風格的視頻,Magic Hour生成的視頻主要以動畫風格為主。
圖源:Magic Hour
同樣是AI+視頻,Yarn旨在利用人工智能,幫助客戶制作專業(yè)品質(zhì)的產(chǎn)品和銷售視頻。銷售團隊可以使用 Yarn 制作銷售資料、發(fā)布視頻、用例演示、培訓指南,YC里的的一些公司比如DriverAI (W24) 、Replo (S23) 、Forge (W24) 已經(jīng)在嘗試使用Yarn。
同類型的成熟產(chǎn)品有Loom AI,去年10 月份宣布以 9.75 億美元被協(xié)作軟件巨頭 Atlassian收購。
圖源:Yarn
Infinity AI號稱只需上傳文字劇本,就可以將其制作成電影。由MIT校友組成的創(chuàng)始團隊稱在未來十年內(nèi),由三名編劇組成的團隊會贏得奧斯卡金像獎。
不過,從demo上看生成的效果還不夠成熟,目前只能生成半身人像視頻,且人臉的面目比較僵硬,達到所謂“電影級別的效果”還言之過早。
圖源:Infinity AI
「AI+視頻」是本屆YC一個擁擠賽道,同在擠在同類型產(chǎn)品中競爭的還有「AI+語音/音樂」,至少有十多個項目。
VoicePanel是一個用于定性研究的全自動平臺,負責招募高質(zhì)量的參與者并對他們進行訪談,將反饋綜合成有價值的報告。
兩位創(chuàng)始人都是哈佛大學計算機工程畢業(yè),CEO John曾在Google有著十多年工作經(jīng)驗,后加入Optimizely并結(jié)識CTO Asa,后者曾在Microsoft工作,曾創(chuàng)立了 Level (YC S21)被 英國出租代理服務(wù)公司Vouch 收購。
圖源:VoicePanel
Retell AI由五位華人創(chuàng)立,幫助開發(fā)人員在短時間內(nèi)制作類人語音代理。實際上語音人工智能已經(jīng)出現(xiàn)了一段時間,但始終沒有被主流廣泛應(yīng)用。主要原因是用戶體驗不佳,表現(xiàn)為AI對話流程常常因不自然的停頓和中斷,人類的請求經(jīng)常被誤解,生成的聲音聽起來機械化等等。
Retell AI生成的類人語音AI代理已經(jīng)實現(xiàn)了平均 800 毫秒的響應(yīng)時間,達到了人類交互的水平。在團隊展示的Demo中,AI代理相應(yīng)迅速、聲音真實、理解迅速并且在被打斷時也能做出正確響應(yīng)。
圖源:Retell AI
Soundry AI為音樂家和聲音設(shè)計師構(gòu)建了一個通用的文本到聲音人工智能生成器。三位聯(lián)合創(chuàng)始人都因?qū)σ魳返臒釔鄱鴪F結(jié)在一起,其中CEO Mark在康奈爾大學獲得人工智能博士學位,另一家創(chuàng)業(yè)公司也是音樂相關(guān)。
用戶可以使用Soundry AI創(chuàng)建獨特、高質(zhì)量、無版權(quán)的demo,目前的展示來看,效果相比同類產(chǎn)品更為優(yōu)秀。
圖源:Soundry AI