国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

不怕你走,就怕你不用AI寫代碼!OpenAI Codex負(fù)責(zé)人親口承認(rèn):內(nèi)部已很少再打開IDE

0
分享至

  

  整理|冬梅

  2 月初,OpenAI 正式發(fā)布了其最新一代編程智能體GPT-5.3-Codex,這是目前 OpenAI 在 AI 編程領(lǐng)域的最新旗艦?zāi)P?,?biāo)志著該公司在“智能體變成實(shí)際協(xié)作者”這條路線上的一次重要升級。官方發(fā)布中指出,GPT-5.3-Codex 在原有 GPT-5.2-Codex 能力基礎(chǔ)上進(jìn)行了全面提升,包括更強(qiáng)的推理能力、更高的效率和更廣的工作流支持,同時提升了用戶交互體驗(yàn)和長期任務(wù)處理能力,目標(biāo)是讓智能體像人類同事一樣在整個開發(fā)流程中協(xié)作。

  在權(quán)威評測上,新版本在多個行業(yè)相關(guān) benchmark 上表現(xiàn)卓越,例如在軟件工程綜合評測 SWE-Bench Pro 和系統(tǒng)操作評測 Terminal-Bench2.0 上大幅領(lǐng)先前代,在 OSWorld 和其他能力指標(biāo)上也表現(xiàn)顯著,更重要的是整體推理速度提升約 25%。官方強(qiáng)調(diào),這些改進(jìn)不僅體現(xiàn)在代碼生成能力,還包括調(diào)試、審查、架構(gòu)設(shè)計(jì)等工程師真實(shí)需要的工作流環(huán)節(jié)。

  在 Reddit、技術(shù)論壇等開發(fā)者社區(qū)中,GPT-5.3-Codex 的反饋呈現(xiàn)出明顯的兩極分化。一部分開發(fā)者分享了正面的經(jīng)驗(yàn),例如模型在 CLI 與 IDE 插件中帶來的更流暢操作、新版計(jì)劃模式提供的更清晰步驟反饋等,這與官方提出的“交互式協(xié)作和實(shí)時指導(dǎo)”方向一致。

  但也有不小比例的用戶發(fā)出了批評:有用戶指出目前 GPT-5.3-Codex尚未通過 API 向所有開發(fā)者開放,部分平臺(如通過 API key)無法直接調(diào)用最新模型,這讓許多開發(fā)者難以在自定義環(huán)境中集成。

  

  另一些用戶反映新模型在某些編輯器里表現(xiàn)尚不成熟,例如在 Zed 編輯器中體驗(yàn)不佳,偶爾中斷或無法按預(yù)期編輯文件,甚至有人因此重新回退使用老版本。

  

  還有開發(fā)者表示,他們并不總是能獲得“官方宣傳的強(qiáng)大師任務(wù)表現(xiàn)”,尤其在 Web 生成等任務(wù)上出現(xiàn)停滯,并認(rèn)為其它競爭模型(如某些 Claude 系列)在某些日常任務(wù)上體驗(yàn)更順暢。

  近日,OpenAI Codex 的產(chǎn)品負(fù)責(zé)人 Alexander Embiricos 做客了一檔訪談節(jié)目,談及了 Codex 的產(chǎn)品方向,目標(biāo)并不只是“讓 AI 寫得更好”,而是將 AI 打造成一種貫穿軟件工程全生命周期的主動型工程隊(duì)友——能夠理解任務(wù)、制定計(jì)劃、執(zhí)行實(shí)現(xiàn)、完成交付,甚至參與審查。

  與許多模型負(fù)責(zé)人不同,Alexander 的視角明顯更偏向“工作流”和“真實(shí)使用場景”。

  在加入 OpenAI 之前,Alexander 曾聯(lián)合創(chuàng)立協(xié)作工具公司 Multi 并成功退出,長期關(guān)注的不是技術(shù)極限,而是工具是否真的被人全天候使用、是否改變了人的工作方式。也正因?yàn)槿绱?,這場對話沒有圍繞參數(shù)規(guī)?;蚧鶞?zhǔn)測試展開,而是反復(fù)回到一個更具現(xiàn)實(shí)沖擊力的問題:當(dāng)工程師開始把完整任務(wù)交給 AI,軟件工程這件事,正在發(fā)生什么變化?

  在對話中,Alexander 明確否定了“AI 會減少工程師數(shù)量”的判斷。他認(rèn)為,未來五年工程師和創(chuàng)造者只會更多,而不是更少。原因并不復(fù)雜:歷史上,“計(jì)算機(jī)”“程序員”這些詞本身就被多次重定義,而“軟件工程師”也正站在下一次重定義的門檻上。

  真正發(fā)生變化的,是人才棧的壓縮。在 Codex 團(tuán)隊(duì)內(nèi)部,傳統(tǒng)的前端、后端、基礎(chǔ)設(shè)施等分工正在迅速模糊,每個人都被要求具備更強(qiáng)的全棧能力,甚至同時參與設(shè)計(jì)與產(chǎn)品判斷。在這樣的背景下,“工程師”不再只是執(zhí)行者,而更像是問題定義者與結(jié)果把關(guān)者。Alexander 甚至半開玩笑地表示,某些情況下,產(chǎn)品經(jīng)理這個角色是否仍然必要,都是一個值得重新討論的問題。

  他的判斷很清晰:分工會被壓縮,但人類作為創(chuàng)造者的地位不會被削弱。

  如果說對未來的判斷仍帶有主觀色彩,那么 Alexander 描述的OpenAI 內(nèi)部變化,則更像是一種已經(jīng)發(fā)生的事實(shí)。

  他反復(fù)提到一個關(guān)鍵節(jié)點(diǎn):GPT-5.2 Codex 的發(fā)布。在那之前,AI 更多扮演的是“輔助工具”的角色——自動補(bǔ)全、結(jié)對編程,人仍然需要坐在編輯器前,驅(qū)動整個過程。但從 GPT-5.2 Codex 開始,工作方式發(fā)生了本質(zhì)變化:工程師不再“和 AI 一起寫代碼”,而是把整個任務(wù)直接委托給 AI。

  在 OpenAI 內(nèi)部,許多工程師幾乎不再打開傳統(tǒng) IDE,而是全天候運(yùn)行Codex。會議期間如果沒有讓 Codex 同步處理任務(wù),反而會被認(rèn)為是在浪費(fèi)時間。Alexander 沒有給出一個精確比例,但他的判斷非常明確:現(xiàn)在 OpenAI 內(nèi)部,絕大多數(shù)代碼都是由 AI 寫出來的。這并不意味著工程師“無事可做”,而是他們的注意力,已經(jīng)從實(shí)現(xiàn)細(xì)節(jié),轉(zhuǎn)移到任務(wù)拆解、計(jì)劃評估和結(jié)果審查上。

  在對話的最后,Alexander 回答了一位頂尖高校學(xué)生的提問:如何在未來五年成為 AI 生態(tài)中有價值的工程師?他的態(tài)度出人意料地樂觀——這是一個前所未有適合做工程師的時代。工具極其強(qiáng)大,理解復(fù)雜系統(tǒng)和代碼庫的成本被大幅壓縮。但正因?yàn)椤皹?gòu)建變得容易”,真正稀缺的東西反而更加清晰:主動性、審美,以及對質(zhì)量的執(zhí)念。

  他的建議只有一句話:去構(gòu)建高質(zhì)量的東西。一個有思想、有完成度的項(xiàng)目,比任何標(biāo)準(zhǔn)化簡歷都更有說服力。

  以下為完整對話內(nèi)容,經(jīng) AI 前線編輯整理:

  

  主持人:我的第一個問題可能有點(diǎn)奇怪,但我還是想問下。我對人們的動機(jī)特別著迷:你行動的動力更多是來自對失敗的恐懼,還是對勝利的興奮與渴望?

  Alexander:我是個追求極致的人。比起害怕失敗,勝利的渴望絕對更能驅(qū)動我。不過我得跟你坦白一件事:在加入 OpenAI 之前經(jīng)營創(chuàng)業(yè)公司時,曾經(jīng)歷過至暗時刻——實(shí)際上那段日子黑暗時刻比比皆是——我突然意識到過去幾個月自己一直在拼命避免失敗。那一刻恍然大悟:天啊,原來這就是我如此痛苦的原因,很可能也是公司止步不前的根源。所以我得不斷自我調(diào)整,重新聚焦于爭取勝利的初心。但說到底,比成功欲望更強(qiáng)烈的,大概是我天生熱愛創(chuàng)造,特別是為人們打造新事物。想到今年就無比振奮,因?yàn)閷⒂袩o數(shù)尚未存在的精彩之作被創(chuàng)造出來,交付到眾人手中。

  主持人:馬斯克曾預(yù)言編程會成為首批被大規(guī)模自動化的職業(yè)之一。基于你的職位和日常觀察,你認(rèn)同這個觀點(diǎn)嗎?

  Alexander:我完全認(rèn)同編程會是最早被大語言模型深度滲透的領(lǐng)域之一。不過說到“編程被自動化”這個說法,其實(shí)值得細(xì)品——這就像當(dāng)年我們不再寫匯編語言,轉(zhuǎn)向高級語言編程時,能說編程被自動化了嗎?并非如此。

  我們只是得以用更高效率編寫更多代碼,結(jié)果反而是市場對代碼的需求激增,需要更多軟件工程師來創(chuàng)造價值。這種自動化更像是工具進(jìn)化帶來的職能轉(zhuǎn)變,就像“計(jì)算機(jī)”這個詞的起源:據(jù)說在布萊切利公園破譯德國恩尼格瑪密碼時,需要專人打孔卡、操作機(jī)器、做大量表格運(yùn)算——這些繁瑣的機(jī)械操作后來被自動化了。甚至最早的電子表格軟件,靈感就源于辦公室里格子間工位排成矩陣,人們各自計(jì)算后將表格傳給下個人的場景。這些具體操作確實(shí)被技術(shù)取代了,但每次這樣的變革后,對最終成果的需求都會呈指數(shù)級增長,即便具體的工作形態(tài)已徹底改變,整個行業(yè)反而需要更多從業(yè)者參與其中。

  主持人:所以你認(rèn)為五年后工程師數(shù)量會增加而非減少,對嗎?

  Alexander:沒錯,其實(shí)我們也在不斷重新定義術(shù)語的內(nèi)涵——比如“計(jì)算機(jī)”這個詞現(xiàn)在指代的東西早已不同,而如今我們又有了“軟件工程師”這個頭銜。所以我堅(jiān)信未來會有更多創(chuàng)造者。

  現(xiàn)在有個很有趣的觀察:人才棧正在發(fā)生壓縮現(xiàn)象。雖然當(dāng)前我們?nèi)匀恍枰浖こ處?、軟件設(shè)計(jì)師,以及像我這樣的產(chǎn)品經(jīng)理——關(guān)于 PM 這個角色你們可以盡情調(diào)侃,說實(shí)話我也覺得未必需要——但或許當(dāng)人們談?wù)摗肮こ處煛睍r,腦海中浮現(xiàn)的已經(jīng)是比過去更全能的形態(tài)。倒退幾年,絕大多數(shù)團(tuán)隊(duì)還嚴(yán)格區(qū)分后端工程師和前端工程師;而現(xiàn)在至少在 Codex 團(tuán)隊(duì),這種界限已經(jīng)非常模糊,每個人都更趨向全棧。因此我認(rèn)為人才棧確實(shí)會持續(xù)壓縮,但人類作為創(chuàng)造者的本質(zhì)不會改變。

  主持人:為什么你認(rèn)為在這個世界里我們不需要產(chǎn)品經(jīng)理?你這是在吊人胃口啊。

  Alexander:首先我覺得產(chǎn)品經(jīng)理這個角色本身就極難定義——它本質(zhì)上就是個沒有固定范式的崗位,目標(biāo)就是靈活適配團(tuán)隊(duì)或業(yè)務(wù)的需求。比如當(dāng)一群人正全力沖刺開發(fā)時,產(chǎn)品經(jīng)理的價值在于后退幾步,用前瞻性視野預(yù)判方向,協(xié)調(diào)各方資源推進(jìn)市場落地,同時擔(dān)任團(tuán)隊(duì)的頭號啦啦隊(duì)長和質(zhì)量把關(guān)人。

  但仔細(xì)想想,這些我描述的(可能也是我當(dāng)前做的)所有工作,完全可以由一位兼具產(chǎn)品思維的資深技術(shù)負(fù)責(zé)人或設(shè)計(jì)師來完成。所以產(chǎn)品經(jīng)理這個角色確實(shí)常常能發(fā)揮作用,但在團(tuán)隊(duì)規(guī)模真正變得龐大之前,可能并不需要配置太多這樣的崗位

  AGI 的瓶頸是什么?

  主持人:過去幾天我可沒少狂扒你的“底褲”——把你的文章、推文、過往采訪翻了個底朝天,這趟探索簡直樂趣無窮。你曾在某處提到,人類驗(yàn)證工作的速度和輸入效率才是制約 AGI 發(fā)展的關(guān)鍵瓶頸,而非模型算力或架構(gòu)本身。然后這話就撂在那兒沒下文了,快給我解解惑:為什么說人類打字速度和驗(yàn)證工作會成為核心瓶頸?你這句話到底藏著什么深意?

  Alexander:確實(shí)如此。這個話題很有意思。我認(rèn)為現(xiàn)在存在多個瓶頸,但這或許是最能吸引眼球的一個。如果不介意的話,我們不妨用蘇格拉底式問答來探討:你目前每天使用 AI 的頻率大概是多少?

  主持人:每天 30 多次吧。

  Alexander:那假設(shè)你完全不需要耗費(fèi)任何精力,你覺得 AI 每天能幫到你多少次?

  主持人:我認(rèn)為在所有事務(wù)中,AI 將會全天候覆蓋每一件事。

  Alexander:確實(shí)如此。現(xiàn)在無論是 OpenAI 內(nèi)部還是外部的工程師都在告訴我:他們?nèi)旌蜷_著 Codex,從不合上筆記本電腦。開會期間若沒讓它運(yùn)行著,簡直就是在浪費(fèi)時間——必須確保 Codex 隨時在為我處理工作。

  這確實(shí)很酷也很令人興奮,但反過來說,要管理這些智能體、確保它們持續(xù)運(yùn)轉(zhuǎn)本身也是個龐大的工作量?;氐絼偛耪f的每天 30 次使用頻率,我們觀察 Codex 用戶的使用數(shù)據(jù)也大致在這個區(qū)間。但在我看來,AI 本應(yīng)每天為我們提供上萬次幫助——只要算力允許,這個目標(biāo)終將實(shí)現(xiàn)。問題在于,即便像我這樣專門研究這個領(lǐng)域的人,明知該用 AI 處理所有事務(wù),但我實(shí)在太懶,懶得敲那么多提示詞;也缺乏足夠的創(chuàng)意去發(fā)掘 AI 能幫忙的所有場景。結(jié)果我的使用頻率和你相差無幾。

  直到現(xiàn)在,當(dāng)我用 AI 完成像準(zhǔn)備這次對話這樣有趣的任務(wù)時,還會暗自得意:“不錯,又解鎖了 AI 的新用法?!边@對你我這樣熱衷此道的人倒無妨,但我們不能指望普通人為享受通用人工智能的紅利而付出太多學(xué)習(xí)成本。

  理想狀態(tài)應(yīng)該是:使用 AI 無需琢磨提示詞技巧,它就該簡單到不費(fèi)吹灰之力;你甚至無需意識到需要 AI 幫助,它自會理解你的處境,適時給予貼心的協(xié)助。

  主持人:這正是我認(rèn)為 Claude 做得好的地方——他們針對法律、Excel 等場景推出了定制化版本,讓用戶能直接上手建立 DCF 模型(雖然我對模型不感冒,但不得不承認(rèn)比過去的操作強(qiáng)多了)。那么你認(rèn)為你的職責(zé)是否就是將提示詞和人工操作產(chǎn)品化,從而消除這一瓶頸?

  Alexander:沒錯,這正是我們要做的——既要確保模型具備卓越能力,最終更要讓 AI 高度產(chǎn)品化,可能是神奇的對話框、語音輸入,甚至直接加入群聊就能自動提供幫助。

  不過中間階段其實(shí)藏著更深的門道,我認(rèn)為當(dāng)前最大的價值恰恰就藏在這個過渡期。具體來說,你可以嘗試針對特定市場將 AI 的某個功能產(chǎn)品化,雖然很多公司都在這么做,但真正找準(zhǔn)有效形態(tài)并不容易。之前你播客有位嘉賓說得特別在理:企業(yè)沒有付費(fèi)門檻根本沒法落地 AI。

  主持人:對,就是 Invisible AI 的 Matt Fitzpatrick 提到的這個觀點(diǎn)。

  Alexander:確實(shí),從財(cái)務(wù)角度看是這樣,但我其實(shí)完全不同意企業(yè)級優(yōu)先的自動化路徑。

  我認(rèn)為當(dāng)前最重要的是為真實(shí)用戶打造工具。正如 Matt 在播客中提到的,通過全職員工構(gòu)建自動化流程當(dāng)然可行,但這會受制于自上而下的視角局限和人力配置的邊界。

  而我憧憬的 AI 未來,是讓每個人都成為被 AI 賦能的超級個體。要實(shí)現(xiàn)這個愿景,我們需要打造面向個人用戶、能讓所有人輕松上手的工具。當(dāng)前最有趣的階段,恰恰是為那些熱衷于探索 AI 應(yīng)用場景的先行者構(gòu)建工具。回想 Cognition 的 Code 工具初次發(fā)布時的精妙之處,正是提供了一個能在終端中無縫使用的開放工具,激發(fā)用戶自發(fā)探索應(yīng)用場景。這啟示我們,在將 AI 拓展到編程之外的工作領(lǐng)域時,最重要的不是過度定制垂直場景工具,而是打造足夠開放的創(chuàng)作平臺,讓用戶能針對任何任務(wù)進(jìn)行創(chuàng)造性應(yīng)用。

  智能體開發(fā)的三個階段

  主持人:但這不就把責(zé)任和精力又推回給用戶了嗎?這恰恰回到了你之前說的“人類行動瓶頸”問題——如果連任務(wù)都不定義,等于把定義權(quán)完全交給了人類,而人類既缺乏這種定義能力,也缺少這樣做的意愿。

  Alexander:是的,我是這么認(rèn)為的,這也是我覺得它是瓶頸所在的原因。

  在我看來,整個過程基本分為三個階段:首先,先讓智能體在軟件工程和編碼領(lǐng)域做到足夠出色,因?yàn)榇笳Z言模型本身就擅長這方面;其次,我們會意識到,要讓智能體在更廣泛的場景中發(fā)揮作用,讓它能夠操作計(jì)算機(jī)是非常有價值的,同時我們也會發(fā)現(xiàn),所有智能體本質(zhì)上其實(shí)都是編碼智能體,因?yàn)榫幋a是智能體使用計(jì)算機(jī)的最佳方式。

  所以我們可以沿用這個極具靈活性的思路,把它開放給所有樂于探索和嘗試的人,我們已經(jīng)看到有人開始通過類似 Codex 這類應(yīng)用這么做了,這類應(yīng)用原本是為開發(fā)者設(shè)計(jì)的,但開發(fā)者們卻用它來完成各種非編碼類的任務(wù);最后,等我們驗(yàn)證出有效的方案后,就進(jìn)行你所說的產(chǎn)品化,打造出功能高度專一、用戶能夠開箱即用的產(chǎn)品。我認(rèn)為我們會在未來幾個月里快速走完這一整個過程。

  主持人:你剛才提到的關(guān)于企業(yè)內(nèi)全職員工部署和實(shí)施的問題,關(guān)鍵還在于數(shù)據(jù)安全敏感性、權(quán)限配置和訪問條款——這些實(shí)際操作難如登天,而大多數(shù)人其實(shí)并沒有我們想象的那么聰明和自信。尤其是在大型企業(yè)環(huán)境中更是如此。我認(rèn)為確實(shí)需要全職員工深入介入,為各種橫向解決方案進(jìn)行定制化適配才能落地運(yùn)行。我錯了嗎?

  Alexander:我覺得你的判斷是對的。如果你一開始就試圖從零直接跳到一,腦子里又有一個宏大的愿景——比如構(gòu)建一個覆蓋所有流程的終極自動化系統(tǒng)——那確實(shí)會立刻撞上大量現(xiàn)實(shí)障礙。

  我這里并不是貶義地說“宏大”,而是說這類項(xiàng)目不可避免地要處理安全、合規(guī)等問題,而這些問題都是真實(shí)存在的。你還需要打通各種數(shù)據(jù)系統(tǒng)、系統(tǒng)記錄、執(zhí)行系統(tǒng)等等。要完成這些,你基本上需要一個完整的、企業(yè)級的 IT 或數(shù)據(jù)基礎(chǔ)設(shè)施團(tuán)隊(duì)來支撐。

  但我們觀察到,如果完全采用這種自上而下(top-down)的方式,結(jié)果往往是:嚴(yán)重低估、甚至浪費(fèi)了 AI 在幫助企業(yè)中的潛力。

  相比之下,更好的方式可能是并行推進(jìn)。一方面繼續(xù)解決系統(tǒng)層面的難題,另一方面,把 AI 先交到真正干活的人手里——那些每天在一線工作的員工。

  當(dāng)員工開始實(shí)際使用 AI,他們會逐漸建立起一種“心理模型”,理解 AI 能幫自己做什么、不能做什么。然后,他們會自然地把 AI 拉進(jìn)自己的工作流中。

  我舉個例子:假設(shè)你在做客服工作,公司開始用 AI 自動化你工作中一些重要環(huán)節(jié),但你自己從來沒用過 ChatGPT,甚至被禁止使用。那么在這種情況下,你對“AI 到底是什么”是沒有直覺的。

  但如果是在另一種世界里,你一邊日常使用 ChatGPT 工作,一邊看到 LLM 正在自動化你的一部分任務(wù),那你對 AI 的理解會深刻得多。你會覺得自己是被“加速”的,是有控制權(quán)的,甚至能影響自動化往哪個方向發(fā)展,而不是被一個“從天而降的黑箱系統(tǒng)”所取代。后者其實(shí)是非常令人無力的。

  所以回到你提的問題:你提到的數(shù)據(jù)控制問題確實(shí)存在,也非?,F(xiàn)實(shí)。但歸根結(jié)底,每一個工具、每一個功能、每一個工作流,最終都是服務(wù)于某個具體的人——某個員工。而這些員工,最終都是通過瀏覽器、文件系統(tǒng)等接口在使用工具。換句話說,一切最終都會收斂到一個“界面”,而這個界面是可以被運(yùn)行在本地計(jì)算機(jī)上的智能體(agent)所操作的。這也是為什么 OpenAI 會去做一件在外界看來有點(diǎn)“反?!钡氖隆?strong>我們在構(gòu)建自己的瀏覽器(Atlas)。

  你可能會問為什么要這么做,原因有很多,但其中一個關(guān)鍵原因是:當(dāng)我們從端到端嚴(yán)格控制瀏覽器時,就能為企業(yè)構(gòu)建安全的、可控的智能體式瀏覽體驗(yàn)。

  這樣,智能體就可以“代理式”地訪問那些企業(yè)還沒有通過 API 或 FD(功能部門)完全開放的系統(tǒng)和流程。

  GPT-5.3 Codex效率大幅提升,

  我們?nèi)绾巫龅降模?/strong>

  主持人:你之前提到,有些工程師甚至不愿意合上電腦,因?yàn)樗麄儾幌胫袛嘤?Codex 構(gòu)建的效率。你們和 Cerebras 建立了合作,而 Cerebras 目前被認(rèn)為是推理速度最快的算力提供方之一。這是一次非常漂亮的合作。那么,推理速度對使用 Codex 的開發(fā)者到底有多重要?

  Alexander:簡單來說:非常重要。

  主持人:那這會不會形成一種“推理能力的壟斷”?比如你們現(xiàn)在有了,競爭對手沒有。

  Alexander:這只是我的個人看法,但我不認(rèn)為最終會走向一種壟斷式的格局。市場上的競爭壓力非常大,未來一定會出現(xiàn)多種不同的解決方案。

  不過我可以透露的是:關(guān)于這次合作,我們很快會有新消息公布,而且我對此非常興奮。這些東西一旦上線,會非常棒。

  即便不談硬件合作,僅從模型本身來看,比如 GPT-5.3 Codex,相比之前的模型,在效率上已經(jīng)有了顯著提升。我們收到的反饋是:開發(fā)者明顯感覺到它比以前快得多,而且是“有競爭力的快”。此外,你還可以在多個層面做優(yōu)化:模型本身的效率以及推理方式的改進(jìn)。

  舉個具體的例子:我們最近在 API 層面做了一次更新,相關(guān)模型的響應(yīng)速度提升了大約40%;而在 Codex 產(chǎn)品里,速度也提升了大約25%。所以,速度真的很重要,我們基本是在硬件、推理方式、模型層三個方向同時推進(jìn)。

  主持人:你剛才提到把 AI 交到用戶手里,這讓我想到推理成本的問題。我有位朋友 Jason Lemkin(來自 SaaStr)提出一個觀點(diǎn):“推理就是新的銷售和市場”。意思是說,與其養(yǎng)龐大的銷售和市場團(tuán)隊(duì),不如把錢花在推理上,讓用戶更快上手、看到價值,最終甚至不再需要傳統(tǒng)的銷售和市場團(tuán)隊(duì)。這有點(diǎn)像下一代的 PLG(產(chǎn)品驅(qū)動增長)。你怎么看?

  Alexander:說實(shí)話,我對這個觀點(diǎn)是有些保留的。在這樣一個“人人都能構(gòu)建產(chǎn)品、構(gòu)建門檻越來越低”的世界里,真正困難的事情并沒有消失。什么是難的?是與客戶建立真正良好的關(guān)系 并理解他們真正需要什么。

  而且我認(rèn)為,這些事情甚至比以前更難了,因?yàn)槭袌錾系倪x擇變得更多、軟件數(shù)量爆炸式增長。

  另外,構(gòu)建“正確的東西”和“高質(zhì)量的東西”依然非常難。

  所以回到銷售和市場這個問題,我并不認(rèn)為它們會消失。相反,隨著市場競爭加劇,它們的難度其實(shí)是在上升的,而不是下降。

  在 OpenAI,

  很多人不再打開 IDE 了

  主持人:能不能聊點(diǎn)更具體的?比如在 OpenAI 內(nèi)部,現(xiàn)在有多少代碼是由 Codex 生成的?我記得之前 Claude for Work 的負(fù)責(zé)人 Boris 說他們內(nèi)部幾乎 100% 都是 AI 寫代碼。

  Alexander:我先說我個人的感受,再說團(tuán)隊(duì)整體情況?;旧希艺J(rèn)識的大多數(shù)人現(xiàn)在已經(jīng)很少再打開傳統(tǒng)代碼編輯器了。

  這種變化是逐步發(fā)生的,但一個非常明顯的“拐點(diǎn)”出現(xiàn)在GPT-5.2 Codex發(fā)布之后。那一代模型突然在以下幾個方面變得非常強(qiáng):

  能持續(xù)運(yùn)行更長時間

  能端到端完成任務(wù)

  能管理上下文

  能更好地遵循指令

  這也是我們后來決定做 Codex App 的重要原因之一。在 GPT-5.2 Codex 之前,我們更多是在用 AI 做自動補(bǔ)全 或者“結(jié)對編程”(pair programming)。 那時候,你仍然需要坐在電腦前,手放在鍵盤上,AI 可能幫你做一點(diǎn)點(diǎn)事情,但整體節(jié)奏還是你在“開車”。

  而從 2024 年 12 月 GPT-5.2 Codex 開始,我們切換到了一種完全不同的工作方式:我不再和 AI 一起寫代碼,而是把整個任務(wù)直接委托給它。流程變成了一起制定計(jì)劃、確認(rèn)規(guī)格、然后我就“放手讓它跑”

  這是一次非常本質(zhì)的轉(zhuǎn)變。

  這也是為什么我們在上周發(fā)布了 Codex App——我們想打造一種更適合“委托(delegation)”而不是“結(jié)對”的產(chǎn)品形態(tài),讓你可以同時把任務(wù)分配給多個智能體。

  即便在 OpenAI 內(nèi)部,這種變化也非常劇烈。我沒有一個精確的百分比數(shù)據(jù),但可以說:絕大多數(shù)代碼現(xiàn)在都是由 AI 寫的。很多人甚至不再打開 IDE。即便打開,更多也是為了設(shè)計(jì)模塊之間的接口 或協(xié)助規(guī)劃方案, 真正的代碼實(shí)現(xiàn),已經(jīng)不再由人類直接完成了。

  Codex App 為什么

  不是一個傳統(tǒng) IDE?

  主持人:那你覺得 24 個月后,IDE 還會是開發(fā)棧的一部分嗎?

  Alexander:這要看你怎么定義 IDE?!凹砷_發(fā)環(huán)境”這個詞本身就非常模糊,幾乎什么都能算 IDE。如果按這個定義,那你甚至可以說 Codex App 也是 IDE。但我個人并不這么看。在我心里,IDE 是一個極其強(qiáng)大的編輯器。而我們在設(shè)計(jì) Codex App 時,刻意沒有加入文本編輯功能,就是為了讓使用方式足夠清晰。

  Codex App 的核心能力在于:管理多個智能體、委托任務(wù)以及審查變更。它還有一個非常顯眼的“Skills”系統(tǒng),這是一個開放標(biāo)準(zhǔn),能支持大量非編碼任務(wù),比如:任務(wù)分流和部署監(jiān)控。但它沒有文本編輯器,這是我們有意為之的設(shè)計(jì)選擇。

  主持人:如果大量代碼都是由 Codex 生成的,那你們內(nèi)部現(xiàn)在是怎么做代碼審查的?AI 會參與內(nèi)部的代碼審查嗎?

  Alexander:這里其實(shí)有幾個層面。首先,你想做什么這件事的“規(guī)格說明(spec)”或“計(jì)劃(plan)”,變得前所未有地重要。你需要從架構(gòu)層面去思考:這段代碼應(yīng)該如何工作。最近我們上線了一個非常重要的“計(jì)劃模式(Plan Mode)”。它的工作方式和其他系統(tǒng)不太一樣:智能體會先獨(dú)立提出一個完整的執(zhí)行方案,通常是一個相當(dāng)長、相當(dāng)詳細(xì)的計(jì)劃,然后再回來問你:

  你是否同意這種實(shí)現(xiàn)方式? 是否希望對某些部分提出修改意見?

  這其實(shí)非常像現(xiàn)實(shí)中的場景:假設(shè)你招了一個剛加入團(tuán)隊(duì)、對代碼庫還不熟的新工程師。在正式開始寫代碼之前,他需要先向團(tuán)隊(duì)提交一份類似 RFC(Request for Comments)的方案,征求大家的意見。所以,即便這還不是傳統(tǒng)意義上的代碼審查,但“對計(jì)劃的審查”正在變得越來越重要。這是因?yàn)槲覀円呀?jīng)進(jìn)入了一個更偏向“委托(delegation)”而不是“協(xié)作編寫”的工作階段。

  這一點(diǎn)往往被低估了。接下來才是更傳統(tǒng)意義上的代碼審查。我聽到的一個非常常見的問題,尤其是在開源社區(qū),是所謂的“AI 垃圾代碼(AI slop)”。很多人直接把 AI 生成的代碼提交成 PR,這些 PR 質(zhì)量很差,提交者可能根本沒有測試過,甚至沒有真正審過代碼。這是一個真實(shí)存在的問題。

  因此,在使用 Codex 時,一個非常常見的做法是:讓 Codex 審查它自己生成的 PR 或代碼改動。而 Codex 在這方面表現(xiàn)得非常好。我們是明確訓(xùn)練過模型去做代碼審查的。訓(xùn)練目標(biāo)包括:給出高信噪比的反饋、盡量減少“誤報式批評”(false positives)。這意味著:當(dāng) Codex 提出修改意見時,你是可以高度信任它的。

  所以在 OpenAI 內(nèi)部,以及我們推薦給外部用戶的做法是:主動讓 Codex 做代碼審查,甚至可以設(shè)置為自動審查。

  事實(shí)上,在 OpenAI,幾乎所有代碼在推送到主倉庫時,都會自動經(jīng)過 Codex 的審查。一個挺有意思的現(xiàn)象是:有些人為了“測試模型有多強(qiáng)”,會讓 Codex 去審查其他模型寫的代碼。結(jié)果往往是:“好吧,那我可能干脆直接用 Codex 寫代碼算了?!?/strong>

  主持人:你剛才提到,對于那些還沒用過 Codex,或者很久沒回來用的用戶,你怎么看“留存”這件事?我記得 YC 合伙人 Tom Blomfield 之前發(fā)過一條推文,提到不同代碼智能體之間的切換成本——不管是 Cursor、Claude Code 還是 Codex。在這種情況下,用戶到底有多“黏”?你們是如何思考留存的?

  Alexander:我們在 Codex 上采取了一種相當(dāng)反直覺的策略把它做得盡可能開放。比如 Codex 的核心執(zhí)行框架(harness)是開源的,我們一直在努力降低用戶在不同工具之間切換的成本。舉個例子:去年我們剛發(fā)布 Codex 時,做了一件很簡單的事——我們只是“確立”了一個約定,而不是強(qiáng)推一個品牌化標(biāo)準(zhǔn)。這個約定叫agents.md。它是一個文件,你可以在里面寫給智能體的指令。

  我們刻意沒有叫它codex.md,而是希望它成為一個所有智能體都能用的通用約定?,F(xiàn)在,幾乎所有智能體都在使用agents.md,這其實(shí)是一件很棒的事情。就在上周,我們還推動了另一件事:把Skills(技能)——也就是給智能體用的腳本和指令——放進(jìn)一個中性的目錄里,叫agents/,而不是放進(jìn)codex/這樣的私有命名空間。

  同樣,除了“那個熟悉的例外”,大家基本都跟進(jìn)了。從開發(fā)者角度來說,這意味著:選擇更多 并且試錯成本更低。當(dāng)然,目前來看,代碼生成這類任務(wù)本身是高度“封閉”的(hermetic)。你可以把它理解成美劇里的“單元劇”:智能體讀取一個通用的 agents 文件、使用通用的 skills、生成一個補(bǔ)丁、補(bǔ)丁提交進(jìn) Git。

  從輸入到輸出,都是高度廠商中立的,所以切換成本很低。但未來會發(fā)生變化。當(dāng)智能體不再只是寫代碼,而是開始接入 Sentry、操作 Google Docs 或連接企業(yè)內(nèi)部系統(tǒng),這時,“連接某個系統(tǒng)”本身就變成了一次高度粘性的決策。尤其在企業(yè)場景下,你必須信任:智能體能訪問這些系統(tǒng),同時又有足夠嚴(yán)格的安全護(hù)欄、沙箱和權(quán)限控制。而這些事情,你是不愿意反復(fù)做很多次的。

  所以我們在構(gòu)建 Codex 時,其實(shí)已經(jīng)提前預(yù)判了這一階段的到來。這也是為什么我們采用了極其保守的沙箱策略——本質(zhì)上是操作系統(tǒng)級別的控制。我個人很喜歡一本書叫《Seven Powers》,講的是企業(yè)構(gòu)建長期價值和可持續(xù)性的七種方式,其中之一就是“留存與黏性”。但對我們來說,這件事的優(yōu)先級其實(shí)有點(diǎn)不一樣。

  “贏”的決定性因素:

  算力優(yōu)勢 + 最好的模型

  主持人:但如果從商業(yè)角度看,你們肯定還是會關(guān)心:如何讓用戶留在 Codex,而不是在 Cursor 或 Claude Code 出現(xiàn)更好模型時立刻切走?

  Alexander:這是個很好的問題。當(dāng)然,我們是在經(jīng)營一家公司,但從根本上說,我們的使命是“安全地把 AGI 的收益帶給全人類”。所以對很多人來說很反直覺的一點(diǎn)是:我們花了巨大的精力訓(xùn)練模型,然后把這些模型提供給競爭對手使用。我知道,從風(fēng)險投資的視角來看,這幾乎是難以理解的。

  主持人:這在 VC 視角里確實(shí)非常反常。

  Alexander:是的,但這正是 OpenAI 非常獨(dú)特的地方。我們在玩一場極其長期的博弈。當(dāng)競爭對手變強(qiáng)時,我們是能學(xué)到東西的,這反而對我們有幫助。如果他們是封閉的、黑箱式地進(jìn)步,我們反而學(xué)不到。

  舉個例子:今天早上我還轉(zhuǎn)推了 Warp 的一個新發(fā)布。我和他們沒有任何商業(yè)關(guān)系,但他們在“云端 + 本地智能體協(xié)作”這件事上的一些設(shè)計(jì)思路,真的很有啟發(fā)性。這個領(lǐng)域有意思的地方就在于:大家在不同公司、不同路徑上,正在同時得出相似的結(jié)論,然后把它們實(shí)現(xiàn)出來。

  當(dāng)然,從現(xiàn)實(shí)角度講,我們也并不是沒有優(yōu)勢:ChatGPT 帶來的巨大分發(fā)優(yōu)勢、自研模型與自有執(zhí)行框架的深度耦合、對新模型的提前訪問權(quán)。所以我們確實(shí)是在“為了贏而競爭”,而且我們有很多優(yōu)勢。但與此同時,我們也在堅(jiān)持把模型服務(wù)提供給整個生態(tài),同時推動開放標(biāo)準(zhǔn)。

  主持人:如果一定要用投資語言來問一句:最終決定勝負(fù)的關(guān)鍵是什么?是 GTM?是品牌?是產(chǎn)品執(zhí)行?還是算力和推理速度?

  Alexander:如果從公司整體角度說——當(dāng)然這已經(jīng)遠(yuǎn)遠(yuǎn)超出我的職級了——我會說是:算力優(yōu)勢 + 最好的模型。

  為了實(shí)現(xiàn)這一點(diǎn),我們需要成功的商業(yè)模式來支撐持續(xù)投入。而 Codex 這種“研究 + 產(chǎn)品”高度融合的團(tuán)隊(duì),其實(shí)會反過來倒逼模型進(jìn)步得更快。但如果從產(chǎn)品層面來說,我認(rèn)為最重要的一點(diǎn)只有一個:做出一個真正好用、讓人愿意用的產(chǎn)品。我們一直強(qiáng)調(diào)先服務(wù)好個人,讓人真正“熟練”地使用這些工具,再自然地把自動化引入工作流。這條路徑看起來有點(diǎn)反直覺,但我認(rèn)為它的長期影響力會更大。至于企業(yè)市場,GTM 非常重要。我學(xué)到的一個慘痛教訓(xùn)是:你不能只是對企業(yè)說一句“你們隨便用吧”。

  你需要做大量教育、支持復(fù)雜配置、和負(fù)責(zé)人(比如開發(fā)者體驗(yàn)負(fù)責(zé)人)一起設(shè)計(jì)工作方式,再把這種工作方式復(fù)制到整個組織中。

  主持人:那你們內(nèi)部衡量成功的核心指標(biāo)是什么?是收入嗎?

  Alexander:不是。最核心的指標(biāo)是活躍用戶數(shù)。

  主持人:具體是 DAU 還是 WAU?

  Alexander:目前我們主要看 WAU(周活躍用戶)。標(biāo)準(zhǔn)是:這個人是否真的在產(chǎn)品里完成過一次交互,比如發(fā)送過一個 prompt。

  主持人:如果 Codex 是要替代 IDE 的,DAU 會不會更合理?

  Alexander:我同意。DAU 很快會更合理。我們現(xiàn)在用 WAU,更多是歷史原因。我理想中的狀態(tài)是:任何一個任務(wù),你的第一反應(yīng)都是“讓一個智能體來幫我”。

  就像查信息打卡 Google,問問題打開 ChatGPT。

  下一階段是人們做任何事先打開一個輸入框,然后智能體開始行動,哪怕它只幫你完成其中一小步。

  主持人:你認(rèn)為 Chat 會成為 AI 與人類交互的長期主界面嗎?

  Alexander:簡短答案是:會。

  但更準(zhǔn)確地說,是“對話界面 + 專用界面”的組合。如果你看科幻電影,未來的 AI 往往是一個你可以用任何方式、聊任何事的存在。你不應(yīng)該需要區(qū)分這是我的編程 AI 或者這是我的銷售 AI。

  你只是“跟一個東西說話”,它就會幫你。但對高階用戶來說,只靠聊天會很煩。就像你有一個助理,但你所有事情都必須通過“對話”才能完成,那是低效的。

  所以最終形態(tài)會是 Chat / 語音作為通用入口,針對不同角色的專用 GUI。比如我:用聊天做播客準(zhǔn)備,用 Codex App 深入看代碼。而一個市場人員用聊天問產(chǎn)品問題,用專門的分析界面看廣告數(shù)據(jù)。

  構(gòu)建高質(zhì)量代碼模型的

  數(shù)據(jù)是充足的

  主持人:我在 LinkedIn 上提到過這檔節(jié)目,有一位來自另一家公司的優(yōu)秀投資人留言說——

  他用了一個“哈利·波特”的比喻,說某家公司就像伏地魔,“那個不能被提及名字的人”。他說:“你應(yīng)該問問他,代碼數(shù)據(jù)的護(hù)城河到底怎么看?現(xiàn)在是不是 Anthropic 已經(jīng)拿走了所有數(shù)據(jù)?”

  Alexander:從我們目前看到的情況來看——當(dāng)然,這一點(diǎn)我也會更多地參考我們研究團(tuán)隊(duì)的判斷——我們認(rèn)為用于構(gòu)建高質(zhì)量代碼模型的數(shù)據(jù)是充足的。我反而覺得,現(xiàn)在更有意思、也更困難的數(shù)據(jù)來源,在于知識型工作(knowledge work)任務(wù)。這類數(shù)據(jù)在互聯(lián)網(wǎng)上幾乎不存在,比如戰(zhàn)略分析、復(fù)雜決策、跨角色協(xié)作,實(shí)際業(yè)務(wù)判斷過程。

  所以你會開始產(chǎn)生一些很有意思的想法,比如:是否需要付費(fèi)讓人去“模擬完成任務(wù)”,從而學(xué)習(xí)這些完整的任務(wù)軌跡,是否應(yīng)該收購一些已經(jīng)倒閉、但沉淀了大量協(xié)作數(shù)據(jù)的公司,比如使用 Slack 的組織。總體來說,知識型工作的任務(wù)分布,比編碼復(fù)雜得多,也稀缺得多。

  主持人:既然這些數(shù)據(jù)如此稀缺,那你們?nèi)绾慰创蛿?shù)據(jù)服務(wù)商的關(guān)系?比如 McCor、Turing、Invisible、Scale 這類公司。你們會在這方面投入 10 倍資源,還是反而覺得“數(shù)據(jù)太貴了,不如自己做”?

  Alexander:我們的判斷標(biāo)準(zhǔn)其實(shí)只有一個:哪種方式能讓我們跑得最快。在內(nèi)部搭建完整的數(shù)據(jù)采集體系,時間成本和人力成本都非常高,而我們是一個相對精干的小團(tuán)隊(duì)。所以到目前為止,我的觀察是:一旦我們需要大規(guī)模跑數(shù)據(jù)項(xiàng)目,通常會選擇和這些公司合作,把精力集中在模型和產(chǎn)品本身。

  Codex 會走向低端消費(fèi)者市場嗎?

  主持人:在消費(fèi)端,Codex 會不會和 Lovable、Replit 這類工具正面競爭?比如一年或兩年后,是否會下沉到“任何人都能做一個 about me 頁面或小企業(yè)網(wǎng)站”的層級?

  Alexander:目前來看,我們并不覺得自己在和它們直接競爭。如果你看過我們的超級碗廣告,口號是:“You can just build things.”(你可以直接開始構(gòu)建)。通過這個應(yīng)用,我們注意到:越來越多技術(shù)背景不強(qiáng)的人,也開始用 Codex 來做東西了。他們做的事情通常很“Hello World”級別,但確實(shí)在發(fā)生。而且我們最近有一個很大的變化:開始向免費(fèi) ChatGPT 用戶和 Go 計(jì)劃用戶提供部分 Codex 功能。這在“可用性”層面是一次巨大的擴(kuò)展。所以我確實(shí)預(yù)期,會有一些用戶原本可能會去用專門的低代碼工具,但現(xiàn)在因?yàn)?Codex 就在他們手邊,于是直接用 Codex 做一些簡單的構(gòu)建。

  主持人:如果讓你說一件“最想做得不一樣、但目前還沒法做的事”,會是什么?

  Alexander:這是個有意思的問題。老實(shí)說,最近這幾周對我們來說非常好,我對當(dāng)前發(fā)生的一切都挺興奮的。

  主持人:這種“風(fēng)向變化”的感覺,團(tuán)隊(duì)內(nèi)部能明顯感受到嗎?

  Alexander:絕對能。我們對這種變化非常敏感。如果回看 Codex 的歷史:去年我們第一個發(fā)布的產(chǎn)品,是一個聽起來非常驚艷的想法——給每個智能體一臺云端電腦,可以并行完成任務(wù)

  坦白說,它并沒有像我們后來發(fā)布的產(chǎn)品那樣成功。從去年 8 月 GPT-5 之后,我們開始全力推進(jìn)交互式編程,而這正是當(dāng)下市場競爭最激烈的方向。公開數(shù)據(jù)上看從 8 月開始,我們大約增長了 20 倍,到年底,又幾乎翻了一倍。但真正的變化發(fā)生在上周。我們一直認(rèn)為自己擁有最智能的模型(Codex 5.3),但用戶反饋是模型偏慢、不夠“好玩” 、在工作過程中溝通感不強(qiáng)

  我們正面解決了這些問題。

  即便對比某個在我們之前 20 分鐘發(fā)布、短暫“state-of-the-art”的競品模型,我們也明顯感覺到了變化。

  同時,我們一直被詬病的一點(diǎn)是:IDE 插件體驗(yàn)很好,但 CLI(命令行)不夠精致。而現(xiàn)在這個 App 的反饋幾乎是一邊倒的正向評價——簡單、直覺,甚至“出乎意料地簡單”。很多曾經(jīng)的批評者也被轉(zhuǎn)化成了用戶。再加上超級碗廣告、免費(fèi)開放策略——所以回到你的問題,我現(xiàn)在最想做的兩件事是:

  第一,我想重新回到云端智能體(cloud agent)。去年我們從云端轉(zhuǎn)向交互式編程,是一個非常理性的決策:如果用戶還不能流暢地使用工具、還不能簡單地讓它跑起來,就貿(mào)然推進(jìn)自動化工作流,那只會變成“只有極少數(shù)高級用戶能用的空想”。

  但現(xiàn)在不一樣了。當(dāng)用戶每天都在用、每次使用都會配置得更好,那么讓它獨(dú)立在云端運(yùn)行,就不再是一個巨大跨越。

  第二,是關(guān)注真正的瓶頸?,F(xiàn)在,寫代碼本身幾乎已經(jīng)變得“廉價”。真正難的是:如何做代碼評審、如何判斷質(zhì)量以及如何確認(rèn)方向是對的。這些問題仍然被嚴(yán)重低估、投入不足。

  我的目標(biāo)是:最終讓一個你信任的智能體,可以端到端負(fù)責(zé)一個微服務(wù)或內(nèi)部工具,完成完整的迭代閉環(huán),甚至直接接收用戶反饋,而不需要人類審查。這在智能、在安全、在控制層面,都是極其困難的問題。

  市場終局:少數(shù)超級智能體,

  而不是十幾個工具

  主持人:你認(rèn)為 Benchmark 和評測到底該占多大權(quán)重?

  Alexander:這是個可能讓你不太滿意的答案:兩者都重要。Benchmark 能很好地衡量“智能水平”,尤其是在評測還沒被刷爆之前,進(jìn)步非常有參考價值。但你必須把它和使用體驗(yàn)結(jié)合起來。而體驗(yàn),本質(zhì)上是“感覺(vibes)”。不管是內(nèi)部同事還是客戶,我總是驚訝于:人們對模型的評價有多么依賴感覺。人生本來就很“vibes based”。我對孩子說的教訓(xùn)是:人們更愿意和他們喜歡的人一起工作。

  主持人:投資角度看,你如何判斷這個市場的最終形態(tài)?

  Alexander:我認(rèn)為,最終會是更少的玩家,捕獲更多的價值。我們現(xiàn)在處在一個“過渡期”:目前真正實(shí)現(xiàn)產(chǎn)品市場匹配的,幾乎只有編碼智能體。但這是暫時的。長期來看,智能體會變成什么都能幫你做的超級助手。

  在那樣的世界里你不會希望公司里有 12 個不同的智能體,讓員工自己去想“該和誰說話” 。那樣他們就無法形成熟練度,也就無法真正把自動化融入工作。相反,如果你只有一個可以聊任何事情的智能體,員工的 onboarding 就是一句話:“有事就找它。” 它會成為工作的重力中心。

  我以前在 Dropbox 工作。在 Slack 崛起之前,我們曾討論過:人們是該在文檔里評論,還是去 Slack 里討論?文檔內(nèi)評論更高效,但現(xiàn)實(shí)是:Slack 成了溝通的中心引力場。哪怕效率更低,人們也更愿意在那里交流。我認(rèn)為,未來的智能體,也會發(fā)生同樣的事情。

  SaaS 是否會被模型公司“吃掉”?

  主持人:現(xiàn)在的人才爭奪有多激烈?我常對公司說:與其在舊金山,不如在歐洲建團(tuán)隊(duì),因?yàn)?SF 的人才又貴又難留。我錯了嗎?

  Alexander:人才戰(zhàn)爭現(xiàn)在非常激烈。即便是在OpenAI,我們品牌很強(qiáng),也依然要花大量精力去“贏下”心儀的候選人。沒人是“免費(fèi)送上門”的。

  主持人:在股權(quán)定價下,最頂尖的人才還覺得有吸引力嗎?

  Alexander:目前沒有人向我表達(dá)過相反的看法

  主持人:你剛才提到,目前智能體真正大規(guī)模使用的場景,主要還是編碼,少量擴(kuò)展到比如客服。但從投資角度看,我今天在尋找那些能長期積累價值、為客戶持續(xù)提供卓越產(chǎn)品的公司。

  現(xiàn)在市場上有一種很強(qiáng)的觀點(diǎn):大型 SaaS 公司的收入耐久性接近于零,SaaS 已死,因?yàn)槟P吞峁┥蹋銈儭nthropic 等)會“來吃我們的午餐”。 你會如何建議?

  Alexander:我的第一反應(yīng)其實(shí)非常樸素:所有東西最終都是為人服務(wù)的,否則意義何在?

  即便是 SaaS,本質(zhì)上也是為人設(shè)計(jì)的。所以我會反問幾個問題:這家公司是否真正擁有與“人”的關(guān)系? 或者,它是否掌握了一個極其關(guān)鍵的系統(tǒng)記錄(system of record)

  如果答案是“是”,那我并不認(rèn)為這家公司會輕易消失。事實(shí)上,在 AI 時代,這兩點(diǎn)——

  人與系統(tǒng)的交互入口 + 核心記錄系統(tǒng),可能比以往任何時候都更重要。

  反過來,如果一家 SaaS 公司只是一個“膠水層”:不直接面對人也不擁有系統(tǒng)級記錄,那我會更謹(jǐn)慎。我不是這方面的終極專家,但這種公司讓我更不安。

  Alexander:如果基于這種邏輯再看市場,比如SalesforceServiceNow股價下跌 20%、30%、甚至 40%,我認(rèn)為這種反應(yīng)被嚴(yán)重夸大了。

  確實(shí)有一些公司處境艱難。坦率說,我認(rèn)為Dropbox正面臨非常困難的局面。

  但像Monday.com這樣的公司——對其主要用戶群體(大量中小企業(yè)和消費(fèi)者)來說:你能不能用 AI 臨時“vibe coding”一個待辦清單?可以。

  但成本是否劃算?并不劃算

  一個待辦清單的需求本身非常穩(wěn)定、簡單:添加任務(wù)、完成任務(wù)、查看歷史、分配成員。

  并不值得反復(fù)用 AI 定制。所以現(xiàn)實(shí)是:大多數(shù)人會繼續(xù)用現(xiàn)成工具。市場的恐慌情緒,更多是條件反射式的過度反應(yīng)。

  不過我確實(shí)認(rèn)為:客服會成為被強(qiáng)烈沖擊的領(lǐng)域。老實(shí)說,我不太愿意站在那個賽道上。

  給下一代工程師的建議

  主持人:最后,請您回答幾個網(wǎng)友的提問。有位學(xué)生提問是這樣的我是 CS 學(xué)生,在斯坦福 / 劍橋 / ETH。如果我想在未來 5 年成為 AI 生態(tài)中有價值的工程師,你會怎么建議?

  Alexander:說實(shí)話,從未有過比現(xiàn)在更好的時代來當(dāng)工程師。你擁有前所未有強(qiáng)大的工具能快速理解復(fù)雜代碼庫、能讓 AI 幫你規(guī)劃改動,甚至能把過去幾天的研究壓縮到幾個小時。所以首先,你應(yīng)該非常樂觀。

  但問題變成:既然構(gòu)建變得容易,什么變得稀缺?我給出的答案是:主動性(agency)、審美(taste)和質(zhì)量(quality)。

  我的建議只有一句話:去構(gòu)建東西,而且是高質(zhì)量的東西。當(dāng)有人帶著有思想的項(xiàng)目來找我,那比一份標(biāo)準(zhǔn)簡歷有吸引力得多。

  https://www.youtube.com/watch?v=S1rQngjpUdI

  聲明:本文為 AI 前線整理,不代表平臺觀點(diǎn),未經(jīng)許可禁止轉(zhuǎn)載。

  會議推薦

  InfoQ 2026 全年會議規(guī)劃已上線!從 AI Infra 到 Agentic AI,從 AI 工程化到產(chǎn)業(yè)落地,從技術(shù)前沿到行業(yè)應(yīng)用,全面覆蓋 AI 與軟件開發(fā)核心賽道!集結(jié)全球技術(shù)先鋒,拆解真實(shí)生產(chǎn)案例、深挖技術(shù)與產(chǎn)業(yè)落地痛點(diǎn),探索前沿領(lǐng)域、聚焦產(chǎn)業(yè)賦能,獲取實(shí)戰(zhàn)落地方案與前瞻產(chǎn)業(yè)洞察,高效實(shí)現(xiàn)技術(shù)價值轉(zhuǎn)化。把握行業(yè)變革關(guān)鍵節(jié)點(diǎn),搶占 2026 智能升級發(fā)展先機(jī)!

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
新歡就是出軌對象!買超喜當(dāng)爸,當(dāng)年那個“小三”成功上位了

新歡就是出軌對象!買超喜當(dāng)爸,當(dāng)年那個“小三”成功上位了

八斗小先生
2026-03-08 12:25:18
陳立夫:從高官到雞農(nóng),58歲患糖尿病,活102歲的長壽秘訣是什么

陳立夫:從高官到雞農(nóng),58歲患糖尿病,活102歲的長壽秘訣是什么

林雁飛
2026-03-06 14:35:14
三婚又要離,越扒越窒息,他也太渣了!

三婚又要離,越扒越窒息,他也太渣了!

背包旅行
2026-03-07 20:05:55
黎真主黨擊退以空降部隊(duì) 黎方26人死亡

黎真主黨擊退以空降部隊(duì) 黎方26人死亡

財(cái)聯(lián)社
2026-03-07 19:42:09
4換1大戲!湖人這波操作6到飛!他真出事了!

4換1大戲!湖人這波操作6到飛!他真出事了!

體育新角度
2026-03-08 16:38:13
伊朗小學(xué)遭襲致超165人遇難,大多是10歲左右的小女孩,特朗普發(fā)聲:是伊朗干的,伊朗的彈藥襲擊“非常不準(zhǔn)確”

伊朗小學(xué)遭襲致超165人遇難,大多是10歲左右的小女孩,特朗普發(fā)聲:是伊朗干的,伊朗的彈藥襲擊“非常不準(zhǔn)確”

每日經(jīng)濟(jì)新聞
2026-03-08 14:13:38
3天暴跌100元!i茅臺143萬散戶訂單砸盤,黃牛徹底懵了

3天暴跌100元!i茅臺143萬散戶訂單砸盤,黃牛徹底懵了

花小貓的美食日常
2026-03-08 12:21:29
三個人48小時,用了3000元不到,做了部全網(wǎng)5億流量的爆款A(yù)I短劇

三個人48小時,用了3000元不到,做了部全網(wǎng)5億流量的爆款A(yù)I短劇

九千光年
2026-03-06 18:58:09
湖北單親媽媽嫁65歲美國老頭,帶兒子移民美國,婚后14年老頭去世

湖北單親媽媽嫁65歲美國老頭,帶兒子移民美國,婚后14年老頭去世

哄動一時啊
2026-02-09 16:56:31
性壓抑已經(jīng)變態(tài)至此了?

性壓抑已經(jīng)變態(tài)至此了?

黯泉
2026-03-07 11:28:43
我用百度智能云跑OpenClaw,AI幫我24小時盯盤、找黑馬

我用百度智能云跑OpenClaw,AI幫我24小時盯盤、找黑馬

技術(shù)領(lǐng)導(dǎo)力
2026-02-12 14:41:56
張?zhí)m主動招呼汪小菲過去合影!就這一個動作,什么都說明白了!

張?zhí)m主動招呼汪小菲過去合影!就這一個動作,什么都說明白了!

樂悠悠娛樂
2026-03-08 13:47:33
復(fù)星國際股價跌超80%再爆雷,2025年預(yù)虧超200億

復(fù)星國際股價跌超80%再爆雷,2025年預(yù)虧超200億

財(cái)經(jīng)智多星
2026-03-08 08:23:17
準(zhǔn)備同歸于盡!伊朗或啟用“沉睡小組”,在美國本土執(zhí)行斬首行動

準(zhǔn)備同歸于盡!伊朗或啟用“沉睡小組”,在美國本土執(zhí)行斬首行動

滄海旅行家
2026-03-06 18:28:51
澳大利亞驚現(xiàn)封閉亂倫家族:4代人近親繁衍38名成員全是亂倫產(chǎn)物

澳大利亞驚現(xiàn)封閉亂倫家族:4代人近親繁衍38名成員全是亂倫產(chǎn)物

第7情感
2026-02-23 20:45:16
超級大冷!東部第一活塞遭10連敗籃網(wǎng)23分逆轉(zhuǎn) 波特30+13

超級大冷!東部第一活塞遭10連敗籃網(wǎng)23分逆轉(zhuǎn) 波特30+13

醉臥浮生
2026-03-08 09:47:25
從端屎端尿到?jīng)Q絕分手,瞿穎用半年看透他,原來患難不一定見真情

從端屎端尿到?jīng)Q絕分手,瞿穎用半年看透他,原來患難不一定見真情

觀察者海風(fēng)
2026-02-28 19:30:08
1270萬畢業(yè)生搶?shí)?,?nèi)卷學(xué)歷貶值,家長投幾十萬培養(yǎng)破防了,為啥

1270萬畢業(yè)生搶?shí)?,?nèi)卷學(xué)歷貶值,家長投幾十萬培養(yǎng)破防了,為啥

眼光很亮
2026-03-08 01:08:15
男子養(yǎng)豪豬拔刺 每斤刺能賣400元

男子養(yǎng)豪豬拔刺 每斤刺能賣400元

閃電新聞
2026-03-08 00:25:56
請12人吃飯結(jié)賬變四桌,我悄悄結(jié)賬走人,半小時飯店來電:人被扣了,我直接回答:和我沒關(guān)系

請12人吃飯結(jié)賬變四桌,我悄悄結(jié)賬走人,半小時飯店來電:人被扣了,我直接回答:和我沒關(guān)系

奶茶麥子
2026-03-08 00:01:07
2026-03-08 16:55:00
AI前線 incentive-icons
AI前線
面向AI愛好者、開發(fā)者和科學(xué)家,提供AI領(lǐng)域技術(shù)資訊。
1347文章數(shù) 133關(guān)注度
往期回顧 全部

科技要聞

OpenClaw最大的推手是閑魚和小紅書

頭條要聞

伊朗軍方公布"家底":具備打至少6個月高強(qiáng)度戰(zhàn)爭能力

頭條要聞

伊朗軍方公布"家底":具備打至少6個月高強(qiáng)度戰(zhàn)爭能力

體育要聞

大傷后被交易,他說:22歲的我已經(jīng)死了

娛樂要聞

周迅新戀情曝光,李亞鵬等人已成過去

財(cái)經(jīng)要聞

油價要失控?

汽車要聞

9分鐘充飽 全新騰勢Z9GT首搭閃充技術(shù)26.98萬起

態(tài)度原創(chuàng)

教育
旅游
手機(jī)
房產(chǎn)
公開課

教育要聞

第一次考英語四級,如何規(guī)劃復(fù)習(xí)才能順利通過,最好突破550分

旅游要聞

一起去看玉蘭花!這些地方開正好~

手機(jī)要聞

2026年第九周,蘋果iPhone 17系列國內(nèi)銷量近2400萬!

房產(chǎn)要聞

傳統(tǒng)學(xué)區(qū)房熄火?2月??诙址勘鸬陌鍓K竟然是…

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版