国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網易首頁 > 網易號 > 正文 申請入駐

還是谷歌懂程序員?Demis 采訪首提“氛圍編程”,Gemini 3 徹底戒掉“爹味”說教

0
分享至

責編 | 王啟隆

出品丨AI 科技大本營(ID:rgznai100)

谷歌這幾天連發(fā)產品,Gemini 3 余溫還未消退,立刻就把 Nano Banana Pro 這一大殺器祭了出來,而 OpenAI 則是反常的沒有太多動作。

前幾天 Google DeepMind CEO Demis Hassabis 和 Gemini 團隊副總裁 Josh Woodward 進行了一場深度對話,聊到了 Gemini 3 的很多細節(jié)內容。


具體來說,谷歌這次不僅要在模型層面給大家“炫技”,還同時把重點放在了一個更枯燥、但對商業(yè)世界更致命的詞上:效率。

在 AI 領域,有一個公開的秘密:模型越聰明,推理成本就越高。這也是為什么很多所謂的“殺手級應用”至今還停留在 PPT 階段,因為你燒不起那個錢。

谷歌這次干了一件很“谷歌”的事。他們通過極致的“蒸餾技術”(Distillation),硬生生把頂尖模型的運行成本壓到了地板上。當你能在數十億次日均搜索請求中調用 Gemini 3 而不破產時,這游戲規(guī)則就變了。

Demis 在訪談里提到了一個很有意思的觀點:他們在成本與性能的帕累托前沿(Pareto frontier)上保持領先。

這話翻譯成人話就是:比我聰明的沒我便宜,比我便宜的沒我聰明。

另一個很有意思的變化,是模型“人設”的調整。

過去幾年,我們見過太多試圖扮演“知心姐姐”的 AI 了。你問它一個代碼問題,它先夸你思路清奇,再給你熬一碗雞湯,最后才吞吞吐吐地給出答案。

Gemini 3 似乎正在戒掉這種“討好型人格”。


Josh Woodward 提到,新模型變得更“簡潔、切中要點”。這甚至被認為非常適合那些“頭腦封閉”的用戶。我覺得這才是工具該有的樣子。當我想修水管的時候,我不需要扳手跟我談論人生哲理,我只需要它能擰緊螺絲。

這種“去人格化”其實是另一種形式的“極客化”。它不再試圖模仿人類的情感交互,而是專注于成為一個極其高效的信息處理器和邏輯推理機。比如 Demis 提到現(xiàn)在的“氛圍編程”(vibe coding),聽起來很玄乎,其實就是讓 AI 真正理解程序員當下的語境,而不是傻乎乎地補全代碼。

而關于那個終極問題——AGI(通用人工智能)到底什么時候來?

Demis 的回答很誠實,也很克制:5 到 10 年。

在這個人人都在喊“明年就實現(xiàn) AGI”的浮躁當下,這個時間表聽起來甚至有點保守。但他指出的路徑非常清晰:僅僅靠堆算力、堆數據(Scaling Laws)可能不夠了,我們需要一兩個本質上的研究突破。

他在訪談中特別提到了推理(Reasoning)、記憶(Memory)以及世界模型(World Models)。這三個詞,基本上圈定了下一階段 AI 戰(zhàn)爭的主戰(zhàn)場?,F(xiàn)在的模型大多還是“概率鸚鵡”,它們并不真正理解物理世界的因果律。只有當 AI 建立起對這個世界的內在模型,知道“杯子掉在地上會碎”不僅僅是文本里的統(tǒng)計規(guī)律,而是一個物理事實時,我們才算真正摸到了 AGI 的門檻。

今年年末的這一輪發(fā)布,或許標志著谷歌在 AI 戰(zhàn)場上,終于結束了漫長的“防御姿態(tài)”,開始真正揮拳反擊。

以下為對話內容:

主持人:Demis,Josh,歡迎來到 Hard Fork 節(jié)目。

Demis Hassabis:很高興來到這里。

主持人:兩年前,桑達爾·皮查伊跟我們打比方說,Bard 就像一輛經過改裝的本田思域,正在跟一堆超跑賽車。那 Gemini 3 算是什么車?

Josh Woodward:這個問題刁鉆。Demis,你要不來接這招?

Demis Hassabis:我敢打賭它肯定比本田思域快。其實我不太用汽車來打比方,也許它算是一輛那種超酷的直線加速 Top Fuel 賽車吧。

主持人:好吧。現(xiàn)在大家對這個模型都很興奮。我們聽到一些早期測試者的反饋,顯然你們也展示了很多令人印象深刻的基準測試數據。那么具體來說,Gemini 3 能做到哪些以前的 AI 模型做不到的事?

Josh Woodward:我先來吧。有幾點特別突出。

第一,我們開始看到這個模型在推理能力上表現(xiàn)出色,能夠同時思考多個步驟。以前的模型有時候聊著聊著就思緒斷片了,或者跑偏了,這一個就好得多。第二點就是各種全新的生成式界面。這是我們在創(chuàng)建新型交互界面方面最強的模型,它能真正給用戶提供定制化的設計和答案。第三點我覺得是編程,我們在編程本身投入了巨大精力。你會看到很多編程示例,包括像 Google Anti-Gravity 這樣即將推出的新產品展示。

主持人:有種觀點認為,對于普通用戶來說,聊天這個場景已經“解決”得差不多了。也就是說,普通用戶用 Gemini 這樣的產品,幾乎想不出什么問題能問出比上一代模型有質的飛躍的答案。對于 Gemini 3,你們覺得這種說法站得住腳嗎?普通人真的能感覺到差別嗎?

Josh Woodward:我們在測試中看到的一點是——Demis 你也可以補充——這個模型更簡潔、更有表現(xiàn)力。它開始用一種更容易理解的方式呈現(xiàn)信息,我覺得這對大多數人來說是立竿見影的體驗提升。然后更有趣的是這些模型開始與其他類型的信息進行交互

我們經常談論學生如何用它學習,或者在獲得你許可的情況下,它如何連接你其他谷歌產品中的數據。這些方式表明它正在超越傳統(tǒng)的文本問答交互。

Demis Hassabis:對,我想補充的是,你會發(fā)現(xiàn)它在通用事物的可靠性上高得驚人。而且我們在所謂的“人設”(我們內部叫 persona),也就是它的風格上下了很大功夫。我覺得它更簡練,更切中要害,很有幫助。它的風格更好了,跟它頭腦風暴或者使用它的時候,感覺更讓人愉悅。另外,我覺得在某些方面它實現(xiàn)了某種階梯式的跨越,比如“氛圍編程”。最近我重拾了游戲編程的愛好,我打算圣誕假期給自己定幾個小項目,因為我覺得它在前端開發(fā)之類的任務上已經達到了極其有用、極其能干的程度,這可能是以前的版本不太擅長的。

主持人:Demis,上次五月份你來節(jié)目的時候說,你認為我們距離通用人工智能(AGI)還有五到十年,中間可能還需要幾次重大突破?,F(xiàn)在看了 Gemini 3 的表現(xiàn),你的時間表有變化嗎?或者說它包含了你認為必要的那些突破嗎?

Demis Hassabis:沒有,我覺得一切都在完全按計劃進行。我們對這一進展非常滿意。這是個絕對驚艷的模型,完全符合我的預期,也延續(xù)了我們要打造 Gemini 之初設定好的軌跡——這實際上是過去幾年全行業(yè)最快的發(fā)展速度。我們會繼續(xù)保持這個軌跡。

但在那之上,我仍然認為需要這一兩個關鍵點,才能真正實現(xiàn)通用智能所期望的那種全面的一致性。還有在推理和記憶上的改進?;蛟S還需要像世界模型這樣的概念——你知道我們也在做 Simo 和 Genie 這種項目——它們會建立在 Gemini 之上,但在不同維度進行擴展。要完全解決具身智能(physical intelligence)這類問題,其中一些想法是必不可少的。所以我認為兩方面都是真的:我對 Gemini 3 的進展非常滿意,我想大家會感到驚喜;但它也是在我們預期的進度之內。這意味著還要五到十年,并且可能還需要一兩項突破。

主持人:你提到了 Gemini 3 的風格。最近關于 AI 伴侶以及人們與它們建立關系的討論很多。你們如何定位 Gemini 3 的個性?你們希望用戶和它建立什么樣的關系?

Josh Woodward:我想說在 App 里,Casey,我們團隊真的更傾向于把它看作一個工具。它是幫你理清思路、披荊斬棘搞定日常瑣事的東西。無論是在不同類型的問題上協(xié)助你,還是幫你創(chuàng)作,這才是我們看到它發(fā)光發(fā)熱的地方。如果你把視野拉大,看看 Gemini 或者我們的 NotebookLM、Flow 這些項目,我們真的是在思考如何讓 AI 成為你工具箱里的超能力工具,不管是寫作、研究還是做視頻。這是我們的重心。隨著時間推移,我們團隊更感興趣的是追蹤像“我們幫你完成了多少任務”這樣的新指標。這有點像最早期的谷歌搜索:你來了,找到答案或者跳到網頁,然后繼續(xù)你的生活。

主持人:在 Gemini 3 發(fā)布前的日子里,你們的一些競爭對手表現(xiàn)得很緊張。我覺得他們也聽到了同樣的風聲,說這模型相當厲害。輿論可能正在從谷歌在 AI 領域苦苦追趕,轉變?yōu)楝F(xiàn)在處于領跑地位,或者至少是領導者之一。你們覺得谷歌現(xiàn)在在 AI 競賽中領先嗎?

Demis Hassabis:聽著,你們很清楚,這是一個極其慘烈的競爭環(huán)境,可能是史上最激烈的。所以,唯一重要的事情就是你自己的進步速度。這是我們關注的焦點,我們對此很滿意。

我其實不把它看作什么“重奪領先”之類的。我們一直都是這項研究的先驅?,F(xiàn)在的關鍵是要找到節(jié)奏,確保這些研究成果能轉化到下游的所有產品中。我覺得我們已經漸入佳境了。不論是作為谷歌“動力核心”的 DeepMind,還是 Gemini App、NotebookLM 這些 AI 原生產品,亦或是為地圖、YouTube、安卓、搜索這些現(xiàn)有的谷歌產品注入 AI 動力,甚至是以 AI 為先的視角重新構想它們。這進展得非常順利。我覺得我們在這場進化中才走到一半,但看到用戶對這些新功能——比如 Workspace 和 Gmail 里的功能——表現(xiàn)出的價值感和興奮感,真的很令人激動。那里幾乎有無限的可能性。所以,我們對這些以及我們正在構想和原型的 AI 原生產品都感到非常興奮。

主持人:上周我們節(jié)目請了一位歷史學家,他用了 AI Studio 里一個未發(fā)布的谷歌模型,結果被震撼到了,因為模型能轉錄非常古老的文件,還能正確推理出——你知道的——19 世紀加拿大皮毛貿易里的食糖計量單位。你能明確告訴我們,這哥們兒用的是 Gemini 3 嗎?

Josh Woodward:這個我不確定。不過我得說,這模型在建立這類關聯(lián)上確實神了。我不知道那位歷史學家是不是用了舊文檔的照片或者日記之類的……

主持人:對,他就是這么干的。

Josh Woodward:它確實很擅長這個。像我這種字跡潦草的人,拍一張筆記照片給它,它處理起來毫不費力,簡直小菜一碟。

主持人:你剛才提到會把這個集成到搜索旁邊的 AI 模式里。這是否意味著你們找到了一種比以前更高效、更便宜的方法來運行這個模型?

Demis Hassabis:我覺得除了模型本身的性能不斷提升外,我們做得特別好的一點就是模型的效率。我們開創(chuàng)并率先使用的模型蒸餾技術以及其他許多技術,現(xiàn)在都派上了用場。這顯然是必須的,因為我們有像“AI 概覽”這樣極端的應用場景,必須服務數十億用戶。當然,我們的云客戶和企業(yè)客戶也非??粗剡@種成本效益。我們一直努力在成本與性能的帕累托前沿(Pareto frontier)上保持領先。無論你在乎性能還是在乎成本,在這個模型家族里總有一款適合你。當然今天我們只發(fā)布了 Pro,但我們在 3.0 時代還有其他系列的型號在開發(fā)中,很快大家就會看到了。

主持人:好像每次發(fā)新模型,我們都要重新討論一遍 Scaling Laws,以及是不是開始出現(xiàn)邊際收益遞減了。我都能猜到接下來幾天推特上那幾個賬號會說什么。所以在他們開噴之前,我想問問你們針對 Gemini 3 是怎么看這個問題的?

Demis Hassabis:我們對 Gemini 3 相比 2.5 的進步非常滿意。正如前面所說,這個進步基本符合預期,完全按計劃進行。但這并不意味著就不存在某種邊際收益遞減。人們聽到“遞減”就覺得要么是零,要么是指數級增長,其實中間還有個過渡。可能它不會每個時代都指數級翻倍,但它依然是穩(wěn)賺不賠的投資,回報極高。我們正處于這個階段。正如我所說,雖然還要看后續(xù)發(fā)展,但我懷疑要通往 AGI 還需要一兩個研究突破。但在此期間,你顯然需要這種規(guī)模化的基礎模型,也就是我們今天正在構建并不斷看到進步的多模態(tài)基礎模型。

主持人:在你們今天展示的眾多基準測試中,哪一個對普通用戶來說最重要?

Josh Woodward:這個問題很好。我覺得大多數人不會像我們這樣盯著基準測試看,但基準測試始終是一個代理指標。比如突破 LM Arena 的 1500 分大關,這很棒。但真正重要的是產品中的用戶滿意度。令人鼓舞的是,這兩者是同向發(fā)展的,互為良好的印證。所以最終我們會公布所有基準測試數據,我們?yōu)榇烁械阶院?,這代表了驚人的進步,但你也必須把它轉化為有意義的產品體驗。我們在每次發(fā)布中都試圖兼顧這兩點。

主持人:模型能力增強后,有沒有出現(xiàn)什么新的危險能力或者安全隱患?

Demis Hassabis:我們在發(fā)布這個模型上花了很長時間,因為它是前沿模型,有一些新能力。就像你從基準測試看到的,它非常強悍。正如 Josh 所說,我們在內部不僅僅盯著這些基準分看,它們只是整體性能的代理指標,所以我們關注的是全方位的表現(xiàn)以及用戶的最終體驗。我們在安全測試的各個維度上投入了大量時間,與安全研究所合作,也找了外部測試人員,當然還有大量的內部測試。可以說,這是我們迄今為止測試得最徹底的一個模型。

主持人:你想提一下那些冒出來的“新能力”嗎?不管是安全方面的還是別的?有沒有什么讓你覺得:“好吧,我們必須得把這個送給外部研究人員好好查查”?

Demis Hassabis:怎么說呢,我們只是在工具調用、函數調用這些事情上下了很大功夫。顯然這些對編程能力極其重要,開發(fā)者也需要,對推理能力也很關鍵。但也正是這些能力讓它在更具風險的領域——比如網絡攻防——變得更強了。所以當我們?yōu)榱撕玫挠美ヌ嵘@些維度時,必須加倍小心,持續(xù)檢查各種指標,確保它們不被濫用。

主持人:我們現(xiàn)在處于 AI 泡沫中嗎?

Demis Hassabis:這個問題的答案太非黑即白了。我個人的觀點是,AI 行業(yè)的某些部分可能確實有泡沫。比如有些種子輪融資,光靠幾頁 PPT 什么都沒有,就能融個上百億,這看起來確實像是泡沫初現(xiàn)的跡象。

但另一方面,我們也看到了大量驚人的工作和價值。不僅僅是像 Gemini App、NotebookLM 這些新產品領域,往遠了看還有機器人、游戲。我是做游戲出身的,想到這兒我就手癢。還有我們和 Isomorphic 以及 Waymo 在做的藥物研發(fā),這些都是全新的藍海領域。它們可能需要一段時間才能成熟為數千億規(guī)模的產業(yè),但我認為其中有半打到一打的機會,Alphabet 會參與其中,這讓我很興奮。

至于眼前的回報,我們有“動力核心”這部分,把 AI 推送到數十億人每天使用的產品中。點子多到簡直執(zhí)行不過來。怎么重構 Workspace?怎么搞安卓、YouTube?潛力太大了,這將帶來近期的收入和直接回報,同時我們在投資未來。更別提云收入和 TPU 那些了,那也將是巨大的。所以不管有沒有泡沫,我對 Alphabet 的處境感覺很好。我們的工作就是在兩種情況下都贏。如果沒有泡沫,大家繼續(xù)嗨,那我們抓住機會;如果有泡沫,出現(xiàn)回調,我覺得我們也處于最有利的位置去應對那種局面。

主持人:如果有人問:“嘿,聽說 Gemini 3 剛出,它到底能干啥?”你會建議聽眾掏出手機或電腦演示什么例子?

Josh Woodward:Gemini 的圖像模型(Nano banana)依然是世界頂尖的。我會建議你就掏出手機——iPhone、安卓都行——拍張自拍,把自己放進畫面里編輯一下。大家依然很熱衷于玩這個,特有意思。然后再給他們展示 Gemini 3 的其他新功能。我們發(fā)現(xiàn)很多人就是沖著這些有趣的用例來的,然后才開始嘗試 App 的其他部分。

原視頻鏈接:https://youtu.be/rq-2i1blAlU?si=7LtLg4_0NGbsNATU

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
17投砍26分6板!廣東20歲鋒線新星閃耀星銳賽,值得杜鋒更多信任

17投砍26分6板!廣東20歲鋒線新星閃耀星銳賽,值得杜鋒更多信任

老葉評球
2026-03-08 15:39:05
繞開日本永久舉辦權!國際排聯(lián)官宣,中國女排錯失,40年等待落空

繞開日本永久舉辦權!國際排聯(lián)官宣,中國女排錯失,40年等待落空

體育見習官
2026-03-08 08:59:24
伊朗就新的最高領袖人選作出最終決定

伊朗就新的最高領袖人選作出最終決定

極目新聞
2026-03-08 14:05:15
文旅部部長:7名外國游客到上海旅游,買了40箱中國貨;“成為中國人”成了網絡熱詞,老外愛上喝開水吃火鍋等中式生活

文旅部部長:7名外國游客到上海旅游,買了40箱中國貨;“成為中國人”成了網絡熱詞,老外愛上喝開水吃火鍋等中式生活

新民晚報
2026-03-07 15:00:52
準備同歸于盡!伊朗或啟用“沉睡小組”,在美國本土執(zhí)行斬首行動

準備同歸于盡!伊朗或啟用“沉睡小組”,在美國本土執(zhí)行斬首行動

東極妙嚴
2026-03-06 13:43:35
OpenClaw,又失業(yè)一批中產階級

OpenClaw,又失業(yè)一批中產階級

動察Beating
2026-03-05 11:55:52
第25波打擊,伊朗通報全球,以色列后院起火,特朗普開始急了!

第25波打擊,伊朗通報全球,以色列后院起火,特朗普開始急了!

阿萔影視評論
2026-03-08 01:17:09
李連杰首次正面回應換心謠言,說我換人類心臟還是想象力太小,為什么不換一個華為心臟小米肝特斯拉腎

李連杰首次正面回應換心謠言,說我換人類心臟還是想象力太小,為什么不換一個華為心臟小米肝特斯拉腎

觀威海
2026-03-05 16:31:07
國乒最狠一刀:3000分,斬斷王曼昱三年奔赴,也撕開奧運選拔的猙獰

國乒最狠一刀:3000分,斬斷王曼昱三年奔赴,也撕開奧運選拔的猙獰

最愛乒乓球
2026-03-08 06:06:12
美國將軍反思:毛澤東不首先使用核武,反而成了最強的威懾!

美國將軍反思:毛澤東不首先使用核武,反而成了最強的威懾!

鶴羽說個事
2026-03-06 18:25:20
回顧:2005年梁海玲器官被切后慘死豪宅,有人透露:她知道的太多

回顧:2005年梁海玲器官被切后慘死豪宅,有人透露:她知道的太多

歷來都很現(xiàn)實
2024-09-24 23:58:16
火箭五子球隊地位或發(fā)生變化 烏度卡的調整 意識到問題的嚴重性

火箭五子球隊地位或發(fā)生變化 烏度卡的調整 意識到問題的嚴重性

大話火箭隊
2026-03-07 15:51:24
奉勸男性:若不想被前列腺炎折磨下半生,盡早改掉這4大習慣!

奉勸男性:若不想被前列腺炎折磨下半生,盡早改掉這4大習慣!

全球軍事記
2026-03-02 10:13:18
梅西怒了?贏球后徑直離場!1分鐘2送妙傳遭吐餅 900球里程碑延后

梅西怒了?贏球后徑直離場!1分鐘2送妙傳遭吐餅 900球里程碑延后

我愛英超
2026-03-08 07:56:18
真敢提建議!全國人大代表卓長立呼吁:鼓勵大學生加入家政行業(yè)

真敢提建議!全國人大代表卓長立呼吁:鼓勵大學生加入家政行業(yè)

我心縱橫天地間
2026-03-05 16:39:56
香港網約車價格火了!1公里20港元,司機:太羨慕了。

香港網約車價格火了!1公里20港元,司機:太羨慕了。

我不叫阿哏
2026-03-08 13:14:22
軍統(tǒng)女少尉王慶蓮晚年稱:共產黨養(yǎng)我31年,我從內心里感激共產黨

軍統(tǒng)女少尉王慶蓮晚年稱:共產黨養(yǎng)我31年,我從內心里感激共產黨

明月清風閣
2026-03-08 08:25:13
“一人公司”火了!全國人大代表、科大訊飛董事長劉慶峰:要完善適配稅費規(guī)則

“一人公司”火了!全國人大代表、科大訊飛董事長劉慶峰:要完善適配稅費規(guī)則

時代周報
2026-03-07 18:44:10
1967年,梁興初視察成都軍區(qū)時,被流氓威脅:這條街,你們出不去

1967年,梁興初視察成都軍區(qū)時,被流氓威脅:這條街,你們出不去

大運河時空
2026-02-21 13:40:03
vivo和OPPO差距有多大?2026年實測對比,別再買錯了

vivo和OPPO差距有多大?2026年實測對比,別再買錯了

小兔子發(fā)現(xiàn)大事情
2026-03-08 08:34:51
2026-03-08 16:32:49
AI科技大本營 incentive-icons
AI科技大本營
連接AI技術的創(chuàng)造者和使用者
2639文章數 7660關注度
往期回顧 全部

科技要聞

OpenClaw最大的推手是閑魚和小紅書

頭條要聞

媒體:伊朗用"窮人巡航導彈"反擊美以 美盟友聞之色變

頭條要聞

媒體:伊朗用"窮人巡航導彈"反擊美以 美盟友聞之色變

體育要聞

大傷后被交易,他說:22歲的我已經死了

娛樂要聞

周迅新戀情曝光,李亞鵬等人已成過去

財經要聞

油價要失控?

汽車要聞

9分鐘充飽 全新騰勢Z9GT首搭閃充技術26.98萬起

態(tài)度原創(chuàng)

本地
手機
健康
游戲
公開課

本地新聞

食味印象|一口入魂!康樂烤肉串起千年絲路香

手機要聞

2026年第九周,蘋果iPhone 17系列國內銷量近2400萬!

轉頭就暈的耳石癥,能開車上班嗎?

曝NS2開發(fā)機門檻降低 但老任不希望粗制濫造游戲泛濫

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版