国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

Gemini 3負責人最新訪談:不做情感陪伴,只做最強生產(chǎn)力工具

0
分享至



作者 林易

編輯 重點君

11月19日,谷歌發(fā)布Gemini 3模型。DeepMind首席執(zhí)行官戴米斯·哈薩比斯(Demis Hassabis)和Gemini團隊負責人喬?!の榈挛值拢↗osh Woodward)聯(lián)合接受專訪。

此次升級,Gemini 3開始具備生成界面(Generative UI)的能力。當用戶查詢梵高生平時,它能即時構(gòu)建一個包含圖片和時間線的交互式頁面;當涉及復雜計算時,它能直接生成一個定制化的房貸計算器。

這種從回答問題向構(gòu)建應用的躍遷,標志著大模型應用正在跨越單純的對話框,進入動態(tài)軟件生成的階段。

Gemini 3模型推理能力顯著增強。根據(jù)伍德沃德的說法,前代模型常在第5、6步推理時丟失思路,而 Gemini 3能在復雜的稅務規(guī)劃或長代碼調(diào)試中維持10到15步的連貫邏輯,大幅提升了在處理復雜任務時的可靠性。

在被稱作“人類終極考試”(Humanity's Last Exam)的跨學科博士級難題集考試中,Gemini 3pro的得分從前代Gemini 2.5Pro的21.6%大幅上升至37.5%,遠超GPT-5.1的26.5%。在SimpleQA Verified測試中,Gemini 3pro達到了72.1%的準確率,相較GPT-5.1和Claude Sonnet 4.5提升了超1倍,大幅減少此前模型常見的幻覺現(xiàn)象。

此次最具突破性的升級出現(xiàn)在視覺智能領域。Gemini 3 Pro在一項專門針對屏幕理解和UI交互的ScreenSpot-Pro 測試中,取得了72.7%的高分,幾乎是GPT-5.1性能的20倍。這意味著AI Agent能夠區(qū)分按鈕、菜單、文本和上下文,而不僅僅是識別圖像中的物體,為AI Agent實現(xiàn)更高級的自動化操作電腦提供了基礎,大幅提升了模型作為數(shù)字工作代理的實用性。



在衡量Web開發(fā)能力的WebDev Arena排行榜上,Gemini 3拿下了1487 Elo的高分。伴隨Gemini 3發(fā)布,谷歌推出了全新的代理開發(fā)平臺“Google Antigravity”,由Gemini 3作為“智能代理”去調(diào)用工具、編寫接口、調(diào)試Bug,配合Vibe Coding的全新能力,用戶只需用自然語言描述需求,模型即可生成功能完整且設計美觀的代碼。

谷歌在戰(zhàn)略定位上表現(xiàn)得極為克制,拒絕了當下熱門的情感陪伴領域,將Gemini定義為提升生產(chǎn)力的超級工具。其內(nèi)部考核指標不是用戶粘性或情感依賴,而是今天幫用戶完成了多少項任務。在Gemini Agent的早期演示中:模型不僅能理解郵件語境,還能深度接入用戶郵箱,自動歸類并擬定回復,甚至幫助用戶徹底清空收件箱。從單純助手進化為能夠獨立工作的智能同事。



以下為訪談實錄:

羅茲:凱西,我們今天臨時加播一期特別節(jié)目,主題是Gemini 3的發(fā)布。

牛頓:是的,凱文。這款模型在硅谷AI圈子里期待已久,我們終于要親手體驗真正的成品了。

羅茲:我們之所以打破常規(guī)周五發(fā)布節(jié)奏,專門錄制這一期,主要有兩個原因。首先,我們獲得了與谷歌兩位AI核心負責人(DeepMind首席執(zhí)行官哈薩比斯和Gemini團隊副總裁伍德沃德)的專訪機會。

其次,Gemini 3的發(fā)布引發(fā)了業(yè)界強烈關注。我們聽到多個實驗室的內(nèi)部消息稱,這款模型在某些關鍵領域?qū)崿F(xiàn)了突破,可能對競爭對手構(gòu)成實質(zhì)性威脅。過去兩年,谷歌曾被視為追趕者,如今的問題是:他們是否已重返領跑位置?

牛頓:在正式進入訪談之前,我們先簡要介紹已知信息。谷歌在發(fā)布前舉行了閉門簡報會,Gemini 3最引人注目的新能力包括:大幅提升的編碼與“氛圍編碼”能力;以及全新的交互界面生成功能。

它不再僅輸出文字,而是直接為用戶生成定制化的交互界面。例如,用戶詢問梵高生平時,模型會即時生成一個包含圖片、時間線和交互元素的完整學習頁面;又如生成百萬美元以上房產(chǎn)的按揭計算器。這些功能標志著從“回答問題”向“構(gòu)建體驗”的躍遷。

羅茲:在所有公開基準測試中,Gemini 3均大幅超越Gemini 2.5 Pro。例如,在被稱作“人類終極考試”(Humanity's Last Exam)這一跨學科博士級難題集上,前者得分僅21.6%,后者直接提升至37.5%。谷歌的總體表態(tài)是:任何你能在ChatGPT、Claude或其他舊版Gemini上完成的任務,在Gemini 3上都能做得更好。

牛頓:他們還展示了Gemini Agent的早期演示:模型可深度接入用戶郵箱,理解全部郵件內(nèi)容,自動歸類、擬定回復,甚至幫助用戶徹底清空收件箱。

此外,本周起Gemini 3將登陸Gemini App和谷歌搜索的AI Mode;美國大學生將獲一年免費高級版訪問權(quán)限。谷歌反復強調(diào)的關鍵詞是“Learn Anything”(學習任何事物),這實際上是將Gemini定位為終極個性化教育工具。

羅茲:德米斯、喬希,歡迎來到《Hard Fork》。兩年前,桑達爾·皮查伊(Sundar Pichai)把Bard比作“一輛改裝后的本田思域”,在與更強勁對手的賽道上競速。那么,Gemini 3是一輛什么車?

哈薩比斯:我希望它比本田思域快得多。我不太習慣用汽車來比喻,或許更像一輛專業(yè)的拖曳賽車(Drag Racer)。它不是為日常駕駛或環(huán)形賽道設計的,它擁有純粹的、為某一特定目標所凝聚的巨大力量。它代表著我們最頂尖的研究成果與規(guī)模化算力的完美結(jié)合,目標就是要在智能前沿的這場競賽中,展現(xiàn)出無與倫比的瞬間爆發(fā)力。

羅茲:這很有趣。相比以往所有AI模型,Gemini 3在具體層面上究竟能做什么全新的事情?請給我們一些量化、實際的例子。

伍德沃德:有三點最為突出。第一,在多步推理上,它能同時思考更多步驟,我們將其可靠性提升到了一個全新的層次。前代模型常在進行到第5、6步復雜的邏輯推導時“丟失思路”或產(chǎn)生幻覺,而Gemini 3能可靠地完成10到15步的連貫推理任務,例如復雜稅務規(guī)劃、跨國差旅的整體規(guī)劃與預訂,或是對一個擁有數(shù)百萬行代碼的龐大系統(tǒng)進行全面調(diào)試。

其次,它將首次大規(guī)模生成全新交互界面。用戶需求的不再是簡單的文字回答,而是定制化的軟件組件。比如你問它:“幫我設計一個可以追蹤我所有投資組合的儀表板”,它會實時生成一個交互式的、可操作的儀表盤界面,而不是一堆描述如何制作儀表盤的文字。

第三,我們在編碼能力上投入巨大資源,尤其是前端與“氛圍編碼”,這意味著它可以根據(jù)自然語言的提示來生成功能完整、設計優(yōu)美的用戶界面代碼。即將推出的Google Antigravity等新產(chǎn)品也將充分展示這一點,模型能夠動態(tài)地根據(jù)上下文改變用戶界面的布局和功能。

牛頓:許多人認為,對普通用戶而言,“聊天”這一用例已經(jīng)基本解決。他們甚至想不出什么新問題能讓Gemini 3的回答與前代產(chǎn)生質(zhì)的區(qū)別。你如何看待這種看法?

伍德沃德:我理解這種觀點。表面上看,基礎問答的準確率已經(jīng)很高。但真正的區(qū)別在于可靠性、整合度與信息呈現(xiàn)方式。Gemini 3的回答將更簡潔、更有表現(xiàn)力、信息呈現(xiàn)方式更易理解,這是大多數(shù)人立刻能感知到的變化。

更重要的是,模型開始與用戶其他數(shù)據(jù)源深度整合,例如與谷歌生態(tài)內(nèi)其他產(chǎn)品聯(lián)動,真正超越單純的問答模式,成為用戶的“數(shù)字化大管家”。它能理解你整個郵箱的語境,從而在起草回復時,不僅回答問題,還能根據(jù)你過去的風格、你與收件人的關系來調(diào)整語氣和內(nèi)容。

哈薩比斯:我完全同意。它的可靠性、風格與個性都經(jīng)過精心打磨,更簡練、更切中要害。在“氛圍編碼”等場景已跨越實用性門檻。這是一種從“智能助手”到“智能同事”的轉(zhuǎn)變。我本人計劃用它在圣誕假期重拾游戲編程,它現(xiàn)在不僅能寫出功能代碼,還能在設計初期就提供架構(gòu)建議。

羅茲:德米斯,你在今年5月接受我們采訪時判斷AGI仍需5至10年,并可能需要若干重大突破。Gemini 3是否改變了這一時間表?

哈薩比斯:完全沒有。它完全符合我們過去兩年設定的軌跡。事實上,自Gemini系列啟動以來,我們的進步速度已是行業(yè)最快。Gemini 3令人驚艷,但仍在預期之內(nèi)。

距離真正的通用人工智能,仍需在一致性、推理深度、記憶機制以及物理世界建模(如我們正在推進的SIMA與Genie項目)上取得1至2次關鍵突破。我們現(xiàn)在做的是“系統(tǒng)1思維”(快、直覺式),但要實現(xiàn)AGI,我們必須解鎖“系統(tǒng)2思維”(慢、深思熟慮、分析式)。

此外,模型需要具備長期的、選擇性的記憶機制,能夠回憶和應用數(shù)周、數(shù)月前的特定互動內(nèi)容,而非僅僅局限于有限的上下文窗口。因此,5至10年的判斷不變。

牛頓:關于模型個性與用戶關系,業(yè)界正在熱議“AI伴侶”。你希望用戶與Gemini 3建立何種關系?

伍德沃德:這是一個非常敏感但重要的問題。我們將其定位為“超級工具”而非情感伴侶,核心價值是幫助用戶高效完成日常任務,提升生產(chǎn)力。我們內(nèi)部更關注一個新指標:今天我們幫你完成了多少項任務?這更接近初代谷歌搜索的核心價值——效率。我們認為,將模型推向情感伴侶的定位,既有安全風險,也偏離了谷歌作為信息和工具提供者的核心使命。

羅茲:你們放棄了“情色伴侶”這一病毒式增長機會,是否重大戰(zhàn)略失誤?

伍德沃德:無可奉告。我們的安全團隊對此有嚴格的規(guī)范和指導原則。

羅茲:過去幾周,競爭對手明顯緊張。你認為谷歌目前在AI競賽中是否已處于領先?

哈薩比斯:當前環(huán)境是史上最激烈的競爭。唯一真正重要的是進步速度,而我們對此非常滿意。我們從未失去研究領先地位,現(xiàn)在只是產(chǎn)品落地終于跟上。競爭對手在研究上很優(yōu)秀,但在規(guī)?;职l(fā)和垂直整合上,他們無法復制我們的優(yōu)勢。

我們正將Gemini注入Maps、YouTube、Android、搜索、Workspace等數(shù)十億用戶產(chǎn)品,這個分發(fā)網(wǎng)絡和終端數(shù)據(jù)反饋環(huán)是無法逾越的護城河。此外,我們在定制化TPU芯片上的全棧優(yōu)勢,使我們的訓練成本和效率遠超依賴外部GPU資源的競爭者。

牛頓:關于規(guī)模定律與回報遞減的爭論,你怎么看?有人認為,模型的規(guī)模越大,性能提升的邊際效益越低。

哈薩比斯:這是一個持續(xù)的辯論。我們對Gemini 3相較2.5的提升非常滿意,完全符合預期。回報并非像早期那樣呈指數(shù)級爆炸式增長,但它帶來的實用性增量和可靠性提升仍遠高于我們的邊際成本,仍值得我們?nèi)ν度搿T诘诌_AGI所需的1至2次研究突破到來之前,通過最大規(guī)模的基礎模型持續(xù)推動性能,仍然是當前最有效的策略。我們相信,規(guī)模定律依然有效。

羅茲:我們是否正處于AI泡沫之中?

哈薩比斯:這是一個過于二元的問題。某些領域(例如數(shù)十億美元種子輪卻無實際產(chǎn)品、只講概念的公司)確實存在泡沫,估值與實際收入不成比例。但谷歌同時擁有短期變現(xiàn)(搜索、Workspace、云TPU)與長期萬億級新賽道(機器人、游戲、藥物發(fā)現(xiàn)、材料科學等)。

例如,我們的AlphaFold等專業(yè)模型正在藥物發(fā)現(xiàn)領域創(chuàng)造實際價值,這是一個與消費者AI估值無關的萬億級市場。無論短期泡沫是否存在,我們都將勝出:繁榮時抓住機會,收縮時憑借全棧優(yōu)勢和深厚的現(xiàn)金流更具韌性。

牛頓:如果現(xiàn)在是感恩節(jié)聚會,有人想轉(zhuǎn)移政治話題,你會建議他們用Gemini 3展示什么功能來驚艷全場?

伍德沃德:我不知道它能不能拯救感恩節(jié),但它能帶來歡笑。拿出手機自拍,然后讓Gemini 3瘋狂編輯照片。

我們Gemini中的圖像模型在全球范圍內(nèi)仍然是最強的。你可以即時將家人合影變成任何滑稽的場景、風格或時代背景。絕對能引發(fā)全場大笑。隨后,當你展示它能如何幫你撰寫一封得體的辭職信或生成一個定制化的節(jié)日食譜計算器時,他們自然就會探索其他新功能了。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
明確了!C1能增駕D駕照,交警:滿足1個條件,就能成功升級C1D

明確了!C1能增駕D駕照,交警:滿足1個條件,就能成功升級C1D

電動車小辣椒
2026-01-12 07:04:53
善惡有報,2025年塌房的六大網(wǎng)紅,為了流量各種作妖,不值得同情

善惡有報,2025年塌房的六大網(wǎng)紅,為了流量各種作妖,不值得同情

單手搓核彈
2026-01-06 14:04:34
19歲河南小伙在倫敦“撿”了個瑞士爺爺,回國后硬是把他接來鄭州養(yǎng)老,臨終前老人說了一句話,讓無數(shù)人破防

19歲河南小伙在倫敦“撿”了個瑞士爺爺,回國后硬是把他接來鄭州養(yǎng)老,臨終前老人說了一句話,讓無數(shù)人破防

源溯歷史
2026-01-09 18:47:21
但凡王石當初愛玩貪玩啥都見過,老了也不會選錯人。

但凡王石當初愛玩貪玩啥都見過,老了也不會選錯人。

小霍霍
2026-01-05 15:04:23
美國政府批準 向中國出口 英偉達H200芯片

美國政府批準 向中國出口 英偉達H200芯片

每日經(jīng)濟新聞
2026-01-14 08:12:01
央行官宣!將單設1萬億元,支持民營企業(yè)發(fā)展

央行官宣!將單設1萬億元,支持民營企業(yè)發(fā)展

每日經(jīng)濟新聞
2026-01-15 16:15:07
中戲院長主動投案!閆學晶兒子學籍疑云反轉(zhuǎn)?背后牽扯不簡單?

中戲院長主動投案!閆學晶兒子學籍疑云反轉(zhuǎn)?背后牽扯不簡單?

復轉(zhuǎn)這些年
2026-01-14 18:39:16
中國人民銀行決定下調(diào)再貸款、再貼現(xiàn)利率

中國人民銀行決定下調(diào)再貸款、再貼現(xiàn)利率

界面新聞
2026-01-15 15:39:24
78年初戀考上北大與我分手,我守邊疆24年,轉(zhuǎn)業(yè)時重新找到我

78年初戀考上北大與我分手,我守邊疆24年,轉(zhuǎn)業(yè)時重新找到我

嘮叨說歷史
2025-06-13 13:45:51
唐嫣離婚真相大白后兩月沉默,給娛樂圈上深刻一課

唐嫣離婚真相大白后兩月沉默,給娛樂圈上深刻一課

菠蘿欣賞家本尊
2026-01-15 14:46:49
高峰也沒想到,他當年拋棄的兒子,如今開始給那英爭光了

高峰也沒想到,他當年拋棄的兒子,如今開始給那英爭光了

趣文說娛
2026-01-04 16:34:24
蒼天好輪回!徐帆回應離婚5個月后,馮小剛迎來"反噬"

蒼天好輪回!徐帆回應離婚5個月后,馮小剛迎來"反噬"

素衣讀史
2026-01-13 12:10:41
中美俄每月養(yǎng)老金對比:美國一個月1.3萬,俄羅斯1692元,中國呢

中美俄每月養(yǎng)老金對比:美國一個月1.3萬,俄羅斯1692元,中國呢

阿傖說事
2025-11-11 10:40:35
官方:上海海港后衛(wèi)李浩然加盟遼寧鐵人

官方:上海海港后衛(wèi)李浩然加盟遼寧鐵人

懂球帝
2026-01-15 16:33:10
為什么說不要在外面表現(xiàn)出自己很幸福?網(wǎng)友:知人知面不知心!

為什么說不要在外面表現(xiàn)出自己很幸福?網(wǎng)友:知人知面不知心!

另子維愛讀史
2026-01-14 19:55:59
演員王勁松過往言論突然上了熱搜

演員王勁松過往言論突然上了熱搜

映射生活的身影
2026-01-13 19:10:11
澤連斯基:烏克蘭能源系統(tǒng) 將進入緊急狀態(tài)

澤連斯基:烏克蘭能源系統(tǒng) 將進入緊急狀態(tài)

每日經(jīng)濟新聞
2026-01-15 08:02:13
哥嫂去世后,我收養(yǎng)了侄子侄女,如今他們卻成為我養(yǎng)老的最大支柱

哥嫂去世后,我收養(yǎng)了侄子侄女,如今他們卻成為我養(yǎng)老的最大支柱

人間百態(tài)大全
2026-01-14 06:50:03
報應來了!捐給美國7千萬,滿嘴“中國窮關我啥事”,如今破產(chǎn)了

報應來了!捐給美國7千萬,滿嘴“中國窮關我啥事”,如今破產(chǎn)了

泠泠說史
2026-01-12 18:41:26
大部分人的存款,都會歸于零

大部分人的存款,都會歸于零

詩詞中國
2025-12-21 21:19:44
2026-01-15 18:07:00
劃重點KeyPoints incentive-icons
劃重點KeyPoints
追蹤全球AI科技,記錄中國硬核崛起
145文章數(shù) 15關注度
往期回顧 全部

科技要聞

阿里最狠的一次“自我革命”

頭條要聞

賈國龍稱會爭取讓西貝活下來 再次強調(diào)西貝不是預制菜

頭條要聞

賈國龍稱會爭取讓西貝活下來 再次強調(diào)西貝不是預制菜

體育要聞

聶衛(wèi)平:黑白棋盤上的凡人棋圣

娛樂要聞

傳奇棋圣聶衛(wèi)平離世,網(wǎng)友集體悼念

財經(jīng)要聞

央行再次結(jié)構(gòu)性降息0.25個百分點

汽車要聞

今年推出超40款新車,BBA要把失去的奪回來

態(tài)度原創(chuàng)

健康
教育
房產(chǎn)
家居
親子

血常規(guī)3項異常,是身體警報!

教育要聞

跨越山海,我在新西蘭讀博上癮了:原來學習本身就能帶來純粹的快樂

房產(chǎn)要聞

突發(fā)!商業(yè)用房購房貸款最低首付比例下調(diào)至30%

家居要聞

自在自宅 個性自由

親子要聞

叔叔扮演幽靈偷吃零食嚇寶藍一跳 ,幸好爸爸及時回家了~

無障礙瀏覽 進入關懷版