国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

沒有KPI,也能領(lǐng)先OpenAI?從“內(nèi)部觀察者”視角看頂級AI實驗室如何運作

0
分享至


作者|冬梅

編輯|蔡芳芳

在人工智能競爭持續(xù)升溫的當(dāng)下,圍繞 DeepMind、OpenAI 與 Anthropic 的討論,已經(jīng)不再只是“誰的模型更強”的問題,而是逐漸演變?yōu)橐粋€更深層的命題:頂級 AI 實驗室究竟如何組織研究、選擇技術(shù)路線,并在算力、資本與安全之間做出長期取舍。

在近日 InfoQ 對《哈薩比斯:谷歌 AI 之腦》(TheInfinityMachine)作者、知名科技史學(xué)家、金融史學(xué)家塞巴斯蒂安·馬拉比(Sebastian Mallaby)的采訪中,我們嘗試從一個更接近“內(nèi)部觀察者”的視角,重新理解 DeepMind 的成長邏輯,以及它與 OpenAI、Anthropic 之間真正的結(jié)構(gòu)性差異。

作為長期跟蹤哈薩比斯及其團隊的觀察者,馬拉比認(rèn)為,DeepMind 的優(yōu)勢并不僅僅來自谷歌提供的算力和資金,更來自一種獨特的組織方式:既允許科學(xué)家長期自由探索,又能在關(guān)鍵時刻迅速形成突擊小組推動突破。這種機制,使它能夠持續(xù)攻克 AlphaGo、AlphaFold 這樣需要十年以上投入的問題。

與此同時,不同實驗室在“安全與速度”之間的取舍差異,也正在成為影響 AGI 競爭格局的重要變量。而隨著 AI 規(guī)?;╯caling) 從訓(xùn)練階段擴展到推理階段乃至未來智能體層面,AI 進(jìn)步的動力結(jié)構(gòu)本身也正在發(fā)生變化。

從這個意義上說,今天的 AI 競爭,已經(jīng)不再只是模型能力的競賽,而是一場圍繞組織模式、研究方法與系統(tǒng)資源配置展開的長期博弈。

DeepMind 為什么能成功?

InfoQ:您在書中提到,哈薩比斯在 MIT 的導(dǎo)師托馬索·波吉奧(Tomaso Poggio)曾表示,他遇到的很多諾獎得主,既才華橫溢又運氣極佳。有少數(shù)諾獎得主天賦異稟,無論研究什么注定會獲獎。2009 年辛頓遇到哈薩比斯,認(rèn)為他是比自己更爭強好勝的人。如果讓您用幾個詞形容哈薩比斯,會是什么?為什么這么說?

馬拉比:讓我用三個詞來形容他的話,我會說天造之才、爭強好勝、友善謙遜。

天才這個自然不必多說了。爭強好勝是他發(fā)自內(nèi)心地渴望勝利,渴望做出一番了不起的成就。我覺得這和他從小參加國際象棋比賽有關(guān)。他才六歲的時候,就早早地置身于激烈的競爭之中,也因此變得極具好勝心。這份好勝心,成了他前進(jìn)的動力。

但反過來想,如果一個人只是爭強好勝、天賦異稟,為人卻不友善,那別人就不會愿意為他效力,也不會喜歡他,甚至?xí)敕皆O(shè)法給他使絆子、阻礙他。而他的優(yōu)勢就在于,大家都很喜歡他。人們和他接觸后,都會覺得他為人正派,價值觀很好,希望人工智能能為人類帶來福祉。正因如此,大家才愿意支持他的事業(yè)。我很難想象,如果沒有這份善良,他還能否取得今天這般成就。

InfoQ:所以你認(rèn)為 DeepMind 如今的成功與哈薩比斯這個創(chuàng)始人謙遜、善良的個性有關(guān)嗎?與其他 AI 實驗室相比,DeepMind 又有哪些獨特之處?

馬拉比:是的,我認(rèn)為這些都與哈薩比斯的個性密切相關(guān)。

DeepMind 的獨特之處首先在于,它成立于 2010 年,那時候人工智能甚至連一張貓咪的照片都識別不出來。當(dāng)時相關(guān)技術(shù)還完全不成熟,可還是有人愿意加入這家公司,投身于一項尚未成功的事業(yè)。正是這份超前的投入與遠(yuǎn)見,讓 DeepMind 在最初大約十年里一直處于行業(yè)領(lǐng)先地位,直到 ChatGPT 問世,賽道才迎來了激烈角逐。而在那之前的十年,他們始終遙遙領(lǐng)先,這一切都源于起步之早,而這無疑直接歸功于哈薩比斯。他從 18 歲、進(jìn)入劍橋大學(xué)之前,就堅信人工智能的可能性,早早地就對這份愿景矢志不渝。這或許也是造就他的另一項特質(zhì):他不僅好勝、是天才、為人善良,更是一位具有遠(yuǎn)見卓識的先行者

InfoQ:您書中提到,哈薩比斯其實并不喜歡商業(yè)管理。他的理想組織形態(tài)是“貝爾實驗室 + 學(xué)術(shù)研究所”。DeepMind 團隊一直在英國獨立辦公,團隊早期很多制度是允許科學(xué)家長期研究、不要求短期產(chǎn)品以及他們的論文可以公開發(fā)表,這和硅谷很多公司完全不同。這些看起來“過于自由”的條件,會不會給哈薩比斯的管理帶來困難?通常習(xí)慣了自由的人,尤其是天才們,是不愿意受到約束的。

馬拉比:我認(rèn)為 DeepMind 最關(guān)鍵的一點,是他們給了這些頂尖人才極大的自由。研究員們可以自主決定研究方向,發(fā)表學(xué)術(shù)論文,擁有類似在大學(xué)里的研究自由。

但如果 DeepMind 只有自由,那只會變成一群人各做各的研究,最終拿不出任何成型的產(chǎn)品。而哈薩比斯把自由探索和集中攻堅結(jié)合了起來——當(dāng)他判斷某個研究方向已經(jīng)具備取得重大突破的條件時,就會下令:“好了,這條路線可以落地了,我們要組建專門團隊,全速推進(jìn),實行自上而下的集中管理。”

他把這類團隊稱作“突擊小組(strike team)”。從最早開發(fā)雅達(dá)利游戲智能體,到后來的 AlphaGo,再到 AlphaZero 直至 AlphaFold 在內(nèi)的一系列模型,背后都有這樣的突擊小組。在突擊小組里,會有負(fù)責(zé)人統(tǒng)一指揮,所有人朝著同一個目標(biāo)沖刺,有時間壓力和截止日期,工作強度極高。

所以哈薩比斯的天才之處,就在于把自由探索和成果轉(zhuǎn)化結(jié)合在了一起——利用理論科學(xué)上的突破,落地打造出 AlphaGo 這樣的產(chǎn)品。

他之所以懂學(xué)術(shù)自由,是因為自己讀過博士,了解大學(xué)的研究模式;而組建突擊小組的思路,則來自他的游戲行業(yè)經(jīng)歷——他曾在游戲公司任職,還自己創(chuàng)辦過一家,很清楚游戲公司如何趕工期、按時交付產(chǎn)品。他正是把這兩種模式完美融合在了一起。

InfoQ:像 DeepMind 這樣的頂級 AI 實驗室是如何組織和管理人才的?例如如何招聘科學(xué)家?如何管理頂級研究人員?是否會給他們很高的薪酬或者更多的資源?

馬拉比:在最初階段,公司給的薪資其實并不高,因為當(dāng)時他們的資金非常有限。雖然會提供公司期權(quán),但大多數(shù)加入的人并不認(rèn)為這些期權(quán)未來會有價值——因為當(dāng)時的 AI 既沒有成熟的產(chǎn)品,也沒有清晰的盈利模式。

因此,在創(chuàng)業(yè)早期,要吸引優(yōu)秀人才其實是很困難的。我認(rèn)為,德米斯能做到這一點,很大程度上是因為他和他的聯(lián)合創(chuàng)始人沙恩·萊格(Shane Legg) 本身都是非常受尊敬的科學(xué)家,這使得其他研究人員愿意加入他們的團隊。

另外,還有一些人加入的原因是,他們并不想處理創(chuàng)業(yè)公司中的那些“非科研”事務(wù),比如和律師打交道、對接投資人、考慮辦公場所等。這些事情在他們看來既煩瑣又無聊。如果德米斯愿意負(fù)責(zé)這些組織和管理工作,他們就可以專注于自己擅長的科學(xué)研究。因此,一些人(比如參與雅達(dá)利項目的研究者姆尼赫)就提到,這正是他加入的原因。

不過到 2014 年之后,情況發(fā)生了明顯變化。被谷歌收購后,DeepMind 獲得了充足的資金支持,不僅能夠提供更具競爭力的薪酬,也建立了更加穩(wěn)定、完善的工作環(huán)境,包括更優(yōu)質(zhì)的辦公條件和高質(zhì)量的免費餐食。整體而言,收購之后,這里的工作體驗顯著提升。

此外,隨著 AI 技術(shù)不斷發(fā)展,科研對算力的依賴也越來越強。要讓模型真正取得突破性效果,需要大量先進(jìn)的半導(dǎo)體和計算資源。因此,對于科學(xué)家來說,能否獲得充足的算力成為一個關(guān)鍵因素。而在 DeepMind 工作,可以直接使用谷歌的算力和芯片資源,這也成為吸引頂尖人才加入的重要原因之一。

InfoQ:DeepMind 在被谷歌收購時并非完全處于“被動求生”狀態(tài),您在上次分享中也提到過,當(dāng)時 Meta CEO 扎克伯格曾邀請哈薩比斯共進(jìn)晚餐商議收購之事,馬斯克也曾向他們拋出橄欖枝,也就是說,DeepMind 在進(jìn)入谷歌體系之前就已自帶光環(huán)了。那是不是可以解讀成 DeepMind 進(jìn)入 Alphabet 體系中享有很高的話語權(quán)?這是 DeepMind 成功的因素之一嗎?

馬拉比:是的,我認(rèn)為,當(dāng)時有其他公司也有意收購他們,這一點在他們最終賣給 Alphabet 時,實際上增強了他們的談判籌碼。

不過,我也認(rèn)為更關(guān)鍵的一點在于 Alphabet 的領(lǐng)導(dǎo)層——尤其是拉里·佩奇(Larry Page),以及后來接任的桑達(dá)爾·皮查伊(Sundar Pichai)——在與德米斯接觸之后,很快意識到他是一個非常特別的人。他們非常希望能夠留住他,并且愿意按照他的想法去推進(jìn)事情,因為他們認(rèn)為他極具價值。

在收購 DeepMind 時,來自加拿大的深度學(xué)習(xí)先驅(qū)杰弗里·辛頓(Geoffrey Hinton)曾開玩笑地說:“就算只買德米斯一個人,也值 1 億到 1.5 億英鎊。”這其實反映了他們對德米斯的高度評價——他不僅是一個創(chuàng)業(yè)者,更是一個具有天才級洞察力的人。

正因為如此,谷歌在收購之后給予了 DeepMind 極高的重視和充分的資源支持,包括大量的研究資金。這也是 DeepMind 后來能夠持續(xù)取得成功的重要原因之一——本質(zhì)上,是因為谷歌對德米斯的認(rèn)可與信任,并愿意長期支持他的研究方向。

InfoQ:即使有很高的話語權(quán),但谷歌畢竟是一家商業(yè)公司,DeepMind 是如何在長期科研和短期成果之間取得平衡的?

馬拉比:在相當(dāng)長一段時間里,DeepMind 的重心一直是長期科研,而不是產(chǎn)品化。它基本沒有推出真正意義上的商業(yè)產(chǎn)品,雖然也曾嘗試過一些醫(yī)療應(yīng)用,但那更多是因為德米斯的聯(lián)合創(chuàng)始人穆斯塔法·蘇萊曼( Mustafa Suleyman)的推動,而不是谷歌的核心訴求。

谷歌當(dāng)時是允許,甚至支持 DeepMind 專注于基礎(chǔ)研究的。它每年投入近 10 億美元來支持這些研究項目——這是一個非常大的投入,但對于現(xiàn)金充裕的谷歌來說,是可以承擔(dān)的。

這種局面在 2022 年發(fā)生了根本性變化。隨著 ChatGPT 的推出,谷歌突然意識到,傳統(tǒng)搜索引擎可能會被基于大語言模型的新型搜索方式所顛覆。這種威脅讓谷歌感到緊張,因此他們迅速轉(zhuǎn)向,希望與 OpenAI 競爭,并開始要求 DeepMind 從以科學(xué)研究為主,轉(zhuǎn)向更偏產(chǎn)品化的方向,尤其是開發(fā)大語言模型。

一開始我也在想,德米斯是否會對此感到不適應(yīng),畢竟他本質(zhì)上是一位科學(xué)家。

但后來我和他交流時,他的看法很有意思。他說:“你要記住,在創(chuàng)立 DeepMind 之前,我運營的是自己的創(chuàng)業(yè)公司萬靈藥工作室(Elixir Studios),那是一家游戲公司,我們是做產(chǎn)品的。我并不排斥做產(chǎn)品,而且我本身也是一個很有競爭心的人,我也希望在這場競爭中獲勝?!?/p>

他還提到,到了這個階段,AI 的發(fā)展已經(jīng)進(jìn)入一個新的狀態(tài):構(gòu)建大語言模型,一方面是在打造產(chǎn)品,另一方面本身也是在推進(jìn)科學(xué)前沿。

事實上,自從 ChatGPT 出現(xiàn)之后,我們已經(jīng)看到大量新的技術(shù)進(jìn)展不斷涌現(xiàn),比如:

  • 更長上下文窗口的模型(可以記住更多信息)

  • 能處理圖像、視頻和語音的多模態(tài)模型

  • 具備復(fù)雜推理能力的模型

  • 以及能夠執(zhí)行任務(wù)的智能體(Agent)模型

這些前沿探索本身就發(fā)生在“產(chǎn)品形態(tài)”之中。因此,在當(dāng)前階段,科學(xué)研究與產(chǎn)品開發(fā)并不是二選一的關(guān)系,而是可以同時推進(jìn)的兩條路徑。

賺幾十億美金,抵不過拿一個諾貝爾獎

InfoQ:在收購后的最初幾年里,DeepMind 與谷歌之間最大的文化沖突是什么?谷歌在多大程度上允許 DeepMind 保持科研獨立?

馬拉比:這些文化上的分歧,主要集中在“安全性”問題上。DeepMind 希望建立一套更獨立、更特殊的治理機制,以確保 AI 不會僅僅被用于服務(wù)某一家公司的商業(yè)利益。他們設(shè)想成立一個類似“倫理和安全審查委員會”的機構(gòu),成員可能包括像美國前總統(tǒng)奧這樣的人物,由這個機構(gòu)來決定 AI 應(yīng)該如何被使用。

對于這個想法,谷歌在表面上有時似乎表示支持,但實際上并沒有真正打算落實。因此,雙方圍繞這一問題,與律師、投行顧問等一起,進(jìn)行了長達(dá)三年的反復(fù)博弈。

在這段時間里,德米斯甚至曾嘗試尋找其他出路,比如去接觸阿里巴巴創(chuàng)始人馬云,希望獲得資金支持,讓 DeepMind 重新獨立運作。這可以說是雙方最核心的一次“文化沖突”

不過,在科研層面上,雙方的分歧其實并不明顯。谷歌一直非常支持 DeepMind 開展前沿研究,比如 AlphaGo 項目。

事實上,在 AlphaGo 于韓國比賽期間,谷歌的聯(lián)合創(chuàng)始人謝爾蓋·布林(Sergey Brin),以及當(dāng)時的 CEO 埃里克·施密特(Eric Schmidt)等高層都親自前往現(xiàn)場觀賽,他們對這一項目非常投入,也非常享受這一歷史性時刻。

InfoQ:您提到谷歌和 DeepMind 之間曾爆發(fā)了激烈的文化沖突,您在書中也提到德米斯差點就帶著團隊離開了谷歌。但最后為什么又決定留下來了,谷歌做了一些什么樣的妥協(xié)嗎?

馬拉比:其實歸根結(jié)底,德米斯在那段時間最想做的還是科研。因為如果真要為了自立門戶再去創(chuàng)辦一家新公司,他不僅得四處奔波拉投資,還得雇一堆律師去跟谷歌法務(wù)部“撕破臉”,這肯定會讓谷歌那邊大動肝火。對他來說,與其深陷這種無休止的商業(yè)糾葛,他顯然更愿意把全部精力都放在攻克 AI 科學(xué)難題上。

所以我覺得,這才是他最終選擇留下的原因。

還有一個很有趣的點:德米斯的大本營在倫敦,而不是硅谷。在硅谷,那種“你必須得擁有自己公司”的創(chuàng)業(yè)狂熱幾乎是一種信仰;但在倫敦,這種氛圍沒那么激進(jìn)。德米斯 顯然更愿意堅守最初把公司賣給谷歌時的那份初心。

在他面前,其實擺著兩條截然不同的路:一條是靠獨立打拼建立一個龐大的商業(yè)帝國,成為身家百億的超級富豪;另一條則是深耕科學(xué)領(lǐng)域,發(fā)明真正的 AI,最終問鼎諾貝爾獎。

顯然,比起那幾十億美金,他更渴望那一枚諾貝爾獎?wù)?/strong>。

InfoQ:我們能否討論一個假設(shè),如果 DeepMind 沒有被谷歌收購,它今天會是什么樣?

馬拉比:在我生活的英國,常能聽到一種聲音:“唉,要是當(dāng)初 DeepMind 沒賣給谷歌該多好,那樣我們現(xiàn)在就有一家獨立的英國 AI 巨頭了。”

但我完全不這么看。

我認(rèn)為當(dāng)時的 DeepMind 真的太缺錢了。你完全可以換個角度來看待這樁收購:這根本不是什么“英國 AI 產(chǎn)業(yè)的損失”,正相反,這是英國的一大勝利。像德米斯這樣天才的英國創(chuàng)業(yè)者,憑本事說服了一家美國巨頭,心甘情愿地每年往倫敦的 AI 實驗室里砸近10 億美元

想一想,美國人拿著大把鈔票來投資英國,這難道不是天大的好事嗎?

如果德米斯當(dāng)時沒把公司賣給谷歌,憑他的天賦和那股子不服輸?shù)膭蓬^,他肯定也能成功。他大概率會保持獨立,或者轉(zhuǎn)頭去拿埃隆·馬斯克之類大佬的投資。但那條路肯定要難走得多,因為手里的錢會縮水,而且還得整天面對各種“內(nèi)耗”——畢竟馬斯克可是個極度好斗的人。

如果沒有谷歌的財力支持,像 AlphaGo 這樣的奇跡可能要推遲很久才會出現(xiàn)。但無論如何,德米斯最終還是會成為 AI 領(lǐng)域的領(lǐng)軍人物。那是他的使命,也是他的天賦所在——只要是他想做成的事,這世界上恐怕沒什么能攔得住他。

AlphaGo 與 AlphaFold 背后,是選擇問題的能力

InfoQ:AlphaGo 可以說讓 DeepMind 一戰(zhàn)成名。在谷歌內(nèi)部,伴隨著 AlphaGo 的成功,谷歌高層有沒有重新評估 AGI 價值?您認(rèn)為這場勝利是否改變了 DeepMind 在集團內(nèi)部的話語權(quán)?具體體現(xiàn)在哪些方面?

馬拉比:對于谷歌的每一個人來說,DeepMind 在 AlphaGo 上的勝利無異于一記具有震撼性的警鐘。

通過那場比賽,所有人真切地看到了 AI 蘊含的恐怖力量。早些時候,謝爾蓋·布林還曾斷言:“要做出一個能下圍棋的系統(tǒng)肯定難如登天?!苯Y(jié)果,德米斯用事實狠狠地打了他的臉。谷歌高層不得不承認(rèn),AI 的進(jìn)化速度早已遠(yuǎn)超他們的預(yù)期。

從那時起,研發(fā)預(yù)算開始瘋狂飆升。原本 DeepMind 的經(jīng)費就已經(jīng)很高了,AlphaGo 之后更是又翻了一番。

可以說,這場勝利成了德米斯手里最有力的籌碼,讓他能說服谷歌源源不斷地砸錢。而一年后(2017 年)橫空出世的AlphaZero,則進(jìn)一步鞏固了他的地位,證明了這種投入是完全值得的。

InfoQ:無論是 AlphaGo,還是 AlphaFold,都在業(yè)內(nèi)備受關(guān)注。在您看來,AlphaGo 與 AlphaFold 在方法論上有什么共通之處?

馬拉比:它們其實都是“無限機器”的例子。

以圍棋為例,先手一開始可以在 361 個交叉點中選擇任意一個落子,然后輪到后手有 360 種選擇。接下來依次是 359、358……如果把這些可能性相乘,很快就會得到一個極其龐大的數(shù)字——每一步棋、每一個應(yīng)對,以及對應(yīng)對的再應(yīng)對,都會形成爆炸式增長的可能性空間。

所以,這是一個巨大的搜索空間,一個幾乎無限的可能性集合。我把它稱為“無限機器”。也就是說,像 AlphaGo 這樣的系統(tǒng),本質(zhì)上是一臺能夠從幾乎無限的可能走法中提取出“意義”的機器。

如果你再看蛋白質(zhì)結(jié)構(gòu)——一張蛋白質(zhì)的圖像,你會看到它是如何折疊的。里面有無數(shù)細(xì)小的彎曲,而每一個彎曲都可能朝不同方向變化。因此,蛋白質(zhì)可能形成的結(jié)構(gòu)組合,比圍棋還要大得多,某種意義上說,已經(jīng)非常接近“無限”。

但 DeepMind 仍然發(fā)明了一種機器,能夠在所有這些可能的組合中預(yù)測出正確的蛋白質(zhì)結(jié)構(gòu)——這些組合所涉及的原子數(shù)量甚至超過宇宙中的原子數(shù)。所以,從這個角度看,它同樣是一臺“無限機器”。我認(rèn)為這就是兩者之間最核心的聯(lián)系:如何從如此龐大的數(shù)據(jù)和可能性中提取出有意義的結(jié)果。

AlphaFold 的確是一個非常重要、具有里程碑意義的成就,在全球范圍內(nèi)都是如此。那么,為什么 DeepMind 選擇把它開源?

一方面,是出于幫助全世界、推動科學(xué)進(jìn)步的考慮;另一方面,也是因為 DeepMind 認(rèn)為,他們之所以能夠做出 AlphaFold,很大程度上得益于一個長期積累的科學(xué)共同體。

比如 CASP 這個競賽——它是由學(xué)術(shù)界發(fā)起的,每兩年舉行一次,讓不同科研團隊競賽蛋白質(zhì)結(jié)構(gòu)預(yù)測。在 DeepMind 于 2020 年獲勝之前,這個競賽已經(jīng)持續(xù)了大約 18 年。

也就是說,在 DeepMind 解決這個問題之前,整個領(lǐng)域已經(jīng)有了大量的基礎(chǔ)研究工作。因此,DeepMind 也希望通過回饋學(xué)術(shù)界的方式,來表達(dá)感謝——他們把 AlphaFold 系統(tǒng)開放出來,讓整個領(lǐng)域都能使用這些預(yù)測結(jié)果。

如果他們只是利用了所有人的開放研究成果,卻不公開自己的研究,那在道義上會顯得不太合適。所以,這也是他們選擇開源的重要原因之一。

當(dāng)然,還有一個現(xiàn)實層面的因素:在商業(yè)應(yīng)用,比如藥物研發(fā)中,僅僅是 AlphaFold 2(也就是后來獲得諾貝爾獎的版本)其實還不夠。

你不僅需要知道蛋白質(zhì)的結(jié)構(gòu),還需要理解蛋白質(zhì)之間、蛋白質(zhì)與其他分子之間是如何相互作用的。這正是 AlphaFold 3 和 4 要解決的問題。

而 AlphaFold 4 并沒有開源,它是專有的系統(tǒng)。這也意味著它正在逐漸走向產(chǎn)品化階段,因此 DeepMind 和谷歌選擇將其保留在內(nèi)部

InfoQ:無論 AlphaGo,還是 AlphaFold 都是非常偉大的成就,那 DeepMind 是如何選擇“值得投入十年的課題”的?有哪些判斷依據(jù)是可復(fù)制的?

馬拉比:德米斯經(jīng)常提到一個概念,叫作“科學(xué)品味”(Scientific Taste)。

他有一種敏銳的直覺:能“嗅”出 AI 領(lǐng)域中哪些懸而未決的問題雖然極具挑戰(zhàn),但只要拼命攻關(guān)兩年就一定能捅破那層窗戶紙。他極其擅長進(jìn)行這種戰(zhàn)略豪賭。這種能力不僅源于他對科學(xué)前沿的深刻理解,更源于他看透了科學(xué)家這個群體的運作邏輯。

他曾跟我講過一個關(guān)于 AlphaFold 的精彩故事。

2018 年時,團隊已經(jīng)研發(fā)了兩年,做出的系統(tǒng)雖然貴為全球最強,但還遠(yuǎn)沒有達(dá)到能預(yù)測“所有蛋白質(zhì)形狀”的終極目標(biāo)。它只是比其他 AI 強,但離解決問題還差得遠(yuǎn)。當(dāng)時,團隊負(fù)責(zé)人安德魯·西尼爾(Andrew Senior)甚至有些灰心地對德米斯說:“這題我們解不出來,實在太難了。我們已經(jīng)盡力了,2018 版系統(tǒng)表現(xiàn)不錯,已經(jīng)領(lǐng)先全人類了,但求你別逼我們?nèi)ヮA(yù)測自然界所有的蛋白質(zhì),那根本不可能?!?/p>

但德米斯直覺認(rèn)為,預(yù)測所有蛋白質(zhì)是有可能的。為了驗證自己的判斷,他親自參加了 AlphaFold 團隊的每一次技術(shù)研討會。

他在會上并不多說話,而是在冷靜地觀察團隊的討論是否“流暢”(fluent)。

所謂的“流暢”,是指大家是否在源源不斷、快速地蹦出新的研究靈感。德米斯認(rèn)為,只要靈感還在流淌——哪怕有些想法現(xiàn)在看起來不一定對——只要大家還有“產(chǎn)生新點子的能力”,就說明科學(xué)進(jìn)步的空間遠(yuǎn)未枯竭。

基于這種觀察,德米斯決定頂住壓力,拒絕關(guān)閉項目。他不僅沒有聽從老負(fù)責(zé)人的撤退建議,反而換了主帥,提拔了年輕的約翰·江珀(John Jumper)。

江珀堅信成功就在前方,德米斯則給了他毫無保留的支持。兩年后,他們交出了足以問鼎諾貝爾獎的科研成果。

這個故事告訴我們:作為領(lǐng)導(dǎo)者,你不僅需要那種判斷“什么能成”的科學(xué)品味,更要學(xué)會坐在會議室里,去捕捉那些思維碰撞的火花,去傾聽靈感流動的聲音

InfoQ:AlphaGo、AlphaFold 都只是 AGI 路線上的階段實驗。您贊同這個說法嗎?

馬拉比:嗯,可以這么說。我認(rèn)為它們確實都推動了人工智能科學(xué)的發(fā)展。而在這條漫長路徑的盡頭,將會是通用人工智能(AGI)。

不過從另一個角度來看,你也可以認(rèn)為,大語言模型的成功源自人工智能研究中的另一條技術(shù)路線,這條路線并不包括強化學(xué)習(xí),因此它和 AlphaGo 的路徑并不相同。

而且,它與 AlphaFold 也有一定程度的分離。AlphaFold 的確使用了 Transformer 模型,但那是一種特殊形式的 Transformer。關(guān)于 AlphaFold 和 Transformer 的相關(guān)研究,大致集中在 2018 到 2020 年之間,更準(zhǔn)確地說是在 2019 到 2020 年。

與此同時,OpenAI 已經(jīng)在基于 Transformer 架構(gòu)構(gòu)建大語言模型了。因此,我更傾向于把這看作是人工智能進(jìn)展中的另一條獨立技術(shù)路線。

所以,從宏觀上看,任何在 AI 領(lǐng)域的重要突破,都會推動未來的發(fā)展;但從更具體的技術(shù)起源來看,大語言模型的誕生路徑,其實是相對獨立的。

AGI 競爭的真實格局

InfoQ:根據(jù)您對 AI 行業(yè)的了解,您認(rèn)為 DeepMind、OpenAI、Anthropic 的核心差異是什么?

馬拉比:首先,一個很大的差異在于它與谷歌的關(guān)系。就像我之前說的,DeepMind 有來自谷歌的大量資金支持,這是一個非常大的優(yōu)勢。因為即便在今天,訓(xùn)練這些模型的成本依然極其高昂,而它們帶來的收入其實并不多。

所以現(xiàn)階段,你必須有充足的資金支撐,而德米斯很幸運,有谷歌在背后支持。相比之下,Anthropic 和 OpenAI 需要不斷去找投資人融資,這本身就很困難——這是一個很關(guān)鍵的差別。

不過在其他方面,它們其實又很相似。比如說,它們都有自己的大語言模型,而且這些模型整體水平都很高。不同時間點上,可能某一家會領(lǐng)先另外兩家,但這種領(lǐng)先是動態(tài)變化的。

如果換一個角度來看它們的差異,可以從“安全性”入手。Anthropic 對安全問題非常重視,甚至不久前還因為 AI 在軍事系統(tǒng)中的應(yīng)用問題,與五角大樓發(fā)生過爭議。

而 DeepMind 在這方面的表現(xiàn)則不太一樣。我認(rèn)為德米斯本人也是重視安全的,包括在軍事應(yīng)用方面,但他并沒有和政府發(fā)生正面沖突。所以你可以說,Anthropic 是最愿意為推動安全議題而承擔(dān)風(fēng)險的公司;DeepMind(以及谷歌)排在中間。

至于 OpenAI,就很有意思了。從外部表現(xiàn)來看,它似乎沒有那么強調(diào)安全——比如在 Anthropic 和五角大樓發(fā)生爭議時,OpenAI 的態(tài)度更像是:“沒問題,我們可以提供 AI。”

這在某種程度上也類似他們發(fā)布 ChatGPT 時的策略:他們并不介意推出一個可能存在風(fēng)險的產(chǎn)品,而是選擇先發(fā)布再迭代。相比之下,Anthropic 和 DeepMind 都曾因為更謹(jǐn)慎,而沒有發(fā)布一些模型。

所以如果做一個粗略排序:

  • 最激進(jìn)(最不保守):OpenAI

  • 中間:谷歌 DeepMind

  • 最強調(diào)安全:Anthropic

你提到 OpenAI 最近招募了 OpenClaw 的開源項目創(chuàng)始人彼得·斯坦伯格(Peter Steinberger),也在問這會不會對谷歌或 DeepMind 構(gòu)成威脅,尤其是在 OpenClaw 現(xiàn)在很火的情況下。

我認(rèn)為,在谷歌 DeepMind 內(nèi)部,本身就有大量在做智能體的優(yōu)秀研究人員。即使招募了一個做出 OpenClaw 的人,也不太可能從根本上改變整個競爭格局。

另外一點很關(guān)鍵:OpenClaw 確實令人印象深刻,但它同樣也具有一定的風(fēng)險性。真正的挑戰(zhàn)在于,如何做出既強大又安全的系統(tǒng)——只有這樣,它才真正具備大規(guī)模應(yīng)用價值。而至于彼得是否能夠做到這一點,目前其實還無法確定。

InfoQ:谷歌、OpenAI、xAI、Anthropic 以及中國的 DeepSeek、阿里巴巴、騰訊等公司,您認(rèn)為誰最接近 AGI?

馬拉比:AGI(通用人工智能)的定義一直都是不精確的,人們其實并沒有一個統(tǒng)一、清晰的標(biāo)準(zhǔn)。

從某種角度來說,你完全可以這樣理解:現(xiàn)在這些優(yōu)秀的大語言模型,本身就具備“通用性”(general)、“人工性”(artificial)以及一定程度的“智能”(intelligent)。因此,也有人會認(rèn)為——某種意義上的 AGI 其實已經(jīng)出現(xiàn)了。

但這本質(zhì)上取決于你如何定義 AGI。

一種更務(wù)實的理解方式是:AGI 應(yīng)該是一種在現(xiàn)實世界中極其有用的機器,尤其是在商業(yè)環(huán)境里,能夠執(zhí)行原本由人類完成的工作。換句話說,它不只是“聰明”,而是“能干活”。

在這個維度上,你可以看到一些非常具體的進(jìn)展。例如,Claude Code 這樣的系統(tǒng),已經(jīng)能夠非常高效地編寫代碼,以至于企業(yè)對程序員的需求結(jié)構(gòu)可能發(fā)生變化——過去可能需要 20 個工程師,未來也許只需要 10 個,因為有一半的代碼是由模型完成的。

當(dāng)然,這并不是某一家獨有的能力。其他公司也在做類似的事情:比如 OpenAI Codex,以及谷歌 DeepMind 自己的代碼生成模型,中國的一些模型在代碼生成方面也表現(xiàn)不俗。

所以問題就變成了:誰現(xiàn)在最好?也許此刻可以說是 Claude,但六個月之后,很可能格局就會變化。

換句話說,在“是否接近 AGI”這個問題上,我們已經(jīng)進(jìn)入了一個新的階段:關(guān)鍵不再只是“有沒有”,而是“誰在什么任務(wù)上更實用、替代性更強”,以及這種能力能否持續(xù)、穩(wěn)定地提升。

InfoQ:那您認(rèn)為,AGI 突破更可能來自模型規(guī)模,還是新的算法?

馬拉比:到目前為止我們?nèi)〉玫倪M(jìn)展,其實是多方面共同作用的結(jié)果。

很重要的一點是要理解:無論是來自谷歌、OpenAI,還是 Anthropic 的進(jìn)展,雖然它們確實在不斷擴大算力規(guī)模(scaling compute),但這并不是全部。與此同時,它們也在持續(xù)改進(jìn)算法、優(yōu)化工程實現(xiàn),并進(jìn)行各種技術(shù)創(chuàng)新,這些共同推動了整個 AI 科學(xué)的發(fā)展。

所以,本質(zhì)上這是一個“規(guī)模 + 技術(shù)”的組合驅(qū)動過程。而我也認(rèn)為,未來大概率仍然會延續(xù)這種組合路徑。

當(dāng)然,現(xiàn)在很多人在討論一個問題:算力擴展是否會遇到瓶頸?我的看法是,每當(dāng)人們認(rèn)為“擴展快到極限了”的時候,總會出現(xiàn)新的擴展方式。

比如說,早期的基礎(chǔ)模型通過擴大訓(xùn)練規(guī)模獲得了巨大提升,但后來這種邊際收益可能開始下降。于是,又出現(xiàn)了新的擴展路徑——比如在推理階段對“推理模型”進(jìn)行擴展,這又帶來了新的性能提升空間。

再往未來看,也許還會出現(xiàn)新的規(guī)模化維度,比如智能體或者具身智能的擴展。

因此,我的判斷是:規(guī)?;旧聿粫В皇窃诓粩鄵Q一種形式出現(xiàn),并且仍然會是一個長期存在的核心競爭優(yōu)勢。

聲明:本文為 AI 前線整理,不代表平臺觀點,未經(jīng)許可禁止轉(zhuǎn)載。

會議推薦

QCon 全球軟件開發(fā)大會·2026 北京站將于 4 月 16 日 -18 日正式舉辦。本屆大會以“Agentic AI 時代的軟件工程重塑”為主題,聚焦 100+ 重磅議題,匯聚來自阿里、騰訊、字節(jié)跳動、小米、百度等一線科技企業(yè)與創(chuàng)新團隊的技術(shù)專家,圍繞 AI 工程化、系統(tǒng)架構(gòu)與研發(fā)模式演進(jìn)展開深入探討。更多詳情可掃碼或聯(lián)系票務(wù)經(jīng)理 18514549229 進(jìn)行咨詢。

今日薦文

你也「在看」嗎?

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
中日關(guān)系正在發(fā)生改變:日本表面動作不斷,實則開始另眼看中國

中日關(guān)系正在發(fā)生改變:日本表面動作不斷,實則開始另眼看中國

陳漎侃故事
2026-05-07 10:06:51
GPT-5.5 Instant 突然全員免費了!

GPT-5.5 Instant 突然全員免費了!

新浪財經(jīng)
2026-05-07 04:41:37
王清海教授:山楂的3個黃金組合,掃清血管“垃圾”,便宜又好用

王清海教授:山楂的3個黃金組合,掃清血管“垃圾”,便宜又好用

蠟筆小小子
2026-04-21 14:43:37
張才仁侵犯徐杰違體了嗎?專家:誰說這個球不違體的?懸賞100萬

張才仁侵犯徐杰違體了嗎?專家:誰說這個球不違體的?懸賞100萬

南海浪花
2026-05-07 09:48:10
林芳兵現(xiàn)狀:低調(diào)定居北京,61歲知性優(yōu)雅,丈夫兒子都是她的驕傲

林芳兵現(xiàn)狀:低調(diào)定居北京,61歲知性優(yōu)雅,丈夫兒子都是她的驕傲

喜歡歷史的阿繁
2026-05-07 10:59:33
哈佛研究發(fā)現(xiàn):人要有旺盛的生命力,必須有一項運動愛好

哈佛研究發(fā)現(xiàn):人要有旺盛的生命力,必須有一項運動愛好

觀星賞月
2026-05-06 01:42:29
岳陽摩托車飆車后續(xù),現(xiàn)場慘不忍睹2老人當(dāng)場死亡,肇事者是慣犯

岳陽摩托車飆車后續(xù),現(xiàn)場慘不忍睹2老人當(dāng)場死亡,肇事者是慣犯

觀察鑒娛
2026-05-07 09:50:00
“白骨精”扮演者楊春霞,一生拒談西游記,至今不肯原諒導(dǎo)演楊潔

“白骨精”扮演者楊春霞,一生拒談西游記,至今不肯原諒導(dǎo)演楊潔

歷史龍元閣
2026-04-30 10:15:20
印巴空戰(zhàn)一周年,巴基斯坦已經(jīng)蛻變

印巴空戰(zhàn)一周年,巴基斯坦已經(jīng)蛻變

觀察者網(wǎng)
2026-05-07 08:48:02
你們都是什么時候?qū)δ信麻_竅的?網(wǎng)友:果然還是攔不住有心人

你們都是什么時候?qū)δ信麻_竅的?網(wǎng)友:果然還是攔不住有心人

夜深愛雜談
2026-02-21 21:37:02
陳思誠這次賠大了!歐神喝酒上位富婆姐!

陳思誠這次賠大了!歐神喝酒上位富婆姐!

八卦瘋叔
2026-05-07 11:33:07
馬光遠(yuǎn)高呼深圳房地產(chǎn)爆發(fā),拐點已至!網(wǎng)友:買房人開始著急了…

馬光遠(yuǎn)高呼深圳房地產(chǎn)爆發(fā),拐點已至!網(wǎng)友:買房人開始著急了…

火山詩話
2026-05-07 09:59:19
晉祠景區(qū)五一臨時將男廁改女廁,網(wǎng)友:夯爆了!

晉祠景區(qū)五一臨時將男廁改女廁,網(wǎng)友:夯爆了!

黃河新聞網(wǎng)呂梁
2026-05-06 10:18:16
世界級港口被20國爭搶,美國直接叫價千億!可投資方卻只認(rèn)準(zhǔn)中國

世界級港口被20國爭搶,美國直接叫價千億!可投資方卻只認(rèn)準(zhǔn)中國

大運河時空
2026-05-06 13:00:03
倫敦世乒場外暖心一幕!馬龍偶遇奧恰洛夫,場上宿敵也是場下好友

倫敦世乒場外暖心一幕!馬龍偶遇奧恰洛夫,場上宿敵也是場下好友

丹妮觀
2026-05-07 11:01:39
毛主席遺體至今仍面色紅潤,但防腐費用每年需上億元,是真是假?

毛主席遺體至今仍面色紅潤,但防腐費用每年需上億元,是真是假?

歷史龍元閣
2026-05-05 10:15:14
心理學(xué)上有個詞叫:螃蟹效應(yīng)。永遠(yuǎn)要記住,和周圍人搞好關(guān)系的秘訣就是,不分享喜悅、不炫耀成功、不說三道四、不假裝聰明

心理學(xué)上有個詞叫:螃蟹效應(yīng)。永遠(yuǎn)要記住,和周圍人搞好關(guān)系的秘訣就是,不分享喜悅、不炫耀成功、不說三道四、不假裝聰明

德魯克博雅管理
2026-04-28 17:04:30
“自由計劃”僅一天就暫停!6日0點后,俄軍仍在大規(guī)模轟炸烏克蘭

“自由計劃”僅一天就暫停!6日0點后,俄軍仍在大規(guī)模轟炸烏克蘭

鷹眼Defence
2026-05-06 16:42:01
中美之間似乎正在復(fù)制美日廣場協(xié)議,美元繼續(xù)升值對美國是災(zāi)難

中美之間似乎正在復(fù)制美日廣場協(xié)議,美元繼續(xù)升值對美國是災(zāi)難

掉了顆大白兔糖
2026-05-05 15:18:03
奧利賽變奧利給,孔帕尼還是太年輕,不是紅牌估計連皇馬都過不去

奧利賽變奧利給,孔帕尼還是太年輕,不是紅牌估計連皇馬都過不去

穆里尼奧主義者
2026-05-07 12:45:34
2026-05-07 13:11:00
AI前線 incentive-icons
AI前線
面向AI愛好者、開發(fā)者和科學(xué)家,提供AI領(lǐng)域技術(shù)資訊。
1476文章數(shù) 149關(guān)注度
往期回顧 全部

科技要聞

凌晨突發(fā)!馬斯克租22萬塊GPU給“死敵”

頭條要聞

北京三位女大學(xué)生青海自駕游2死1傷 傷者一審獲刑4年

頭條要聞

北京三位女大學(xué)生青海自駕游2死1傷 傷者一審獲刑4年

體育要聞

阿森納巴黎會師歐冠決賽!5月31日開戰(zhàn)

娛樂要聞

小S阿雅重返大S母校,翻看大S畢業(yè)照

財經(jīng)要聞

特朗普:美伊“很有可能”達(dá)成協(xié)議

汽車要聞

理想為什么不做轎車,有了解釋……

態(tài)度原創(chuàng)

親子
藝術(shù)
房產(chǎn)
數(shù)碼
時尚

親子要聞

大家好呀,我是優(yōu)奈!四個月啦

藝術(shù)要聞

這位老教授筆下的青年,活力滿滿

房產(chǎn)要聞

五一海南樓市,太淡了!

數(shù)碼要聞

三星筆記本版Exynos 2800芯片曝光:1.4nm十核CPU

“白色闊腿褲”今年夏天又火了!這樣穿時髦又高級

無障礙瀏覽 進(jìn)入關(guān)懷版