国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

AlphaGo之父出山:另辟蹊徑,繞過(guò)大模型探索超級(jí)智能

0
分享至

又一位大佬創(chuàng)業(yè)了。

幾周前,消息確認(rèn)前谷歌 DeepMind 首席科學(xué)家、AlphaGo 核心負(fù)責(zé)人戴維·席爾瓦(David Silver)正式離職,并在倫敦創(chuàng)立人工智能初創(chuàng)公司"Ineffable Intelligence"。據(jù)悉,該公司正在推進(jìn)一輪規(guī)模達(dá) 10 億美元的種子輪融資,目前已接近完成。

這一融資額度,追平了 OpenAI 前首席科學(xué)家伊利亞·蘇茨克維(Ilya Sutskever)2024 年創(chuàng)立 Safe Superintelligence(SSI)時(shí)創(chuàng)下的紀(jì)錄。


圖 | 戴維·席爾瓦 (來(lái)源:Youtube)

與當(dāng)前依賴(lài)海量文本預(yù)訓(xùn)練的大模型路徑不同,席爾瓦的新公司明確提出:他們要繞過(guò) LLM 既定范式,回歸強(qiáng)化學(xué)習(xí)(Reinforcement Learning, RL)本源,構(gòu)建一個(gè)不依賴(lài)人類(lèi)既有知識(shí)、能自主探索新知的智能系統(tǒng)。

作為 DeepMind 聯(lián)合創(chuàng)始人德米斯·哈薩比斯(Demis Hassabis)自大學(xué)時(shí)代的密友與長(zhǎng)期合作伙伴,席爾瓦的離開(kāi)可以說(shuō)是該公司歷史上最重要的人事變動(dòng)之一。DeepMind 發(fā)言人在簡(jiǎn)短聲明中確認(rèn)了這一消息:“戴維的貢獻(xiàn)是無(wú)價(jià)的,我們非常感謝他對(duì) DeepMind 工作所做出的貢獻(xiàn)?!?/p>

席爾瓦不僅是技術(shù)標(biāo)桿,更是強(qiáng)化學(xué)習(xí)路線(xiàn)的堅(jiān)定倡導(dǎo)者。作為圖靈獎(jiǎng)得主查理·薩頓(Charlie Sutton)的學(xué)生,他的論文被引用量已超過(guò) 28 萬(wàn)次,并于 2019 年獲得 ACM 計(jì)算獎(jiǎng)。

他主張回歸強(qiáng)化學(xué)習(xí)的核心思路。2025 年 4 月,席爾瓦與其導(dǎo)師薩頓共同發(fā)表論文《歡迎來(lái)到經(jīng)驗(yàn)時(shí)代》(Welcome to the Era of Experience),提出新一代 AI 系統(tǒng)應(yīng)更注重智能體與環(huán)境的交互學(xué)習(xí):通過(guò)持續(xù)試錯(cuò)、自我迭代和長(zhǎng)期互動(dòng)積累經(jīng)驗(yàn),而非僅依賴(lài)靜態(tài)數(shù)據(jù)訓(xùn)練。這一理念,也是 Ineffable Intelligence 的技術(shù)基石。


(來(lái)源:arXiv)

在當(dāng)前創(chuàng)投環(huán)境下,Ineffable Intelligence 高達(dá) 10 億美元的融資目標(biāo)尤為引人注目。接近交易的投資人分析,資本市場(chǎng)愿意為一家尚未發(fā)布產(chǎn)品的公司開(kāi)出如此巨額支票,主要基于兩點(diǎn):一是對(duì)席爾瓦個(gè)人技術(shù)聲望的信任,二是對(duì)其所主張的“后大模型時(shí)代”技術(shù)路線(xiàn)的戰(zhàn)略性押注。

目前,包括 OpenAI 的 GPT 系列與谷歌的 Gemini 系列在內(nèi),主流 AI 模型均建立在“預(yù)訓(xùn)練 + 微調(diào)”范式之上。這些模型通過(guò)學(xué)習(xí)互聯(lián)網(wǎng)上海量的文本數(shù)據(jù),掌握預(yù)測(cè)下一個(gè)詞的統(tǒng)計(jì)規(guī)律,從而展現(xiàn)出強(qiáng)大的對(duì)話(huà)與生成能力。但席爾瓦認(rèn)為,這一路徑存在本質(zhì)局限:AI 的能力上限被“人類(lèi)數(shù)據(jù)”本身所鎖定。

席爾瓦曾在私下場(chǎng)合多次表達(dá)對(duì)當(dāng)前技術(shù)路線(xiàn)的擔(dān)憂(yōu)。他指出,大語(yǔ)言模型在后訓(xùn)練階段主要依賴(lài)“人類(lèi)反饋強(qiáng)化學(xué)習(xí)”(RLHF),即通過(guò)人類(lèi)評(píng)估員的打分來(lái)優(yōu)化模型。這意味著,模型所能達(dá)到的最高水平,難以超越人類(lèi)評(píng)估員的認(rèn)知邊界。

“我們想要超越人類(lèi)的認(rèn)知,為此需要一種不同的方法?!?025 年 4 月,席爾瓦在一檔播客節(jié)目中罕見(jiàn)公開(kāi)闡述其理念,“這種方法需要 AI 能夠真正自主探索,發(fā)現(xiàn)人類(lèi)尚不知道的新事物?!?/p>

Ineffable Intelligence 的核心愿景,正是構(gòu)建一個(gè)擺脫人類(lèi)知識(shí)束縛的系統(tǒng)。據(jù)熟悉該項(xiàng)目的人士透露,新公司將致力于研發(fā)“能夠持續(xù)學(xué)習(xí)的超級(jí)智能”——它不僅能處理語(yǔ)言,更能通過(guò)在模擬環(huán)境中的自我博弈與試錯(cuò),從第一性原理出發(fā),推導(dǎo)解決問(wèn)題的最優(yōu)解。

席爾瓦的堅(jiān)持,有扎實(shí)的成果支撐。作為 AlphaGo 總設(shè)計(jì)師,他主導(dǎo)了 2016 年那場(chǎng)轟動(dòng)全球的人機(jī)大戰(zhàn)。在與李世石的第二局比賽中,著名的“第 37 手”曾被所有人類(lèi)專(zhuān)家判定為失誤,因?yàn)樗环先魏我阎獓宥ㄊ?。然而后續(xù)棋局證明,這正是決定勝負(fù)的關(guān)鍵一手。席爾瓦將此類(lèi)現(xiàn)象稱(chēng)為“不可言說(shuō)”(Ineffable)的智慧。AI 通過(guò)計(jì)算,發(fā)現(xiàn)了人類(lèi)尚未掌握的規(guī)律。這也正是新公司名稱(chēng)的由來(lái)。


(來(lái)源:Google Deepmind)

此后,席爾瓦團(tuán)隊(duì)開(kāi)發(fā)的 AlphaZero 與 MuZero 進(jìn)一步驗(yàn)證了其理論:AlphaZero 在不依賴(lài)任何人類(lèi)棋譜、僅被告知規(guī)則的前提下,通過(guò)自我對(duì)弈三天便擊敗 AlphaGo;MuZero 甚至無(wú)需知曉規(guī)則,就能在圍棋、國(guó)際象棋和 Atari 游戲中自主摸索規(guī)律,達(dá)到超人水平。

這些成果構(gòu)成了席爾瓦技術(shù)路線(xiàn)的基石:在規(guī)則明確、可模擬的系統(tǒng)中,純粹的強(qiáng)化學(xué)習(xí)完全有能力超越人類(lèi)智能。他堅(jiān)信,只要設(shè)計(jì)出合理的獎(jiǎng)勵(lì)機(jī)制,AI 就能在更復(fù)雜的現(xiàn)實(shí)任務(wù)中復(fù)刻 AlphaZero 的成功,無(wú)需像大語(yǔ)言模型那樣,通過(guò)模仿人類(lèi)語(yǔ)言來(lái)“假裝”思考。

席爾瓦的創(chuàng)業(yè),也折射出 AI 研究圈正在經(jīng)歷一場(chǎng)“路線(xiàn)大分流”。

隨著大語(yǔ)言模型在商業(yè)應(yīng)用中的普及,越來(lái)越多頂尖科學(xué)家開(kāi)始擔(dān)憂(yōu)技術(shù)發(fā)展的潛在瓶頸。2024 年,OpenAI 前首席科學(xué)家伊利亞·蘇茨克維創(chuàng)辦 Safe Superintelligence(SSI),同樣獲得巨額融資。盡管 SSI 與 Ineffable Intelligence 均以“超級(jí)智能”為目標(biāo),但側(cè)重點(diǎn)有所不同:伊利亞傾向于通過(guò)擴(kuò)大計(jì)算規(guī)模與優(yōu)化模型結(jié)構(gòu)實(shí)現(xiàn)智能躍遷,席爾瓦則更激進(jìn)地主張改變學(xué)習(xí)范式,由“監(jiān)督學(xué)習(xí)”轉(zhuǎn)向“強(qiáng)化學(xué)習(xí)”。

此外,一些曾參與 AlphaGo、AlphaZero 項(xiàng)目的科學(xué)家,近期也離職創(chuàng)辦了 Reflection AI;Meta 的人工智能部門(mén)則在圖靈獎(jiǎng)得主楊立昆(Yann LeCun)帶領(lǐng)下,重組“超級(jí)智能實(shí)驗(yàn)室”,探索不同于 Transformer 架構(gòu)的新路徑。

一位行業(yè)觀察家指出:“當(dāng)前局面頗似 2010 年代初深度學(xué)習(xí)爆發(fā)前夜。大家意識(shí)到,現(xiàn)有 LLM 雖強(qiáng)大,但可能并非通往 AGI 的終極答案。席爾瓦代表最原教旨主義的一派,他認(rèn)為智能的本質(zhì)是決策與探索,而非語(yǔ)言預(yù)測(cè)。”

不過(guò),也有批評(píng)者指出,強(qiáng)化學(xué)習(xí)雖在圍棋、游戲等規(guī)則明確的環(huán)境中表現(xiàn)優(yōu)異,但在現(xiàn)實(shí)世界這類(lèi)規(guī)則模糊、反饋稀疏的開(kāi)放環(huán)境中,其有效性尚未得到充分驗(yàn)證。大語(yǔ)言模型之所以成功,正因語(yǔ)言本身是人類(lèi)智慧的高度壓縮。通過(guò)學(xué)習(xí)語(yǔ)言,AI 能以較低成本獲得常識(shí)。

若完全摒棄這一路徑,Ineffable Intelligence 或需構(gòu)建極其復(fù)雜的數(shù)字孿生系統(tǒng),供 AI 進(jìn)行億萬(wàn)次試錯(cuò)訓(xùn)練,其算力成本將是天文數(shù)字。這也正是 10 億美元融資需要解決的首要問(wèn)題。

目前,Ineffable Intelligence 已在倫敦設(shè)立總部,并啟動(dòng)全球頂尖強(qiáng)化學(xué)習(xí)研究員的招募。雖然公司尚未公布具體產(chǎn)品時(shí)間表,但這家公司的技術(shù)路線(xiàn)與資源投入,或?qū)⒊蔀橛绊?AI 技術(shù)演進(jìn)方向的下一股重要力量。

1. https://www.ft.com/content/dffe72d0-4064-4412-8ebc-50198a30d40e

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
美軍航母“炸”了,史詩(shī)級(jí)災(zāi)難,把臉都丟光了

美軍航母“炸”了,史詩(shī)級(jí)災(zāi)難,把臉都丟光了

毛豆論道
2026-02-26 19:32:00
2連勝男籃最新評(píng)分!3人滿(mǎn)分4人優(yōu)秀,有3人郭士強(qiáng)下次不能再帶了

2連勝男籃最新評(píng)分!3人滿(mǎn)分4人優(yōu)秀,有3人郭士強(qiáng)下次不能再帶了

后仰大風(fēng)車(chē)
2026-03-01 20:26:16
曼聯(lián)2-1水晶宮,賽后評(píng)分:B費(fèi)7.8分,塞斯科7.7分,馬奎爾7.3分

曼聯(lián)2-1水晶宮,賽后評(píng)分:B費(fèi)7.8分,塞斯科7.7分,馬奎爾7.3分

卡靈頓分析師
2026-03-02 01:00:55
澳門(mén)的賭臺(tái),大面積關(guān)停!不是沒(méi)人去,而是被“算法”割廢的?

澳門(mén)的賭臺(tái),大面積關(guān)停!不是沒(méi)人去,而是被“算法”割廢的?

水泥土的搞笑
2026-02-27 17:09:36
超級(jí)杯大戰(zhàn)!斯盧茨基也是刺探軍情!北京國(guó)安氣勢(shì) 申花能守住嗎

超級(jí)杯大戰(zhàn)!斯盧茨基也是刺探軍情!北京國(guó)安氣勢(shì) 申花能守住嗎

80后體育大蜀黍
2026-03-01 23:41:10
這就是公開(kāi)辱華的后果!取消冠軍頭銜只是開(kāi)始,職業(yè)生涯也全毀了

這就是公開(kāi)辱華的后果!取消冠軍頭銜只是開(kāi)始,職業(yè)生涯也全毀了

阿鳧愛(ài)吐槽
2025-12-17 17:24:39
想不通為什么有人去俄羅斯旅游

想不通為什么有人去俄羅斯旅游

劉遠(yuǎn)舉
2026-02-25 08:09:47
朝鮮閱兵式現(xiàn)場(chǎng)大將僅剩5人!戰(zhàn)略軍直接被裁?

朝鮮閱兵式現(xiàn)場(chǎng)大將僅剩5人!戰(zhàn)略軍直接被裁?

IN朝鮮
2026-02-28 10:45:32
新標(biāo)題:27座美軍基地被炸,美國(guó)抗議,特朗普或被彈劾

新標(biāo)題:27座美軍基地被炸,美國(guó)抗議,特朗普或被彈劾

王飬吃吃喝喝
2026-03-02 03:55:24
嚴(yán)重下滑!29歲的泰厄斯瓊斯,為何突然被裁?

嚴(yán)重下滑!29歲的泰厄斯瓊斯,為何突然被裁?

籃球?qū)嶄?/span>
2026-03-02 00:25:17
不結(jié)婚怎么解決生理需求?56歲的歌唱家張也,用行動(dòng)給出了答案

不結(jié)婚怎么解決生理需求?56歲的歌唱家張也,用行動(dòng)給出了答案

攬星辰入夢(mèng)
2026-01-28 23:05:47
女孩當(dāng)小姐,一晚要提供4到5次上門(mén)服務(wù),2015年被親人點(diǎn)到不赴約

女孩當(dāng)小姐,一晚要提供4到5次上門(mén)服務(wù),2015年被親人點(diǎn)到不赴約

漢史趣聞
2025-11-08 09:27:32
街頭,伊朗人悲傷地跳了起來(lái)?

街頭,伊朗人悲傷地跳了起來(lái)?

關(guān)爾東
2026-03-01 23:02:58
知名演員秦嵐自曝患病,已做手術(shù)!

知名演員秦嵐自曝患病,已做手術(shù)!

極目新聞
2026-02-28 23:12:57
給央視賣(mài)命19年,連站6年零下幾十度春晚分會(huì)場(chǎng),撒貝寧沒(méi)他微信

給央視賣(mài)命19年,連站6年零下幾十度春晚分會(huì)場(chǎng),撒貝寧沒(méi)他微信

百態(tài)人間
2026-02-28 15:31:33
三十億防空網(wǎng)七分鐘癱瘓,敗給的不只是美軍

三十億防空網(wǎng)七分鐘癱瘓,敗給的不只是美軍

寰宇文創(chuàng)
2026-01-09 05:39:17
猶太財(cái)團(tuán)又要開(kāi)始賣(mài)國(guó)了,大規(guī)模資產(chǎn)轉(zhuǎn)移后,貝萊德:美國(guó)沒(méi)救了

猶太財(cái)團(tuán)又要開(kāi)始賣(mài)國(guó)了,大規(guī)模資產(chǎn)轉(zhuǎn)移后,貝萊德:美國(guó)沒(méi)救了

老范談史
2026-01-13 20:15:38
造車(chē)新勢(shì)力2月交付承壓:零跑跌至3萬(wàn)輛以下,多家車(chē)企加碼促銷(xiāo)

造車(chē)新勢(shì)力2月交付承壓:零跑跌至3萬(wàn)輛以下,多家車(chē)企加碼促銷(xiāo)

澎湃新聞
2026-03-01 22:10:31
美學(xué)者:特朗普要把中東收入囊中,美國(guó)很可能已點(diǎn)燃世界大戰(zhàn)的導(dǎo)火索

美學(xué)者:特朗普要把中東收入囊中,美國(guó)很可能已點(diǎn)燃世界大戰(zhàn)的導(dǎo)火索

21世紀(jì)經(jīng)濟(jì)報(bào)道
2026-03-01 12:16:06
吸人血的曲婉婷,沒(méi)路了

吸人血的曲婉婷,沒(méi)路了

云石
2026-02-28 23:21:10
2026-03-02 05:40:49
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技評(píng)論獨(dú)家合作
16343文章數(shù) 514683關(guān)注度
往期回顧 全部

科技要聞

榮耀發(fā)布機(jī)器人手機(jī)、折疊屏、人形機(jī)器人

頭條要聞

特朗普警告伊朗“不要報(bào)復(fù)” 伊朗外長(zhǎng)回應(yīng)

頭條要聞

特朗普警告伊朗“不要報(bào)復(fù)” 伊朗外長(zhǎng)回應(yīng)

體育要聞

火箭輸給熱火:烏度卡又輸斯波教練

娛樂(lè)要聞

黃景瑜 李雪健坐鎮(zhèn)!38集犯罪大劇來(lái)襲

財(cái)經(jīng)要聞

中東局勢(shì)升級(jí) 如何影響A股、黃金和原油

汽車(chē)要聞

理想汽車(chē)2月交付26421輛 歷史累計(jì)交付超159萬(wàn)輛

態(tài)度原創(chuàng)

家居
健康
時(shí)尚
游戲
親子

家居要聞

素色肌理 品意式格調(diào)

轉(zhuǎn)頭就暈的耳石癥,能開(kāi)車(chē)上班嗎?

今年春天最流行的4件衛(wèi)衣,照著穿就很好看

以《生化危機(jī)》命名?Capcom解答對(duì)RE引擎的誤讀

親子要聞

帶娃看醫(yī)生,聽(tīng)懂這幾句話(huà)少走90%彎路!

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版