国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

30萬(wàn)被引的AlphaGo之父,創(chuàng)業(yè)4個(gè)月融資近百億元!篤信RL實(shí)現(xiàn)ASI

0
分享至


新智元報(bào)道

編輯:艾倫

【新智元導(dǎo)讀】AlphaGo 之父 David Silver 創(chuàng)辦的 Ineffable Intelligence 獲 11 億美元種子輪,創(chuàng)歐洲融資紀(jì)錄,估值達(dá) 51 億美元。這家公司押注強(qiáng)化學(xué)習(xí)和自我經(jīng)驗(yàn)學(xué)習(xí),試圖挑戰(zhàn)依賴 Scaling Law 的大模型主線。

4 月 27 日,前谷歌 DeepMind 頂級(jí)研究員、UCL 教授 David Silver 創(chuàng)辦的倫敦 AI 實(shí)驗(yàn)室 Ineffable Intelligence 宣布完成 11 億美元種子輪融資,投后估值 51 億美元。


https://www.cnbc.com/2026/04/27/deepmind-ineffable-intelligence-record-seed-funding-nvidia-google.html

這是歐洲迄今最大規(guī)模種子輪。

Sequoia Capital 和 Lightspeed Venture Partners 共同領(lǐng)投,Nvidia、谷歌、Index、DST Global、英國(guó) Sovereign AI Fund 等參與。

Ineffable 的目標(biāo)是,做一個(gè)從自身經(jīng)驗(yàn)中發(fā)現(xiàn)知識(shí)的「superlearner」,繼續(xù)把強(qiáng)化學(xué)習(xí)推向 ASI。

這筆錢(qián)的特別之處在于階段。

Ineffable 成立時(shí)間只有數(shù)月,公開(kāi)產(chǎn)品、收入、路線圖都還有限,但一上來(lái)就拿到 51 億美元估值。

AI 投資已經(jīng)進(jìn)入一個(gè)新階段,頂尖研究員的個(gè)人信用,正在替代傳統(tǒng)意義上的商業(yè)驗(yàn)證,成為早期融資最稀缺的抵押物。

這筆巨款,投向了強(qiáng)化學(xué)習(xí)

過(guò)去三年,AI 行業(yè)的主線是大語(yǔ)言模型。

更大的語(yǔ)料、更大的集群、更強(qiáng)的推理,幾乎構(gòu)成了所有頭部公司的共同劇本。

Silver 選擇的是另一條路,強(qiáng)化學(xué)習(xí)。

強(qiáng)化學(xué)習(xí)的核心,是讓模型在環(huán)境里行動(dòng),通過(guò)反饋修正策略。

圍棋、國(guó)際象棋、星際爭(zhēng)霸這些封閉系統(tǒng),是它最早打出聲量的地方。


游戲《星際爭(zhēng)霸 2》

Silver 的新公司想把這套方法放大,讓系統(tǒng)從基本動(dòng)作技能一路學(xué)到科學(xué)、數(shù)學(xué)、技術(shù)層面的突破。

公司公開(kāi)表述里,Ineffable 的使命是「與超級(jí)智能進(jìn)行第一次接觸」。

Silver 對(duì)大模型路線的分歧也在這里。

大語(yǔ)言模型主要從人類已經(jīng)寫(xiě)下的文本和代碼中學(xué)習(xí),能力邊界很大程度上受制于人類數(shù)據(jù)。

Silver 在接受 Wired 采訪時(shí)把人類數(shù)據(jù)比作化石燃料,把自我學(xué)習(xí)比作可再生能源。

這個(gè)比喻也解釋了為什么投資人愿意給一個(gè)沒(méi)有完全展開(kāi)商業(yè)模式的實(shí)驗(yàn)室開(kāi)出巨額支票。

強(qiáng)化學(xué)習(xí)

是Scaling Law撞墻后的出路嗎?

依賴海量人類數(shù)據(jù)的傳統(tǒng) Scaling Law 沒(méi)有失效,但邊際收益正在變差。

繼續(xù)堆參數(shù)、堆語(yǔ)料、堆訓(xùn)練算力仍會(huì)帶來(lái)提升,只是高質(zhì)量人類文本正在變成瓶頸。

Epoch AI 估算,公開(kāi)高質(zhì)量人類文本的有效庫(kù)存約為 300 萬(wàn)億 Token,按趨勢(shì)可能最早在今年,最晚在 2032 年,被徹底用光。


https://epoch.ai/blog/will-we-run-out-of-data-limits-of-llm-scaling-based-on-human-generated-data

也就是說(shuō),舊范式這條路還能走,但越來(lái)越貴、越來(lái)越慢。

純強(qiáng)化學(xué)習(xí)確實(shí)提供了一條更接近 AGI / ASI 的路線,因?yàn)樗屇P蛷摹改7氯祟愇谋尽罐D(zhuǎn)向「通過(guò)行動(dòng)和反饋獲得經(jīng)驗(yàn)」。

AlphaGo Zero 已經(jīng)證明,在規(guī)則清晰、反饋明確的環(huán)境里,系統(tǒng)可以不依賴人類棋譜,通過(guò)自我對(duì)弈達(dá)到超人水平。

OpenAI o1 也顯示,大規(guī)模強(qiáng)化學(xué)習(xí)和測(cè)試時(shí)更多思考時(shí)間,能顯著增強(qiáng)復(fù)雜推理能力。

但純強(qiáng)化學(xué)習(xí)短期很難單獨(dú)承擔(dān) AGI 路線。

圍棋、數(shù)學(xué)、代碼這類任務(wù)有明確驗(yàn)證器,強(qiáng)化學(xué)習(xí)很強(qiáng);

現(xiàn)實(shí)世界的問(wèn)題沒(méi)有穩(wěn)定獎(jiǎng)勵(lì)函數(shù),探索成本高,安全和對(duì)齊也更難。

谷歌 DeepMind 的 AlphaProof 更像是現(xiàn)實(shí)方向的樣板,它結(jié)合預(yù)訓(xùn)練語(yǔ)言模型、Lean 形式化驗(yàn)證和 AlphaZero 式強(qiáng)化學(xué)習(xí),在 IMO 上達(dá)到銀牌水平。

所以更靠譜的判斷是,未來(lái)不是大模型預(yù)訓(xùn)練和強(qiáng)化學(xué)習(xí)二選一,而是混合路線。

預(yù)訓(xùn)練提供知識(shí)和語(yǔ)言底座,強(qiáng)化學(xué)習(xí)提供行動(dòng)反饋和目標(biāo)壓力,搜索、驗(yàn)證器、工具調(diào)用、仿真環(huán)境提供可持續(xù)的新經(jīng)驗(yàn)。

ASI 的關(guān)鍵,是讓它能持續(xù)試錯(cuò)、驗(yàn)證、發(fā)現(xiàn),并把經(jīng)驗(yàn)重新變成能力。

大廠人,正在變成新的公司

Ineffable 趕上了一個(gè)窗口期。

OpenAI、DeepMind、Anthropic、xAI 等公司在上一輪 AI 競(jìng)賽中聚集了最稀缺的人才,也開(kāi)始向創(chuàng)業(yè)市場(chǎng)外溢。

大模型公司繼續(xù)用巨額算力和產(chǎn)品分發(fā)打仗,離開(kāi)的人帶著新路線、新組織和更高上行空間,去拿另一張桌子的籌碼。

類似案例正在增多。

TechCrunch 提到,前 DeepMind 研究員 Tim Rockt?schel 創(chuàng)辦的 Recursive Superintelligence 曾被報(bào)道融資需求可能上探 10 億美元;


Yann LeCun 離開(kāi) Meta AI 負(fù)責(zé)人崗位后,其參與的 AMI Labs 在 3 月宣布 10.3 億美元融資。


Ineffable 不是孤例,它是頂尖研究員創(chuàng)業(yè)潮里,金額最夸張的其中一筆。

這也解釋了英國(guó)政府為何入場(chǎng)。

英國(guó) Sovereign AI Fund 和 British Business Bank 參與了這輪融資,后者確認(rèn)投資 2000 萬(wàn)美元,并稱過(guò)去 12 個(gè)月已做出 9 筆 AI 投資,包括 Wayve、PolyAI 等公司。

對(duì)英國(guó)來(lái)說(shuō),DeepMind 被谷歌收購(gòu)之后,倫敦長(zhǎng)期擁有頂級(jí) AI 人才密度,但缺少能留在本土、繼續(xù)擴(kuò)張的前沿實(shí)驗(yàn)室。

Ineffable 提供了一個(gè)重新下注的機(jī)會(huì)。

最大的問(wèn)題,是從游戲走向世界

Ineffable 的技術(shù)敘事很干凈,也有可見(jiàn)的風(fēng)險(xiǎn)。

圍棋、象棋、星際爭(zhēng)霸有規(guī)則、邊界和可計(jì)算的反饋。

真實(shí)世界的科學(xué)發(fā)現(xiàn)、技術(shù)發(fā)明和社會(huì)系統(tǒng),沒(méi)有這么穩(wěn)定的獎(jiǎng)勵(lì)函數(shù)。

一個(gè)智能體在模擬環(huán)境中學(xué)到的策略,如何遷移到開(kāi)放世界,是強(qiáng)化學(xué)習(xí)走向通用智能繞不開(kāi)的問(wèn)題。

Silver 的答案仍然是模擬。

Wired 報(bào)道稱,他希望把 Agent 放進(jìn)模擬環(huán)境,讓它們學(xué)習(xí)達(dá)成目標(biāo)、相互協(xié)作,并觀察它們?nèi)绾螌?duì)待其他智能體。

這種方法有一個(gè)優(yōu)點(diǎn),系統(tǒng)行為在更可控的空間里被觀察;

也有一個(gè)難點(diǎn),模擬世界必須足夠豐富,才可能訓(xùn)練出對(duì)真實(shí)世界有用的能力。

安全問(wèn)題也會(huì)隨之被放大。

一個(gè)從經(jīng)驗(yàn)中學(xué)習(xí)、持續(xù)尋找更優(yōu)策略的系統(tǒng),可能會(huì)發(fā)現(xiàn)人類沒(méi)有預(yù)設(shè)過(guò)的路徑。

強(qiáng)化學(xué)習(xí)的魅力正在這里,風(fēng)險(xiǎn)也正在這里。

投資人押注的,其實(shí)是 Silver 能不能把 AlphaGo 時(shí)代那套「從經(jīng)驗(yàn)中學(xué)習(xí)」的方法,從游戲房間帶到更大的世界。

David Silver 的第二次開(kāi)局

David Silver 的履歷是這個(gè)估值的最重要支柱。

UCL 官網(wǎng)資料顯示,他曾任 DeepMind 強(qiáng)化學(xué)習(xí)研究組負(fù)責(zé)人,主導(dǎo) AlphaGo,并參與 AlphaZero,后者通過(guò)自我對(duì)弈在圍棋、國(guó)際象棋、日本將棋中達(dá)到超人類水平。

同時(shí),他還通過(guò)國(guó)際象棋比賽認(rèn)識(shí)了 DeepMind CEO Demis Hassabis,并成為終生好友。


即便離開(kāi)了 DeepMind,二人仍保持親密關(guān)系——David Silver 自述「離開(kāi)只是因?yàn)橄腴_(kāi)辟一條全新的道路」。


https://www.wired.com/story/david-silver-ai-ineffable-intelligence-reinforcement-learning/

ACM 在 2020 年授予他 2019 ACM Prize in Computing,理由是其在計(jì)算機(jī)博弈上的突破性貢獻(xiàn)。

英國(guó)皇家學(xué)會(huì)資料還列出,他參與過(guò)從 Atari、AlphaGo、AlphaZero 到 AlphaStar 的多項(xiàng)關(guān)鍵工作。

其谷歌學(xué)術(shù)主頁(yè)及公開(kāi)資料顯示,Silver 的學(xué)術(shù)引用量已達(dá) 30 萬(wàn),H-index 達(dá)到 103,是強(qiáng)化學(xué)習(xí)領(lǐng)域少數(shù)同時(shí)擁有學(xué)術(shù)影響力和產(chǎn)業(yè)戰(zhàn)績(jī)的人。


https://scholar.google.com/citations?user=-8DNE4UAAAAJ&hl=zh-CN&oi=ao

Ineffable 的 11 億美元種子輪,表面是又一個(gè) AI 融資紀(jì)錄,核心是一次路線投票。

大模型仍在主賽道狂奔,Silver 試圖證明,ASI 還可以從行動(dòng)、反饋和自我經(jīng)驗(yàn)里長(zhǎng)出來(lái)。

過(guò)去,AlphaGo 讓強(qiáng)化學(xué)習(xí)第一次走到大眾面前;

現(xiàn)在,Ineffable 想讓它從棋盤(pán)走向一整套新的智能系統(tǒng)。

參考資料:

https://www.cnbc.com/2026/04/27/deepmind-ineffable-intelligence-record-seed-funding-nvidia-google.html

https://www.wired.com/story/david-silver-ai-ineffable-intelligence-reinforcement-learning/

https://davidstarsilver.wordpress.com/

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
牛!中國(guó)制造,已經(jīng)強(qiáng)到如此可怕了!火遍全球的越野跑鞋竟是made in china !

牛!中國(guó)制造,已經(jīng)強(qiáng)到如此可怕了!火遍全球的越野跑鞋竟是made in china !

英國(guó)報(bào)姐
2026-04-27 20:39:55
一線民警手握查詢權(quán)限,卻把公民銀行卡信息當(dāng)商品賣(mài)

一線民警手握查詢權(quán)限,卻把公民銀行卡信息當(dāng)商品賣(mài)

網(wǎng)絡(luò)易不易
2026-04-27 12:04:17
金價(jià):大家不用等候了!不出意外,金價(jià)可能將歷史重演!

金價(jià):大家不用等候了!不出意外,金價(jià)可能將歷史重演!

殘夢(mèng)重生來(lái)
2026-04-28 04:40:09
真有錢(qián)!傳奇球星:我踢中超1年能賺5400萬(wàn),后代幾輩子都花不完

真有錢(qián)!傳奇球星:我踢中超1年能賺5400萬(wàn),后代幾輩子都花不完

國(guó)足風(fēng)云
2026-04-27 19:47:58
美媒:中國(guó)福建艦,2026年,完全形成戰(zhàn)斗力,不可思議!

美媒:中國(guó)福建艦,2026年,完全形成戰(zhàn)斗力,不可思議!

萬(wàn)里繁華
2026-04-28 12:02:20
多項(xiàng)數(shù)據(jù)生涯最低,NBA最完美的3D,也快要謝幕了

多項(xiàng)數(shù)據(jù)生涯最低,NBA最完美的3D,也快要謝幕了

體壇熱評(píng)
2026-04-28 16:54:45
徐巧芯突拋8千億,韓國(guó)瑜嚇傻,傅崐萁暴怒,鄭麗文重鎊炸出

徐巧芯突拋8千億,韓國(guó)瑜嚇傻,傅崐萁暴怒,鄭麗文重鎊炸出

陳博世財(cái)經(jīng)
2026-04-28 14:16:26
北美當(dāng)個(gè)寶,國(guó)內(nèi)沒(méi)人鳥(niǎo),投資13.7億的好萊塢大片被國(guó)人上了一課

北美當(dāng)個(gè)寶,國(guó)內(nèi)沒(méi)人鳥(niǎo),投資13.7億的好萊塢大片被國(guó)人上了一課

八卦南風(fēng)
2026-04-28 14:39:59
孫楊私生子眉毛嘴巴和他一模一樣,13歲在北京練擊劍

孫楊私生子眉毛嘴巴和他一模一樣,13歲在北京練擊劍

喜歡歷史的阿繁
2026-04-28 00:37:17
反轉(zhuǎn)!巴薩即將鎖定新巨星,夏窗預(yù)算超1.3億歐,球迷松口氣

反轉(zhuǎn)!巴薩即將鎖定新巨星,夏窗預(yù)算超1.3億歐,球迷松口氣

祥談體育
2026-04-28 18:49:54
特朗普在白宮迎接英王,共進(jìn)下午茶,系查爾斯三世即位后首次訪美

特朗普在白宮迎接英王,共進(jìn)下午茶,系查爾斯三世即位后首次訪美

新京報(bào)
2026-04-28 09:21:07
至今,還有13個(gè)國(guó)家和中國(guó)沒(méi)有建交,他們都是誰(shuí)?

至今,還有13個(gè)國(guó)家和中國(guó)沒(méi)有建交,他們都是誰(shuí)?

深度報(bào)
2026-04-22 22:30:57
深夜重大喜訊!伊朗特種部隊(duì)行動(dòng)成功,美伊和談?dòng)瓉?lái)關(guān)鍵破局

深夜重大喜訊!伊朗特種部隊(duì)行動(dòng)成功,美伊和談?dòng)瓉?lái)關(guān)鍵破局

小蘭聊歷史
2026-04-28 04:35:51
“只顧自己紋眉,不管女兒死活?”14歲女孩生日照,臉上全是槽點(diǎn)

“只顧自己紋眉,不管女兒死活?”14歲女孩生日照,臉上全是槽點(diǎn)

蝴蝶花雨話教育
2026-04-25 00:45:03
北京公交專用道行駛時(shí)間,又有新調(diào)整!

北京公交專用道行駛時(shí)間,又有新調(diào)整!

BRTV新聞
2026-04-28 12:40:41
今日!CCTV5直播趙心童亮相+CBA遼籃+NBA+國(guó)羽,網(wǎng)絡(luò)轉(zhuǎn)西甲+意甲

今日!CCTV5直播趙心童亮相+CBA遼籃+NBA+國(guó)羽,網(wǎng)絡(luò)轉(zhuǎn)西甲+意甲

晚池
2026-04-28 01:06:03
深夜抵湘!不降北京直奔生產(chǎn)線,巴鐵總統(tǒng)這趟"反常"行程大有深意

深夜抵湘!不降北京直奔生產(chǎn)線,巴鐵總統(tǒng)這趟"反常"行程大有深意

溫讀史
2026-04-28 18:23:59
顏寧完全沒(méi)有必要如此敏感

顏寧完全沒(méi)有必要如此敏感

廖保平
2026-04-28 08:43:09
伊朗外長(zhǎng):美方請(qǐng)求談判,伊方正在考慮

伊朗外長(zhǎng):美方請(qǐng)求談判,伊方正在考慮

界面新聞
2026-04-27 22:24:15
受賄數(shù)額特別巨大!原副部級(jí)彭曉春被提起公訴

受賄數(shù)額特別巨大!原副部級(jí)彭曉春被提起公訴

看看新聞Knews
2026-04-28 14:32:08
2026-04-28 19:07:00
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺(tái)領(lǐng)航智能+時(shí)代
15084文章數(shù) 66818關(guān)注度
往期回顧 全部

財(cái)經(jīng)要聞

政治局會(huì)議:加強(qiáng)算力網(wǎng)等規(guī)劃建設(shè)

頭條要聞

《奇葩說(shuō)》辯手稱淘寶上賣(mài)毒品前體 有人留言"能吃嗎"

頭條要聞

《奇葩說(shuō)》辯手稱淘寶上賣(mài)毒品前體 有人留言"能吃嗎"

體育要聞

季后賽最新局勢(shì):雷霆4-0晉級(jí)首隊(duì) 4隊(duì)3-1

娛樂(lè)要聞

蔡卓妍官宣結(jié)婚,老公比她小10歲

科技要聞

10億周活目標(biāo)落空!傳OpenAI爆發(fā)內(nèi)部分歧

汽車(chē)要聞

拒絕瘋狂套娃!現(xiàn)代艾尼氪金星長(zhǎng)在未來(lái)審美點(diǎn)上

態(tài)度原創(chuàng)

本地
房產(chǎn)
藝術(shù)
教育
公開(kāi)課

本地新聞

用青花瓷的方式,打開(kāi)西溪濕地

房產(chǎn)要聞

紅利爆發(fā)!海南,沖到全國(guó)人口增量第4!

藝術(shù)要聞

深圳極具未來(lái)感的“外星”建筑亮相

教育要聞

湖北城市建設(shè)職業(yè)技術(shù)學(xué)院人工智能學(xué)院“崗課賽證創(chuàng)”打通就業(yè)路

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版