国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

我們正在嚴(yán)重低估AI的進(jìn)展!AlphaGo締造者罕見(jiàn)發(fā)聲:2026年AI自主上崗8小時(shí)

0
分享至

  

  來(lái)源:新智元

  【導(dǎo)讀】當(dāng)我們還在調(diào)侃「AI寫(xiě)錯(cuò)代碼」時(shí),實(shí)驗(yàn)室里的科學(xué)家卻看到它能獨(dú)立完成幾個(gè)小時(shí)的復(fù)雜任務(wù)。AlphaGo作者Julian罕見(jiàn)發(fā)聲:公眾對(duì)AI的認(rèn)知,至少落后一個(gè)世代。最新數(shù)據(jù)更顯示,AI正以指數(shù)速度逼近專(zhuān)家水準(zhǔn),2026或許就是臨界點(diǎn)。我們,是在見(jiàn)證未來(lái),還是在自欺欺人?

  AlphaGo、AlphaZero的核心作者——Julian拋出了一個(gè)尖銳的比喻:人們今天對(duì)AI的態(tài)度,很像當(dāng)初面對(duì)新冠疫情早期的反應(yīng)。

  Julian的意思很直接:我們正在嚴(yán)重低估AI的進(jìn)展。

  

  很多人還在笑它寫(xiě)錯(cuò)代碼,抱怨它沒(méi)法替代人類(lèi);但在實(shí)驗(yàn)室里,研究者早已看到另一幅景象——AI已經(jīng)能獨(dú)立完成幾個(gè)小時(shí)的復(fù)雜任務(wù),并且還在按指數(shù)速度進(jìn)化。

  這就是他決定站出來(lái)發(fā)聲的原因:公眾的認(rèn)知,和前沿的現(xiàn)實(shí),之間至少隔著一個(gè)世代的落差。

  

  科學(xué)家不忍再沉默:AI為何被大眾低估?

  Julian Schrittwieser的名字,或許不像馬斯克、奧特曼那樣家喻戶(hù)曉,但在AI圈,他是響當(dāng)當(dāng)?shù)拇嬖凇?/p>

  

  作為AlphaGo、AlphaZero、MuZero的核心作者之一,他親歷了AI從「圍棋科幻」到「現(xiàn)實(shí)碾壓」的全過(guò)程。

  也正因如此,當(dāng)他在個(gè)人博客寫(xiě)下那段話時(shí),格外刺耳:

  人們注意到AI還會(huì)犯錯(cuò),就急著下結(jié)論:它永遠(yuǎn)不可能達(dá)到人類(lèi)水準(zhǔn),或者影響有限??蓜e忘了——就在幾年前,讓AI寫(xiě)程序、設(shè)計(jì)網(wǎng)站還完全是科幻!

  在他看來(lái),今天的輿論氛圍有點(diǎn)荒謬。

  大眾盯著模型出錯(cuò)的細(xì)節(jié),就斷言「AI不過(guò)如此」;記者拿兩代模型的閑聊對(duì)比,覺(jué)得「沒(méi)啥變化」,就認(rèn)定「進(jìn)步停滯」;政策討論里,AI被當(dāng)成遙遠(yuǎn)的、虛浮的「泡沫」。

  

  然而,實(shí)驗(yàn)室里的研究者看到的,卻是另一幅畫(huà)面:AI的能力曲線正在以指數(shù)型躍升。

  Julian bluntly指出,公眾與前沿之間的認(rèn)知差距,至少滯后了一個(gè)世代

  他之所以站出來(lái)發(fā)聲,不是為了渲染危機(jī),而是為了提醒:如果連科學(xué)家眼前清晰可見(jiàn)的趨勢(shì)都被忽視,真正的臨界點(diǎn)到來(lái)時(shí),我們幾乎沒(méi)有準(zhǔn)備。

  指數(shù)曲線下的震撼

  AI「獨(dú)立上班」的時(shí)間在翻倍

  Julian提出的第一個(gè)關(guān)鍵證據(jù),來(lái)自一家專(zhuān)門(mén)研究模型能力的機(jī)構(gòu)——METR (Model Evaluation and Threat Research)。

  他們的思路很直白:不再只看模型答題對(duì)錯(cuò),而是衡量它們能自主完成多長(zhǎng)時(shí)間的真實(shí)任務(wù)。

  在今年早些時(shí)候的研究里,METR給出的答案是:Claude 3.7 Sonnet能在約1小時(shí)長(zhǎng)度的軟件工程任務(wù)中保持50%的成功率。

  

  這意味著,它已經(jīng)具備獨(dú)立撐起一段「實(shí)打?qū)嵉墓ぷ鲿r(shí)長(zhǎng)」的能力。

  Julian指出,更令人震驚的是——這條曲線呈現(xiàn)出指數(shù)增長(zhǎng)趨勢(shì),每7個(gè)月翻一倍。

  Sonnet 3.7已經(jīng)是7個(gè)月前的模型,正好對(duì)應(yīng)METR統(tǒng)計(jì)出的翻倍周期。

  他隨即給出最新的對(duì)照:在METR官網(wǎng)更新的圖表里,可以看到Grok 4、Claude Opus 4.1、GPT-5已經(jīng)排在右上角。

  

  Julian博文引用的METR數(shù)據(jù),橫軸為時(shí)間,縱軸為可完成任務(wù)的時(shí)長(zhǎng)。可以看到GPT-5、Opus 4.1已經(jīng)突破兩小時(shí)大關(guān)。

  它們不再是「1小時(shí)工作」,而是能夠支撐超過(guò)2小時(shí)的任務(wù)。指數(shù)并沒(méi)有放緩,反而略超預(yù)期

  這條線的含義不止是「2小時(shí)」,而是它所暗示的外推未來(lái)

  如果趨勢(shì)不變,2026年年中,模型將能連續(xù)完成8小時(shí)工作;再往后,2027年,模型可能在不少?gòu)?fù)雜任務(wù)上超越人類(lèi)專(zhuān)家。

  Julian的意思很明確:你也許不必喜歡這種預(yù)測(cè),但忽視它的代價(jià)極高。

  跨行業(yè)評(píng)測(cè):AI已逼近人類(lèi)專(zhuān)家

  如果說(shuō)METR的研究證明了AI在軟件工程任務(wù)上的「時(shí)間地平線」不斷拉長(zhǎng),那么另一項(xiàng)研究——OpenAI的GDPval則把這個(gè)趨勢(shì)帶進(jìn)了現(xiàn)實(shí)經(jīng)濟(jì)。

  GDPval的設(shè)計(jì)非常直接:找來(lái)44個(gè)職業(yè)、9大行業(yè)的任務(wù),每個(gè)職業(yè)挑選30個(gè)真實(shí)工作樣本,總共1320項(xiàng)任務(wù)。

  

  GDPval任務(wù)覆蓋9大行業(yè),44個(gè)職業(yè),模型表現(xiàn)已與人類(lèi)差距極小。Claude Opus 4.1在多個(gè)維度甚至領(lǐng)先GPT-5。

  這些任務(wù)由平均14年經(jīng)驗(yàn)的行業(yè)專(zhuān)家設(shè)計(jì),再交給模型去完成,最后由盲評(píng)打分:只看結(jié)果,不看作者是誰(shuí)。

  Julian在博文里寫(xiě)道:

  最新的結(jié)果顯示,GPT-5在許多職業(yè)任務(wù)上已經(jīng)接近人類(lèi)水準(zhǔn)。更令人意外的是,Claude Opus 4.1(發(fā)布時(shí)間甚至早于 GPT-5),在GDPval上的表現(xiàn)顯著優(yōu)于GPT-5,幾乎追平了行業(yè)專(zhuān)家。

  這不是某個(gè)孤立benchmark的「漂亮成績(jī)」,而是在跨越法律、金融、工程、醫(yī)療、創(chuàng)意等行業(yè)的真實(shí)檢驗(yàn)中,AI開(kāi)始逼近人類(lèi)平均水平。

  

  OpenAI GDPval評(píng)測(cè)結(jié)果(2024–2025)??v軸為模型在真實(shí)職業(yè)任務(wù)中的勝率(對(duì)比有多年經(jīng)驗(yàn)的行業(yè)專(zhuān)家),深色為純勝率,淺色為勝或平局。可以看到GPT-5已逼近「行業(yè)專(zhuān)家水平線」。

  更值得注意的是:OpenAI在這份報(bào)告中,并沒(méi)有刻意凸顯自家模型,反而坦誠(chéng)承認(rèn)友商Claude的表現(xiàn)更好

  

  Julian特別稱(chēng)贊這一點(diǎn),認(rèn)為這是行業(yè)少見(jiàn)的「科研誠(chéng)信」:

  在追求安全和有益結(jié)果時(shí),比拼輸贏反而不是最重要的。

  當(dāng)然,GDPval的設(shè)計(jì)也并非完美。

  Julian也提醒,許多任務(wù)依然相對(duì)「整潔」(messy程度不高),沒(méi)有模擬長(zhǎng)周期、多輪反饋的復(fù)雜工作環(huán)境。

  但即便如此,趨勢(shì)已經(jīng)足夠說(shuō)明問(wèn)題——AI不只是能寫(xiě)點(diǎn)小程序,而是在真實(shí)的職業(yè)場(chǎng)景里,正一步步靠近甚至超越人類(lèi)。

  質(zhì)疑聲出現(xiàn):趨勢(shì)真的可靠嗎?

  在Julian的博文下,不少讀者認(rèn)同「AI沒(méi)有泡沫」,但也有人提出尖銳的質(zhì)疑。

  其中,Atharva Raykar的評(píng)論獲得了高贊。他指出:

  把AI的進(jìn)展直接類(lèi)比成指數(shù)曲線,其實(shí)很危險(xiǎn)。疫情的指數(shù)傳播有明確機(jī)制支撐,而AI的提升并不是必然的。

  

  他的觀點(diǎn)是:AI的進(jìn)步更像是摩爾定律,靠整個(gè)行業(yè)不斷疊加創(chuàng)新與工程突破。

  如果沒(méi)有推理模型等關(guān)鍵節(jié)點(diǎn)的突破,能力曲線可能早就「撞墻」。所以,單純外推曲線,未必能保證未來(lái)必然繼續(xù)加速。

  Atharva還提到另一個(gè)問(wèn)題:評(píng)測(cè)任務(wù)不夠「messy」

  METR的任務(wù)平均「復(fù)雜度得分」只有3/16,相當(dāng)于結(jié)構(gòu)清晰的小型工程任務(wù);而現(xiàn)實(shí)世界中的軟件項(xiàng)目、科研探索,往往在7–16的區(qū)間,遠(yuǎn)比benchmark混亂。

  也就是說(shuō),現(xiàn)在的評(píng)測(cè)結(jié)果可能高估了AI在真實(shí)世界中的適用性。

  Julian在后續(xù)回復(fù)中承認(rèn)了這些提醒的合理性,但也強(qiáng)調(diào):

  我類(lèi)比的重點(diǎn)并不是AI一定會(huì)像病毒傳播那樣加速,而是公眾和決策層正在忽視已經(jīng)發(fā)生的增長(zhǎng)。

  短期(1–2 年)的趨勢(shì)依然很清晰——在這種尺度上,外推往往比專(zhuān)家預(yù)測(cè)更靠譜。

  在他看來(lái),問(wèn)題的關(guān)鍵不是曲線未來(lái)是否會(huì)「拐彎],而是:如果趨勢(shì)真的繼續(xù),而社會(huì)卻沒(méi)有準(zhǔn)備,那代價(jià)將會(huì)極其沉重。

  未來(lái)是替代,還是百倍增幅的協(xié)作?

  Julian 在文章的最后給出了他最具沖擊力的預(yù)測(cè):

  2026年中,至少有一款頂級(jí)模型能連續(xù)自主完成8小時(shí)的工作任務(wù)——這意味著它不再只是一個(gè)「對(duì)話工具」,而是能真正以「全職員工」的形式參與工作流。

  2026年底,在多個(gè)行業(yè)任務(wù)中,會(huì)有模型的表現(xiàn)正式達(dá)到人類(lèi)專(zhuān)家的平均水平。

  2027年之后,在不少垂直任務(wù)里,AI的表現(xiàn)將頻繁超越專(zhuān)家,并逐步成為生產(chǎn)力的主力。

  這不是科幻,而是從當(dāng)前曲線直接外推出的「保守版本」。

  

  Julian直言,忽視這種趨勢(shì),比過(guò)度擔(dān)憂更危險(xiǎn)。

  但他同時(shí)也強(qiáng)調(diào),AI的未來(lái)不一定意味著「替代」。在他設(shè)想的畫(huà)面里,更有可能出現(xiàn)的是這樣一種場(chǎng)景:

  人類(lèi)依舊是指揮者,但身邊會(huì)有幾十個(gè)、上百個(gè)超強(qiáng)助手。人機(jī)協(xié)作下的效率提升,不是1倍,而是10倍、100倍。

  這種模式不僅能避免大規(guī)模失業(yè)的恐慌,還可能釋放前所未有的創(chuàng)造力。

  科研、設(shè)計(jì)、醫(yī)療、法律、金融……幾乎所有行業(yè)都會(huì)因此重組。

  Julian把這種可能性稱(chēng)為「更安全、更有益的道路」:讓AI成為超強(qiáng)工具,而不是對(duì)手。

  這幅未來(lái)圖景令人震撼:或許在不遠(yuǎn)的2026或2027,你不是被AI取代,而是帶著一支「AI 團(tuán)隊(duì)」去上班。

  Julian的提醒,其實(shí)很簡(jiǎn)單:我們正在低估AI。

  不是說(shuō)它完美無(wú)缺,而是它的曲線比多數(shù)人想象的更快、更陡。

  按照當(dāng)前的趨勢(shì),2026或許就是關(guān)鍵轉(zhuǎn)折點(diǎn)——AI可能不再是「實(shí)驗(yàn)室的奇觀」,而是走進(jìn)每一個(gè)普通行業(yè),真正改寫(xiě)經(jīng)濟(jì)的底層邏輯。

  這不是危言聳聽(tīng),而是一個(gè)事實(shí):未來(lái)兩三年內(nèi),我們都將直面一個(gè)被低估的臨界點(diǎn)。

  而當(dāng)那一刻到來(lái)時(shí),每個(gè)人都要回答同一個(gè)問(wèn)題:你會(huì)抵抗、觀望,還是率先和你的AI團(tuán)隊(duì)并肩上崗?

  參考資料:

  https://x.com/polynoamial/status/1972167347088904371

  https://www.julian.ac/blog/2025/09/27/failing-to-understand-the-exponential-again/

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
迪馬爾科:國(guó)米換帥是對(duì)的,但那不意味著我們和小因沒(méi)成功過(guò)

迪馬爾科:國(guó)米換帥是對(duì)的,但那不意味著我們和小因沒(méi)成功過(guò)

懂球帝
2026-01-12 07:50:15
演員朱珠疑似塌房?照片流出,驚呆網(wǎng)友!

演員朱珠疑似塌房?照片流出,驚呆網(wǎng)友!

大眼妹妹
2025-12-15 10:39:19
馬斯克怒斥英國(guó)政府:“法西斯”

馬斯克怒斥英國(guó)政府:“法西斯”

財(cái)聯(lián)社
2026-01-11 18:46:06
破案了!許利民痛斥球員耍大牌,指的是誰(shuí)?許導(dǎo)忍不住點(diǎn)出姓名

破案了!許利民痛斥球員耍大牌,指的是誰(shuí)?許導(dǎo)忍不住點(diǎn)出姓名

南海浪花
2026-01-12 06:17:12
眾星告別《驕陽(yáng)似我》宋威龍發(fā)18宮照趙今麥感謝曦光,莊序發(fā)長(zhǎng)文

眾星告別《驕陽(yáng)似我》宋威龍發(fā)18宮照趙今麥感謝曦光,莊序發(fā)長(zhǎng)文

阿訊說(shuō)天下
2026-01-11 21:16:47
伊朗總檢察長(zhǎng)警告:任何參與抗議的人都可能面臨死刑

伊朗總檢察長(zhǎng)警告:任何參與抗議的人都可能面臨死刑

桂系007
2026-01-10 23:48:54
鄭爽廣電封禁通知曝光!日子久了都忘了她有多惡劣,違法還棄養(yǎng)

鄭爽廣電封禁通知曝光!日子久了都忘了她有多惡劣,違法還棄養(yǎng)

萌神木木
2026-01-11 16:41:19
為保護(hù)馬杜羅夫妻戰(zhàn)死的古巴桑切斯上校,被曝光家人都住在美國(guó)!

為保護(hù)馬杜羅夫妻戰(zhàn)死的古巴桑切斯上校,被曝光家人都住在美國(guó)!

阿龍聊軍事
2026-01-09 20:20:47
濟(jì)南戰(zhàn)役大捷,粟裕卻被手下大將當(dāng)眾“摔帽子”!饒漱石連忙開(kāi)會(huì)

濟(jì)南戰(zhàn)役大捷,粟裕卻被手下大將當(dāng)眾“摔帽子”!饒漱石連忙開(kāi)會(huì)

古書(shū)記史
2026-01-09 00:30:19
再摳門(mén),也不要在網(wǎng)上買(mǎi)這6樣?xùn)|西,會(huì)致癌,看完真會(huì)后怕的!

再摳門(mén),也不要在網(wǎng)上買(mǎi)這6樣?xùn)|西,會(huì)致癌,看完真會(huì)后怕的!

古事尋蹤記
2026-01-07 07:18:22
不得不說(shuō)!廣東隊(duì)外援奎因,不懂人情世故呀

不得不說(shuō)!廣東隊(duì)外援奎因,不懂人情世故呀

體育哲人
2026-01-11 17:53:23
原來(lái)她是王石大女兒,比后媽年齡還大,45歲單身不結(jié)婚父親愁白頭

原來(lái)她是王石大女兒,比后媽年齡還大,45歲單身不結(jié)婚父親愁白頭

銀河史記
2026-01-06 12:33:04
優(yōu)衣庫(kù)這件“菱格羽絨服”,黑灰倆色我直接all,in了!

優(yōu)衣庫(kù)這件“菱格羽絨服”,黑灰倆色我直接all,in了!

吳霶愛(ài)體育
2025-12-19 11:55:59
2026年養(yǎng)老金好消息!1956年到1961年出生的人,可能調(diào)整更多嗎?

2026年養(yǎng)老金好消息!1956年到1961年出生的人,可能調(diào)整更多嗎?

社會(huì)日日鮮
2026-01-11 11:09:44
城市街頭的時(shí)尚動(dòng)態(tài):瑜伽褲下的生命力與美感

城市街頭的時(shí)尚動(dòng)態(tài):瑜伽褲下的生命力與美感

一抹暖陽(yáng)
2026-01-04 21:40:28
大寒那天,上海可能要下暴雪了

大寒那天,上海可能要下暴雪了

脊梁in上海
2026-01-11 19:44:01
李詠遺孀哈文現(xiàn)狀:定居美國(guó)富人區(qū),7年了沒(méi)再婚,女婿條件不錯(cuò)

李詠遺孀哈文現(xiàn)狀:定居美國(guó)富人區(qū),7年了沒(méi)再婚,女婿條件不錯(cuò)

削桐作琴
2026-01-03 14:25:54
我只認(rèn)出了萬(wàn)梓良 ,你們呢 ?

我只認(rèn)出了萬(wàn)梓良 ,你們呢 ?

小椰的奶奶
2026-01-12 01:45:27
李在明:若民間無(wú)人機(jī)“入朝”屬實(shí),將是嚴(yán)重犯罪

李在明:若民間無(wú)人機(jī)“入朝”屬實(shí),將是嚴(yán)重犯罪

新京報(bào)
2026-01-11 07:40:22
決議生效!芬蘭正式“退群”

決議生效!芬蘭正式“退群”

環(huán)球時(shí)報(bào)國(guó)際
2026-01-10 22:57:42
2026-01-12 08:07:00
互聯(lián)網(wǎng)思想 incentive-icons
互聯(lián)網(wǎng)思想
AI時(shí)代,互聯(lián)網(wǎng)思想觀察
2381文章數(shù) 16901關(guān)注度
往期回顧 全部

科技要聞

“我們與美國(guó)的差距也許還在拉大”

頭條要聞

李獻(xiàn)林學(xué)習(xí)教育期間違規(guī)吃喝:5人喝4瓶酒 1人酒后死亡

頭條要聞

李獻(xiàn)林學(xué)習(xí)教育期間違規(guī)吃喝:5人喝4瓶酒 1人酒后死亡

體育要聞

U23國(guó)足形勢(shì):末輪不負(fù)泰國(guó)即確保晉級(jí)

娛樂(lè)要聞

留幾手為閆學(xué)晶叫屈?稱(chēng)網(wǎng)友自卑敏感

財(cái)經(jīng)要聞

外賣(mài)平臺(tái)"燒錢(qián)搶存量市場(chǎng)"迎來(lái)終局?

汽車(chē)要聞

2026款宋Pro DM-i長(zhǎng)續(xù)航補(bǔ)貼后9.98萬(wàn)起

態(tài)度原創(chuàng)

健康
手機(jī)
教育
時(shí)尚
旅游

這些新療法,讓化療不再那么痛苦

手機(jī)要聞

真我 Neo8 參數(shù)曝光,驍龍 8 Gen5 、8000mAh電池

教育要聞

1分鐘說(shuō)清!山西工程科技職業(yè)大學(xué)專(zhuān)業(yè)錄取線

當(dāng)一個(gè)57歲的女人,決定從零開(kāi)始

旅游要聞

生態(tài)優(yōu)先,雪域高原煥發(fā)新生機(jī)(子夜走筆)

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版