国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

當(dāng)AI走進(jìn)Second Half:真正的問(wèn)題、價(jià)值與生態(tài)是什么?|甲子光年

0
分享至



重新定義問(wèn)題、評(píng)估真實(shí)價(jià)值、重構(gòu)產(chǎn)業(yè)生態(tài)。

今年4月,時(shí)任OpenAI研究員姚順雨寫了一篇博客《The Second Half 下半場(chǎng)》,他認(rèn)為:“AI的下半場(chǎng)將把重點(diǎn)從解決問(wèn)題轉(zhuǎn)向定義問(wèn)題。在這個(gè)新時(shí)代,評(píng)估將比訓(xùn)練更重要?!?/p>

12月17日,騰訊升級(jí)大模型研發(fā)架構(gòu),新成立AI Infra部、AI Data部、數(shù)據(jù)計(jì)算平臺(tái)部,全面強(qiáng)化其大模型的研發(fā)體系與核心能力。姚順雨出任“CEO/總裁辦公室”首席AI科學(xué)家,同時(shí)兼任AI Infra部、大語(yǔ)言模型部負(fù)責(zé)人。

一場(chǎng)新的競(jìng)賽開(kāi)始了。

這一年,AI技術(shù)正從“規(guī)模競(jìng)賽”轉(zhuǎn)向“價(jià)值定義”。AI下半場(chǎng)的關(guān)鍵不在于模型有多大,而在于能否通過(guò)評(píng)估、Agent與應(yīng)用場(chǎng)景構(gòu)建,創(chuàng)造新問(wèn)題、新工作流和新產(chǎn)業(yè)生態(tài)。

AI似乎已經(jīng)走進(jìn)了下半場(chǎng),但是關(guān)于下半場(chǎng)本身還有很多問(wèn)題等待厘清。

在12月3日舉辦的“轟然成勢(shì),萬(wàn)象歸一”2025甲子引力年終盛典的巔峰對(duì)話環(huán)節(jié),甲子光年創(chuàng)始人&CEO張一甲與面壁智能聯(lián)合創(chuàng)始人&CEO李大海、云知聲創(chuàng)始人&CEO黃偉、昆侖萬(wàn)維董事長(zhǎng)兼CEO方漢、它石智航創(chuàng)始人兼CEO陳亦倫一起聊了聊《當(dāng)AI走進(jìn)Second Half》。

在這場(chǎng)關(guān)于“AI下半場(chǎng)”的討論中有三個(gè)關(guān)鍵詞:重新定義問(wèn)題、評(píng)估真實(shí)價(jià)值、重構(gòu)產(chǎn)業(yè)生態(tài)。而這些來(lái)自AI產(chǎn)業(yè)一線的佼佼者將會(huì)做出怎樣的回答?

以下為本場(chǎng)巔峰對(duì)話的文字實(shí)錄,經(jīng)「甲子光年」編輯,在不改變?cè)獾幕A(chǔ)上略有刪改。

1.什么是“AI下半場(chǎng)”

張一甲:今天我們一起聊聊“AI下半場(chǎng)”,首先請(qǐng)四位嘉賓介紹一下自己和所在公司。

李大海:大家好,我是李大海,面壁智能是一家具有清華背景,且專注于推動(dòng)端側(cè)大模型研發(fā)及產(chǎn)業(yè)應(yīng)用的公司。自 2022 年 8 月成立以來(lái),面壁智能已逐步形成“理論-模型-工具-應(yīng)用”的全鏈路技術(shù)生態(tài)閉環(huán)與產(chǎn)業(yè)向心力。圍繞“密度法則”(Densing Law)的科學(xué)化理論與架構(gòu)創(chuàng)新,我們自主研發(fā)MiniCPM面壁小鋼炮系列端側(cè)模型,憑借超高效能優(yōu)勢(shì),不僅收獲了來(lái)自開(kāi)源社區(qū)、開(kāi)發(fā)者的廣泛認(rèn)可,更推動(dòng)了在汽車、AI手機(jī)、AIPC、智能家居等終端領(lǐng)域廣泛落地。

黃偉:大家好,我是黃偉。有朋友開(kāi)玩笑說(shuō),云知聲是一家“古典主義”人工智能企業(yè),意思是我們活得比較久,所以我對(duì)“AI下半場(chǎng)”的話題可能有自己的一些想法。

云知聲成立十多年了。在AI 1.0時(shí)代,專注投入AI算法和所謂的“小模型”,給客戶提供基于算法和模型的產(chǎn)品和解決方案;到了大模型時(shí)代,我們自己研發(fā)了大模型,并在一些確定場(chǎng)景里面提供了基于自研大模型的產(chǎn)品和解決方案。

方漢:大家好,我是方漢。我們公司是2008年成立,2015年上市,從2020年開(kāi)始在AI方面加大投入,2022年12月份發(fā)布國(guó)內(nèi)第一個(gè)13B開(kāi)源的中文預(yù)訓(xùn)練大模型,公司目前主要業(yè)務(wù)海外(95%的收入來(lái)自于海外),目前在海外的AI產(chǎn)品,有AI音樂(lè)、AI社交、AI視頻以及短劇等業(yè)務(wù)。

我們重點(diǎn)關(guān)注AIGC領(lǐng)域,在海外AI業(yè)務(wù)均已產(chǎn)生大量的收入,我們相信全球AI應(yīng)用市場(chǎng)會(huì)蓬勃發(fā)展。目前的狀態(tài),技術(shù)遠(yuǎn)超前于產(chǎn)品,我相信這個(gè)情況會(huì)在“AI下半場(chǎng)”得到極大改觀。

陳亦倫:大家好,我是陳亦倫,我們是一家年輕的公司,2025年2月5日成立。它石智航是一家AI驅(qū)動(dòng)的具身智能機(jī)器人公司,希望以機(jī)器人技術(shù)和具身智能技術(shù)為核心,打造可信賴的具身智能全棧系統(tǒng),讓它可以規(guī)模化地走入到大家的生產(chǎn)和生活中,我們也很感興趣用技術(shù)解決高價(jià)值的生產(chǎn)生活問(wèn)題。

張一甲:首先我們來(lái)聊聊“重新定義問(wèn)題”。過(guò)去幾年,我們見(jiàn)證了“AI上半場(chǎng)”:算力狂飆、模型軍備競(jìng)賽、參數(shù)越卷越大,大家都在拼“更強(qiáng)的模型”。今年4月,當(dāng)時(shí)還是OpenAI研究員的姚順雨提到了“AI下半場(chǎng)”的概念,他認(rèn)為:在這個(gè)新時(shí)代,評(píng)估將比訓(xùn)練更重要。我們不再只是問(wèn)“我們能訓(xùn)練出一個(gè)能解決X的模型嗎”,而是在問(wèn)“我們應(yīng)該訓(xùn)練AI去做什么,以及如何衡量真正的進(jìn)步”。我想知道,你們認(rèn)為我們進(jìn)入“AI下半場(chǎng)”了嗎?你們理解的“AI下半場(chǎng)”有什么特征?

李大海:“下半場(chǎng)”的概念,不同的人會(huì)有不同的理解。

我個(gè)人觀點(diǎn),從技術(shù)上很難說(shuō)已經(jīng)到了“下半場(chǎng)”。比如,從最近谷歌發(fā)布的Gemini 3展現(xiàn)出的驚艷效果來(lái)看,大家發(fā)現(xiàn)預(yù)訓(xùn)練時(shí)代還沒(méi)有結(jié)束,依舊能帶來(lái)驚喜。從技術(shù)層面來(lái)說(shuō),還有智能體的突破、大模型如何提高個(gè)性化記憶及主動(dòng)學(xué)習(xí)的能力,以及模型之間的如何更好的協(xié)同完成更復(fù)雜的任務(wù)等等,這些提升模型智能能力上線工作都還在路上,所以技術(shù)上遠(yuǎn)沒(méi)有收斂。

但是從應(yīng)用的角度來(lái)講,“下半場(chǎng)”肯定到了。以前發(fā)一個(gè)模型,大家只能拿行業(yè)里面的標(biāo)準(zhǔn)評(píng)測(cè)集去評(píng)分。現(xiàn)在大家主要關(guān)心大模型如何賦能實(shí)際業(yè)務(wù),更關(guān)注成本、ROI,跟人比效能是不是更高。越到后面,大家越會(huì)用產(chǎn)品說(shuō)話,所以從應(yīng)用層面來(lái)講,這個(gè)過(guò)程在穩(wěn)定持續(xù)的發(fā)生,但是不會(huì)一蹴而就。


面壁智能聯(lián)合創(chuàng)始人&CEO 李大海

黃偉:如果提“下半場(chǎng)”,好像有點(diǎn)隱含的意思是說(shuō)“上半場(chǎng)”的事已經(jīng)做得差不多,條件具備了所以開(kāi)始“下半場(chǎng)”,這好像拿到畢業(yè)文憑才能找工作。我的觀點(diǎn)是需要“勤工儉學(xué)”,一邊讀書(shū)一邊工作。我認(rèn)為,所謂的“下半場(chǎng)”,其實(shí)是2023年就已經(jīng)開(kāi)始,在某些場(chǎng)景里,有些公司已經(jīng)開(kāi)始嘗試用一定的模型能力去解決問(wèn)題。

如果沒(méi)有做嚴(yán)格的區(qū)分,所謂的“上下半場(chǎng)”可能會(huì)同時(shí)存在。一方面基礎(chǔ)模型在不斷迭代升級(jí),可能也會(huì)出現(xiàn)做了一些數(shù)據(jù)調(diào)優(yōu)工作之后,發(fā)現(xiàn)一個(gè)新的大模型比調(diào)優(yōu)之后做得還要好,但并不意味著這件事不重要。如果人工智能始終在做研發(fā)沒(méi)有落地,可能就是泡沫。

但還有些問(wèn)題更重要:定義的AI能力是什么,定義AI要解決什么問(wèn)題。

其實(shí),不同人對(duì)AGI(通用人工智能)的定義也是不一樣的,有的人可能會(huì)把AGI想得無(wú)比強(qiáng)大,同時(shí)要具備20個(gè)博士學(xué)位,甚至在很多領(lǐng)域達(dá)到院士的水平。但其實(shí)AGI可能也就是普通人,比如自動(dòng)駕駛領(lǐng)域,難道開(kāi)車需要博士學(xué)位嗎?所以我們要定義一下,在什么場(chǎng)景需要什么能力,這可能是“下半場(chǎng)”比較重要的話題。


云知聲創(chuàng)始人&CEO 黃偉

方漢:我個(gè)人看法是,實(shí)現(xiàn)AGI之后才會(huì)有“下半場(chǎng)”。但是這樣的話,今天就沒(méi)法討論了。

如果按照一甲之前引用的觀點(diǎn),我可以從宏觀層面下個(gè)判斷:當(dāng)AI產(chǎn)品不以技術(shù)、算法作為護(hù)城河,而更多的是以產(chǎn)品創(chuàng)新或者用戶黏性作為護(hù)城河,“AI下半場(chǎng)”就到來(lái)了。

在微觀上,我認(rèn)為,就像之前互聯(lián)網(wǎng)和移動(dòng)互聯(lián)網(wǎng)時(shí)代一樣,當(dāng)一個(gè)公司的產(chǎn)品總監(jiān)的薪資跟算法總監(jiān)的薪資看齊的時(shí)候,我認(rèn)為“下半場(chǎng)”就真的到來(lái)了。


昆侖萬(wàn)維董事長(zhǎng)兼CEO 方漢

陳亦倫:我之前仔細(xì)閱讀了姚順雨博士的那篇Blog,他提到“上半場(chǎng)”跟“下半場(chǎng)”,我理解是一個(gè)大型AI系統(tǒng)發(fā)展的節(jié)奏,我想用另外一種方式來(lái)詮釋我對(duì)這種節(jié)奏的觀察。

在行業(yè)里其實(shí)有三個(gè)Scaling Law:

1.對(duì)于數(shù)據(jù)的Scaling Law;

2.對(duì)于算力的Scaling Law;

3.對(duì)于環(huán)境或者推理時(shí)運(yùn)行時(shí)間的Scaling Law。

這三個(gè)Scaling Law,它是有先后順序的。你必須先打穿第一個(gè)環(huán)節(jié)——數(shù)據(jù)墻,才有資格進(jìn)入到第二個(gè)環(huán)節(jié)——算力墻,當(dāng)你打穿算力墻的時(shí)候,才有資格進(jìn)入到交互態(tài),進(jìn)一步提升能力。

這三個(gè)發(fā)展的階段決定了不同行業(yè)的發(fā)展節(jié)奏。以我在上一個(gè)十年全身心參與過(guò)的自動(dòng)駕駛行業(yè)為例,2019年到2021年,自動(dòng)駕駛行業(yè)最頭部的公司率先打破了數(shù)據(jù)墻,這個(gè)時(shí)候大家已經(jīng)能看到自動(dòng)駕駛具備很好的能力了。2022年到2025年是算力跟數(shù)據(jù)豐收的紅利期,大家可以看到路上其實(shí)自動(dòng)駕駛系統(tǒng)已經(jīng)很多了,它是不是做得足夠好了?沒(méi)有。這些問(wèn)題集中體現(xiàn)在自動(dòng)駕駛車輛怎么跟其他的社會(huì)車輛互相交互、避讓,那么就需要一個(gè)訓(xùn)練環(huán)境。環(huán)境就是第三層次Scaling Law,也就是駕駛級(jí)的世界模型。

我覺(jué)得這件事情基本上跟大語(yǔ)言模型的發(fā)展過(guò)程等同,我認(rèn)為大語(yǔ)言模型是一個(gè)被祝福的領(lǐng)域,因?yàn)樗鼪](méi)有數(shù)據(jù)墻這種說(shuō)法,它從出生的第一天,互聯(lián)網(wǎng)數(shù)據(jù)就是極其充沛的,所以它直接跳過(guò)了第一個(gè)階段,進(jìn)入到了第二個(gè)階段。你會(huì)發(fā)現(xiàn)一開(kāi)始,大家就在瘋狂地比拼算力。不過(guò),我認(rèn)為第二個(gè)階段的紅利已經(jīng)在慢慢降低了,大家就到了第三個(gè)階段。第三個(gè)階段是我們?cè)趺礃忧逦x任務(wù),賦予它的交互模型,然后再上類似強(qiáng)化學(xué)習(xí)的方法,這樣就有希望能夠在單點(diǎn)或者是多點(diǎn)任務(wù)上徹底解決這個(gè)領(lǐng)域。


它石智航創(chuàng)始人兼CEO 陳亦倫

張一甲:接下來(lái)我想分別問(wèn)各位嘉賓一些問(wèn)題。大海總,我們知道面壁智能一直在強(qiáng)調(diào)模型能力與場(chǎng)景融合,比如你們已經(jīng)將VLA多模態(tài)大模型部署于汽車智能座艙端側(cè)。在這個(gè)過(guò)程中,誰(shuí)來(lái)定義“AI該做什么”?是你們自己還是來(lái)自場(chǎng)景或客戶?

李大海:這肯定雙向奔赴。作為AI公司,面壁智能更擅長(zhǎng)的持續(xù)提升模型智能能力并提高模型應(yīng)用的性價(jià)比,模型擅長(zhǎng)做什么事情。但是模型能做的事情太多了,哪些事情真正有價(jià)值,這個(gè)價(jià)值錨點(diǎn)是由客戶來(lái)提供。

就拿智能座艙舉例,我們的MiniCPM端側(cè)模型部署到汽車的智能座艙中,能夠準(zhǔn)確識(shí)別不同的用戶、理解用戶的指令,感受用戶的情緒和艙內(nèi)艙外的環(huán)境。但這個(gè)能力最后在哪些場(chǎng)景里面有價(jià)值?很多時(shí)候是需要我們與客戶、主機(jī)廠一起來(lái)共創(chuàng)、定義的。

比如說(shuō)AI發(fā)現(xiàn)后座上有小朋友,會(huì)主動(dòng)開(kāi)啟兒童鎖,用戶會(huì)覺(jué)得這個(gè)功能很有用。在吉利的銀河M9這款車上,超過(guò)90%的用戶都會(huì)主動(dòng)打開(kāi)端側(cè)大模型的功能,我們覺(jué)得這是一個(gè)很好的正面反饋。

張一甲:黃偉總,首先恭喜云知聲以“港股AGI第一股”的身份完成上市。云知聲已經(jīng)成立十多年了,在這個(gè)過(guò)程當(dāng)中你們面臨了無(wú)數(shù)的分岔路口,身邊的人也是來(lái)來(lái)往往。云知聲長(zhǎng)期深耕語(yǔ)音、多模態(tài)和產(chǎn)業(yè)場(chǎng)景,尤其是醫(yī)療場(chǎng)景。前段時(shí)間我們對(duì)話時(shí)你跟我說(shuō)“云知聲不做特別大的平臺(tái)型大模型,那種模型評(píng)測(cè)可以,但落地很難”。這一路走來(lái),你們是怎么定義問(wèn)題的?

黃偉:我覺(jué)得每一個(gè)做實(shí)業(yè)的創(chuàng)始人都要回答:公司定位是什么,競(jìng)爭(zhēng)優(yōu)勢(shì)是什么。

我們做醫(yī)療并不是因?yàn)榻裉煊辛舜竽P?,大家看好“AI+醫(yī)療”。恰恰相反,我們?cè)谑畮啄昵熬烷_(kāi)始做醫(yī)療,而且我們是在很多人不看好,十多年前很多醫(yī)院沒(méi)有信息化,數(shù)據(jù)還沒(méi)有數(shù)字化的情況下,我們就已經(jīng)決定做了。

那么,為什么我們選擇做醫(yī)療,有兩個(gè)方面原因。

第一,這個(gè)事業(yè)的天花板足夠高。人類有兩個(gè)H很重要,一個(gè)是Happy,一個(gè)是Health;第二,醫(yī)療在國(guó)內(nèi)其實(shí)它并不是一個(gè)巨頭可以統(tǒng)一的領(lǐng)域,就算是今天BAT過(guò)來(lái)做,依然很難做。它是一個(gè)非常分散的市場(chǎng),相對(duì)來(lái)說(shuō),它對(duì)創(chuàng)業(yè)者來(lái)講會(huì)起到某種保護(hù)隔離作用。

當(dāng)然,很多時(shí)候選擇就意味著痛苦和堅(jiān)持,因?yàn)樵谀莻€(gè)時(shí)間點(diǎn)做醫(yī)療的話是很難的事情,面臨的是“先有雞還是先有蛋”的問(wèn)題。你憑什么讓醫(yī)院用你的產(chǎn)品?難道我能跟院長(zhǎng)說(shuō)“你把數(shù)據(jù)給我,我就能做好”?

To B和To C是完全不同的決策機(jī)制。To C的話你只需要80%的人說(shuō)你OK就可以了,很多人你用各種營(yíng)銷手段是可以影響的。To B是關(guān)鍵人決策,就是90%的人說(shuō)你好,沒(méi)用,一定要關(guān)鍵決策者或者是流程機(jī)制認(rèn)可你。

所以你的決定能不能落實(shí),就是你的心理、定力、耐力、毅力各方面的綜合考驗(yàn)。在這個(gè)過(guò)程中,我們堅(jiān)持下來(lái)了。

今天來(lái)看,第一,我覺(jué)得“AI+醫(yī)療”是大家比較認(rèn)可的一個(gè)方向;第二,我們確實(shí)做得比較早,有先發(fā)優(yōu)勢(shì),我們覆蓋了幾百家醫(yī)院。這些都是我們今天醫(yī)療大模型在醫(yī)院內(nèi)部能夠更順利落地的一個(gè)重要前提。

張一甲方漢總,我是你們的用戶。昆侖萬(wàn)維今年推出了多款A(yù)I模型,天工大模型4.0、空間智能大模型Matrix-Zero、視頻生成大模型SkyReels等。你們推出了這么多的模型,這期間有沒(méi)有收到一些反饋,從而讓你們覺(jué)得要做什么、不做什么?

方漢:其實(shí)我覺(jué)得所有做AI業(yè)務(wù)的決策人都會(huì)遇到一個(gè)問(wèn)題,就是B端跟C端的反饋是完全不一樣的,我認(rèn)為B端對(duì)于效率更敏感,C端對(duì)成本更敏感。

在B端,現(xiàn)在最好的商業(yè)模式是編程,編程基本上就是增效。在B端,你一定要說(shuō)服客戶,我們能夠幫你大幅提高生產(chǎn)效率。比如,我們做的天工超級(jí)智能體(Skywork Super Agents),可以給B端提供deep research的功能,不用人干預(yù)就能快速生成一篇很詳細(xì)的分析文檔,一些B端的用戶反饋,這至少幫他省了幾十個(gè)實(shí)習(xí)生的工作量。

在C端,情感供給是剛需。但是如果由真人來(lái)供給情感,成本是絕大多數(shù)人沒(méi)法接受的。如果用AI來(lái)供給情感,就可以把成本打到真人的幾十分之一,這種商業(yè)模式在C端就會(huì)迅速爆發(fā)。所以,我們選擇了AI社交這個(gè)賽道。

簡(jiǎn)而言之,一個(gè)AI產(chǎn)品到底該做不該做,其實(shí)就看在B端增加多少效率,在C端降低多少成本,憑著這兩點(diǎn)去分析應(yīng)用場(chǎng)景,基本上我覺(jué)得就可以get到用戶最關(guān)鍵的需求。

張一甲亦倫總,它石智航的英文簡(jiǎn)稱是TARS,這讓我想到了電影《星際穿越》中的機(jī)器人TARS,它石的TARS代表的是“Trusted AI and Robotics Solution”(可信賴的AI和機(jī)器人解決方案),我們應(yīng)該如何理解Trusted AI?你們是一家非常年輕的公司,某種程度上說(shuō),你們處于后發(fā)身位,你們是如何選擇要做什么?

陳亦倫:我們公司起名字確實(shí)是參考了TARS,因?yàn)槲覀児镜膭?chuàng)始團(tuán)隊(duì)都是《星際穿越》的忠實(shí)粉絲,電影里面我們最喜歡的機(jī)器人就是TARS,它真誠(chéng)、幽默、可信賴,所以我們希望我們做的機(jī)器人也是可信賴的。

我一直在做物理世界AI,我覺(jué)得AI在物理世界的可信賴最基本一條是能力可信賴。

比如說(shuō)對(duì)于一個(gè)自動(dòng)駕駛系統(tǒng),我可以放心地把方向盤交給它,這件事情背后是因?yàn)樗哪芰υ谖抑希蛘甙凑誏4的標(biāo)準(zhǔn),它的能力應(yīng)該是人類駕駛10倍以上為技術(shù)保證。

再比如說(shuō)我在參加一個(gè)重要的國(guó)際活動(dòng),用一個(gè)語(yǔ)言模型做翻譯的時(shí)候,我可以非常信賴它的翻譯是對(duì)的。

對(duì)于機(jī)器人來(lái)說(shuō)這一點(diǎn)就尤為重要,所以說(shuō)我們希望打造在能力上非常優(yōu)秀的,讓這個(gè)機(jī)器人非??煽俊⒖尚刨?、可以對(duì)生產(chǎn)生活產(chǎn)生價(jià)值。

我們選擇落地場(chǎng)景有三個(gè)原則:第一,必須是真實(shí)需求,真需求往往來(lái)自行業(yè)最迫切的痛點(diǎn);第二,要有足夠的市場(chǎng)顆粒度,解決這個(gè)問(wèn)題后能覆蓋一個(gè)足夠大的市場(chǎng);第三,要有技術(shù)難度,真需求、大市場(chǎng)往往伴隨著極高的技術(shù)門檻,這也是我們的核心競(jìng)爭(zhēng)力所在。

2.多維度對(duì)AI價(jià)值進(jìn)行評(píng)估

張一甲:那我們就就來(lái)聊聊第二個(gè)關(guān)鍵詞——“評(píng)估真實(shí)價(jià)值”。AI模型存在一個(gè)根本性矛盾:它們?cè)诟唠y度、設(shè)計(jì)良好的benchmark(基準(zhǔn))上表現(xiàn)得很驚艷,但當(dāng)應(yīng)用到真實(shí)世界,落地到產(chǎn)業(yè)中,面對(duì)復(fù)雜多變的場(chǎng)景時(shí),往往會(huì)出現(xiàn)一些問(wèn)題。如果讓你們?cè)O(shè)計(jì)一套評(píng)測(cè)體系來(lái)評(píng)估AI模型的真實(shí)價(jià)值,你們會(huì)如何設(shè)計(jì)?


甲子光年創(chuàng)始人&CEO 張一甲

陳亦倫:首先我也非常認(rèn)同現(xiàn)在很多AI模型打榜結(jié)果非常驚艷,但是在實(shí)際部署過(guò)程中,它可能會(huì)出現(xiàn)一些不符合期望的現(xiàn)象。

按照一個(gè)更加工程化的視角來(lái)看,AI模型其實(shí)就是在逼近數(shù)據(jù)分布。你訓(xùn)練時(shí)候的分布,跟你實(shí)際應(yīng)用時(shí)候的分布,這兩個(gè)分布如果越接近,它的性能就會(huì)越好。為什么說(shuō)打榜的AI不太容易泛化呢?恰恰因?yàn)樗^(guò)度聚焦于打榜,所以它會(huì)讓整個(gè)的數(shù)據(jù)分布越來(lái)越遠(yuǎn)離,這會(huì)出現(xiàn)問(wèn)題。

如何消除這種問(wèn)題?各個(gè)領(lǐng)域都有自己的一套方法,我可以提供一套之前行之有效的方法論,就是自動(dòng)駕駛影子模式。自動(dòng)駕駛影子模式是一個(gè)典型的、部署的數(shù)據(jù)跟訓(xùn)練的數(shù)據(jù)在任何角落、任何時(shí)刻都能夠?qū)R的一種方式。即便你人在開(kāi)一輛車的時(shí)候,它背后也有一個(gè)像影子一樣的自動(dòng)駕駛模式隨時(shí)在跑,它會(huì)隨時(shí)判斷AI輸出的結(jié)果跟人輸出的結(jié)果是不是一致,發(fā)現(xiàn)異常數(shù)據(jù)都會(huì)被收集并加入到訓(xùn)練。這樣就可以每時(shí)每刻都在做評(píng)測(cè),收集出來(lái)的數(shù)據(jù)都能夠動(dòng)態(tài)的反饋到系統(tǒng),讓它變得越來(lái)越好。

我觀察到,不僅是自動(dòng)駕駛領(lǐng)域,我覺(jué)得很多AI相關(guān)領(lǐng)域都有這樣的影子模式,機(jī)器人也是一樣,所以說(shuō)我覺(jué)得它背后的關(guān)鍵還是怎么把訓(xùn)練的數(shù)據(jù)跟實(shí)際使用的數(shù)據(jù)盡可能拉齊。

方漢:現(xiàn)在為了刷benchmark,很多的大模型要么背題,要么背答案,要么背過(guò)程,現(xiàn)在更多是在背過(guò)程,最大的問(wèn)題就是這些題目是固定的。

這個(gè)情況其實(shí)跟我們平時(shí)在招聘的時(shí)候遇到的問(wèn)題是一樣的,招聘的時(shí)候我們可以通過(guò)兩個(gè)方面判斷:

第一,看這個(gè)人是哪個(gè)學(xué)校畢業(yè)的,學(xué)歷如何,這個(gè)就是好像現(xiàn)在的benchmark;

第二,看這個(gè)人做過(guò)什么項(xiàng)目,在項(xiàng)目中解決了什么問(wèn)題,這個(gè)就是實(shí)際的應(yīng)用場(chǎng)景。

我認(rèn)為,現(xiàn)在的benchmark還是有非常大的作用,因?yàn)樗蟹浅=y(tǒng)一的標(biāo)準(zhǔn),但是現(xiàn)在所有的benchmark都在拼命的換題。與其這樣,我覺(jué)得不如把現(xiàn)實(shí)世界的工單作為一個(gè)評(píng)測(cè)標(biāo)準(zhǔn)。比如說(shuō)我們?cè)贕ithub上,把Github上每時(shí)每刻提交的新的issue(問(wèn)題),讓所有參加測(cè)試的大模型同時(shí)去解決,看誰(shuí)的完成率更高,我認(rèn)為這種是相對(duì)比較公正的。

第三,把真實(shí)世界的工作流引入評(píng)測(cè)體系,比如要看AI產(chǎn)品的用戶真實(shí)數(shù)據(jù),比如用戶留存率。把流量分給不同AI產(chǎn)品,最后看哪個(gè)AI產(chǎn)品的用戶留存率最高,這是非常干的數(shù)據(jù)。

黃偉:我基本認(rèn)同方總的觀點(diǎn),我也分享幾個(gè)方面的想法。

第一,我們模型優(yōu)化的方向是不是現(xiàn)實(shí)世界里面迫切需要解決的問(wèn)題。

第二,我們有沒(méi)有必要讓物理學(xué)博士一定要把川菜做得很好吃,因?yàn)楫吘刮覀儸F(xiàn)在很多所謂的評(píng)測(cè)榜單都是有模擬題,通過(guò)刷題你是可以刷到比較好的,但是未必代表一個(gè)真實(shí)水平。

所以我覺(jué)得非常重要的一點(diǎn),就是我們要了解在真實(shí)世界里需要解決什么問(wèn)題。當(dāng)然To C和To B的問(wèn)題是不太一樣的。To C這一塊可能要解決80%、90%人的80%、90%的需求。但是To B這一塊你可能要解決這個(gè)場(chǎng)景里面這個(gè)客戶當(dāng)下的痛點(diǎn)是什么,如果你定位很準(zhǔn)確的話,我們是有足夠多的手段來(lái)解決好這個(gè)問(wèn)題的。

3.產(chǎn)業(yè)生態(tài)正在底層發(fā)生重構(gòu)

張一甲:最后,我們來(lái)聊聊“重構(gòu)產(chǎn)業(yè)生態(tài)”。你們用AI改變了哪些產(chǎn)業(yè)的生態(tài)?可以講講最新的進(jìn)展和實(shí)例。

李大海:我們看到了一些變化。

一是大模型的應(yīng)用在向端云協(xié)同的方向演進(jìn)。比如我們已經(jīng)把端側(cè)大模型部署到汽車、手機(jī)等終端上,用戶也開(kāi)始在手機(jī)上利用端側(cè)大模型執(zhí)行復(fù)雜的任務(wù)。在我們看來(lái),端云協(xié)同最大的優(yōu)勢(shì)在于模型響應(yīng)快、數(shù)據(jù)不出本地確保隱私安全。

在云端,大家用AI解決一些復(fù)雜的問(wèn)題時(shí),模型深度思考10秒沒(méi)有任何問(wèn)題,甚至做一份Deep Reaserch,半個(gè)小時(shí)后再給一份完整的答案也可以接受。但是我們?cè)诟鷻C(jī)器人、智能座艙和手機(jī)設(shè)備互動(dòng)的時(shí)候,希望它可以立刻響應(yīng),這背后的速度以及功耗也都是大模型規(guī)?;瘧?yīng)用需要考慮的關(guān)鍵因素。

二是有些企業(yè)從直接為用戶提供服務(wù),轉(zhuǎn)向?yàn)锳gent提供服務(wù)。從App轉(zhuǎn)向Agent這個(gè)過(guò)程中,服務(wù)用戶和服務(wù)Agent慢慢會(huì)產(chǎn)生新的遷移,這背后有很多的機(jī)會(huì)。

黃偉:我們現(xiàn)在做的事情更多是延續(xù),但是我感覺(jué)到這個(gè)行業(yè)在更底層方面在發(fā)生重構(gòu)。比如豆包手機(jī)助手,五年后回頭看,也許就是里程碑式的事情。

我們主要是To B的模式,以前給客戶提供的是基于Bert模型的產(chǎn)品,現(xiàn)在開(kāi)始給客戶提供基于GPT模型的產(chǎn)品,當(dāng)然性能和能力相比過(guò)去都有顯著提升?,F(xiàn)在我們?cè)陂T診環(huán)節(jié),可以給醫(yī)院提供基于大模型的門診病歷生成系統(tǒng),這背后就是數(shù)字醫(yī)生,從這個(gè)角度來(lái)講,我們既是延續(xù)也是重構(gòu)。

另一方面,我們?cè)谝恍┬碌膱?chǎng)景,或者根據(jù)一些新的需求,做微觀層面的重構(gòu)。包括企業(yè)組織結(jié)構(gòu),原來(lái)是人人協(xié)同,接下來(lái)可能是人與Agent協(xié)同。以前我們通過(guò)網(wǎng)站操作并執(zhí)行任務(wù),后來(lái)通過(guò)APP,而現(xiàn)在的AI Agent可能就沒(méi)有界面,用戶告知意圖,它可以幫我完成所有的任務(wù)。這是接下來(lái)所有人必須要重點(diǎn)關(guān)注的,這里面也是蘊(yùn)藏著巨大的商機(jī)。

方漢:我舉個(gè)例子,我們發(fā)布的音樂(lè)生成大模型Mureka。大家可能以為傳統(tǒng)的歌手對(duì)我們的音樂(lè)生成大模型是深惡痛絕,但實(shí)際他們是最愿意擁抱音樂(lè)生成大模型的群體。因?yàn)楦枋衷谧龈璧臅r(shí)候,有一個(gè)工序是做小樣,做一個(gè)小樣可能成本要幾萬(wàn)元,一個(gè)月的時(shí)間能做2-3個(gè)小樣。現(xiàn)在他們用Mureka,可以在一天之內(nèi)做出十幾個(gè)小樣,拿這個(gè)小樣可以直接到抖音上投流看用戶反饋,找專家評(píng)審,這使得所有歌手做新歌的速度比原來(lái)快很多,這是我們觀察到的第一個(gè)對(duì)產(chǎn)業(yè)的影響。

第二個(gè)例子是Skywork Super Agents。因?yàn)槲覀冏鲂醒械乃俣确浅??,?dǎo)致很多券商原來(lái)要請(qǐng)大學(xué)生寫行研報(bào)告,現(xiàn)在這個(gè)工種幾乎已被AI取代。我跟很多券商的朋友交流過(guò),他們都使用我們的Skywork Super Agents做快速的行研報(bào)告,每次股市上一個(gè)新的事件出來(lái)之后,可以很迅速的在幾分鐘之內(nèi)把行研報(bào)告寫出來(lái),他們?cè)俑鶕?jù)行研報(bào)告做決策,這對(duì)于二級(jí)市場(chǎng)的影響非常深刻。

張一甲:我家人在炒股,就是在付費(fèi)用你們的Agents做行研報(bào)告。我想補(bǔ)充問(wèn)一下,因?yàn)槟銈冇写罅康腃端用戶,在大量真實(shí)的場(chǎng)景中,有沒(méi)有什么數(shù)據(jù)或用戶反饋?zhàn)屇阌X(jué)得非常有意思,或者和之前想得不一樣?

方漢:其實(shí)我們做AI聊天的時(shí)候做過(guò)大量用戶訪談,一開(kāi)始認(rèn)為大家AI聊天都是要滿足生活中滿足不能不了的幻想,結(jié)果用戶調(diào)研之后發(fā)現(xiàn)根本不是,用戶跟AI聊天主要兩個(gè)原因:第一,用戶認(rèn)為和AI聊天沒(méi)有社交門檻和心理障礙;第二,用戶覺(jué)得跟AI聊天是特別安全的事情,因?yàn)锳I不會(huì)“電詐”你,跟真人聊天很有可能遭遇“電詐”。這是用戶反饋跟我們想象有很大差別的地方。

張一甲:請(qǐng)亦倫總分享一下你觀察到的AI給產(chǎn)業(yè)帶來(lái)了什么樣的改變?

陳亦倫:我們?cè)谧鰴C(jī)器人,它是軟硬結(jié)合的領(lǐng)域。我觀察到,這一代機(jī)器人的企業(yè)有一個(gè)非常明顯的特點(diǎn)是,會(huì)主動(dòng)在硬件設(shè)計(jì)中考量AI,我們的機(jī)器人硬件設(shè)計(jì)標(biāo)準(zhǔn)也是“designed for AI”,這樣的好處是能盡可能縮小digital-to-physical gap。

舉兩個(gè)例子:第一,現(xiàn)在的機(jī)器狗、機(jī)器人,關(guān)節(jié)都走向了直驅(qū)或準(zhǔn)直驅(qū)。為什么要做這樣的選擇?因?yàn)檫@種最容易被AI建模、最容易被AI驅(qū)動(dòng),Sim2Real的gap會(huì)比較?。坏诙?,在設(shè)計(jì)整個(gè)硬件系統(tǒng)的時(shí)候,我們和生態(tài)合作伙伴,首先討論的問(wèn)題已經(jīng)不是機(jī)械怎么安裝,而是在考慮計(jì)算流怎么走,算力是怎么分配的,通信怎么走,延時(shí)怎么卡。這其實(shí)就是AI在驅(qū)動(dòng)硬件的趨勢(shì)。

張一甲:每年甲子引力年終盛典其實(shí)都是產(chǎn)業(yè)交流和資源對(duì)接平臺(tái),會(huì)有各行各業(yè)的決策者來(lái)到現(xiàn)場(chǎng)。各位嘉賓也都來(lái)自產(chǎn)業(yè),站在歲末的時(shí)間點(diǎn)上,展望新的一年,你們有什么期待?

陳亦倫:回到我最開(kāi)始提到的AI發(fā)展的三個(gè)階段:數(shù)據(jù)、算力、環(huán)境。三個(gè)階段要三把鑰匙解鎖,我們目前接近于拿到了第一把鑰匙,希望明年可以跟大家匯報(bào),具身智能Scaling Law的這幾把鑰匙都是長(zhǎng)成什么樣子的。

方漢:我的期待比較明確,希望看到基于AI的全新產(chǎn)品模式出現(xiàn)。如果只是一味迭代算法,現(xiàn)在并沒(méi)有沒(méi)有太多aha moment(頓悟時(shí)刻),但我相信產(chǎn)品的aha moment會(huì)大量涌現(xiàn)。

黃偉:對(duì)過(guò)去兩年AI技術(shù)演進(jìn),自己感到非常意外和驚喜,期待明年世界模型有更加超出預(yù)期的表現(xiàn),這樣會(huì)進(jìn)一步加速AGI。

李大海:我比較期待明年大模型在自主學(xué)習(xí)上進(jìn)一步突破,且能夠跟端側(cè)應(yīng)用有機(jī)結(jié)合,期待有更多的硬件能夠進(jìn)入到各位的組織里學(xué)習(xí)、進(jìn)化,成為大家的硅基同事。

張一甲可以感受到,這場(chǎng)巔峰對(duì)話與上一場(chǎng)巔峰對(duì)話的畫(huà)風(fēng)非常不一樣。

黃偉總剛才提到一個(gè)詞叫“勤工儉學(xué)”,各位做的事情就是一邊工、一邊學(xué),在研究的時(shí)候做好商業(yè),從商業(yè)反哺我們的研究,我們也會(huì)看到越來(lái)越多的真實(shí)世界實(shí)踐,這恰恰是對(duì)于技術(shù)迭代本身的一個(gè)很好的校準(zhǔn)和反哺。

非常期待四位嘉賓在做AI和做公司兩件事情上取得更好的進(jìn)展,謝謝大家!

(封面圖及文中配圖來(lái)源:2025甲子引力年終盛典)

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
擺爛!曼聯(lián)24歲懶王獻(xiàn)戰(zhàn)犯表演:7數(shù)據(jù)掛零 場(chǎng)上蠕動(dòng)+跑都不想跑

擺爛!曼聯(lián)24歲懶王獻(xiàn)戰(zhàn)犯表演:7數(shù)據(jù)掛零 場(chǎng)上蠕動(dòng)+跑都不想跑

風(fēng)過(guò)鄉(xiāng)
2025-12-27 06:44:54
大烏龍!0分張鎮(zhèn)麟?yún)⒓淤惡蟀l(fā)布會(huì):被告知沒(méi)資格 無(wú)奈趕緊離開(kāi)

大烏龍!0分張鎮(zhèn)麟?yún)⒓淤惡蟀l(fā)布會(huì):被告知沒(méi)資格 無(wú)奈趕緊離開(kāi)

醉臥浮生
2025-12-27 22:06:14
法國(guó)、德國(guó)、英國(guó)、加拿大、丹麥、西班牙、意大利、荷蘭、挪威等14國(guó)發(fā)表聯(lián)合聲明

法國(guó)、德國(guó)、英國(guó)、加拿大、丹麥、西班牙、意大利、荷蘭、挪威等14國(guó)發(fā)表聯(lián)合聲明

每日經(jīng)濟(jì)新聞
2025-12-25 07:29:06
中山大學(xué)教授太不要臉了!高中生兒子發(fā)表3篇SCI論文,被質(zhì)疑學(xué)術(shù)造假

中山大學(xué)教授太不要臉了!高中生兒子發(fā)表3篇SCI論文,被質(zhì)疑學(xué)術(shù)造假

回旋鏢
2025-12-27 19:14:15
美國(guó)頁(yè)巖油陷阱!廢水回注正在失控,或引發(fā)人類巨大災(zāi)難

美國(guó)頁(yè)巖油陷阱!廢水回注正在失控,或引發(fā)人類巨大災(zāi)難

新浪財(cái)經(jīng)
2025-10-07 21:58:33
借3500元10天后要還4970元,蘋果應(yīng)用商場(chǎng)一借款A(yù)pp遭投訴:未審核強(qiáng)制放款,私人賬戶轉(zhuǎn)賬,年化利率超1500%

借3500元10天后要還4970元,蘋果應(yīng)用商場(chǎng)一借款A(yù)pp遭投訴:未審核強(qiáng)制放款,私人賬戶轉(zhuǎn)賬,年化利率超1500%

大風(fēng)新聞
2025-12-27 21:18:11
輪船拉導(dǎo)彈!美國(guó)萬(wàn)萬(wàn)沒(méi)有想到東大的反擊計(jì)劃會(huì)如此極端!

輪船拉導(dǎo)彈!美國(guó)萬(wàn)萬(wàn)沒(méi)有想到東大的反擊計(jì)劃會(huì)如此極端!

阿龍聊軍事
2025-12-27 22:07:28
徐湖平被查,兒子兒媳光速跑路!這家人的操作比宮斗劇還“精彩”

徐湖平被查,兒子兒媳光速跑路!這家人的操作比宮斗劇還“精彩”

畫(huà)夕
2025-12-27 20:28:24
張鎮(zhèn)麟加盟首次0分!上海大勝送四川7連敗 古德溫20+5+6

張鎮(zhèn)麟加盟首次0分!上海大勝送四川7連敗 古德溫20+5+6

醉臥浮生
2025-12-27 21:16:05
小米也漲價(jià)了!內(nèi)存壓力傳導(dǎo)至手機(jī)廠商,業(yè)界稱終端再不漲明年必定虧損

小米也漲價(jià)了!內(nèi)存壓力傳導(dǎo)至手機(jī)廠商,業(yè)界稱終端再不漲明年必定虧損

澎湃新聞
2025-12-26 20:22:27
姜昆風(fēng)波事態(tài)升級(jí),具體行程被扒出,當(dāng)事人曝視頻并不是拼接

姜昆風(fēng)波事態(tài)升級(jí),具體行程被扒出,當(dāng)事人曝視頻并不是拼接

凡知
2025-12-27 17:31:13
再反轉(zhuǎn)!助理辟謠姜昆沒(méi)出國(guó),網(wǎng)友曝飛機(jī)上合照,這次又社死

再反轉(zhuǎn)!助理辟謠姜昆沒(méi)出國(guó),網(wǎng)友曝飛機(jī)上合照,這次又社死

知法而形
2025-12-26 23:23:24
保定大量商戶突然關(guān)閉,整個(gè)街道冷冷清清

保定大量商戶突然關(guān)閉,整個(gè)街道冷冷清清

映射生活的身影
2025-12-27 18:09:05
國(guó)家終于出手了!被牽連的何止李梓萌,全紅嬋成龍也沒(méi)逃過(guò)

國(guó)家終于出手了!被牽連的何止李梓萌,全紅嬋成龍也沒(méi)逃過(guò)

暖心萌阿菇?jīng)?/span>
2025-12-27 01:25:19
黃循財(cái):不允許任何國(guó)家和企業(yè)借新加坡為中轉(zhuǎn)點(diǎn)轉(zhuǎn)運(yùn)芯片出口中國(guó)

黃循財(cái):不允許任何國(guó)家和企業(yè)借新加坡為中轉(zhuǎn)點(diǎn)轉(zhuǎn)運(yùn)芯片出口中國(guó)

百態(tài)人間
2025-12-27 16:40:18
太稀罕了!深圳一家公司通知供應(yīng)商趕緊對(duì)賬,12月底結(jié)清所有貨款

太稀罕了!深圳一家公司通知供應(yīng)商趕緊對(duì)賬,12月底結(jié)清所有貨款

火山詩(shī)話
2025-12-27 09:04:18
前一夜還劍拔弩張,今天40分鐘就談攏,打了20天的泰柬為何突然停手?

前一夜還劍拔弩張,今天40分鐘就談攏,打了20天的泰柬為何突然停手?

上觀新聞
2025-12-27 17:32:06
中方下“逐客令”,直言:一粒大米也不要,直接叫停900萬(wàn)噸訂單

中方下“逐客令”,直言:一粒大米也不要,直接叫停900萬(wàn)噸訂單

愛(ài)吃醋的貓咪
2025-12-27 16:24:13
75歲港星小36歲未婚妻被曝已婚,冬至與丈夫在老家吃飯,兒子16歲

75歲港星小36歲未婚妻被曝已婚,冬至與丈夫在老家吃飯,兒子16歲

觀察鑒娛
2025-12-27 10:00:22
AI大神吳恩達(dá):很多計(jì)算機(jī)專業(yè)應(yīng)屆生找不到工作,是因?yàn)楦咝Un程嚴(yán)重滯后

AI大神吳恩達(dá):很多計(jì)算機(jī)專業(yè)應(yīng)屆生找不到工作,是因?yàn)楦咝Un程嚴(yán)重滯后

爆角追蹤
2025-12-27 12:33:54
2025-12-28 03:15:00
甲子光年
甲子光年
中國(guó)科技產(chǎn)業(yè)化前沿智庫(kù)
3302文章數(shù) 9254關(guān)注度
往期回顧 全部

科技要聞

小米也漲價(jià)了!業(yè)界稱終端再不漲明年必虧

頭條要聞

美媒:特朗普顯然觸及了中國(guó)的紅線 中方怒了

頭條要聞

美媒:特朗普顯然觸及了中國(guó)的紅線 中方怒了

體育要聞

83分鐘絕殺!曼城2-1年度收官:英超6連勝狂飆

娛樂(lè)要聞

張昊唯逃稅涉黃風(fēng)波落幕:法院認(rèn)定朋友造謠

財(cái)經(jīng)要聞

注意,開(kāi)始拉物價(jià)了!

汽車要聞

好音響比大屏更重要?車企開(kāi)始“聽(tīng)”用戶的

態(tài)度原創(chuàng)

健康
親子
游戲
藝術(shù)
教育

這些新療法,讓化療不再那么痛苦

親子要聞

千萬(wàn)別給小孩子穿太好!網(wǎng)友:怪不得說(shuō)男孩就得窮養(yǎng)!

我真幸運(yùn):《泰拉瑞亞》1.4.5更新定檔1月份!

藝術(shù)要聞

驚艷!這件木雕美得讓人心動(dòng),絕對(duì)不容錯(cuò)過(guò)!

教育要聞

初二開(kāi)始,沒(méi)人再等你了

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版