国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

李彥宏斷言有點早 開源大模型不弱雞

0
分享至

自2022年11月ChatGPT問世,這一現(xiàn)象級產(chǎn)品迅速點燃了市場的大模型熱情。新老科技企業(yè)紛紛殺入,誓要抓住移動互聯(lián)網(wǎng)以來最大的一次產(chǎn)業(yè)紅利。當行業(yè)如火如荼發(fā)展一門心思搞技術(shù)之時,又出現(xiàn)了“路線之爭”:

閉源路線:以國外OpenAI的ChatGPT,Anthropic的Claude,谷歌的Gemini,國內(nèi)百度的文心一言,月之暗面的Kimi等企業(yè)為典型代表,傾向于閉源大模型的高性能,強商業(yè)化等優(yōu)勢,其中以百度最為激進,李彥宏近期便一直以“閉源擁躉”頻頻出圈,發(fā)表諸如“開源大模型是智商稅“,”大模型場景下開源是最貴的”等出位言論,引發(fā)行業(yè)熱議;

開源路線:以META的Llama,國內(nèi)阿里云的通義為典型代表,認為開源模式的協(xié)作特性可實現(xiàn)技術(shù)的快速迭代,可以通過模型托管提高云計算的業(yè)務(wù)成長空間,且該路線有利于數(shù)據(jù)敏感型組織通過私有云或本地化內(nèi)網(wǎng)落地大模型,較之閉源具有高成長性,多落地場景等優(yōu)點。

與行業(yè)往日爭議不同,此次大模型爭論充滿技術(shù)情懷,從業(yè)者爭論多聚焦在 “技術(shù)之爭”,李彥宏就表示“開源模型會越來越落后”,其讓頻頻登上熱搜。

那么在這場開閉源的爭論中我們要建立怎樣的分析框架?又來如何理性評判當前的路線之爭呢?

其一,根據(jù)Scaling laws原理,大模型的成功乃是更大算力,更多數(shù)據(jù),更高算力的綜合結(jié)果,這背后則是資金的海量投入,基礎(chǔ)設(shè)施完善,管理的穩(wěn)定等等,大模型沒有閃電戰(zhàn)只有持久戰(zhàn);

其二,百度選擇閉源有技術(shù)的考量,但與商業(yè)路徑也密不可分;

其三,開源大模型并沒有想象那般弱雞,閉源也不一定能永遠保持先進性;

其四,開閉源大模型共存將會是長期趨勢;

Scaling laws原理:大模型將長期燒錢

我們首先從大語言模型中的第一性原理“Scaling laws”入手分析(被翻譯為“縮放原理”或“尺度定律”)。

2020 年 1 月,OpenAI 發(fā)布論文《Scaling Laws for Neural Language Models》,奠定了 Scaling Law的基礎(chǔ),為后續(xù) GPT 的迭代指明了方向:更大參數(shù)、更多數(shù)據(jù)和更多算力能夠得到更好的模型智能。

也就從此時開始,OpenAI開啟了大參數(shù)模型路線,GPT-3的參數(shù)已經(jīng)達到1750億(GPT-2還只有15億),訓(xùn)練數(shù)據(jù)則直接躍升到570億G。

大模型的大參數(shù)軍備競賽也由此拉開大幕,動輒數(shù)千億級的大模型流行于市場,帶來技術(shù)的快速發(fā)展和普及。

由此也就引發(fā)了一個新的問題:算力。

根據(jù) Scaling Law 論文,可以用 6ND 來估算模型所需要的訓(xùn)練算力(N為參數(shù),D為數(shù)據(jù)集TOKEN數(shù)),算力需求在大模型時代得到指數(shù)級提升(長文本大模型所需算力可能還要高于6ND)。

這一方面催生了底層算力提供者英偉達為代表的GPU廠商的爆炸式增長,另一方面大模型廠商若要保持技術(shù)先進性就必須花大價錢在算力基礎(chǔ)設(shè)施方面。

在華泰證券的圖表中我們也能清晰看到大模型與此前的云計算爆發(fā)式增長一樣,業(yè)務(wù)的增長是要基礎(chǔ)算力的高投入為前提的。根據(jù)Visible Alpha一致預(yù)測,2026年全球科技四巨頭(微軟,谷歌,META和亞馬遜)合計資本支出將達2399億美元,2023-2026年CAGR為18.86%。

有觀點曾寄希望于Scaling Law的邊際效應(yīng)收窄效應(yīng),認為只要熬到技術(shù)成熟期(Scaling Law效應(yīng)邊際效應(yīng)迅速放大之時),算力的投入便會達峰,此時模型只需要維護自身模型的可靠性與穩(wěn)固性即可,只是站在當下時代,Scaling Law遠未到終點。

清華大學的唐杰教授在2024年 2 月就指出:我們還遠未到 Scaling law 的盡頭, 數(shù)據(jù)量、計算量、參數(shù)量還遠遠不夠。未來的 Scaling law 還有很長遠的路要走。

現(xiàn)實中主流大模型廠商的算力仍然在持續(xù)增大,模型的參數(shù)規(guī)模也在增大,行業(yè)終局是看不到頭的。

研發(fā)人員固然可以通過技術(shù)架構(gòu)優(yōu)化和軟硬件資源協(xié)同等方面來提高大模型的性能,只是我們也必須得承認,指數(shù)級的大模型技術(shù)迭代仍然仰賴于高參數(shù)和強算力。

在上述兩項約束條件下,大模型廠商不得不面臨非常棘手的問題:

如果把算力的資本性支出視為“蛋”,大模型的高性能為“雞”,究竟雞生蛋還是蛋生雞就成了大模型廠商不得不面臨的問題。

我們以閉源大模型的忠實擁躉百度為例,在基石的廣告業(yè)務(wù)壓力不斷加碼之時,其經(jīng)營理念已經(jīng)越加審慎,如對非核心業(yè)務(wù)的裁撤,人員的優(yōu)化等等。這在資本開支中則反饋表現(xiàn)為支出的越加保守,過去三年表現(xiàn)非常明顯。

2023年META和亞馬遜等科技頭部企業(yè)也均在進行資本支出的結(jié)構(gòu)性優(yōu)化,如亞馬遜的物流倉儲成本開始降低,與此同時云計算的數(shù)據(jù)中心等基礎(chǔ)設(shè)施仍處于大規(guī)模擴張中。百度亦是如此,表面看其資本開支越發(fā)慎重,但大模型相關(guān)的基礎(chǔ)設(shè)施投入必然是高速增長的。

這對百度也就會帶來一個問題,結(jié)構(gòu)化的資本開支縮減終有結(jié)束之時,Scaling Law還遠未能看到終端,加之“第二曲線”短期內(nèi)無法扛起支出重任,從財務(wù)方面就迫使百度不得不在商業(yè)路徑上進行考慮。

以賣模型(API接口)的閉源大模型成為首選,對C端用戶文心一言收取會員,對B端以API的接口費為主要變現(xiàn),又由于閉源大模型乃是企業(yè)獨家開發(fā),維護和管理成本也相對低廉,對百度是十分劃算的。在雞生蛋和蛋生雞的問題上,百度選擇了雞生蛋。

可閉源果真就能戰(zhàn)勝開源嗎?

開源大模型不弱雞

前文中我們已經(jīng)從大模型的原理,技術(shù)以及商業(yè)路徑角度,簡單勾勒了行業(yè)當前的現(xiàn)狀,并對百度對閉源大模型抱以極度的熱忱有了一定的理解。

接下來我們來討論開閉源大模型的趨勢性問題 。

如開篇所言,李彥宏對開源大模型常有鄙夷之情,如開篇“開源模型會越來越落后”,又如“沒有應(yīng)用,開源閉源模型都一文不值”,閉源大模型果真如此不堪嗎?

ARK Investment每年都會將其觀點和洞察力發(fā)表在年初的“Big Ideas”報告中,在2024年的報告中,”開源模型性能進步快于閉源模型“乃是其重要觀點之一。在上圖中阿里云的Qwen-72B乃為閉源大模型之最。

一方面閉源大模型確實有先發(fā)優(yōu)勢,以O(shè)penAI的ChatGPT為典型代表,但另一方面大模型的演進又是一個持久戰(zhàn)(Scaling law為主要因素),對企業(yè)的管理,投入以及持續(xù)的創(chuàng)新力就有了更高的要求,如此前OpenAI一系列的“人事斗爭”很難說不會影響核心業(yè)務(wù)。

與之所對應(yīng)的開源大模型也在此時開始展示先進性。

2024 年 4 月,Meta 發(fā)布 Llama 3,設(shè)計目標是多模態(tài)、多語言,根據(jù) Meta 公布的目前訓(xùn)練數(shù)據(jù),其性能與 GPT-4 相當。

Llama大模型的成功給了開源陣營足夠的信心,在權(quán)威機構(gòu)推出全新的大模型測評基準LiveBench AI中,阿里通義Qwen2拿下美國最新測評榜單開源大模型全球第一,成績超過Meta的Llama3-70B模型。

在基礎(chǔ)算力的投入保障之下,拉長時間線,開源大模型是可以保持足夠競爭力的,僅就此來看李彥宏鄙夷開源大模型性能不進步是站不住腳的。

這再次告訴我們:閉源和開源絕非技術(shù)理念之爭,而是商業(yè)路徑的分歧。

那么究竟哪何種商業(yè)路徑最適合大模型的落地呢?

篇幅原因我們省去繁瑣的分析過程,精簡觀點如下:

中短期:閉源大模型在變現(xiàn)方面優(yōu)勢更明顯,以賣模型為主要商業(yè)模式,簡單易操作。百度又可以通過改造原互聯(lián)網(wǎng)應(yīng)用產(chǎn)品(如地圖,文庫,搜索等),實現(xiàn)模型的落地改進產(chǎn)品力,將業(yè)務(wù)線由“AI+”向“+AI”過渡。此外需要提醒的是,企業(yè)內(nèi)部原產(chǎn)品線的改造也是伴隨巨大的成本開支需求的,如華泰證券曾測算,META若內(nèi)容推薦完全以大模型為主,取代原有算法,將需要至少50萬片英偉達GPU,僅此一項就是一筆巨大開支(最近有消息稱META今年GPU規(guī)模將超過30萬塊),這就對短期內(nèi)閉源大模型的落地和變現(xiàn)提出了更高的要求。

長期:開源大模型走的更遠,如高度定制化的特點將提高大模型對不同行業(yè)的滲透率,當不同行業(yè)的接入大模型,提高大模型的應(yīng)有廣度之后,企業(yè)開發(fā)展則要仰賴于開源大模型背后的算力和云計算平臺,以實現(xiàn)可持續(xù)增長。

在上述兩種路徑中,“資本”是商業(yè)模式運轉(zhuǎn)的必要條件,這又回到了我們前文所言的“雞生蛋”的悖論。

這也就使得采取閉源大模型的往往具有以下特點:應(yīng)用端具有得天獨厚優(yōu)勢(如谷歌),又如技術(shù)上短期內(nèi)遙遙領(lǐng)先(如OpenAI);

開源大模型則具有:資金底子雄厚(如META),云計算基礎(chǔ)設(shè)施健全(如阿里云),能夠熬得住,扛得起基礎(chǔ)設(shè)施膨脹帶來的巨大成本,又能接得住開源大模型普及后的云計算需求。

顯然沒有一種大模型是兼有所有優(yōu)點而無缺點的,百度此時以激烈語言來鼓吹閉源大模型,其背后應(yīng)是其短期商業(yè)化的焦慮(此前API接口價格戰(zhàn)對閉源大模型影響更大),以及對爭奪目標客戶心智的野心。

基于此我們并不認為會有包打一切的大模型路徑,相反企業(yè)選擇適合自己的路徑更多是“權(quán)宜之計”,客戶選擇開閉源模式也將會有自己的考量,一些企業(yè)也采取開閉源共存的模式來滿足不同客戶需求,如谷歌將輕量級的開源模型系列Gemma進行開源。

不過此時發(fā)表出格語言最能出圈,能夠提高閉源大模型優(yōu)點的普及型,只是忽視了開源大模型絕非“弱雞”,大模型的發(fā)展會是持久戰(zhàn),未來有太多的不可測性,輕易下斷言在其后很可能被反噬。

聲明:個人原創(chuàng),僅供參考

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
筱梅產(chǎn)后十五天,和小菲逛夜市買夜宵,網(wǎng)友:完全忘了大S!

筱梅產(chǎn)后十五天,和小菲逛夜市買夜宵,網(wǎng)友:完全忘了大S!

潮鹿逐夢
2026-03-11 08:30:00
男人是視覺動物,常常首先落在外表,這是不可否認的

男人是視覺動物,常常首先落在外表,這是不可否認的

疾跑的小蝸牛
2026-03-11 22:20:47
國防部:日本部署遠程導(dǎo)彈徹底撕下偽裝

國防部:日本部署遠程導(dǎo)彈徹底撕下偽裝

界面新聞
2026-03-11 15:11:03
寧忠?guī)r被黑龍江省記大功,王濛即將破格晉升國家級教練

寧忠?guī)r被黑龍江省記大功,王濛即將破格晉升國家級教練

米修體育
2026-03-11 20:04:37
記者直擊以色列戰(zhàn)損情況

記者直擊以色列戰(zhàn)損情況

新華社
2026-03-11 18:03:15
女子到山東威海旅游被忽悠34萬買海景房,中介估價該房產(chǎn)現(xiàn)市值不足10萬,如今因還不上貸款被開發(fā)商起訴

女子到山東威海旅游被忽悠34萬買海景房,中介估價該房產(chǎn)現(xiàn)市值不足10萬,如今因還不上貸款被開發(fā)商起訴

洪觀新聞
2026-03-11 13:09:53
尼克松晚年坦言:他很后悔當初訪華,只因毛主席識破的訪華計謀!

尼克松晚年坦言:他很后悔當初訪華,只因毛主席識破的訪華計謀!

冰語歷史
2026-03-07 06:23:39
下半場遭勒沃庫森閃擊,阿森納本賽季歐冠首次比分落后

下半場遭勒沃庫森閃擊,阿森納本賽季歐冠首次比分落后

懂球帝
2026-03-12 03:05:06
伊朗內(nèi)奸事件大反轉(zhuǎn)!

伊朗內(nèi)奸事件大反轉(zhuǎn)!

新動察
2026-03-10 11:19:03
終于明白買家為何這么快接受邵晴,張嘉倪八年生倆娃卻被拒之門外

終于明白買家為何這么快接受邵晴,張嘉倪八年生倆娃卻被拒之門外

孤傲何妨初
2026-03-11 09:16:51
上海這晚,57歲周濤秒了30歲李雪琴,不愧是央視嚴選的國泰民安臉

上海這晚,57歲周濤秒了30歲李雪琴,不愧是央視嚴選的國泰民安臉

大鐵貓娛樂
2026-02-08 00:10:03
對肝最好的“3種食物”,建議:春天要多吃,養(yǎng)肝排毒強免疫

對肝最好的“3種食物”,建議:春天要多吃,養(yǎng)肝排毒強免疫

阿龍美食記
2026-03-09 13:28:40
超1100萬桶!“沖突后,伊朗原油全部運往中國”

超1100萬桶!“沖突后,伊朗原油全部運往中國”

觀察者網(wǎng)
2026-03-11 21:58:05
文旅部部長:7名外國游客到上海旅游,買了40箱中國貨;“成為中國人”成了網(wǎng)絡(luò)熱詞,老外愛上喝開水吃火鍋等中式生活

文旅部部長:7名外國游客到上海旅游,買了40箱中國貨;“成為中國人”成了網(wǎng)絡(luò)熱詞,老外愛上喝開水吃火鍋等中式生活

新民晚報
2026-03-07 15:00:52
WTT冠軍賽:日本男單大獲全勝 王楚欽橫掃 張本智和下輪對手出爐

WTT冠軍賽:日本男單大獲全勝 王楚欽橫掃 張本智和下輪對手出爐

羅納爾說個球
2026-03-11 19:37:43
財政壓力的下半場:退休人員占比近四成,才是硬賬

財政壓力的下半場:退休人員占比近四成,才是硬賬

超先聲
2026-01-09 16:45:39
難怪特朗普想停戰(zhàn):特朗普之子有了大麻煩,以色列的命根子被炸了

難怪特朗普想停戰(zhàn):特朗普之子有了大麻煩,以色列的命根子被炸了

混沌錄
2026-03-11 16:58:08
一種新型的異性關(guān)系,正在中年男女間悄然流行:你知我心我知你意

一種新型的異性關(guān)系,正在中年男女間悄然流行:你知我心我知你意

楓紅染山徑
2026-02-26 00:12:30
深夜突發(fā),龍頭利潤暴降236%,5股業(yè)績暴雷,僅2股增長,別踩雷

深夜突發(fā),龍頭利潤暴降236%,5股業(yè)績暴雷,僅2股增長,別踩雷

風風順
2026-03-11 08:29:02
女性情趣用品市場爆火,人均消費2716元

女性情趣用品市場爆火,人均消費2716元

映射生活的身影
2026-03-10 18:42:42
2026-03-12 04:35:00
思辨財經(jīng) incentive-icons
思辨財經(jīng)
移動互聯(lián)網(wǎng),電商干貨大全
1134文章數(shù) 25638關(guān)注度
往期回顧 全部

科技要聞

騰訊"養(yǎng)蝦"暴漲后,百度急得在門口"裝蝦"

頭條要聞

特朗普再次威脅將切斷與西班牙貿(mào)易往來:非常糟糕

頭條要聞

特朗普再次威脅將切斷與西班牙貿(mào)易往來:非常糟糕

體育要聞

郭艾倫重傷,CBA下半賽季還能期待些什么

娛樂要聞

蔡少芬曬全家福照,兩女兒成最大亮點

財經(jīng)要聞

喚醒10萬億存量資金 公積金改革大潮來了

汽車要聞

蓮花糾偏, 馮擎峰的“收”與“守”

態(tài)度原創(chuàng)

健康
數(shù)碼
親子
旅游
軍事航空

轉(zhuǎn)頭就暈的耳石癥,能開車上班嗎?

數(shù)碼要聞

OpenClaw裝進平板!聯(lián)想AI平板宣布首發(fā)端側(cè)一鍵部署:四大優(yōu)勢公布

親子要聞

父母都是清華大學畢業(yè),孩子卻休學了…

旅游要聞

昆明呈貢第十四屆“萬溪梨花節(jié)”將于3月13日啟幕

軍事要聞

朝鮮"崔賢"號驅(qū)逐艦進行戰(zhàn)略巡航導(dǎo)彈試射

無障礙瀏覽 進入關(guān)懷版