国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

晚點獨家丨智譜上市,唐杰內(nèi)部信要求全面回歸基礎(chǔ)模型研究

0
分享至



真正決定下一階段格局的,還是更底層的兩件事——模型架構(gòu)與學(xué)習(xí)范式。同時,應(yīng)用側(cè)可能會出現(xiàn)一個清晰的方向:AI 替代不同工種/任務(wù)的爆發(fā)年。

文丨申遠(yuǎn)

編輯丨宋瑋

晚點獨家獲悉,1 月 8 日智譜上市當(dāng)天,清華大學(xué)計算機系教授、智譜創(chuàng)立發(fā)起人兼首席科學(xué)家唐杰發(fā)布內(nèi)部信,宣布很快將推出新一代模型 GLM-5。

唐杰說,今天是 “智譜生命中激動人心的一天”。他沒有直接回應(yīng)大模型公司的商業(yè)模式爭議或給出智譜 2026 年商業(yè)化目標(biāo),但強調(diào),真正 “有人用”,能幫到更多的人的理論、技術(shù)或產(chǎn)品才是智譜在追逐 AGI 路上的重要成就。

DeepSeek 給中國大模型企業(yè)帶來沖擊,許多人認(rèn)為,DeepSeek 現(xiàn)象級成功首先沖擊了智譜的生態(tài)位,它們有幾乎同樣的學(xué)術(shù)科研團隊屬性,而智譜在大模型開源生態(tài)中同樣貢獻(xiàn)良多。

內(nèi)部信表示,智譜 2025 年如期完成了年初定下的戰(zhàn)略,即 4 月發(fā)一個 “穩(wěn)住陣腳” 的模型、年中發(fā)一個 “上牌桌” 的模型(成為 one of the best)、年底發(fā)一個 Top 1 的模型。

這種全面回歸基礎(chǔ)模型研究的戰(zhàn)略是智譜對 DeepSeek 沖擊的回應(yīng)。12 月 23 日,智譜基座模型 GLM-4.7 上線并開源,Artificial Analysis(AA 智能指數(shù))顯示,GLM-4.7 排名國產(chǎn)第一,和 Claude 4.5 Sonnet 并列全球第六。

除了 GLM-5 的發(fā)布,內(nèi)部信還介紹了 2026 年智譜聚焦的三個技術(shù)方向,包括全新的模型架構(gòu)設(shè)計,更通用的 RL(強化學(xué)習(xí))范式以及對模型持續(xù)學(xué)習(xí)與自主進(jìn)化的探索。它們均圍繞基礎(chǔ)模型能力提升展開。

隨著基礎(chǔ)模型能力提升,Agent 和領(lǐng)域大模型最終都將與基礎(chǔ)模型結(jié)合,甚至,AI 也不一定意味著需要創(chuàng)建新的應(yīng)用。“大模型的應(yīng)用也要回到第一性原理。”唐杰在去年的一條微博上說,2026 將是 AI 替代不同工種的爆發(fā)年。

2025 年智譜還經(jīng)歷了較大范圍組織調(diào)整, 限縮 To C、產(chǎn)研和視頻生成團隊規(guī)模,包括 AutoGLM 在內(nèi)的成果則陸續(xù)開源。

自 ChatGPT 發(fā)布以來,AI 快速發(fā)展的三年多,“行業(yè)并沒有什么共識,大家只是往前走而已?!?唐杰在一次內(nèi)部交流中說到。

以下是唐杰公開信全文,智譜授權(quán)晚點獨家發(fā)布。

用“咖啡”的精神做 AGI

在香港科技大學(xué)做短期訪問時,和楊強教授在實驗室一樓的咖啡廳偶然碰到。我說這幾天咖啡喝的太多,感覺有點上癮,需要戒一戒了。

楊老師說:“為什么要戒呢?上癮也不一定是壞事呀,如果我們做研究能像喝咖啡一樣上癮,又何愁研究做不好呢?”。

是啊,“上癮”便是人生的精彩所在,無論是研究,還是其它事,只要專注、努力,就一定能做好。

“讓機器像人一樣思考”是智譜自始至終的愿景和理想,也是智譜人持之以恒奮斗的唯一目標(biāo)。

2018年底,在人腦認(rèn)知的雙系統(tǒng)理論的啟發(fā)下,我們設(shè)計了一個擁有快思考+慢思考的機器“認(rèn)知”系統(tǒng)。2019年我們正式成立智譜,開始嘗試探索AGI,實現(xiàn)“讓機器像人一樣思考”的宏偉愿景。

這里的最大挑戰(zhàn)可能是直到今天也沒有人包括我們自己能夠給出一個準(zhǔn)確的AGI定義以及如何實現(xiàn)AGI的技術(shù)路徑,也許這正是探索AGI的魅力所在。

我們處在歷史上一個從未有過的非凡時刻,一個技術(shù)再一次顛覆式地改變世界的時刻。大模型不僅是通用人工智能的關(guān)鍵底座,更有望成為驅(qū)動生產(chǎn)力變革的核心引擎。

回顧一路走來的歷程,我們能走到今天的一個重要原因是,我們始終堅持做讓用戶真正用得上的AI技術(shù)。只有真正有人用的理論、技術(shù)或產(chǎn)品才能最終成為AGI之路上的重要成就。當(dāng)然,不是所有的創(chuàng)新都能成功,我們也有很多有風(fēng)險的項目都以敗告終,但這也往往教會了我們從失敗中汲取力量,這讓智譜變得更強大,對AGI的理解也更深刻。更重要的是,這讓我們注重實用的同時,不再只盯著短期收益:幫助用戶、幫助國家、幫助全球科技進(jìn)步成為智譜的長期目標(biāo)。

2020年,我們推出了自己的大模型算法架構(gòu)GLM,并開始嘗試訓(xùn)練100億參數(shù)的基座模型,模型很成功,得到包括美團在內(nèi)的很多企業(yè)試用,這是一個很大膽的嘗試,因為當(dāng)年還是BERT模型橫行的小模型時代。但當(dāng)時的成功距離我們夢想中的AGI還遙不可及。部分原因是模型的知識量還不夠大,而另一部分原因則是模型還不會像人一樣推理思考。

2021到2022年,大模型發(fā)展并不順利,大多數(shù)人并不接受“讓機器像人一樣思考”這種類似登月一樣的瘋狂計劃,也不認(rèn)為這可能是個非常大的技術(shù)變革機會,或者害怕失敗。我們還是決定賭一把,用更多數(shù)據(jù)訓(xùn)練一個1300億參數(shù)的大模型。

這個決策很難,因為還不能影響公司總體發(fā)展節(jié)奏。為此我們成立了兩個專門的小型創(chuàng)新團隊,一個負(fù)責(zé)模型訓(xùn)練,這就是后來公司的GLM三劍客;另一個則獨立負(fù)責(zé)MaaS平臺建設(shè),當(dāng)時這兩個小團隊可能互相都不知道對方的存在。2022年中,GLM-130B訓(xùn)出來了,其中很多精細(xì)的設(shè)計引起了全球關(guān)注;同時MaaS平臺上線,也就是現(xiàn)在的bigmodel.cn,有了第一批真正的API用戶。隨后,我們正式在公司成立了AI院,專注下一代大模型研發(fā);成立MaaS平臺部,負(fù)責(zé)對外提供大模型API服務(wù)。有時候,我們需要找到有足夠大膽夢想的人(甚至專門投入更多精力去找這樣的人),一個大膽宏偉的目標(biāo)也許決定了一半的成功。

2023年,我和國內(nèi)一個頂尖的創(chuàng)業(yè)前輩(其實他比我小不少)聊AI可能對未來的改變,我們一致認(rèn)為AI會顛覆搜索、顛覆瀏覽器,會給每個人帶來一個全新的AI助手;甚至有了這個AI助手后,我們也不再需要應(yīng)用商店,反之我們可能需要為AI打造一個“API商店”,可能這個API商店的底層邏輯就是顛覆現(xiàn)有的操作系統(tǒng);隨后,也許更重大的顛覆是計算機本身,因為屆時我們可能不是需要一個給人用的計算機了,而是適合AI的計算機。

這個變革發(fā)生的意義將是無窮的,因為它將徹底重塑計算機底層邏輯,挑戰(zhàn)計算機界用了80年的奠基石——馮諾伊曼體系。聊到這里的時候,我們不約而同覺得我們對AI的投入還太少了,還不夠All-in。

現(xiàn)實也是殘酷的,All-in不僅需要堅定的信念,也需要極其強大的資金、團隊支持,更需要精準(zhǔn)的預(yù)判。2023到2024年是全球大模型的爆發(fā)年,大廠紛紛“All-in”大模型,國內(nèi)也掀起創(chuàng)業(yè)高潮,百模大戰(zhàn)、各種AI助手層出不窮。

我們那時候可能也有失誤,有技術(shù)的也有商業(yè)的?,F(xiàn)在復(fù)盤,可能原因是我們自己在追逐AGI的路上有迷失的時候,會被眼前的短期收益、短期熱鬧所迷惑。AGI是個技術(shù)變革,技術(shù)是平權(quán)的,是公開透明的,是要讓所有人都能用的上并從中獲益。

隨后DeepSeek的出現(xiàn)警醒了我們,文鋒2023年創(chuàng)業(yè)的時候和我聊過,當(dāng)時我并沒有意識到他對AGI如此執(zhí)著,感謝他帶給我很多不一樣的思考。選擇對AGI技術(shù)的執(zhí)著追求,不斷探索AGI的上界,同時精準(zhǔn)的未來預(yù)判成為下一步智譜需要不斷改進(jìn)和升華的地方。這兩年讓我們經(jīng)歷很多,更重要的是“強化學(xué)習(xí)”了我們對AGI、對公司治理和商業(yè)競爭的認(rèn)知。

過去一年,我們其實做了一次比較系統(tǒng)的"強化"。我們喊出了“定力”與“成就”的口號,要求大家保持定力,不驕不躁,不妄自菲薄,成就智譜每個人手上的事,成就自己。

年初的時候,一切都那么難,模型效果達(dá)不到預(yù)期,全國上下價格戰(zhàn),殺出重圍需要找到一個精準(zhǔn)的突破口。

我們堅守了陣地,終于找到Coding作為突破口。

如果說4月份GLM-4.1的發(fā)布像是象征性的試探,那7月底的GLM-4.5的發(fā)布幾乎更是一場決戰(zhàn),所有技術(shù)、平臺、業(yè)務(wù)團隊捏一把汗,日日夜夜加班,我們終于迎來一場久逢的勝利,接著GLM-4.6和GLM-4.7讓我們模型能力方面和那些國際頂尖模型并駕齊驅(qū)。我們的GLM-4.7 在包括AA、競技場等多項評測中獲得開源模型、國產(chǎn)模型的SOTA,來自用戶側(cè)的模型Coding和Agent真實體感也非常好,全球184個國家的15萬開發(fā)者朋友使用GLM Coding Plan,GLM-4.7發(fā)布后MaaS平臺ARR年化收入超過5億(其中海外收入超過2億),從2000萬到5億(25倍)僅用了10個月。

總體來說,在模型側(cè)我們?nèi)缙谕瓿闪四瓿醵ㄏ碌?月發(fā)一個“穩(wěn)住陣腳”的模型、年中發(fā)一個“上牌桌”的模型(即成為 one of the best)、年底發(fā)一個Top 1的模型的整體戰(zhàn)略。這為我們后續(xù)繼續(xù)沖刺AGI技術(shù)高地打下重要根基。

我們的「主權(quán)AI」也迎來全新進(jìn)展:馬來西亞國家級MaaS平臺基于Z.ai開源模型構(gòu)建,GLM成為馬來的國民級模型。主權(quán)AI出海是我參加了總書記座談會后被總書記的“中國AI要走出國門”感召,但說實話我也不知道應(yīng)該怎么做,我們的國際團隊敢拼敢打敢成事,完成中國大模型出海從無到有的一個里程碑。業(yè)務(wù)方面,我們敢于競爭,再次完成了年度超一倍的營收增長目標(biāo)。

在種種困難和機遇并存的情況下,今天,我們以一種幾乎不可能的姿勢成為了全球大模型第一股,這表明了市場對我們技術(shù)與商業(yè)價值的認(rèn)可?!癕ake impossible possible”—— 還記得我們曾經(jīng)說過的嗎?

這一年來,蛻變最大的可能是不是智譜,而是一群一線的年輕人,他們把很多看起來不可能的事,真的做成了。

2026年,公司的目標(biāo)是成為國際領(lǐng)跑的大模型企業(yè)。過去一年大家討論大模型,很多在聊應(yīng)用、聊生態(tài)。

真正決定下一階段格局的,還是更底層的兩件事——模型架構(gòu)與學(xué)習(xí)范式。同時,應(yīng)用側(cè)可能會出現(xiàn)一個清晰的方向:AI替代不同工種/任務(wù)的爆發(fā)年。

基于這一判斷,我們在 2026 年將聚焦于:

  • GLM-5。很快GLM-5將跟大家見面,通過進(jìn)一步的Scaling和很多全新技術(shù)改進(jìn),相信GLM-5會帶給大家很多新奇體驗,讓AI幫大家完成更多真實任務(wù)。
  • 全新的模型架構(gòu)設(shè)計。已經(jīng)廣泛使用近10年的Transformer架構(gòu)已經(jīng)顯露出一些不足,包括超長上下文的計算開銷、記憶機制、更新機制等。這些都需要探索全新的模型架構(gòu),發(fā)現(xiàn)新的Scaling范式,通過芯片-算法協(xié)同設(shè)計等技術(shù)提高計算效率。
  • 具有更強泛化能力的RL。當(dāng)前主流的RLVR范式雖然在數(shù)學(xué)和代碼領(lǐng)域取得了成功,但其依賴人工構(gòu)造可驗證環(huán)境的局限性也日益凸顯。今年需要探索更通用的RL范式,支持AI不僅能在人類指令下完成特定任務(wù),更要能理解并執(zhí)行跨越數(shù)小時甚至數(shù)天的長時程任務(wù)。
  • 最具挑戰(zhàn)性的探索,是開啟通往持續(xù)學(xué)習(xí)與自主進(jìn)化的道路。當(dāng)前所有主流的AI模型,其智能在部署后基本上是靜態(tài)的。它們通過一次性的、耗資巨大的訓(xùn)練過程獲得知識,然后在應(yīng)用中逐漸過時。這與人腦能夠從與世界的持續(xù)交互中不斷學(xué)習(xí)、進(jìn)化的方式截然不同。我們需要對下一代學(xué)習(xí)范式——在線學(xué)習(xí)(Online Learning)或持續(xù)學(xué)習(xí)(Continual Learning)進(jìn)行前瞻性布局。

我們不是一家傳統(tǒng)公司,我們也不打算成為其中之一。我們希望成為一家一切皆有可能發(fā)生的AI原生公司:打造不斷提升智能上界的下一代模型,研發(fā)AI為核心的產(chǎn)品服務(wù)用戶。我們要讓AI成為每個人最得力的助手,幫助我們完成任務(wù)。我們認(rèn)為還需要利用AI參與治理公司降本增效、做到更公平。

隨著時間的推移,一個公司往往會習(xí)慣于做同樣的事情,做漸進(jìn)式的改進(jìn),這會限制我們的創(chuàng)新力。但在AI時代,一切都是變革式的,我們需要有點“不舒服”才能保持創(chuàng)新力,才能提出革命性的想法推動下一個大的增長領(lǐng)域。

因此,我們在智譜內(nèi)部設(shè)立了一個全新部門X-Lab,這個部門將致力于用開放的方式把更多年輕人聚集,做前沿性探索,包括全新的模型架構(gòu)、新的認(rèn)知范式、還將孵化新項目,不局限于軟件或是硬件。同時,我們也會擴大對外投資,不僅僅是戰(zhàn)略聯(lián)合已有的被投企業(yè),也要開辟新的版圖,讓整個行業(yè)貫通起來,讓整個生態(tài)一起繁榮。在X-Lab,每個人的使命就是做完全顛覆式的創(chuàng)新,最終回歸到AGI的主線。

今天是智譜生命中激動人心的一天,是智譜歷史上一個重要的里程碑,更是智譜一個全新時代的開啟。我很喜歡Z.ai這個品牌,Z是字母表中的最后一個,代表終極境地,我們希望在AGI的探索歷程上能走到智能的終極境地,這是我們努力的目標(biāo)。我們非常興奮:

  • 有一個雄心勃勃、改變世界的事業(yè)
  • 著眼長遠(yuǎn)利益、放眼未來
  • 更加專注,探索 AGI 的本質(zhì)
  • 用 AI 賦能偉大的企業(yè)家和公司的蓬勃發(fā)展
  • 用更精準(zhǔn)的預(yù)判抓住企業(yè)發(fā)展機遇
  • 最終,希望我們能夠為人類社會帶來不一樣的 AI,切實推動人類福祉的進(jìn)步。

這是一個無與倫比的開心時刻,這種開心不是一時的多巴胺,而是探索 AGI 之路上積累起來的內(nèi)啡肽,讓我們更加專注,腳踏實地,持續(xù)前行!

唐杰

2026.1.8

題圖來源:《沙丘 2》

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
連續(xù)三天,上海交大每天都獲億元級校友捐贈,重點投向科技創(chuàng)新與人才培養(yǎng)

連續(xù)三天,上海交大每天都獲億元級校友捐贈,重點投向科技創(chuàng)新與人才培養(yǎng)

文匯報
2026-02-28 10:39:59
云南21歲李錦珩離世,死因曝光遺囑內(nèi)容令人心碎

云南21歲李錦珩離世,死因曝光遺囑內(nèi)容令人心碎

孤城落葉
2026-03-01 02:35:20
中國第二大民營企業(yè)“倒了”,負(fù)債高達(dá)7000億,現(xiàn)已“賣身”改名

中國第二大民營企業(yè)“倒了”,負(fù)債高達(dá)7000億,現(xiàn)已“賣身”改名

閱微札記
2026-02-11 17:11:36
曼聯(lián)舊將成最大水貨!全場災(zāi)難表現(xiàn),名宿直接噴爆:徹底棄用

曼聯(lián)舊將成最大水貨!全場災(zāi)難表現(xiàn),名宿直接噴爆:徹底棄用

奶蓋熊本熊
2026-03-01 02:55:46
張本美和不簡單!大腿拉傷仍扳回一局,王曼昱賽后居然說了三個字

張本美和不簡單!大腿拉傷仍扳回一局,王曼昱賽后居然說了三個字

寶哥精彩賽事
2026-03-01 01:20:08
王石不戴假發(fā)樣子曝光!光頭更年輕,到香港聚餐,只喝茶不敢喝酒

王石不戴假發(fā)樣子曝光!光頭更年輕,到香港聚餐,只喝茶不敢喝酒

老頭的傳奇色彩
2026-02-28 19:57:17
“七十不添衣,八十不祝壽”,這句話指的是啥?看完后漲知識了

“七十不添衣,八十不祝壽”,這句話指的是啥?看完后漲知識了

阿龍美食記
2026-02-26 14:30:14
牛肉再次成矚目!專家發(fā)現(xiàn):腫瘤患者吃牛肉,過不多久或有4好處

牛肉再次成矚目!專家發(fā)現(xiàn):腫瘤患者吃牛肉,過不多久或有4好處

展望云霄
2026-02-13 11:19:31
以色列宣布襲擊伊朗!下周大盤將何去何從?

以色列宣布襲擊伊朗!下周大盤將何去何從?

春江財富
2026-02-28 16:59:05
華潤集團副總經(jīng)理被帶走調(diào)查

華潤集團副總經(jīng)理被帶走調(diào)查

地產(chǎn)微資訊
2026-02-28 21:44:26
5年資產(chǎn)縮水270億,賣酒套現(xiàn)1.1億,劉鑾雄終是向歲月低下了頭

5年資產(chǎn)縮水270億,賣酒套現(xiàn)1.1億,劉鑾雄終是向歲月低下了頭

八斗小先生
2026-02-28 17:24:32
印度公布2025年GDP:不僅未能趕超日本,還被英國反超,降至第六

印度公布2025年GDP:不僅未能趕超日本,還被英國反超,降至第六

南生今世說
2026-02-28 10:03:03
全美熱搜第一!約基奇與多爾特爆發(fā)沖突 后者驅(qū)逐遭集體炮轟動作太臟

全美熱搜第一!約基奇與多爾特爆發(fā)沖突 后者驅(qū)逐遭集體炮轟動作太臟

銜春信
2026-02-28 13:17:20
霍尊也沒想到,自己復(fù)出后,分手五年的陳露親手撕碎他最后的體面

霍尊也沒想到,自己復(fù)出后,分手五年的陳露親手撕碎他最后的體面

長歌侃娛
2026-02-27 21:32:42
國內(nèi)“十萬元級”車型年度總冠軍:低調(diào)的銷量王,年銷超38萬臺

國內(nèi)“十萬元級”車型年度總冠軍:低調(diào)的銷量王,年銷超38萬臺

柳先說
2026-01-15 16:06:50
香港知名演員宣布成功戒煙,長達(dá)近40年煙癮,一年省3萬港幣

香港知名演員宣布成功戒煙,長達(dá)近40年煙癮,一年省3萬港幣

白面書誏
2026-02-28 19:12:37
特朗普終于犯下錯,最致命的錯誤!美專家:中國什么都沒做就贏了

特朗普終于犯下錯,最致命的錯誤!美專家:中國什么都沒做就贏了

時光在作祟
2026-02-28 16:45:49
人的基因有多強大?網(wǎng)友:今年剪了個短發(fā),我爸一看就害怕!

人的基因有多強大?網(wǎng)友:今年剪了個短發(fā),我爸一看就害怕!

另子維愛讀史
2026-02-27 21:05:30
開打了!美以聯(lián)合對伊朗發(fā)動空襲,外媒:哈梅內(nèi)伊已指定接班人

開打了!美以聯(lián)合對伊朗發(fā)動空襲,外媒:哈梅內(nèi)伊已指定接班人

欽點歷史
2026-03-01 00:04:15
伊朗稱美以襲擊已致近千人死傷

伊朗稱美以襲擊已致近千人死傷

中國網(wǎng)
2026-03-01 03:46:05
2026-03-01 04:20:49
晚點LatePost
晚點LatePost
晚一點,好一點。商業(yè)的真相總是在晚點。《晚點LatePost》官方賬號
3086文章數(shù) 21893關(guān)注度
往期回顧 全部

科技要聞

狂攬1100億美元!OpenAI再創(chuàng)融資神話

頭條要聞

伊朗媒體公布反擊美軍軍事行動結(jié)果

頭條要聞

伊朗媒體公布反擊美軍軍事行動結(jié)果

體育要聞

球隊主力全報銷?頂風(fēng)擺爛演都不演了

娛樂要聞

周杰倫兒子正面照曝光,與父親好像

財經(jīng)要聞

沖突爆發(fā) 市場變天?

汽車要聞

嵐圖泰山黑武士版3月上市 搭載華為四激光智駕方案

態(tài)度原創(chuàng)

本地
教育
房產(chǎn)
手機
公開課

本地新聞

津南好·四時總相宜

教育要聞

初三不安排春假,最多可連休10天!一地率先公布!

房產(chǎn)要聞

濱江九小也來了!集齊海僑北+哈羅、寰島...江東教育要炸了!

手機要聞

澎湃OS再次公布進(jìn)展通報:10個問題,僅修復(fù)一則!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版