網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

晚點獨家丨智譜上市，唐杰內(nèi)部信要求全面回歸基礎(chǔ)模型研究

2026-01-08 10:30:08　來源: 晚點LatePost

北京舉報

分享至

真正決定下一階段格局的，還是更底層的兩件事——模型架構(gòu)與學(xué)習(xí)范式。同時，應(yīng)用側(cè)可能會出現(xiàn)一個清晰的方向：AI 替代不同工種/任務(wù)的爆發(fā)年。

文丨申遠(yuǎn)

編輯丨宋瑋

晚點獨家獲悉，1 月 8 日智譜上市當(dāng)天，清華大學(xué)計算機系教授、智譜創(chuàng)立發(fā)起人兼首席科學(xué)家唐杰發(fā)布內(nèi)部信，宣布很快將推出新一代模型 GLM-5。

唐杰說，今天是 “智譜生命中激動人心的一天”。他沒有直接回應(yīng)大模型公司的商業(yè)模式爭議或給出智譜 2026 年商業(yè)化目標(biāo)，但強調(diào)，真正 “有人用”，能幫到更多的人的理論、技術(shù)或產(chǎn)品才是智譜在追逐 AGI 路上的重要成就。

DeepSeek 給中國大模型企業(yè)帶來沖擊，許多人認(rèn)為，DeepSeek 現(xiàn)象級成功首先沖擊了智譜的生態(tài)位，它們有幾乎同樣的學(xué)術(shù)科研團隊屬性，而智譜在大模型開源生態(tài)中同樣貢獻(xiàn)良多。

內(nèi)部信表示，智譜 2025 年如期完成了年初定下的戰(zhàn)略，即 4 月發(fā)一個 “穩(wěn)住陣腳” 的模型、年中發(fā)一個 “上牌桌” 的模型（成為 one of the best）、年底發(fā)一個 Top 1 的模型。

這種全面回歸基礎(chǔ)模型研究的戰(zhàn)略是智譜對 DeepSeek 沖擊的回應(yīng)。12 月 23 日，智譜基座模型 GLM-4.7 上線并開源，Artificial Analysis（AA 智能指數(shù)）顯示，GLM-4.7 排名國產(chǎn)第一，和 Claude 4.5 Sonnet 并列全球第六。

除了 GLM-5 的發(fā)布，內(nèi)部信還介紹了 2026 年智譜聚焦的三個技術(shù)方向，包括全新的模型架構(gòu)設(shè)計，更通用的 RL（強化學(xué)習(xí)）范式以及對模型持續(xù)學(xué)習(xí)與自主進(jìn)化的探索。它們均圍繞基礎(chǔ)模型能力提升展開。

隨著基礎(chǔ)模型能力提升，Agent 和領(lǐng)域大模型最終都將與基礎(chǔ)模型結(jié)合，甚至，AI 也不一定意味著需要創(chuàng)建新的應(yīng)用。“大模型的應(yīng)用也要回到第一性原理。”唐杰在去年的一條微博上說，2026 將是 AI 替代不同工種的爆發(fā)年。

2025 年智譜還經(jīng)歷了較大范圍組織調(diào)整，限縮 To C、產(chǎn)研和視頻生成團隊規(guī)模，包括 AutoGLM 在內(nèi)的成果則陸續(xù)開源。

自 ChatGPT 發(fā)布以來，AI 快速發(fā)展的三年多，“行業(yè)并沒有什么共識，大家只是往前走而已?！?唐杰在一次內(nèi)部交流中說到。

以下是唐杰公開信全文，智譜授權(quán)晚點獨家發(fā)布。

用“咖啡”的精神做 AGI

在香港科技大學(xué)做短期訪問時，和楊強教授在實驗室一樓的咖啡廳偶然碰到。我說這幾天咖啡喝的太多，感覺有點上癮，需要戒一戒了。

楊老師說：“為什么要戒呢？上癮也不一定是壞事呀，如果我們做研究能像喝咖啡一樣上癮，又何愁研究做不好呢？”。

是啊，“上癮”便是人生的精彩所在，無論是研究，還是其它事，只要專注、努力，就一定能做好。

“讓機器像人一樣思考”是智譜自始至終的愿景和理想，也是智譜人持之以恒奮斗的唯一目標(biāo)。

2018年底，在人腦認(rèn)知的雙系統(tǒng)理論的啟發(fā)下，我們設(shè)計了一個擁有快思考+慢思考的機器“認(rèn)知”系統(tǒng)。2019年我們正式成立智譜，開始嘗試探索AGI，實現(xiàn)“讓機器像人一樣思考”的宏偉愿景。

這里的最大挑戰(zhàn)可能是直到今天也沒有人包括我們自己能夠給出一個準(zhǔn)確的AGI定義以及如何實現(xiàn)AGI的技術(shù)路徑，也許這正是探索AGI的魅力所在。

我們處在歷史上一個從未有過的非凡時刻，一個技術(shù)再一次顛覆式地改變世界的時刻。大模型不僅是通用人工智能的關(guān)鍵底座，更有望成為驅(qū)動生產(chǎn)力變革的核心引擎。

回顧一路走來的歷程，我們能走到今天的一個重要原因是，我們始終堅持做讓用戶真正用得上的AI技術(shù)。只有真正有人用的理論、技術(shù)或產(chǎn)品才能最終成為AGI之路上的重要成就。當(dāng)然，不是所有的創(chuàng)新都能成功，我們也有很多有風(fēng)險的項目都以敗告終，但這也往往教會了我們從失敗中汲取力量，這讓智譜變得更強大，對AGI的理解也更深刻。更重要的是，這讓我們注重實用的同時，不再只盯著短期收益：幫助用戶、幫助國家、幫助全球科技進(jìn)步成為智譜的長期目標(biāo)。

2020年，我們推出了自己的大模型算法架構(gòu)GLM，并開始嘗試訓(xùn)練100億參數(shù)的基座模型，模型很成功，得到包括美團在內(nèi)的很多企業(yè)試用，這是一個很大膽的嘗試，因為當(dāng)年還是BERT模型橫行的小模型時代。但當(dāng)時的成功距離我們夢想中的AGI還遙不可及。部分原因是模型的知識量還不夠大，而另一部分原因則是模型還不會像人一樣推理思考。

2021到2022年，大模型發(fā)展并不順利，大多數(shù)人并不接受“讓機器像人一樣思考”這種類似登月一樣的瘋狂計劃，也不認(rèn)為這可能是個非常大的技術(shù)變革機會，或者害怕失敗。我們還是決定賭一把，用更多數(shù)據(jù)訓(xùn)練一個1300億參數(shù)的大模型。

這個決策很難，因為還不能影響公司總體發(fā)展節(jié)奏。為此我們成立了兩個專門的小型創(chuàng)新團隊，一個負(fù)責(zé)模型訓(xùn)練，這就是后來公司的GLM三劍客；另一個則獨立負(fù)責(zé)MaaS平臺建設(shè)，當(dāng)時這兩個小團隊可能互相都不知道對方的存在。2022年中，GLM-130B訓(xùn)出來了，其中很多精細(xì)的設(shè)計引起了全球關(guān)注；同時MaaS平臺上線，也就是現(xiàn)在的bigmodel.cn，有了第一批真正的API用戶。隨后，我們正式在公司成立了AI院，專注下一代大模型研發(fā)；成立MaaS平臺部，負(fù)責(zé)對外提供大模型API服務(wù)。有時候，我們需要找到有足夠大膽夢想的人（甚至專門投入更多精力去找這樣的人），一個大膽宏偉的目標(biāo)也許決定了一半的成功。

2023年，我和國內(nèi)一個頂尖的創(chuàng)業(yè)前輩（其實他比我小不少）聊AI可能對未來的改變，我們一致認(rèn)為AI會顛覆搜索、顛覆瀏覽器，會給每個人帶來一個全新的AI助手；甚至有了這個AI助手后，我們也不再需要應(yīng)用商店，反之我們可能需要為AI打造一個“API商店”，可能這個API商店的底層邏輯就是顛覆現(xiàn)有的操作系統(tǒng)；隨后，也許更重大的顛覆是計算機本身，因為屆時我們可能不是需要一個給人用的計算機了，而是適合AI的計算機。

這個變革發(fā)生的意義將是無窮的，因為它將徹底重塑計算機底層邏輯，挑戰(zhàn)計算機界用了80年的奠基石——馮諾伊曼體系。聊到這里的時候，我們不約而同覺得我們對AI的投入還太少了，還不夠All-in。

現(xiàn)實也是殘酷的，All-in不僅需要堅定的信念，也需要極其強大的資金、團隊支持，更需要精準(zhǔn)的預(yù)判。2023到2024年是全球大模型的爆發(fā)年，大廠紛紛“All-in”大模型，國內(nèi)也掀起創(chuàng)業(yè)高潮，百模大戰(zhàn)、各種AI助手層出不窮。

我們那時候可能也有失誤，有技術(shù)的也有商業(yè)的?，F(xiàn)在復(fù)盤，可能原因是我們自己在追逐AGI的路上有迷失的時候，會被眼前的短期收益、短期熱鬧所迷惑。AGI是個技術(shù)變革，技術(shù)是平權(quán)的，是公開透明的，是要讓所有人都能用的上并從中獲益。

隨后DeepSeek的出現(xiàn)警醒了我們，文鋒2023年創(chuàng)業(yè)的時候和我聊過，當(dāng)時我并沒有意識到他對AGI如此執(zhí)著，感謝他帶給我很多不一樣的思考。選擇對AGI技術(shù)的執(zhí)著追求，不斷探索AGI的上界，同時精準(zhǔn)的未來預(yù)判成為下一步智譜需要不斷改進(jìn)和升華的地方。這兩年讓我們經(jīng)歷很多，更重要的是“強化學(xué)習(xí)”了我們對AGI、對公司治理和商業(yè)競爭的認(rèn)知。

過去一年，我們其實做了一次比較系統(tǒng)的"強化"。我們喊出了“定力”與“成就”的口號，要求大家保持定力，不驕不躁，不妄自菲薄，成就智譜每個人手上的事，成就自己。

年初的時候，一切都那么難，模型效果達(dá)不到預(yù)期，全國上下價格戰(zhàn)，殺出重圍需要找到一個精準(zhǔn)的突破口。

我們堅守了陣地，終于找到Coding作為突破口。

如果說4月份GLM-4.1的發(fā)布像是象征性的試探，那7月底的GLM-4.5的發(fā)布幾乎更是一場決戰(zhàn)，所有技術(shù)、平臺、業(yè)務(wù)團隊捏一把汗，日日夜夜加班，我們終于迎來一場久逢的勝利，接著GLM-4.6和GLM-4.7讓我們模型能力方面和那些國際頂尖模型并駕齊驅(qū)。我們的GLM-4.7 在包括AA、競技場等多項評測中獲得開源模型、國產(chǎn)模型的SOTA，來自用戶側(cè)的模型Coding和Agent真實體感也非常好，全球184個國家的15萬開發(fā)者朋友使用GLM Coding Plan，GLM-4.7發(fā)布后MaaS平臺ARR年化收入超過5億（其中海外收入超過2億），從2000萬到5億（25倍）僅用了10個月。

總體來說，在模型側(cè)我們?nèi)缙谕瓿闪四瓿醵ㄏ碌?月發(fā)一個“穩(wěn)住陣腳”的模型、年中發(fā)一個“上牌桌”的模型（即成為 one of the best）、年底發(fā)一個Top 1的模型的整體戰(zhàn)略。這為我們后續(xù)繼續(xù)沖刺AGI技術(shù)高地打下重要根基。

我們的「主權(quán)AI」也迎來全新進(jìn)展：馬來西亞國家級MaaS平臺基于Z.ai開源模型構(gòu)建，GLM成為馬來的國民級模型。主權(quán)AI出海是我參加了總書記座談會后被總書記的“中國AI要走出國門”感召，但說實話我也不知道應(yīng)該怎么做，我們的國際團隊敢拼敢打敢成事，完成中國大模型出海從無到有的一個里程碑。業(yè)務(wù)方面，我們敢于競爭，再次完成了年度超一倍的營收增長目標(biāo)。

在種種困難和機遇并存的情況下，今天，我們以一種幾乎不可能的姿勢成為了全球大模型第一股，這表明了市場對我們技術(shù)與商業(yè)價值的認(rèn)可?！癕ake impossible possible”—— 還記得我們曾經(jīng)說過的嗎？

這一年來，蛻變最大的可能是不是智譜，而是一群一線的年輕人，他們把很多看起來不可能的事，真的做成了。

2026年，公司的目標(biāo)是成為國際領(lǐng)跑的大模型企業(yè)。過去一年大家討論大模型，很多在聊應(yīng)用、聊生態(tài)。

真正決定下一階段格局的，還是更底層的兩件事——模型架構(gòu)與學(xué)習(xí)范式。同時，應(yīng)用側(cè)可能會出現(xiàn)一個清晰的方向：AI替代不同工種/任務(wù)的爆發(fā)年。

基于這一判斷，我們在 2026 年將聚焦于：

GLM-5。很快GLM-5將跟大家見面，通過進(jìn)一步的Scaling和很多全新技術(shù)改進(jìn)，相信GLM-5會帶給大家很多新奇體驗，讓AI幫大家完成更多真實任務(wù)。
全新的模型架構(gòu)設(shè)計。已經(jīng)廣泛使用近10年的Transformer架構(gòu)已經(jīng)顯露出一些不足，包括超長上下文的計算開銷、記憶機制、更新機制等。這些都需要探索全新的模型架構(gòu)，發(fā)現(xiàn)新的Scaling范式，通過芯片-算法協(xié)同設(shè)計等技術(shù)提高計算效率。
具有更強泛化能力的RL。當(dāng)前主流的RLVR范式雖然在數(shù)學(xué)和代碼領(lǐng)域取得了成功，但其依賴人工構(gòu)造可驗證環(huán)境的局限性也日益凸顯。今年需要探索更通用的RL范式，支持AI不僅能在人類指令下完成特定任務(wù)，更要能理解并執(zhí)行跨越數(shù)小時甚至數(shù)天的長時程任務(wù)。
最具挑戰(zhàn)性的探索，是開啟通往持續(xù)學(xué)習(xí)與自主進(jìn)化的道路。當(dāng)前所有主流的AI模型，其智能在部署后基本上是靜態(tài)的。它們通過一次性的、耗資巨大的訓(xùn)練過程獲得知識，然后在應(yīng)用中逐漸過時。這與人腦能夠從與世界的持續(xù)交互中不斷學(xué)習(xí)、進(jìn)化的方式截然不同。我們需要對下一代學(xué)習(xí)范式——在線學(xué)習(xí)（Online Learning）或持續(xù)學(xué)習(xí)（Continual Learning）進(jìn)行前瞻性布局。

我們不是一家傳統(tǒng)公司，我們也不打算成為其中之一。我們希望成為一家一切皆有可能發(fā)生的AI原生公司：打造不斷提升智能上界的下一代模型，研發(fā)AI為核心的產(chǎn)品服務(wù)用戶。我們要讓AI成為每個人最得力的助手，幫助我們完成任務(wù)。我們認(rèn)為還需要利用AI參與治理公司降本增效、做到更公平。

隨著時間的推移，一個公司往往會習(xí)慣于做同樣的事情，做漸進(jìn)式的改進(jìn)，這會限制我們的創(chuàng)新力。但在AI時代，一切都是變革式的，我們需要有點“不舒服”才能保持創(chuàng)新力，才能提出革命性的想法推動下一個大的增長領(lǐng)域。

因此，我們在智譜內(nèi)部設(shè)立了一個全新部門X-Lab，這個部門將致力于用開放的方式把更多年輕人聚集，做前沿性探索，包括全新的模型架構(gòu)、新的認(rèn)知范式、還將孵化新項目，不局限于軟件或是硬件。同時，我們也會擴大對外投資，不僅僅是戰(zhàn)略聯(lián)合已有的被投企業(yè)，也要開辟新的版圖，讓整個行業(yè)貫通起來，讓整個生態(tài)一起繁榮。在X-Lab，每個人的使命就是做完全顛覆式的創(chuàng)新，最終回歸到AGI的主線。

今天是智譜生命中激動人心的一天，是智譜歷史上一個重要的里程碑，更是智譜一個全新時代的開啟。我很喜歡Z.ai這個品牌，Z是字母表中的最后一個，代表終極境地，我們希望在AGI的探索歷程上能走到智能的終極境地，這是我們努力的目標(biāo)。我們非常興奮：

有一個雄心勃勃、改變世界的事業(yè)
著眼長遠(yuǎn)利益、放眼未來
更加專注，探索 AGI 的本質(zhì)
用 AI 賦能偉大的企業(yè)家和公司的蓬勃發(fā)展
用更精準(zhǔn)的預(yù)判抓住企業(yè)發(fā)展機遇
最終，希望我們能夠為人類社會帶來不一樣的 AI，切實推動人類福祉的進(jìn)步。

這是一個無與倫比的開心時刻，這種開心不是一時的多巴胺，而是探索 AGI 之路上積累起來的內(nèi)啡肽，讓我們更加專注，腳踏實地，持續(xù)前行！

唐杰

2026.1.8

題圖來源：《沙丘 2》

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.