国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

連續(xù)發(fā)布兩款萬億參數(shù)模型,螞蟻 AI 來勢(shì)洶洶

0
分享至



大模型開源生態(tài)有了新變化。

作者丨齊鋮湧

編輯丨陳彩嫻

剛剛過去的國(guó)慶,各行各業(yè)進(jìn)入放假模式,但大模型行業(yè)卻一刻也沒閑著。

過去的半個(gè)月,國(guó)內(nèi)外大模型的頭部團(tuán)隊(duì)有十余款重磅產(chǎn)品發(fā)布,但每個(gè)團(tuán)隊(duì)的產(chǎn)品側(cè)重不同。

其中,九月下旬,阿里發(fā)布以 Qwen3-Max 為代表的全家桶產(chǎn)品,大秀了一把肌肉;九月末,DeepSeek 和 Anthropic 瞄準(zhǔn)真實(shí)編程場(chǎng)景,先后發(fā)布了 DeepSeek V3.2-Exp 和 Claude Sonnet 4.5,此外,智譜也拿出 GLM-4.6,目標(biāo)沖擊國(guó)內(nèi)最強(qiáng)代碼模型。

有人全盤布局,也有人專攻精尖,在大模型領(lǐng)域競(jìng)爭(zhēng)駛向深水區(qū)后,各個(gè)公司戰(zhàn)略路線出現(xiàn)了分野。

10 月 9 日凌晨,螞蟻百靈大模型團(tuán)隊(duì)奇襲般官宣了一款自家最新語言大模型 Ling-1T,參數(shù)量達(dá)到 1000B(即 1萬億參數(shù))。然而,就在十天前,百靈團(tuán)隊(duì)才將自研 Ring-1T-preview 大模型開源。

短短十天內(nèi),發(fā)布并開源兩款萬億參數(shù)模型,如此密集的產(chǎn)品發(fā)布讓螞蟻百靈大模型成為了行業(yè)熱議對(duì)象。

與此同時(shí),這樣毫無保留的開源動(dòng)作,也讓業(yè)界猜測(cè):螞蟻到底意圖何在?

01

探索智能上限是終極目標(biāo)

據(jù)了解,螞蟻集團(tuán)研發(fā)的基礎(chǔ)大模型取名“百靈”,寓意“百試百靈”,也蘊(yùn)含科技普惠之意,和阿里一樣,螞蟻也是獨(dú)立團(tuán)隊(duì)獨(dú)立研發(fā),Ling-1T 和 Ring-1T-preview 分別是螞蟻百靈團(tuán)隊(duì)研發(fā)的非思考模型和思考模型。

過去半年時(shí)間里,螞蟻一直在對(duì)百靈大模型進(jìn)行迭代優(yōu)化,并且自上而下形成了三條技術(shù)探索路線:

一條是以 MoE 架構(gòu)為基礎(chǔ)的非思考模型 Ling-Series,另一條是思考模型 Ring-Series,第三條是原生全模態(tài)大模型 Ming-Series 。

如今,螞蟻百靈團(tuán)隊(duì)在 Ling 和 Ring 兩款模型路線上都已經(jīng)將參數(shù)量擴(kuò)大到萬億參數(shù)。

萬億參數(shù),幾乎等同于人類大腦神經(jīng)元數(shù)量,相當(dāng)于讓 AI 擁有等同于人腦的處理能力,但萬億參數(shù)非常難訓(xùn)。目前,國(guó)內(nèi)能達(dá)到萬億參數(shù)規(guī)模的大模型也是鳳毛麟角。

除了剛才提到的百靈大模型 Ling-1T 和 Ring-1T-preview ,目前國(guó)內(nèi)公開資料可查的萬億參數(shù)大模型只有 Kimi K2、阿里 Qwen3-Max 和騰訊混元大模型等少數(shù)幾個(gè)模型,可見大模型領(lǐng)域“萬億俱樂部”的門檻之高。

雖然今年以來盛行“數(shù)據(jù)撞墻論”和“預(yù)訓(xùn)練終結(jié)”的觀點(diǎn),但越來越多科學(xué)家也形成了一個(gè)新的共識(shí):更大的參數(shù),更多的數(shù)據(jù),仍然能帶來持續(xù)的性能提升。

阿里的算法負(fù)責(zé)人林俊旸公開表態(tài):Scaling Law 仍然沒見頂,訓(xùn)練數(shù)據(jù)的增加,參數(shù)規(guī)模的擴(kuò)大,都還能看到模型性能的提升。

楊植麟的Kimi 團(tuán)隊(duì)更是克服萬難悶頭苦干,終于在兩個(gè)月前,拿出了萬億參數(shù)的旗艦?zāi)P蚄2。通義千問團(tuán)隊(duì)直接提出了“大就是好”的暴論,并且讓 Qwen3 堅(jiān)定不移地沿著“Just Scale it”的擴(kuò)展路徑前進(jìn)。

由此可見,大家都還在朝著“探索智能上限”出發(fā)。

02

百靈大模型加速涌現(xiàn)

據(jù)了解,過去一年里,平均7天就有一款高性能大模型誕生。可以說,國(guó)內(nèi)不缺大模型。

但在參數(shù)和效率之間,能做到完美平衡的大模型卻不多。

就拿萬億參數(shù)模型來說,模型變大了,往往會(huì)犧牲推理速度,推理速度上去了,準(zhǔn)確率又很難達(dá)到。業(yè)界知名的旗艦款大參數(shù)模型,都能在推理能力和思考效率上做到很不錯(cuò)的平衡。

這個(gè)平衡點(diǎn),被稱之為帕累托最優(yōu),我們經(jīng)常用多維基準(zhǔn)測(cè)試的分?jǐn)?shù)來量化對(duì)比。這次螞蟻發(fā)布的 Ling-1T 在公開的對(duì)比榜單中,表現(xiàn)讓人非常意外。

下圖是 Ling-1T 在部分權(quán)威基準(zhǔn)評(píng)測(cè)的表現(xiàn),紅色加粗代表 Ling-1T 的得分獲得 Top1,黑色加粗下劃線表示 Top2:


我們重點(diǎn)關(guān)注的編程與數(shù)學(xué)推理( Coding & Math )兩個(gè)維度上,Ling-1T 表現(xiàn)非常亮眼,甚至多個(gè)得分超過 DeepSeek。在知識(shí)理解方面,Ling-1T 也比Kimi、GPT-5 主干模型等的得分,高出幾分。

這意味著,Ling-1T 的深度思考能力和泛化能力,以及邏輯推理能力,都非常全面。因此,Ling-1T 會(huì)非常擅長(zhǎng)從事代碼生成、軟件開發(fā)、競(jìng)賽數(shù)學(xué)、專業(yè)數(shù)學(xué)、邏輯推理等場(chǎng)景。

但對(duì)于萬億參數(shù)模型來說,除了綜合性能,還需要考慮一個(gè)問題:推理正確率。這就需要引入競(jìng)賽數(shù)學(xué)榜單 AIME 25 競(jìng)賽數(shù)學(xué)榜單 AIME 25 的挑戰(zhàn),Ling-1T 的成績(jī)?nèi)缦拢?/p>


Ling-1T 在 AIME 25 測(cè)試中,與 DeepSeek-V3.1-Terminus、Kimi-K2-Instruct-0905 (開源)以及 GPT-5-main、Gemini-2.5-Pro (閉源)這些旗艦?zāi)P蛯?duì)比,展示出更短的思考路徑和更高的推理準(zhǔn)確率,能做到支持 128K 長(zhǎng)文本窗口處理能力,每個(gè) token 做到約 50B 參數(shù)的激活量。

這樣的成績(jī),源自螞蟻百靈團(tuán)隊(duì)長(zhǎng)時(shí)間的積累與創(chuàng)新。

依托于團(tuán)隊(duì)儲(chǔ)備的二十萬億 Token 高質(zhì)量文本語料訓(xùn)練,Ling-1T 吃進(jìn)了大量?jī)?yōu)質(zhì)知識(shí)。在預(yù)訓(xùn)練階段, Ling-1T 的訓(xùn)練團(tuán)隊(duì)讓由 Ling Scaling Laws 自我設(shè)置關(guān)鍵超參,簡(jiǎn)單地說,就是讓大模型自我優(yōu)化。

同時(shí)在強(qiáng)化訓(xùn)練階段,加入了百靈團(tuán)隊(duì)原創(chuàng)的 LPO 策略優(yōu)化算法,讓模型回答得更對(duì)。

此外,團(tuán)隊(duì)還額外提出了“語法-功能-美學(xué)”的混合獎(jiǎng)勵(lì)機(jī)制,提高模型審美。下面這張是 Ling-1T 工程師繪制的模型架構(gòu)圖:


不止是剛發(fā)布的 Ling-1T 和9月30日發(fā)布的 Ring-1T-preview ,螞蟻實(shí)際上已經(jīng)形成了完整的百靈大模型家族。

從尺寸上,包含從160億總參數(shù)到1萬億總參數(shù)的大語言模型產(chǎn)品矩陣;從模態(tài)上,包含了能看能聽能說能畫的,從理解到生成能統(tǒng)一的大模型;

從場(chǎng)景上,也形成了包括手機(jī)上可以運(yùn)行的 Ling-mini,還有能在中小企業(yè)服務(wù)器上部署的 Ling-flash,以及云端可調(diào)用的 Ling-1T。


這些模型,在過去一段時(shí)間,無論是社區(qū)榜單還是實(shí)際使用上,都得到了很多有效回應(yīng)。

螞蟻百靈團(tuán)隊(duì)開發(fā)的全模態(tài)模型 Ming-lite-omni v1.5 甚至在 Hugging Face 模型趨勢(shì)榜(any to any)排到過第一的位置。

Ring-1T-preview 發(fā)布完的第二天,就沖上了 Hugging Face 模型榜 Text Generation 總榜排名第三,排名第四的也是9月 Ling 團(tuán)隊(duì)發(fā)布的混合架構(gòu)思考模型 Ring-flash-linear-2.0 。


圖靈獎(jiǎng)得主 Yann LeCun(楊立昆)甚至點(diǎn)贊并評(píng)論“Impressive”(了不起),了解這位特立獨(dú)行大佬的網(wǎng)友表示:“ LeCun 愿意給 LLM(大模型)說句好話不容易”。


一位蘋果工程師量化完跑起來模型,評(píng)價(jià)螞蟻百靈模型的性能“Getting closer to GPT-5 at home”(在本地部署上的性能接近 GPT-5)。


這些技術(shù)從業(yè)者和開發(fā)者們的真實(shí)聲音,給予了百靈模型非常正向的反饋。

03

探索 AGI ,亟需參與者們的共建意識(shí)

百靈團(tuán)隊(duì),如此快速地躋身“萬億參數(shù)俱樂部”,背后跟螞蟻的戰(zhàn)略動(dòng)作分不開。作為一家成立了20年的互聯(lián)網(wǎng)公司”,螞蟻在 AI 領(lǐng)域的投入一直是非常巨大的。

去年螞蟻20周年時(shí)候,螞蟻集團(tuán)董事長(zhǎng)井賢棟宣布:未來20年,螞蟻要做一家科技驅(qū)動(dòng)、創(chuàng)新驅(qū)動(dòng)的公司。螞蟻集團(tuán)還提出了 AI First 戰(zhàn)略,并將其與“支付寶雙飛輪”和“加速全球化”一齊,并稱為螞蟻集團(tuán)的三大戰(zhàn)略。

而 Ling-1T 和 Ring-1T-preview 的出現(xiàn),則是螞蟻 AI First 戰(zhàn)略持續(xù)加速的表現(xiàn)。

不選擇閉源道路,而是選擇了開源,足以證明,螞蟻想干一件更長(zhǎng)遠(yuǎn)的事:

通過技術(shù)開放的方式,不斷迭代技術(shù),構(gòu)建一個(gè)真正開放的 AGI 生態(tài)。

根據(jù) AI 科技評(píng)論了解,目前“萬億參數(shù)俱樂部”里能做到完全開源的,只有螞蟻百靈的 Ling-1T 和 Ring-1T-preview ,以及 Kimi 的 K2。

在大模型參數(shù)軍備競(jìng)賽愈演愈烈的 2025 年,投入如此巨大之后,螞蟻選擇直接開源,看似讓人費(fèi)解。

但如果了解大模型開源背后的意圖,就會(huì)明白,當(dāng) Ling-1T 和 Ring-1T-preview 這樣萬億參數(shù)模型,公布了背后的訓(xùn)練數(shù)據(jù)、算法、模型,開發(fā)者可以直接利用這些“龐然大物”作為起點(diǎn),快速構(gòu)建復(fù)雜的應(yīng)用程序,無需關(guān)心底層模型的訓(xùn)練。一個(gè)“使用-反饋-迭代”的正向循環(huán),將極大推動(dòng)技術(shù)共建,加快智能涌現(xiàn)。

這條"技術(shù)平權(quán)化"的道路,我們并不陌生。今年年初,DeepSeek 的橫空出世,已經(jīng)為眾多中國(guó)大模型頭部玩家們指明了道路。

今年接任螞蟻集團(tuán) CEO 的韓歆毅,曾在內(nèi)部技術(shù)日上表達(dá)了螞蟻 AI 的主張:

“大家說(螞蟻)聚焦 AI 應(yīng)用,還要不要做基礎(chǔ)大模型,年初討論的時(shí)候我們答案非常堅(jiān)決,一定要,因?yàn)槿绻?AI 做服務(wù)和應(yīng)用,就像訓(xùn)練一個(gè)人去做所有的事,追求智能上限,會(huì)讓這個(gè)人更加聰明,能夠做更多、更好的服務(wù)。我們很堅(jiān)定去探索 AGI 、探索智能上限?!?/p>

螞蟻還專門成立了 InclusionAI 開源組織,建設(shè)了大模型全棧技術(shù),包含強(qiáng)化學(xué)習(xí)推理框架 AReaL、多智能體框架 AWorld 等,這些技術(shù)也已經(jīng)通過開源、開放合作的形式與行業(yè)共享共建,讓創(chuàng)作者可以交流共創(chuàng)。

能看得出來,相比于登臺(tái)唱戲,螞蟻更加愿意把戲臺(tái)搭好,AI 的基礎(chǔ)設(shè)施鋪設(shè)好,才能吸引更多的人來共建,真正邁向 AGI 。


未經(jīng)「AI科技評(píng)論」授權(quán),嚴(yán)禁以任何方式在網(wǎng)頁、論壇、社區(qū)進(jìn)行轉(zhuǎn)載!

公眾號(hào)轉(zhuǎn)載請(qǐng)先在「AI科技評(píng)論」后臺(tái)留言取得授權(quán),轉(zhuǎn)載時(shí)需標(biāo)注來源并插入本公眾號(hào)名片。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
耿精忠已經(jīng)降清,為何還被凌遲?康熙:誰讓他無限作死

耿精忠已經(jīng)降清,為何還被凌遲?康熙:誰讓他無限作死

掠影后有感
2025-12-19 08:07:07
呂某在工作群發(fā)布國(guó)家秘密信息并被3個(gè)群轉(zhuǎn)發(fā),近百同事無一提醒制止致全面擴(kuò)散,3個(gè)群管理員也被追責(zé)

呂某在工作群發(fā)布國(guó)家秘密信息并被3個(gè)群轉(zhuǎn)發(fā),近百同事無一提醒制止致全面擴(kuò)散,3個(gè)群管理員也被追責(zé)

環(huán)球網(wǎng)資訊
2025-12-18 08:02:08
曾凡博與北京簽多年合同正式回歸,末節(jié)陣容無解,奧莫特快走吧!

曾凡博與北京簽多年合同正式回歸,末節(jié)陣容無解,奧莫特快走吧!

細(xì)話籃球
2025-12-19 11:10:55
李湘也沒想到,一場(chǎng)晚宴成“審判臺(tái)”,為女鋪路太過王詩齡太顯老

李湘也沒想到,一場(chǎng)晚宴成“審判臺(tái)”,為女鋪路太過王詩齡太顯老

銀河史記
2025-12-18 00:42:25
澤連斯基還是跪下了,此刻他最后悔的,恐怕就是當(dāng)初沒聽中國(guó)的

澤連斯基還是跪下了,此刻他最后悔的,恐怕就是當(dāng)初沒聽中國(guó)的

云舟史策
2025-12-18 07:21:17
直播一晚84萬!退賽比奪冠還賺,荒野求生成網(wǎng)紅的“杠桿生意”?

直播一晚84萬!退賽比奪冠還賺,荒野求生成網(wǎng)紅的“杠桿生意”?

金融八卦女
2025-12-18 13:54:31
王東首談兒子,21歲只有十一二歲智力,坦言生活困難要靠親姐接濟(jì)

王東首談兒子,21歲只有十一二歲智力,坦言生活困難要靠親姐接濟(jì)

八怪娛
2025-12-19 09:33:25
潛伏美國(guó)37年,暗中保護(hù)錢學(xué)森回國(guó),他是建國(guó)后的第一特工!

潛伏美國(guó)37年,暗中保護(hù)錢學(xué)森回國(guó),他是建國(guó)后的第一特工!

史之銘
2025-12-17 17:44:32
40歲大哥早年花120萬投股票,時(shí)隔10年如今急用錢,他記起這件事

40歲大哥早年花120萬投股票,時(shí)隔10年如今急用錢,他記起這件事

卡西莫多的故事
2025-12-15 10:30:03
王詩齡得了李湘真?zhèn)?,出席活?dòng)打扮得又土又圓,比34歲何超蓮顯老

王詩齡得了李湘真?zhèn)?,出席活?dòng)打扮得又土又圓,比34歲何超蓮顯老

豐譚筆錄
2025-11-16 13:20:22
李澤楷被她迷,林丹為她不顧妻兒,她究竟有什么魅力?

李澤楷被她迷,林丹為她不顧妻兒,她究竟有什么魅力?

趣文說娛
2025-12-12 18:03:47
獨(dú)居者死后財(cái)產(chǎn)“收歸國(guó)有”:民政部門應(yīng)依法澄清誤會(huì)丨中聽

獨(dú)居者死后財(cái)產(chǎn)“收歸國(guó)有”:民政部門應(yīng)依法澄清誤會(huì)丨中聽

大象新聞
2025-12-17 12:41:03
雙向奔赴!威爾斯薪水曝光,拒絕高薪加盟遼寧男籃

雙向奔赴!威爾斯薪水曝光,拒絕高薪加盟遼寧男籃

籃球大陸
2025-12-19 09:07:22
南京博物院尷尬了!8800萬的古畫要拍賣,結(jié)果被捐贈(zèng)人找上門了!

南京博物院尷尬了!8800萬的古畫要拍賣,結(jié)果被捐贈(zèng)人找上門了!

青青子衿
2025-12-18 04:51:07
調(diào)查發(fā)現(xiàn):每天都喝酒的人,多數(shù)到了65歲以后,身體或變成這樣?

調(diào)查發(fā)現(xiàn):每天都喝酒的人,多數(shù)到了65歲以后,身體或變成這樣?

健康之光
2025-12-18 09:09:16
官方:伊布次子和米蘭簽下生涯首份職業(yè)合同

官方:伊布次子和米蘭簽下生涯首份職業(yè)合同

懂球帝
2025-12-19 07:00:20
12月21冬至,比牛羊肉還補(bǔ)的是這“3樣”,營(yíng)養(yǎng)全易消化,不上火

12月21冬至,比牛羊肉還補(bǔ)的是這“3樣”,營(yíng)養(yǎng)全易消化,不上火

阿龍美食記
2025-12-17 19:54:39
12月19日人民幣對(duì)美元中間價(jià)調(diào)升33個(gè)基點(diǎn)

12月19日人民幣對(duì)美元中間價(jià)調(diào)升33個(gè)基點(diǎn)

證券時(shí)報(bào)
2025-12-19 09:35:06
重慶6540萬元高邊坡治理工程曝招投標(biāo)黑幕:程序違規(guī)、文件泄密

重慶6540萬元高邊坡治理工程曝招投標(biāo)黑幕:程序違規(guī)、文件泄密

風(fēng)雷觀察
2025-12-18 17:56:24
0-2!羽球總決賽:國(guó)羽出局第1人!韓悅完敗世界冠軍,2連敗墊底

0-2!羽球總決賽:國(guó)羽出局第1人!韓悅完敗世界冠軍,2連敗墊底

劉姚堯的文字城堡
2025-12-19 10:44:18
2025-12-19 12:40:49
AI科技評(píng)論 incentive-icons
AI科技評(píng)論
點(diǎn)評(píng)學(xué)術(shù),服務(wù)AI
7012文章數(shù) 20715關(guān)注度
往期回顧 全部

科技要聞

2025新一代人工智能創(chuàng)業(yè)大賽總決賽收官

頭條要聞

媒體:美方官宣史上對(duì)臺(tái)單筆最大軍售 野心藏不住了

頭條要聞

媒體:美方官宣史上對(duì)臺(tái)單筆最大軍售 野心藏不住了

體育要聞

沒有塔圖姆,還有塔禿姆

娛樂要聞

曲協(xié)表態(tài)僅6天,郭德綱擔(dān)心的事還是發(fā)生

財(cái)經(jīng)要聞

非法集資911億!"金融大鱷"終審被判無期

汽車要聞

最便宜GLS 2026款奔馳GLS經(jīng)典版售96.8萬

態(tài)度原創(chuàng)

數(shù)碼
藝術(shù)
健康
本地
家居

數(shù)碼要聞

虛幻引擎5.7對(duì)比5.4測(cè)試:GPU最高提升25%、CPU最高提升35%

藝術(shù)要聞

諸樂三的寫意花鳥

這些新療法,讓化療不再那么痛苦

本地新聞

云游安徽|訪黃山云海古村,讀一城山水風(fēng)骨

家居要聞

高端私宅 理想隱居圣地

無障礙瀏覽 進(jìn)入關(guān)懷版