国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請入駐

獨(dú)家|梁文鋒將攜DeepSeek V4撞上姚順雨

0
分享至


我們獨(dú)家獲悉,外界千呼萬喚的DeepSeek-V4將于4月正式上線。作為梁文鋒打磨已久的多模態(tài)大模型,DeepSeek-V4除了在Coding能力上躍升之外,還將在LTM(long term memory長期記憶)上取得突破。

一位接近DeepSeek的人士告訴我們,梁文鋒近半年的主要工作是補(bǔ)齊DeepSeek此前在視覺內(nèi)容處理,以及AI搜索等方面的短板。為了強(qiáng)化DeepSeek的AI搜索能力,DeepSeek早在去年就與百度合作。

自去年1月,DeepSeek發(fā)布風(fēng)靡全球的推理模型DeepSeek-R1以來,一直未有大版本的模型迭代。市場上有關(guān)DeepSeek大迭代版本模型即將到來的消息,每隔一段時(shí)間總會(huì)掀起一陣"It's coming"的討論。

人們在全網(wǎng)專業(yè)平臺(tái)上試圖捕捉DeepSeek新版本的跡象。

3月11日,全球最大的AI模型API聚合平臺(tái)OpenRouter上線兩個(gè)隱身模型,分別是Healer Alpha和Hunter Alpha。Healer Alpha是一款前沿的全模態(tài)模型,能夠原生感知視覺和聽覺輸入,進(jìn)行跨模態(tài)推理,并精確可靠地執(zhí)行復(fù)雜的多步驟任務(wù),但上下文只有26萬。

Hunter Alpha專為智能體應(yīng)用構(gòu)建,是一個(gè)擁有上萬億參數(shù)和100萬token上下文的智能模型。該模型介紹里還顯示,它擅長長期規(guī)劃、復(fù)雜推理和持續(xù)的多步驟任務(wù)執(zhí)行,并具備OpenClaw等框架所需的可靠性和指令執(zhí)行精度。

針對(duì)這兩個(gè)模型,X上又出現(xiàn)一波DeepSeek-V4要來了的聲音。不過從此前公開報(bào)道的DeepSeek-V4來看,DeepSeek-V4具有萬億參數(shù),100萬長上下文,同時(shí)具備原生多模態(tài)能力,支持文本、圖像、視頻的聯(lián)合理解與生成。

OpenRouter上的這兩個(gè)隱身模型的特征與之并不完全吻合。

根據(jù)我們的獨(dú)家信源,梁文鋒待推出的DeepSeek-V4迭代的方向,正是大模型領(lǐng)域今年“皇冠上的明珠”—LTM。

最近半年(2025年9月11日-2026年3月11日),梁文鋒署名的論文主要有三篇。其中《DeepSeek-R1 推理模型研究》發(fā)表于國際頂級(jí)期刊《Nature》,另有兩篇為預(yù)印本論文《mHC(流形約束超連接)框架》,《條件記憶:大語言模型稀疏性的新維度》。

梁文鋒及其團(tuán)隊(duì)在近半年的研究成果,也呈現(xiàn)出清晰的技術(shù)演進(jìn)路線。

通過DeepSeek-R1確立了推理能力的強(qiáng)化學(xué)習(xí)范式后,DeepSeek正進(jìn)一步探索底層架構(gòu)創(chuàng)新。特別是通過“條件記憶”(Engram)等新模塊,試圖在提升模型性能的同時(shí),解決傳統(tǒng)Transformer架構(gòu)在記憶和算力方面的瓶頸,也是為DeepSeek-V4做技術(shù)儲(chǔ)備。

同時(shí),V4還將深度適配國產(chǎn)芯片,有望成為第一個(gè)完全跑在“國產(chǎn)算力生態(tài)”上的大模型。

4月,中國大模型競技場上依然會(huì)很熱鬧。除了備受矚目的DeepSeek,我們從騰訊內(nèi)部了解到,作為騰訊首席AI科學(xué)家姚順雨也將發(fā)布混元新模型(30B參數(shù)級(jí)別)。

姚順雨在去年12月官宣正式加入騰訊后,一直忙于模型和產(chǎn)品的開發(fā)。據(jù)悉,早在去年年初姚順雨就接受邀請回國,不同于外界所傳姚順雨僅有半年的時(shí)間推出新模型,實(shí)際上,姚順雨對(duì)新模型的準(zhǔn)備早已開始。

而姚順雨的30B參數(shù)模型,在動(dòng)輒千億、萬億參數(shù)的今天,顯得有些“小巧”。不過,這恰恰符合姚順雨的理念——方法的復(fù)雜程度,應(yīng)該和任務(wù)本身的難度相匹配,真正的突破來自于用最優(yōu)雅的方法解決最復(fù)雜的問題。

在騰訊內(nèi)部,姚順雨也要求團(tuán)隊(duì)成員不要以打榜為導(dǎo)向。

梁文鋒和姚順雨,一位是“全村人都在等著上桌吃飯”的明星創(chuàng)業(yè)者,一位是“從硅谷空降回來改造大廠”的95后明星科學(xué)家。他們作為備受矚目的國產(chǎn)大模型核心人物,會(huì)怎么影響模型格局,目前尚未可知。

不過,從外部看,兩人面臨的壓力大不相同。

對(duì)梁文鋒而言,DeepSeek APP的MAU已經(jīng)超過1億,但在R1火爆全球之后,大家的期待也被抬到了前所未有的高度。V4的壓力正是來源于必須再次成為全世界最出色的開源大模型。

更何況春節(jié)前后,豆包、千問、智譜、MiniMax等競爭對(duì)手陸續(xù)發(fā)布新版本,這被視為對(duì)DeepSeek的“預(yù)防性競爭行為”。從春節(jié)一直遲到至今的V4,讓市場的焦躁與日俱增。

而對(duì)姚順雨而言,壓力則來自于騰訊大模型需要證明自己。

過去兩年,騰訊在大模型上的節(jié)奏相對(duì)謹(jǐn)慎,混元大模型在元寶APP和微信內(nèi),長期被作為DeepSeek之外的第二選項(xiàng)存在。姚順雨也被寄予厚望,他需要幫騰訊AI大模型找到長期表現(xiàn)欠佳的病根,并用實(shí)際的產(chǎn)品證明,騰訊擁有后發(fā)制人的能力。

壓力的另一面也是動(dòng)力,我們不妨期待4月,國產(chǎn)模型真的能把全球大模型進(jìn)展再推上一個(gè)臺(tái)階。

撰寫|馬舒葉

編輯|劉培

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
事發(fā)深夜!深圳一年輕女子醉酒昏迷,癱倒街頭!4名醫(yī)生路過……

事發(fā)深夜!深圳一年輕女子醉酒昏迷,癱倒街頭!4名醫(yī)生路過……

深圳晚報(bào)
2026-03-13 10:35:13
伊朗體育部長:伊朗隊(duì)不具備參加世界杯條件 應(yīng)取消美國主辦資格

伊朗體育部長:伊朗隊(duì)不具備參加世界杯條件 應(yīng)取消美國主辦資格

新英體育
2026-03-12 10:20:17
難怪大S去世后立馬火化,小S老公被曝猛料,這次馬筱梅也受牽連

難怪大S去世后立馬火化,小S老公被曝猛料,這次馬筱梅也受牽連

離離言幾許
2026-03-12 17:03:04
什么運(yùn)動(dòng)對(duì)心臟最健康?研究發(fā)現(xiàn),排名第一的是它

什么運(yùn)動(dòng)對(duì)心臟最健康?研究發(fā)現(xiàn),排名第一的是它

健康觸點(diǎn)
2026-03-02 06:07:03
楊瀚森在發(fā)展聯(lián)盟被針對(duì)!仍轟16+13,近四戰(zhàn)場均20.7+9.7太猛了

楊瀚森在發(fā)展聯(lián)盟被針對(duì)!仍轟16+13,近四戰(zhàn)場均20.7+9.7太猛了

你的籃球頻道
2026-03-13 12:35:13
美暫時(shí)放寬對(duì)俄石油制裁,俄在美以對(duì)伊開戰(zhàn)兩周內(nèi)已獲60億歐元額外能源收入

美暫時(shí)放寬對(duì)俄石油制裁,俄在美以對(duì)伊開戰(zhàn)兩周內(nèi)已獲60億歐元額外能源收入

紅星新聞
2026-03-13 13:37:17
錢再多有什么用!郭富城稱無法接受年過六旬,每天喝幾十杯咖啡

錢再多有什么用!郭富城稱無法接受年過六旬,每天喝幾十杯咖啡

神秘莫測的世界
2026-03-11 07:50:46
剛剛,開盤暴跌!重挫1100點(diǎn)!

剛剛,開盤暴跌!重挫1100點(diǎn)!

中國基金報(bào)
2026-03-13 08:55:17
升遷最慢的紅軍師長,20年間一級(jí)未升,55年授銜時(shí)還難倒了羅榮桓

升遷最慢的紅軍師長,20年間一級(jí)未升,55年授銜時(shí)還難倒了羅榮桓

史之銘
2026-03-12 16:43:37
全球首款手機(jī)“龍蝦”上線秒光

全球首款手機(jī)“龍蝦”上線秒光

21世紀(jì)經(jīng)濟(jì)報(bào)道
2026-03-12 20:32:03
網(wǎng)友北京郎園偶遇董潔 狀態(tài)越來越好 骨相超牛 漂亮的人老了也漂亮

網(wǎng)友北京郎園偶遇董潔 狀態(tài)越來越好 骨相超牛 漂亮的人老了也漂亮

陳意小可愛
2026-03-12 19:25:59
以色橫行中東的真相

以色橫行中東的真相

高維彬
2026-03-13 13:05:54
勝公牛!雷迪克發(fā)布會(huì)不滿防守,東契奇把控情緒,老詹強(qiáng)調(diào)犧牲!

勝公牛!雷迪克發(fā)布會(huì)不滿防守,東契奇把控情緒,老詹強(qiáng)調(diào)犧牲!

籃球資訊達(dá)人
2026-03-13 14:20:21
楊振寧恐怕都沒想到,多次被傳赴英國的49歲翁帆,能讓他刮目相看

楊振寧恐怕都沒想到,多次被傳赴英國的49歲翁帆,能讓他刮目相看

青橘罐頭
2026-03-12 10:29:42
精疲力竭!比利時(shí)女籃中鋒:張子宇是我見過最強(qiáng)壯的女籃球員

精疲力竭!比利時(shí)女籃中鋒:張子宇是我見過最強(qiáng)壯的女籃球員

懂球帝
2026-03-12 22:55:40
41+7+4,身為科比門徒,放開掄??!怎么能沒點(diǎn)追求呢!

41+7+4,身為科比門徒,放開掄啊!怎么能沒點(diǎn)追求呢!

體育新角度
2026-03-13 14:23:40
看哭一代人!80后本科宿舍8人:3人離世,2人失業(yè),3人工資僅4000

看哭一代人!80后本科宿舍8人:3人離世,2人失業(yè),3人工資僅4000

川渝視覺
2026-03-09 18:10:33
南海撞機(jī)王偉成功跳傘,咋10萬人都找不到他?直到20多年后才明白

南海撞機(jī)王偉成功跳傘,咋10萬人都找不到他?直到20多年后才明白

鶴羽說個(gè)事
2025-12-12 14:31:49
成吉思汗如何解決20萬大軍欲望:亞歐征服之謎

成吉思汗如何解決20萬大軍欲望:亞歐征服之謎

徐網(wǎng)老表哥
2026-03-11 17:29:52
伊朗有言在先,日本8萬噸貨輪爆炸,發(fā)往中國的原油一天都沒中斷

伊朗有言在先,日本8萬噸貨輪爆炸,發(fā)往中國的原油一天都沒中斷

原來仙女不講理
2026-03-12 12:21:21
2026-03-13 14:48:49
白鯨實(shí)驗(yàn)室one incentive-icons
白鯨實(shí)驗(yàn)室one
記錄 AI改變世界的瞬間
102文章數(shù) 14關(guān)注度
往期回顧 全部

科技要聞

《后廠村AI派》:帶你玩轉(zhuǎn)OpenClaw龍蝦

頭條要聞

媒體:穆杰塔巴以中級(jí)教士身份擔(dān)任最高領(lǐng)袖 釋放信號(hào)

頭條要聞

媒體:穆杰塔巴以中級(jí)教士身份擔(dān)任最高領(lǐng)袖 釋放信號(hào)

體育要聞

叕戰(zhàn)奧運(yùn),張雨霏要做回“小將”

娛樂要聞

小S復(fù)工錄制 感謝賈永婕陪大S走到最后

財(cái)經(jīng)要聞

"短劇"苦抄襲

汽車要聞

本田汽車全年業(yè)績由盈轉(zhuǎn)虧 高管們降薪3個(gè)月以擔(dān)責(zé)

態(tài)度原創(chuàng)

游戲
房產(chǎn)
教育
旅游
藝術(shù)

《古墓麗影》三部曲NS2版上線!免費(fèi)升級(jí)還有更新

房產(chǎn)要聞

唏噓!三亞又一房企巨頭破產(chǎn),狂欠43億甩賣資產(chǎn)!

教育要聞

73分學(xué)姐帶你沖刺2026大學(xué)日語四級(jí)真題!合格證書到手!

旅游要聞

借勢春晚出圈!北大荒暖心冰屋引爆冰雪經(jīng)濟(jì)

藝術(shù)要聞

吳冠中:歷代畫竹大都缺乏厚度與深度

無障礙瀏覽 進(jìn)入關(guān)懷版