国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網易首頁 > 網易號 > 正文 申請入駐

DeepSeek論文發(fā)表16天后,國內團隊已經寫出了模型的「生物字典」

0
分享至


來源:AI思想會

【前言】AI 正以前所未有的速度發(fā)展,新的機遇不斷涌現,如果你希望:與技術專家、產品經理和創(chuàng)業(yè)者深度交流,一起探索 AI如何改變各行各業(yè)。歡迎在文末掃二維碼,加入「AI思想會」交流群,和一群志同道合的伙伴共同學習、思考、創(chuàng)造!

今年 1 月,DeepSeek 發(fā)布了一項名為 Engram(條件記憶)的技術,在大模型圈子里掀起不小波瀾。

它的核心思想很簡單:別讓模型死記硬背常識,直接給它一個「外掛記憶庫」。

具體做法是:把常見的 N-gram,比如「人工智能」、「光合作用」,預先存進一個哈希表,模型需要時查表即可,省下大量算力專注推理。

這個思路,能不能用在其他領域的模型訓推上?答案是:能,且效果驚人。

就在 Engram 論文(《Conditional Memory via Scalable Lookup:A New Axis of Sparsity for Large Language Models》)發(fā)布僅 16 天后,同樣 base 在杭州的一支研發(fā)團隊,推出Gengram(Genomic Engram)模塊,把「外掛字典」搬進了基因組世界。


  • 代碼鏈接: https://github.com/zhejianglab/Gengram

  • 模型鏈接: https://huggingface.co/ZhejiangLab/Gengram

  • 論文鏈接: https://github.com/zhejianglab/Gengram/tree/main/paper

傳統(tǒng)方法的困境:為每個堿基「重復造輪子」

當前,主流的基因組基礎模型(Genomic Foundation Models, GFMs),如 Deepmind 的 AlphaGenome 等,普遍采用一種叫「單堿基分詞」的策略,也就是把 DNA 序列拆成一個個單獨的字母(A/T/C/G)來處理。

這聽起來非常符合生物學邏輯,并且操作精度更高,然而代價也是巨大的。

首先是效率低下。要識別一個關鍵功能片段(比如啟動子或剪接位點),模型得靠多層注意力機制,從零開始「拼湊」出像「TATAAAA」這樣的經典堿基組合(Motif)。

其次是容易迷失。在動輒幾萬甚至幾十萬堿基的長序列中,模型常!钢灰姌淠,不見森林」,何況人類的基因組是一串長達 30 億字符的連續(xù)序列。

用更容易理解的方式來打個比方:人類學習「魑魅魍魎」時,一眼就能理解這是個成語。但傳統(tǒng)的基因組模型卻得先分析每個「鬼」字究竟是什么鬼…… 既要區(qū)分又要預測,最終結果就是既費力,又不準。

Gengram 是怎么工作的?

Gengram 的核心邏輯承襲自 Engram:將「靜態(tài)的 Motif 識別」與「動態(tài)的上下文推理」進行解耦處理。

Gengram 預先構建了一個可微分的哈希表,存儲所有長度為 1 到 6 的 DNA 片段(稱為 k-mer,如「ATG」、「CGTA」)對應的語義向量。這些 k-mer 很多就是已知的生物學功能單元(比如轉錄因子結合位點),相當于給 AI 配了一本《基因組學實用短語手冊》。

與其他領域相比,DNA 只有 4 個字母(A/T/C/G)及少量未知堿基(N)構成,整個字符集極小。Gengram 無需承擔復雜的 Tokenizer 壓縮負擔,查表速度極快,幾乎不增加計算開銷。

事實上,由于功能重要性不同,并非所有 Motif 都需要這本「字典」的加持。為此,Gengram 引入了動態(tài)門控機制

模型可以結合上下文語境自主決定何時「查字典」:在遇到外顯子、啟動子等關鍵 Motif 區(qū)域時激活檢索功能;在通過非編碼背景區(qū)域時關閉檢索,依賴推理,優(yōu)化資源。

經團隊測試,這個門控目前已經掌握了「什么時候該查詢參考資料,什么時候該獨立思考」的判斷能力。

小模塊,大提升

事實上,Gengram 只是一個僅約 2000 萬參數的輕量化插件,對于百億級規(guī)模的模型來說微不足道,但它帶來的性能提升卻令人振奮。

在 8k 和 32k 兩個上下文版本中,同等訓練設定下,應用了 Gengram 的模型幾乎在所有任務里領先未應用的版本。

其中,剪接位點預測 AUC 提升了16.1%(從 0.776 到 0.901),表觀遺傳預測任務(H3K36me3) AUC 提升了22.6%(從 0.656 到 0.804)。

這種跨越式的性能飛躍,賦予了模型驚人的數據杠桿效應。

在與多款主流 DNA 基礎模型的橫向測評中,集成 Gengram 的模型僅需極小規(guī)模的訓練數據,和較小的激活參數量,便能在核心任務上媲美乃至超越訓練數據規(guī)模領先其數十倍的公開模型,大幅提升了模型訓練的數據能效比。

同時,Gengram 展現出了卓越的通用適配能力,能夠跨越 Dense(稠密) 與 MoE(混合專家) 等不同模型架構實現無縫部署。

無論采用何種注意力機制變體,Gengram 均能在有效降低訓練損失的同時,顯著加速模型收斂。特別是針對 MoE 架構中專家負載失衡這一頑疾,Gengram 通過吸收局部高頻噪聲,顯著改善了專家負載均衡,實現了模型性能與架構效率的協(xié)同跨越。



跨稀疏度負載均衡:在 Top-2 / 128、64 和 32 專家配置下,使用與不使用 Gengram 模塊的負載均衡損失曲線對比,表明其在多種稀疏度設置下均能實現穩(wěn)定性能。

此外,模型開始「涌現」出對 DNA 物理本質的理解。

當團隊為 Gengram 局部聚合窗口(Local Window Aggregation)測試窗口大小策略時,結果顯示:窗口大小參數設置為 21bp 時,其性能達到峰值。

為什么偏偏是 21?

因為 DNA 雙螺旋結構每 10.5 個堿基旋轉一圈,而 21 個堿基正好對應兩個完整的螺旋周期。這意味著,每相隔 21bp 的堿基在物理空間上其實位于螺旋的同一側,具備相似的生化環(huán)境和特征。

換句話說,Gengram 在沒有學習過任何結構生物學知識的前提下,通過計算自己悟到了 DNA 序列信息和空間相位規(guī)律。



DNA 雙螺旋結構示意圖展示了 B 型 DNA 的結構參數,DNA 雙螺旋每 10.5 個堿基對旋轉一圈。



不同 Gengram 窗口大小下的驗證損失,由此選擇了 21 寬度的窗口

范式啟示:Gengram 為 AI 科學模型提供新探索路徑

Gengram 的成功,遠不止于解決基因組建模的特定難題。它更像一個精巧的概念驗證,為如何構建新一代懂科學的 AI 探索了一種新的模式。

從「暴力記憶」到「結構化知識外掛」:效率范式的轉變。傳統(tǒng) AI 模型增強能力主要靠擴張參數與數據,本質是讓網絡更費力地「記住」 一切。Gengram 則將領域內確鑿的、結構化的先驗知識(如功能 Motif)做成一個輕量、可查詢的外部知識庫。這讓核心模型能從繁瑣的模式記憶中解脫,專注于更高級的上下文推理與組合創(chuàng)新。這預示著,未來科學基礎模型的架構,可能是「通用模型核心+多個領域專用插件」的協(xié)同形態(tài)。

「歸納偏置」注入:生物物理規(guī)律的「硬編碼」。通過將 B 型 DNA 雙螺旋每 10.5 個堿基完成一個旋轉周期(即約 21 bp 的雙圈周期)這一結構特性,顯式轉化為模型內部的局部窗口機制,Gengram 成功地將這種物理空間相位的周期性作為先驗知識注入模型,使其能夠捕捉特定相位的立體化學模式和蛋白質綁定偏好。

可解釋性的內生設計:讓 AI 的「思維過程」透明化。模型不再僅僅進行隱式的統(tǒng)計擬合,而是通過顯式的 Hash 查詢和門控記憶通路,在淺層即展現出對 TATA-box、poly (T) 等關鍵功能基元的高度敏感性,其內部殘差強度的峰值與基因組功能邊界精準對齊,實現了從「黑盒計算」向「具備生物學認知足跡」的演進。

解決長程依賴的新路徑:從局部最優(yōu)到全局洞察。實驗證明,Gengram 使得僅在 8K 長度上訓練的模型,卻獲得了處理 32K 長序列的優(yōu)異能力。這為基因調控元件預測、表觀遺傳學分析、跨物種進化分析以及復雜的多組學建模等復雜長序列問題,開辟了精細化局部感知驅動全局理解的新途徑。

Gengram 建立了一種將領域特有規(guī)律轉化為顯式架構約束的創(chuàng)新范式,證明了通過精細化的局部結構化感知可以有效彌補標稱上下文長度的局限,實現低成本且高效的長程依賴建模。

低調的 Genos Team 是啥背景?

盡管論文署名低調地使用了「Genos Team」,但從開源代碼庫的 Zhejianglab 和 BGI-HangzhouAI 能夠推斷出這支團隊的硬核背景:一家是坐落在杭州的專注于智能計算的新型研發(fā)機構之江實驗室,另一家是杭州華大生命科學研究院。

兩個團隊的融合,構建起「AI + 生命科學」的交叉創(chuàng)新壁壘,這是純 CS 團隊或純基因團隊無法比擬的優(yōu)勢。

論文里的實驗,大多基于人類基因組基礎模型 Genos 實現,從可公開獲取的信息來看,Genos 多數指標都超越了目前的業(yè)界頂流 Evo-2。

閱讀最新前沿科技趨勢報告,請訪問歐米伽研究所的“未來知識庫”

https://wx.zsxq.com/group/454854145828


未來知識庫是“ 歐米伽 未來研究所”建立的在線知識庫平臺,收藏的資料范圍包括人工智能、腦科學、互聯網、超級智能,數智大腦、能源、軍事、經濟、人類風險等等領域的前沿進展與未來趨勢。目前擁有超過8000篇重要資料。每周更新不少于100篇世界范圍最新研究資料。 歡迎掃描二維碼或訪問https://wx.zsxq.com/group/454854145828進入。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
女子花30000購入阿里巴巴股份,被婆家趕出家門,4年后看到收益懵了

女子花30000購入阿里巴巴股份,被婆家趕出家門,4年后看到收益懵了

第四思維
2025-07-31 18:48:48
中國人月薪過萬很普遍了嗎?網友:據說沿海基本上都過萬哦

中國人月薪過萬很普遍了嗎?網友:據說沿;旧隙歼^萬哦

帶你感受人間冷暖
2026-03-01 04:35:13
美“福特”號航母駛離希臘克里特島

美“福特”號航母駛離希臘克里特島

財聯社
2026-02-26 16:57:07
在小縣城名聲很臭是啥體驗?網友:臉皮夠厚,一切不成問題

在小縣城名聲很臭是啥體驗?網友:臉皮夠厚,一切不成問題

解讀熱點事件
2026-02-04 00:05:07
斯諾克紅包賽形勢:中國保2爭3,趙心童吳宜澤穩(wěn)進,肖國棟有機會

斯諾克紅包賽形勢:中國保2爭3,趙心童吳宜澤穩(wěn)進,肖國棟有機會

劉姚堯的文字城堡
2026-03-02 07:40:55
特朗普指責英首相在對伊行動中猶猶豫豫 未爽快支持美國動用英軍基地

特朗普指責英首相在對伊行動中猶猶豫豫 未爽快支持美國動用英軍基地

新浪財經
2026-03-03 01:35:19
巴拿馬變天,大清算開始了!真正的大國力量,有人根本一無所知!

巴拿馬變天,大清算開始了!真正的大國力量,有人根本一無所知!

阿訊說天下
2026-03-01 14:33:45
27座基地被炸,美民眾要求特朗普下臺,苑舉正:中國贏得20年時間

27座基地被炸,美民眾要求特朗普下臺,苑舉正:中國贏得20年時間

古史青云啊
2026-03-02 16:56:40
炸了!沙特正式參戰(zhàn),伊朗一夜逼反所有鄰國,中東戰(zhàn)局徹底失控

炸了!沙特正式參戰(zhàn),伊朗一夜逼反所有鄰國,中東戰(zhàn)局徹底失控

戧詞奪理
2026-03-01 09:21:40
美國對中國滲透沒白費,扶持的“內鬼”,終于開始在中國露頭了

美國對中國滲透沒白費,扶持的“內鬼”,終于開始在中國露頭了

歷史求知所
2025-12-01 11:30:06
活得通透:能自理就好好活著,不能自理,便坦然落幕

活得通透:能自理就好好活著,不能自理,便坦然落幕

青蘋果sht
2026-02-23 05:26:25
比亞迪官宣2026年3月5日召開"顛覆性技術發(fā)布會",刀片電池、兆瓦閃充、智駕系統(tǒng)或迎全面升級

比亞迪官宣2026年3月5日召開"顛覆性技術發(fā)布會",刀片電池、兆瓦閃充、智駕系統(tǒng)或迎全面升級

金融界
2026-03-02 16:59:36
報復來了!黑色血旗升起,導彈命中以軍總部,伊朗:根除美以政權

報復來了!黑色血旗升起,導彈命中以軍總部,伊朗:根除美以政權

凡知
2026-03-03 00:56:09
1勝9負,奪冠熱門慢慢倒下!作為聯盟第一人,或許你被高估了

1勝9負,奪冠熱門慢慢倒下!作為聯盟第一人,或許你被高估了

老梁體育漫談
2026-03-02 23:30:56
中國藝人被困中東!黃渤驚險逃離,玄子一家7000租車,周雨彤回京

中國藝人被困中東!黃渤驚險逃離,玄子一家7000租車,周雨彤回京

潮鹿逐夢
2026-03-02 22:48:22
女孩當小姐,一晚要提供4到5次上門服務,2015年被親人點到不赴約

女孩當小姐,一晚要提供4到5次上門服務,2015年被親人點到不赴約

漢史趣聞
2025-11-08 09:27:32
日本世乒賽大名單落位!女團大調整,2大世界冠軍落選,張本領銜

日本世乒賽大名單落位!女團大調整,2大世界冠軍落選,張本領銜

卿子書
2026-03-02 09:44:06
孫穎莎和王曼昱積分上升,張本美和排名下滑,國乒包攬前七名

孫穎莎和王曼昱積分上升,張本美和排名下滑,國乒包攬前七名

子水體娛
2026-03-02 00:08:03
全球首架!外交部向全球分享,中國飛碟研發(fā)成功,正在試飛?

全球首架!外交部向全球分享,中國飛碟研發(fā)成功,正在試飛?

小小科普員
2026-03-02 23:37:13
特朗普稱同意與伊朗新領導層對話

特朗普稱同意與伊朗新領導層對話

每日經濟新聞
2026-03-02 08:17:27
2026-03-03 02:35:00
人工智能學家 incentive-icons
人工智能學家
人工智能領域權威媒體
4555文章數 37413關注度
往期回顧 全部

科技要聞

蘋果中國官網上線iPhone 17e,4499元起

頭條要聞

中國留學生:很多人得知哈梅內伊身亡后 決定盡快撤離

頭條要聞

中國留學生:很多人得知哈梅內伊身亡后 決定盡快撤離

體育要聞

“想要我簽名嗎” 梅西逆轉后嘲諷對手主帥

娛樂要聞

李亞鵬與哥哥和解 只有一條真心話短信

財經要聞

油價飆升 美伊沖突將如何攪動全球經濟

汽車要聞

國民SUV再添一員 瑞虎7L靜態(tài)體驗

態(tài)度原創(chuàng)

旅游
本地
親子
藝術
軍事航空

旅游要聞

熱度飆升!非遺、冰雪…禹州元宵“文旅大餐”承包圓滿佳節(jié)!

本地新聞

津南好·四時總相宜

親子要聞

45歲這年,我這個二胎媽媽決定做一件“瘋狂”的事

藝術要聞

這四位老人的花鳥畫,竟讓人欲罷不能!

軍事要聞

美國中央司令部透露對伊朗動武全部武器裝備清單

無障礙瀏覽 進入關懷版