国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

杭州又多了一個大模型,堪稱科學家的超級“外掛”

0
分享至


南方人為什么比北方人更容易得地中海貧血,因為幾十年前肆虐的瘧疾導致了南方人某個基因的突變。如何既快又準找到它,是擺在生物學家面前的難題。

為了解決諸如此類的問題,一群最懂基因測序、擁有海量數(shù)據(jù)的人,和一群最懂AI的科學家們在一起,花6個月時間做出了全球首個百億級人類基因組基礎(chǔ)模型Genos。

之江實驗室總工程師趙志峰把他們稱為“硬盤俠”和“鍵盤俠”:前者負責篩選并且把裝有專業(yè)數(shù)據(jù)的硬盤背到實驗室,交給后者,那些敲代碼敲到腰椎間盤突出的年輕科學家。

昨天,他們坐在一起,發(fā)布了一個叫021的科學基礎(chǔ)模型,希望在地球科學、天文學、生命科學、材料科學等多個領(lǐng)域加速科學發(fā)現(xiàn)、變革科研范式,成為科學家們手里的最強“外掛”。

所謂的021,實際上是英文zero to one(從0到1)的簡寫。光從名字看,就包含了變革的意義。按照中國工程院院士、之江實驗室主任王堅的說法,“如果基礎(chǔ)模型是人工智能的皇冠,那么科學基礎(chǔ)模型就是人工智能皇冠上的明珠?!?/strong>


中國工程院院士、之江實驗室主任王堅


全球首個

百億級人類基因組基礎(chǔ)模型

7個月前,在杭州華大的一間小會議室里,包括華大生命科學研究院領(lǐng)域首席科學家 劉石平 和之江實驗室總工程師趙志峰在內(nèi)的幾個人,坐下來喝了一杯咖啡。在這一杯咖啡的時間里,他們就討論了一個問題:生命科學是非常大的一門科學,從哪里開始?最后指向一個答案:“讀懂”基因。

200多年前,奧匈帝國人孟德爾在奧古斯丁修道院的小花園里,通過豌豆實驗首次提出遺傳因子概念,2000年左右,人類完成了基因組全部30億個堿基對的測序。即便如此,目前人類超過90%的基因組功能尚未明確,70%以上的致病點位仍未被定位。

在喝完咖啡的一周后,一個以基因模型訓練為目標的“種子班”在之江實驗室正式啟動, 劉石平 是種子班的班主任。


劉石平

從5月份開始,華大研究院從杭州、北京、深圳、武漢等地陸續(xù)抽調(diào)精英團隊進駐之江實驗室,每天和那里的科學家們同吃同住。他們想解決同一個問題:如何將這30億堿基對放進模型里。

“牽一發(fā)而動全身?!?劉石平 說,基因組的語言極其復雜,一個微小的單堿基突變,原因可能藏在百萬堿基對之外。

比如,科學家花了很久才發(fā)現(xiàn),南方人患地中海貧血概率比北方人高的原因:幾十年南方瘧疾橫行,南方人為了抵抗瘧疾、適應環(huán)境,基因的某些點位發(fā)生了一些突變。雖然這些基因突變提高了南方人抵抗瘧疾的能力,但反過來也帶來了一些副作用,比如導致血紅蛋白運輸氧氣的能力減弱,從而導致地中海貧血或其他血紅蛋白病。

“鍵盤俠”和“硬盤俠”一起奮戰(zhàn)6個月后,全球首個百億級人類基因組基礎(chǔ)模型Genos誕生了。這個針對人類基因組深度優(yōu)化的基因組基礎(chǔ)模型,可支持高達百萬堿基對的超長上下文分析,并實現(xiàn)單堿基分辨率的精準識別。

最近,之江實驗室生命科學計算研究中心研究專家郭玲分享了一個模型的實用案例,曾經(jīng)在做基因序列的時候,發(fā)現(xiàn)在6號染色體上有一個高頻突變,但遺傳病理查不到相關(guān)信息,最后,她把數(shù)據(jù)放到了Genos里,模型給出了三個癥狀預測,得到了醫(yī)生的高度認可。


AI照亮基礎(chǔ)科學研究進階之路

去年,諾貝爾化學獎和物理學獎的獲得者里都出現(xiàn)了人工智能專家的身影。其中,化學獎一半授予大衛(wèi)·貝克,以表彰他在計算蛋白質(zhì)設(shè)計方面的貢獻;另一半授予德米斯·哈薩比斯和約翰·M·詹珀,以表彰他們在蛋白質(zhì)結(jié)構(gòu)預測方面的成就。


德米斯和約翰所在的公司,正是大名鼎鼎的DeepMind,前者更是聯(lián)合創(chuàng)始人兼CEO。在他主導下,AlphaGo橫空出世,將最頂尖的人類棋手斬于馬下。隨后,他們將AlphaGo的相關(guān)技術(shù)運用到生物醫(yī)學研究,推出了可以預測蛋白質(zhì)結(jié)構(gòu)的AI模型AlphaFold。

蛋白質(zhì)是構(gòu)成生命活動的基礎(chǔ)物質(zhì),參與生命體幾乎所有生理功能的調(diào)節(jié)與維持。蛋白質(zhì)的功能和它的三維結(jié)構(gòu)息息相關(guān),和基因一樣,人類對蛋白質(zhì)的結(jié)構(gòu)了解越多就越能解開生命的密碼。


AlphaFold生成的蛋白質(zhì)結(jié)構(gòu)

不過,在AlphaFold出現(xiàn)之前,人類想要還原一個蛋白質(zhì)結(jié)構(gòu)需要花費大量時間和資源。截至2018年,人類才積累了22萬蛋白結(jié)構(gòu)。而AlphaFold用三年時間就生成了六七億個。

從AlphaFold2開始計算,過去五年,AI已經(jīng)成為從事蛋白質(zhì)研究的生物學家不可或缺的工具,甚至被稱為“結(jié)構(gòu)生物學的第二次降臨”。

諾貝爾化學獎的另一位得主,大衛(wèi)·貝克就是其中一員。他是華盛頓大學蛋白質(zhì)設(shè)計研究所所長,和團隊首次使用生成式人工智能從頭設(shè)計出了全新的抗體,有望讓AI從頭設(shè)計蛋白進入抗體藥物市場。

諾貝爾獎的結(jié)果也說明,全世界最聰明的一群人認可了用AI對其他領(lǐng)域基礎(chǔ)科學研究范式的改變,即當下人工智能的發(fā)展已經(jīng)使得AI for Science(AI4S)變得可行。科學家們借助機器學習、數(shù)據(jù)分析、高性能計算等技術(shù),能在各個領(lǐng)域進行更深入的探索和發(fā)現(xiàn)。

隨之而來的問題是,如何讓AI4S在多個科學領(lǐng)域高效地展開?畢竟,AlphaFold3將蛋白質(zhì)序列、DNA/RNA堿基序列以及小分子結(jié)構(gòu)等,破天荒用Token統(tǒng)一編碼放到一個模型里,前后花了6年時間。而它對于科學家的賦能仍局限于生物化學分子這一細分領(lǐng)域,遠未能覆蓋生命科學這一學科。

之江實驗室要做的是,把生命科學在內(nèi)的數(shù)學、物理、化學、天文學、地球科學和材料學等多個不同學科、不同類型的科學數(shù)據(jù)訓練到一個基礎(chǔ)模型里,工作量和困難比當年訓練AlphaFold3指數(shù)級增加。



打造科學家們的超級“外掛”

“語言所表達的維度,遠遠低于科學所需表達的維度?!?/strong>之江實驗室科學模型總體部技術(shù)總師薛貴榮說,科學數(shù)據(jù)涵蓋時間、空間、能量等多個維度,是對復雜物理系統(tǒng)演變規(guī)律的高維表征。

比如,地球科學中超過75%的信息存儲于聲波、磁場等非文本數(shù)據(jù)中;天文學依賴圖像、光譜來解析宇宙結(jié)構(gòu)與演化;生命科學的奧秘深藏于如人類基因組30億堿基對等DNA序列中……

這也意味著,解決科學問題,眼前最緊迫的是,突破語言空間的局限,構(gòu)建一個集“科學空間+語言空間”于一體的更高維空間,建立跨學科數(shù)據(jù)之間的深層連接,變革科學研究范式。


在技術(shù)上,之江實驗室的研發(fā)團隊探索構(gòu)建了全新的OneTokenizer(科學數(shù)據(jù)統(tǒng)一表征) + MoE(混合專家架構(gòu))融合模型架構(gòu)。

為了讓模型能夠識別、處理科學數(shù)據(jù),認識并解決復雜科學問題。他們經(jīng)過了近萬次實驗形成了模型訓練框架,并完成了2360億參數(shù)規(guī)模021科學基礎(chǔ)模型的訓練。最后,一個跨學科知識、跨領(lǐng)域推理、跨語言理解(覆蓋204種語言),具備出色的科學推理能力,能夠深入分析、推導、驗證多類科學問題的科學基礎(chǔ)模型誕生了。

有了021科學基礎(chǔ)模型,對科學研究來說意味著什么?

021模型更像是科學家們打破學科邊界的一個超級“外掛”。薛貴榮演示了一個簡單的例子:一個反應里面涉及5種化合物,包含反應物、溶劑、助劑和催化劑,如何預測這些化合物相互作用能生成什么物質(zhì)?

通過實驗進行高通量篩選,通常需要數(shù)月乃至一年的周期,現(xiàn)在通過021科學基礎(chǔ)模型可以在數(shù)分鐘內(nèi)完成產(chǎn)物的預測,大幅提速。


“這是我見過最漂亮的一朵花!”

在進化到AlphaFold3之后,AI不僅可以回答和預測,還具備了“創(chuàng)造力”。比如,合成新型材料蛋白,生成更多AI-結(jié)構(gòu)模型,開啟藥物發(fā)現(xiàn)的新階段。

浙大城市學院先進材料增材制造創(chuàng)新研究中心主任湯慧萍就見過AI的“非凡創(chuàng)造力”。

在之江實驗室,她帶領(lǐng)著另外一群“硬盤俠”和實驗室的科學家們組成了一支攻堅隊,他們的主線任務是構(gòu)建一個多孔材料逆向生成模型。


湯慧萍

大自然孕育了無數(shù)神奇而有用的多孔材料,比如王蓮、珊瑚、骨骼、竹子,布滿了1厘米以下的孔。這么多復雜的孔構(gòu)型,是天工造物,突破了人類的想象。

那有沒有可能找到一個合適的孔構(gòu)型可以用在不同的領(lǐng)域?

和 劉石平 不同的是,湯慧萍與之江實驗室迸發(fā)出火花是在兩年前。在云棲小鎮(zhèn)的一次會議上,湯慧萍遇到了王堅,當時湯慧萍和王堅聊起了多孔材料,整場聽下來王堅就記住了幾個字——“設(shè)計空間巨大”。

“那就可以用人工智能來做。”王堅對湯慧萍說。

這是一場跨學科的大作戰(zhàn)。70多個人的團隊,涉及材料、機械、力學、計算機、數(shù)學等多種學科。要訓練一個模型,至少需要一個百萬級的數(shù)據(jù)庫?!暗F(xiàn)有的數(shù)據(jù)很少,實驗數(shù)據(jù)又太慢?!睖燮颊f。

于是,團隊決定自己生產(chǎn)數(shù)據(jù)。怎么生產(chǎn)數(shù)據(jù),一開始也是蒙的,有兩三個月時間,一群年輕人坐在一起無從下手。后來找到了數(shù)學這個破題的關(guān)鍵,通過參數(shù)化建模方法和自研仿真算法,僅用3個月就生產(chǎn)了200多萬孔結(jié)構(gòu)-力學性能數(shù)據(jù)。

如果用傳統(tǒng)的仿真方法,要花上57年時間。

一個叫OnePorous的模型應運而生,專注于多孔合金材料的設(shè)計與研發(fā)。其核心功能是通過逆向設(shè)計方法,直接生成滿足目標性能的多孔胞元,減少了傳統(tǒng)正向設(shè)計需不斷試錯迭代的耗時。

團隊為3D打印衛(wèi)星設(shè)計的胞元,就是從AI生成的200多萬個胞元結(jié)構(gòu)中選出來的??吹侥莻€胞元的瞬間,這位多孔材料和增材制造領(lǐng)域的科學家激動地說:“這是我見過最漂亮的一朵花!”


從AI生成的200多萬個胞元結(jié)構(gòu)中選出來的3618胞元


3618胞元構(gòu)成的多孔結(jié)構(gòu)

目前,這個胞元結(jié)構(gòu)已經(jīng)用于衛(wèi)星主體結(jié)構(gòu)制造,這也意味著,之江實驗室與浙大城市學院的跨學科團隊完成了從AI設(shè)計到3D打印制造的全鏈路創(chuàng)新。

除了材料科學模型OnePorous,目前021模型已服務地球科學、天文學、生命科學等多個領(lǐng)域。

比如天文領(lǐng)域模型OneAstronomy,將光譜、光變、圖像等不同模態(tài)的天文數(shù)據(jù)映射至統(tǒng)一表征空間,實現(xiàn)跨模態(tài)融合推理,重構(gòu)數(shù)據(jù)處理范式。通過OneAstronomy,望遠鏡學會了自主觀測。

人類百億級基因組基礎(chǔ)模型Genos在致病性突變識別任務上實現(xiàn)了98.3%的準確率。

今年4月面向全球開放使用的地學領(lǐng)域模型GeoGPT,經(jīng)過不斷迭代升級,其中GeoGPT-VL支持圖像描述總結(jié)、圖像信息提取、地理空間推理、地學分析推理四類典型任務,實現(xiàn)從“讀圖”到專業(yè)推理的跨越。

文 | 沈積慧 梁應杰

VIEW MORE

@下次再“箭”>>

@蔡崇信:中美AI競爭中中國有四大底牌>>

@釘釘副總裁創(chuàng)業(yè)>>

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
小米上架米家燃氣灶3猛火版,到手價899元

小米上架米家燃氣灶3猛火版,到手價899元

ZAEKE知客
2026-02-27 12:41:13
林昀儒晉級男單決賽!莫雷加德升世界第二,創(chuàng)個人世界排名新高

林昀儒晉級男單決賽!莫雷加德升世界第二,創(chuàng)個人世界排名新高

燒體壇
2026-03-01 15:07:35
新iPhone 正式官宣:3 月 2 日,即將發(fā)布!

新iPhone 正式官宣:3 月 2 日,即將發(fā)布!

科技堡壘
2026-02-28 11:22:07
蘇群:趙繼偉那個超遠三分是轉(zhuǎn)折點 意外的英雄是李弘權(quán)!

蘇群:趙繼偉那個超遠三分是轉(zhuǎn)折點 意外的英雄是李弘權(quán)!

蘭亭墨未干
2026-03-01 18:26:14
芒果首播《江山為聘》:雙強掃黑,吳謹言陳哲遠燃炸朝堂

芒果首播《江山為聘》:雙強掃黑,吳謹言陳哲遠燃炸朝堂

阿廢冷眼觀察所
2026-03-01 10:47:21
哈梅內(nèi)伊四位親屬據(jù)稱在襲擊中身亡!伊南部一體育館遭空襲,20名女排球員喪生,伊方:科威特美海軍基地所有基礎(chǔ)設(shè)施被摧毀,大量美軍傷亡

哈梅內(nèi)伊四位親屬據(jù)稱在襲擊中身亡!伊南部一體育館遭空襲,20名女排球員喪生,伊方:科威特美海軍基地所有基礎(chǔ)設(shè)施被摧毀,大量美軍傷亡

每日經(jīng)濟新聞
2026-03-01 09:22:18
人品好!張本美和:我解釋后王曼昱同意醫(yī)療暫停 賽后問我沒問題吧

人品好!張本美和:我解釋后王曼昱同意醫(yī)療暫停 賽后問我沒問題吧

818體育
2026-03-01 13:27:01
中國互聯(lián)網(wǎng)最賺錢的一臺“印鈔機”,突然在一年之內(nèi)“炸機”

中國互聯(lián)網(wǎng)最賺錢的一臺“印鈔機”,突然在一年之內(nèi)“炸機”

流蘇晚晴
2026-02-27 18:16:39
32+5+8,杜蘭特無緣今日最佳,抱歉,因為你遇到100%的詹姆斯

32+5+8,杜蘭特無緣今日最佳,抱歉,因為你遇到100%的詹姆斯

體育新角度
2026-03-01 15:44:26
地產(chǎn)老板集體滯留香港,有的避風,有的開創(chuàng)新事業(yè)

地產(chǎn)老板集體滯留香港,有的避風,有的開創(chuàng)新事業(yè)

新浪財經(jīng)
2026-02-28 21:21:14
越看越上頭!小七寶萌化全網(wǎng),張?zhí)m直言:這娃來的正是好時候!

越看越上頭!小七寶萌化全網(wǎng),張?zhí)m直言:這娃來的正是好時候!

樂悠悠娛樂
2026-02-28 15:12:32
母子變仇敵!河南男子身患尿毒癥,和母親配型成功,母親表示不換

母子變仇敵!河南男子身患尿毒癥,和母親配型成功,母親表示不換

好笑娛樂君每一天
2026-03-01 00:29:47
不容易!中國男籃逆風翻盤,7分險勝,李弘權(quán)成奇兵,張鎮(zhèn)麟低迷

不容易!中國男籃逆風翻盤,7分險勝,李弘權(quán)成奇兵,張鎮(zhèn)麟低迷

萌蘭聊個球
2026-03-01 17:57:52
周末信息如何影響市場?明天是紅色星期一?還是黑色星期一?

周末信息如何影響市場?明天是紅色星期一?還是黑色星期一?

春江財富
2026-03-01 08:39:41
你知道最禽獸的事是什么嗎?網(wǎng)友的故事讓人毛骨悚然!

你知道最禽獸的事是什么嗎?網(wǎng)友的故事讓人毛骨悚然!

特約前排觀眾
2026-02-28 00:15:03
消息人士稱哈梅內(nèi)伊正掌控戰(zhàn)局

消息人士稱哈梅內(nèi)伊正掌控戰(zhàn)局

界面新聞
2026-03-01 07:16:37
地緣沖突“黑天鵝”再襲!明天,A股股民如何應對?

地緣沖突“黑天鵝”再襲!明天,A股股民如何應對?

每經(jīng)牛眼
2026-03-01 10:06:21
若不出意外,2026年上半年開始,一半家庭都可能面臨“四大難題”

若不出意外,2026年上半年開始,一半家庭都可能面臨“四大難題”

貓叔東山再起
2026-03-01 12:40:03
河北小伙放棄鐵飯碗,花13年救活失傳千年藝術(shù),全世界僅他一人會

河北小伙放棄鐵飯碗,花13年救活失傳千年藝術(shù),全世界僅他一人會

鐵錘簡科
2026-03-01 14:40:12
打伊朗前,美國先找了中國,特朗普知道:他錯一步中國就不戰(zhàn)而勝

打伊朗前,美國先找了中國,特朗普知道:他錯一步中國就不戰(zhàn)而勝

通文知史
2026-02-24 23:40:03
2026-03-01 19:03:00
九千光年 incentive-icons
九千光年
90后00后看世界探未來
1844文章數(shù) 5550關(guān)注度
往期回顧 全部

科技要聞

小米超跑概念車全球首秀!殺入頂豪俱樂部

頭條要聞

普京就哈梅內(nèi)伊遇害表示哀悼:一次無恥殺害

頭條要聞

普京就哈梅內(nèi)伊遇害表示哀悼:一次無恥殺害

體育要聞

火箭輸給熱火:烏度卡又輸斯波教練

娛樂要聞

《江山為聘》:吳謹言陳哲遠燃炸朝堂

財經(jīng)要聞

中東局勢升級 如何影響A股、黃金和原油

汽車要聞

理想汽車2月交付26421輛 歷史累計交付超159萬輛

態(tài)度原創(chuàng)

藝術(shù)
時尚
親子
房產(chǎn)
手機

藝術(shù)要聞

這位荷蘭人的書法,看得人直冒冷汗,寫丑書的人看了無地自容!

普通人穿衣不需要太復雜!顏色恰當、搭配和諧,高級又耐看

親子要聞

泉州孕婦跨省求醫(yī),港大深圳醫(yī)院成功救治“先心病”雙胞胎

房產(chǎn)要聞

濱江九小也來了!集齊海僑北+哈羅、寰島...江東教育要炸了!

手機要聞

盧偉冰宣布3月2日MWC現(xiàn)場直播 發(fā)布小米17 Ultra徠卡版新配色

無障礙瀏覽 進入關(guān)懷版