国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

對話王小川:“語言才是中軸,多模態(tài)不是主戰(zhàn)場”

0
分享至


百川智能創(chuàng)始人、CEO 王小川,圖片來源:百川智能

1月13日,百川智能正式開源新一代醫(yī)療大模型Baichuan-M3。

在全球權(quán)威醫(yī)療AI評測HealthBench中,Baichuan-M3以65.1分的綜合成績位列全球第一;在專門考驗復(fù)雜決策能力的HealthBench Hard上,以44.4分的成績奪冠。

這一成績刷新了HealthBench的最高分,首次在醫(yī)療領(lǐng)域?qū)崿F(xiàn)了對GPT-5.2的全面超越。在低幻覺領(lǐng)域,M3也實現(xiàn)了超越,幻覺率3.5全球最低。


圖片來源:百川智能

M3還首次具備了原生的“端到端”嚴肅問診能力。它能像醫(yī)生一樣主動追問、逐層逼近,把關(guān)鍵病史和風險信號問出來,進而在完整的信息上進行深度醫(yī)學(xué)推理。評測顯示,其問診能力顯著高于真人醫(yī)生的平均水平。

從月初OpenAI發(fā)布ChatGPT Health,到今天(1月13日) Anthropic推出Claude for Healthcare,AI醫(yī)療正在全球范圍內(nèi)提檔加速。

強化學(xué)習是過去一年新一代Scaling Law的技術(shù)中軸。在M2發(fā)布后的五個月里,百川智能對強化學(xué)習系統(tǒng)進行了升級,將原本以患者模擬器和靜態(tài)Rubric為主的半動態(tài)反饋,升級為隨模型能力不斷演進的全動態(tài)Verifier System。

隨著監(jiān)督信號持續(xù)變細、變難,模型不斷突破能力上限,M3在復(fù)雜醫(yī)學(xué)問題上的表現(xiàn)實現(xiàn)躍遷,在HealthBench總分上超越OpenAI最新模型GPT-5.2,也在HealthBench Hard上登頂,成為當前全球醫(yī)療溝通和推理能力最強的醫(yī)療大模型。

2025年8月,百川開源醫(yī)療增強大模型M2在HealthBench Hard上取得34.7分的成績,僅次于GPT-5,成為全球唯二突破32分的模型。

在大多數(shù)場景,大模型幻覺只是體驗問題,而在嚴肅醫(yī)療場景可能導(dǎo)致安全事件,這也對AI醫(yī)療的普及和醫(yī)患信任建立帶來很大困擾。

百川M3將醫(yī)療幻覺抑制前移至模型訓(xùn)練階段,在強化學(xué)習過程中將醫(yī)學(xué)事實一致性作為核心訓(xùn)練目標之一,將“知之為知之,不知為不知”直接作用于模型自身能力的形成過程。

這一新的訓(xùn)練方法將醫(yī)學(xué)事實可靠性內(nèi)化為M3自身的基礎(chǔ)能力,使其在不借助任何外部系統(tǒng)的情況下,依然能夠基于自身醫(yī)學(xué)知識進行穩(wěn)定、可信的作答。

通過將事實一致性約束融入訓(xùn)練流程,M3重構(gòu)了幻覺抑制的訓(xùn)練范式,在不依賴工具或檢索增強的純模型設(shè)置下,醫(yī)療幻覺率3.5,超越GPT-5.2。

除了強推理和低幻覺,端到端的問診能力是本次M3最重要的一項突破。

2025年行業(yè)的技術(shù)共識是,用戶提供更完整的上下文,模型才有更好的表現(xiàn)。而在醫(yī)療領(lǐng)域,患者很難完整表達自己的病癥,需要模型像醫(yī)生一樣有能力把患者的混亂敘述轉(zhuǎn)變成可做診療決策的信息。

在Baichuan-M3媒體溝通會上,百川智能創(chuàng)始人、CEO王小川表示,當前大模型在醫(yī)療場景的短板在于,患者描述不完整,模型須具備“主動提問”能力,以收集足夠信息支持決策。

應(yīng)用實踐中,通過prompt“你是一位經(jīng)驗豐富的醫(yī)生”,激活模型的“角色扮演”是更常見的做法。這種方式得到的是模型的表演行為,而非內(nèi)生能力,激活的是模型應(yīng)該提問的行為,而不是必須獲取關(guān)鍵信息的思考。

針對這一行業(yè)困境,百川智能提出了“嚴肅問診范式”與“SCAN原則”,通過Safety Stratification(安全分層)、Clarity Matters(信息澄清)、Association & Inquiry(關(guān)聯(lián)追問)與Normative Protocol(規(guī)范化輸出),將臨床問診中高度依賴經(jīng)驗的思維過程,第一次系統(tǒng)性地“白盒化”。

圖片來源:百川智能

圍繞SCAN原則,百川智能借鑒醫(yī)學(xué)教育里長期使用的OSCE方法,聯(lián)合150多位一線醫(yī)生,搭建了SCAN-bench評測體系,該體系以真實臨床經(jīng)驗作為“標準答案”,將診療過程拆解為病史采集、輔助檢查、精準診斷三大階段,通過動態(tài)、多輪的方式進行考核,完整模擬醫(yī)生從接診到確診的全過程。相比于HealthBench,SCAN-bench是一種全流程端到端的動態(tài)評測新范式。

醫(yī)療應(yīng)用“百小應(yīng)”已同步接入M3,面向醫(yī)生與患者開放相關(guān)能力。醫(yī)生可借助它推演問診與診療思路,患者及家屬也可通過該應(yīng)用更系統(tǒng)地理解診斷、治療、檢查與預(yù)后背后的醫(yī)學(xué)邏輯。

在溝通會上的交流環(huán)節(jié),王小川直言,數(shù)據(jù)不是核心,很多醫(yī)療模型不知道自己在做什么,他更看重算法與評測體系的重要性。

王小川預(yù)判,醫(yī)療AI未來巨大的增量是在院外,不在院內(nèi)。他認為,醫(yī)療AI更多的是服務(wù)患者,而非替代醫(yī)生,可以推動“醫(yī)患權(quán)力讓渡”。百川智能目前已與藥企、醫(yī)院合作,未來商業(yè)化是To C導(dǎo)向,通過輔助決策和健康陪伴等方式實現(xiàn)。

以下是媒體溝通會的對話實錄,經(jīng)鈦媒體編輯整理:

Q:剛才講到你們可以解決很多幻覺的問題,可以在多大程度上導(dǎo)致智能一定程度上損耗?大概會損耗多少?怎么解決這個問題?因為這次是語言模型,我們知道主戰(zhàn)場還是多模態(tài)比較重要,有沒有相關(guān)的進展披露?怎么看二者之間的關(guān)系?

王小川:這就是有用和有害的平衡,算法需要把二者拿捏才能做到綜合評分很高。HealthBench就是降低有害,提升有用。多模態(tài)主戰(zhàn)場這個話我是不認同的,我們2023年就提到語言是自己的中軸,ChatGPT發(fā)布的時候,大家最震撼的就是掌握智力。智力是把不抽象的事情變成抽象事情的能力,所以符號才是核心。

類比即智力,因此在這種邏輯下主要有三種語言:自然語言、數(shù)學(xué)語言、代碼語言,都是形式語言。之前的數(shù)學(xué)家講過數(shù)學(xué)是用相同的事情刻畫不同的事情,Give the same name to different things,所以符號和語言才是中軸。

到目前為止,評判某個公司的模型能力強不強都是以符號作為基礎(chǔ),可用性很強并不代表智力很高。現(xiàn)在醫(yī)療領(lǐng)域很多都是決策問題,并不只是圖像問題,否則看片子就行了。以后醫(yī)院看片子會由小模型來做,很多廠商都有圖像引擎,符號化以后再用語言開展推理工作。感知模型和認知模型需要結(jié)合,可見的時候就是把影像變成報告和診斷模型,最近還有胰腺癌頻掃CT模型,相比智力模型屬于樹上掛著的小葉子,不是主戰(zhàn)場。

Q:所以你們多模態(tài)會用偏小的參數(shù)去做?

王小川:會的,下次我們就會發(fā)布和圖像相關(guān)的模型,就是醫(yī)療圖像診斷做到SOTA的水平,M3只是更小的課題。

Q:要是做得更小的話,是不是背后更重要的是數(shù)據(jù)采集?

王小川:圖像模型對于高質(zhì)量的數(shù)據(jù)依賴度更大,因為有高精度的圖像數(shù)據(jù),很多都是院內(nèi)收集的。今天的語言模型是知識Knowledge,更多的就是論文里面的,醫(yī)生只是把這些知識變成科研題目,就是從專利庫變成論文。

可能有個反常識的地方,大家覺得需要依賴院內(nèi)的高質(zhì)量數(shù)據(jù),把醫(yī)院的高質(zhì)量數(shù)據(jù)轉(zhuǎn)化成知識,然后在論文里面萃取這些信息才是關(guān)鍵。這跟上一代的圖像方法是不一樣的,圖像不是搬出來的,知識是搬出來的。

Q:聯(lián)影也提到多模態(tài)數(shù)據(jù)很難出院,怎么看院內(nèi)數(shù)據(jù)的處理?

王小川:主要是兩個要點:一個是技術(shù),一個是場景。我們認為未來巨大的增量是在院外,不在院內(nèi),院內(nèi)更多的是做手術(shù)、執(zhí)行、掛水的地方,Planning就在院內(nèi),不是幫醫(yī)生在院內(nèi)搞事兒,空間本身是有限的,我們并不鼓勵把場景放在院內(nèi),寫個病歷、做個質(zhì)控,這些都不是未來的主流方向。

最重要的是幫到患者,隔山打牛。今天大家總是講數(shù)據(jù)不夠,投了上千億,去年發(fā)布了500款醫(yī)療垂直大模型,但今天大家有感覺嗎?美國已經(jīng)把兩件事情做完了:OpenEvidence,很多醫(yī)生都在用這款產(chǎn)品輔助診療,讓安全性和準確度提升了很多,ChatGPT馬上就要接入健康數(shù)據(jù),2.3億人很快就可以直接受益。

原來提到的數(shù)據(jù)范式、場景范式都會有點問題,已經(jīng)運行了一年,繼續(xù)運行又能怎么樣?我們強調(diào)AI直接產(chǎn)生作用是在院外,上一代是以醫(yī)生為中心的服務(wù)模式,距離AI的本質(zhì)是遠的。我們強調(diào)技術(shù)紅利是發(fā)生在智力上,不是發(fā)生在圖象識別上,圖象識別不代表智力,只是做題家手里的活兒。

Q:智能的上限多了以后,某種程度上可以彌補數(shù)據(jù)整體不足的問題?

王小川:智力是本質(zhì)問題,不是彌補數(shù)據(jù)不足。數(shù)據(jù)很重要,但在大模型行業(yè)沒有成功案例,大家都搞錯了。我們沒有公開這樣講,要是這樣講的話得罪人太多了。大家都在提數(shù)據(jù)很重要,但只是傳閱的概念,沒有人做成功過。

Q:AI醫(yī)療的主要場景是在院外,不是在院內(nèi),這是什么邏輯?

王小川:我覺得那個院士有他的道理,就是屁股決定腦袋,他的位置在那里,但醫(yī)療是為誰服務(wù)?最終還是要為患者服務(wù),所以需要局部最優(yōu)解。根本問題是醫(yī)生不夠,醫(yī)學(xué)不發(fā)達,患者是受益方,但沒有決策權(quán),居家服務(wù)太少。我們老是說患者是自己健康的第一責任人,但AI都是幫醫(yī)生的,不是幫患者的,總是隔山打牛,這樣對嗎?

我們覺得自己不行,所以要求醫(yī)生賦能給我們。最終總是要服務(wù)個人,因為醫(yī)生的利益也不太一致,醫(yī)生主要就是寫論文,這是他們的主要訴求。OpenEvidence確實讓醫(yī)療效果提升了很多,因為他們習慣用輔助系統(tǒng),中國醫(yī)生不習慣,因為很忙,沒有時間去用,而且用不用對于他們評職稱寫論文有幫助嗎?

Q:剛才提到數(shù)據(jù)到底重不重要,我想提幾個根上的問題:新一代模型的訓(xùn)練主要是從哪幾個方面提升水平和能力?你們肯定是需要數(shù)據(jù)的,到底需要哪些數(shù)據(jù)?量級和通用大模型有什么差別?百川數(shù)據(jù)獲取主要來源是哪些?

王小川:我們要發(fā)展新醫(yī)學(xué),AI for Science需要大量數(shù)據(jù),院內(nèi)也不夠,所以需要自己采集和創(chuàng)造數(shù)據(jù)。

Q:現(xiàn)在你們采用哪些數(shù)據(jù)訓(xùn)練?醫(yī)院的還是患者的?

王小川:核心不是院內(nèi)數(shù)據(jù),而是評價系統(tǒng),DeepSeek也沒有天天說自己的數(shù)據(jù)是怎么來的,所以就是好的定義和訓(xùn)練方法的準備。我們認為讓醫(yī)生幫助我們生產(chǎn)模擬患者的評價體系,跟數(shù)據(jù)訓(xùn)練模型是兩件事情。

Q:醫(yī)生標注數(shù)據(jù)的工作量很大,因為醫(yī)生本身也很忙。

王小川:是的,之前GPT是找了262個國家做到HealthBench的評測集,我們也有百川SCAN的評測集,系統(tǒng)自己就會知道怎么改進,范式?jīng)Q定怎么使用這些數(shù)據(jù)。

Q:剛才提到動態(tài)反饋這件事情,現(xiàn)在大家也都有看到,OpenAI很快就要開放醫(yī)療檔案,國內(nèi)阿福也有在做。雖然你們已經(jīng)有了很好的方法,建立起了模型體系,但會不會因為數(shù)據(jù)量的差距讓模型迭代相對沒有那么快?

王小川:有了個人檔案當然沒有問題,但不是數(shù)據(jù)就可以形成訓(xùn)練阿福的模型,檔案就是更加個性化,跟用戶多少沒什么關(guān)系,用戶更多以后至少團隊能夠通過問答推動產(chǎn)品改進,就像以前的產(chǎn)品一樣,通過用戶反饋進行改進也是技術(shù)層面的事情,所以有機會優(yōu)化產(chǎn)品,但不代表能夠推動模型的進化。

今天的Gemini發(fā)展得非?,沒有那么大的數(shù)據(jù)量也做起來了,所以還是技術(shù)驅(qū)動。今天有些東西是被證明是真的,有些東西是被證偽的。阿福更多的是做生態(tài),有了用戶以后,這是最容易獲得的紅利收益,不是技術(shù)本身。

Q:百川接下來的路想怎么走?

王小川:我們跟阿福不太一樣,阿福還是泛健康的概念,健康這個詞就是很泛的概念,居家至少能夠取代家庭醫(yī)生。

Q:剛才提到C端產(chǎn)品接下來的路線,之前你也講,百川第一天就想做To C,目前To C的商業(yè)化路徑是怎么規(guī)劃的?

王小川:幫助患者產(chǎn)生輔助決策的價值就是有意義的,因此我們可以向患者收費,也可以形成服務(wù)包,后面的醫(yī)療資源和藥械就以服務(wù)包的形式收費。我倒不擔心商業(yè)模式本身,確實是要過了醫(yī)療這個門檻,為用戶創(chuàng)造價值,不管直接收費還是生態(tài)收費都是很容易的事情。

Q:大概會在什么時間實現(xiàn)?

王小川:今年上半年就會開始入場,之前停頓了一段時間,確實不是只賺醫(yī)院的錢或者只賺醫(yī)生的錢。

Q:To C屬于比較偏嚴肅性的,核心是嚴肅性醫(yī)療涉及診療由誰負責,怎么看這個問題?

王小川:現(xiàn)在的法規(guī)要求診斷結(jié)論和治療方案必須由醫(yī)生來給出,我們短期內(nèi)不會去碰這條紅線,可以輔助醫(yī)生把診療做得更好,但會有一個痛點。我們主打的就是讓患者能夠明明白白看醫(yī)生,縮短醫(yī)生和患者之間的Gap,醫(yī)生沒有擅長給患者做更多的溝通、講解,沒法在報告單抽取相關(guān)的內(nèi)容。

最后的診療決策不是一件事情,可能是看兩個方案選哪個,這個決定是患者來做,我們會幫助患者做好。醫(yī)生要讓出決策權(quán),保守方案和激進方案應(yīng)該選哪個?可以讓患者自己選,最后患者會對自己的健康更負責,因為患者是自己健康的第一責任人。我們不做決策,而是建議患者做決策。

Q:產(chǎn)品最終To C,想把決策權(quán)從醫(yī)生手里讓渡到患者手里,現(xiàn)在M3的能力已經(jīng)可以達到這樣的水平了嗎?還是醫(yī)療模型要往更強的能力迭代,才能支撐起來這個愿望?

王小川:需要建立產(chǎn)品形態(tài)和信任。

Q:拋開現(xiàn)有的法規(guī),必須要有醫(yī)院來開處方,要是To C的話,患者Prompt能力并沒有專業(yè)工程師那么強,你們會怎樣挖掘足夠的患者信息支撐最終提供的診斷?

王小川:搜集足夠的信息就可以給出好的建議和服務(wù),我們的核心能力就是端到端嚴肅問診,以前的模型就是“你是一位資深的醫(yī)生”,但想問的和該問的不是一件事情。我們是跟著醫(yī)院的體系在評測中已經(jīng)超過了今天醫(yī)生的提問能力,以前的模型是做不到的。很多問題看著很對,其實是不符合的,現(xiàn)在患者平時的表達就被AI管起來了,感冒以后AI會很清楚身體系統(tǒng),不會被帶到溝里面。

未來的產(chǎn)品場景也在規(guī)劃中,要是去兩個醫(yī)院,每個醫(yī)院給的治療方案不一樣,應(yīng)該聽誰的?我們把相關(guān)方案都放進來,AI可以幫助分析,找到更適合自己的方案,有的是為了讓生存期更長,有的是為了減少痛苦,有的是為了成本更低,能夠把方案講得很清楚,就是為什么這么設(shè)計,怎么才能適合自己,醫(yī)院是打死也做不了的。

Q:要是做To C產(chǎn)品的話,早期怎么培養(yǎng)用戶心智?因為市面上有很多醫(yī)療,阿福泛健康也被當作醫(yī)生來問。

王小川:需要三個事情發(fā)生:要有一定的廣告宣傳投入,我們也會適量增加。要有醫(yī)生的認可,阿福跟我們的路線不一樣,老醫(yī)生都是無感的,我們希望醫(yī)生和患者是一體兩面,共享一款產(chǎn)品,要讓專家點頭,而不只是患者鼓掌。產(chǎn)品做好以后確實能夠取得一定的口碑效應(yīng),GPT可以發(fā)現(xiàn)自己多年以前誤診的對象,就是從接口說話。

Q:你們商業(yè)化做得怎么樣?

王小川:今天上市的兩家是踩在了通用模型的技術(shù)紅利和國家對科技強國扶持的基礎(chǔ)上。AI醫(yī)療也是同樣,屬于今天大模型競爭的重要力量?梢哉f從技術(shù)范式再到國計民生的意義,從通用AI的概念來說更早一些,未來我們也會走到上市這條道路上。

Q:OpenAI商業(yè)路線和產(chǎn)品路線是To C和To B的區(qū)別,百川好像兩條路都在走,怎么評價不同的選擇?

王小川:美國是To C和To B都可以干,但在中國To C比To B更好。

Q:產(chǎn)品形態(tài)具體是怎樣的?

王小川:就是醫(yī)生醫(yī)療版本的大模型,非醫(yī)療的問題就不答了,因為接入患者數(shù)據(jù)以后就會變成子產(chǎn)品放在ChatGPT里面,我們做的就是這樣一個對標的板塊。

雖然是同一個產(chǎn)品,但由于醫(yī)生和患者的身份不同,給出的結(jié)果是不一樣的。醫(yī)生版更像OpenEvidence,更加強調(diào)循證,就是一篇文章的一番話引用在什么地方,ChatGPT引用的有些文章是不存在的,只是幻覺,但在我們的系統(tǒng)中100%存在。

醫(yī)生和患者之間會有區(qū)別,醫(yī)生可以接受各種專業(yè)答案,給到患者幾個不同的點。必須足夠看得懂,讓患者理解專業(yè)語言,翻譯成患者能懂的內(nèi)容,同樣保留循證的能力。必須讓自己能夠做決策,給的信息足夠充分,因為醫(yī)生都是訓(xùn)練過的,知道應(yīng)該怎么辦,也要給患者這種決策能力。

患者模式就會強調(diào)補充信息,進入啟發(fā)式端到端的問診能力,醫(yī)生不會這樣,因為醫(yī)生有自己提問的方法。在這種情況下,我們和OpenEvidence的區(qū)別在于,OpenEvidence只是服務(wù)于醫(yī)生,我們是可復(fù)數(shù)、可懂、可決策、可行動、能夠服務(wù)到患者,這樣的產(chǎn)品定位在全球是獨一無二的。

Q:現(xiàn)在國內(nèi)醫(yī)療AI賽道越來越火,你們怎么做好自己的護城河?

王小川:護城河分為三個部分:模型做得足夠好,今天屢試不爽就在于模型領(lǐng)先一代,就像教育的好學(xué)區(qū),我們的領(lǐng)先度是可以保證的。解決問題的切入點,我們更愿意切入嚴肅、高價值的場景。

大廠和創(chuàng)業(yè)公司不一樣,畢竟有職業(yè)團隊,需要的是更加安穩(wěn)的方案,大創(chuàng)新靠小廠,小創(chuàng)新靠大廠,必須切入我們認為有高價值的事情,共識不是我們優(yōu)先的突破點,而大廠更多的是注重共識,路線圖和產(chǎn)品形態(tài)是不一樣的。

Q:你們產(chǎn)品的核心是解決哪一部分人群對于醫(yī)療認知的Gap?不同人群的Prompt能力有差異,為什么一個專業(yè)問題,醫(yī)生講不明白,你們的產(chǎn)品能夠講明白?產(chǎn)品設(shè)計有什么巧思?

王小川:我們需要患者更好地表達,甚至老年人的話可能是家屬幫助在做,缺少一種醫(yī)學(xué)的Knowhow,患者和醫(yī)生溝通也需要有表達能力,所以要把自己的問題說清楚,把你要什么表達出來,這是一個基礎(chǔ),F(xiàn)在ChapGPT可以把一個東西講得讓7歲的小孩子都明白,可以讓一個嚴肅的文檔夸張一點、友好一點,所以分析問題、講清楚的能力是大模型不缺的。

Q:現(xiàn)階段就是幫助患者建立輔助決策的價值,你們突破到多少用戶規(guī)模就會覺得輔助價值被驗證了?從價值驗證到價格成立大概需要多久?需要經(jīng)歷哪些步驟?

王小川:我們沒有一個完整的判斷,不在我們的計劃中,要是真正有10萬人在用,我們覺得就已經(jīng)證明了讓渡權(quán)利的價值。

Q:剛才你們提到最大增量是在院外,現(xiàn)在醫(yī)療大模型還面臨技術(shù)端需要走在法律法規(guī)政策紅線的前面,院外的哪些場景能夠最終落地?大模型要是出現(xiàn)誤診,責任在哪里?

王小川:今天我們也不會越過紅線,不會去做本身的診斷或者給出處方,但可以做輔助工作,所以我們在紅線內(nèi)已經(jīng)產(chǎn)生了巨大的價值,能夠推動醫(yī)療改革的加速。美國猶他州已經(jīng)開始用AI開藥了,其實可以放開更多的AI能力,只是看能否應(yīng)用于患者而不是躲在醫(yī)生背后。一旦有了體感,就會形成行業(yè)內(nèi)的滾雪球效應(yīng)。

Q:是不是就像自動駕駛L2、L3那樣,權(quán)責更加清晰就可以實現(xiàn)AI醫(yī)生?

王小川:我們的思考并不是把醫(yī)生取代,做手術(shù)、做查體、做各種各樣的康復(fù)診療都需要真實醫(yī)生,但AI可以填補空白。就像剛才講的溝通、提醒、通過給出建議輔助患者決策,這些都是空白,我們大有空間可干。

Q:剛剛進入2026年,各家廠商都在上市,宣布自己的融資情況,你們怎么評價百川現(xiàn)在的狀態(tài)?去年做了哪幾件比較重要的事情?今年的計劃是什么?

王小川:百川去年最重大的就是組織管理專注醫(yī)療,發(fā)布M2和M2Plus,把基礎(chǔ)的醫(yī)療增強概念穩(wěn)固,把循證概念樹立起來,除了推理能力以外就是循證和會問診,去年做了很多積累,M2和M2Plus,包括今年的M3都是在去年的基礎(chǔ)上夯實,我們在腫瘤領(lǐng)域也開了一條線,就是把最難的醫(yī)學(xué)皇冠明珠做好,所以就是模型本身的進步。今年的核心就是模型迭代和落地,幫助患者做決策的能力和居家陪伴的健康看護能力,我們都會進一步落地,醫(yī)療AI也是肉眼可見的未來最重要的應(yīng)用場景。

Q:你們做的事情是造醫(yī)生,不是輔助AI,在什么情況下能夠真正實現(xiàn)跟AI聊天覺得不是輔助的作用,而是真正的醫(yī)生?

王小川:造醫(yī)生就是因為醫(yī)療供給不足,我們的第二個產(chǎn)品已經(jīng)可以當成院外醫(yī)生來看了。

Q:之前提到現(xiàn)在OpenAI也在進軍醫(yī)療領(lǐng)域,你們在中國做AI醫(yī)療本身的優(yōu)勢和劣勢是什么?美國不同醫(yī)院對于個人隱私數(shù)據(jù)保護得非常嚴謹,相互之間數(shù)據(jù)不通,不知道國內(nèi)AI醫(yī)療有沒有自己的優(yōu)勢?

王小川:你是指跟美國相比嗎?我覺得跟美國相比的話,美國更加市場化,而且美國的醫(yī)生數(shù)量是夠的,中國廣大地緣反而更缺優(yōu)質(zhì)的醫(yī)生。你在北京可能沒感覺,北京的資源太豐富了,但那些五年規(guī)培的村醫(yī)只有26%,空白的地方是更多的。中國政府要是想明白了怎么辦,可能會有很大的助力。

Q:你們產(chǎn)品智力的部分其實來自公開的論文,就是類似知識圖譜,用醫(yī)生做標注提高模型的診斷準確率,基于我的理解,是不是有更好的一倆數(shù)據(jù)庫、更優(yōu)的醫(yī)院數(shù)據(jù)就能夠拿到比你們更高的診斷準確性?

王小川:算法是核心,醫(yī)生主要是驅(qū)動評測體系。

Q:腦卒中領(lǐng)域也有跟你們相同的產(chǎn)品,現(xiàn)在已經(jīng)遇到了瓶頸,衛(wèi)健系統(tǒng)也有質(zhì)量更優(yōu)的數(shù)據(jù)。

王小川:大家總是把數(shù)據(jù)當回事,懂這件事、有錢做這件事才是關(guān)鍵,市面上有500多個垂直醫(yī)療模型,我認為他們都不知道什么叫作做模型,所以不要被他們影響。

Q:你們場景的偏向是怎樣的?相比阿福泛健康的打法,性價比比較高,面向全部人群,不管智力能不能看懂醫(yī)學(xué)文獻,能不能和真人交流,要是你們花了很多成本做循證,很有可能拿不到真正肯花錢的用戶。

王小川:我們沒有什么前輩,因為我們是在做To C。解決一個問題要有人買單,因為醫(yī)療最大的問題就是決策方和使用方是不統(tǒng)一的,可能卡在這個問題里面。把一個好產(chǎn)品交給了一個利益不一致的人使用,不是循證成本高不高,而是是否能夠觸達目標人群。達摩院之前宣傳得很好,就是胰腺癌的屏掃CT,但醫(yī)院干嘛要這種便宜的東西?找不到買單方。

Q:你們有病種和場景的偏向嗎?

王小川:目前的做法基本上就是全覆蓋,重點放在兒科、慢病和腫瘤領(lǐng)域。

Q:中國醫(yī)療最大的支付方是醫(yī)保,不是患者,借由中間方就是醫(yī)院,你們規(guī)劃的宏大愿景直接面向患者,患者本身之所以沒有決策權(quán)就是因為不是最大的買單方,要是可以形成規(guī)模的買單方就是在電商平臺,你們的目標買單方是誰?

王小川:現(xiàn)在我們在跟一些藥械溝通,他們都非常強調(diào)在院外,并不是收在院內(nèi),大家在這一點上是同頻的,更多的是讓C端受益方成為決策方和買單方,做到三個統(tǒng)一。

Q:就是要把患者吸引過來,然后讓藥械企業(yè)買單?

王小川:也有可能打包都讓患者買單。

Q:這一部分有其他的廠家在跟,而且已經(jīng)比較落地了,你們比他們的優(yōu)勢是什么?

王小川:技術(shù)更好,確實能夠把病搞明白。

Q:你們現(xiàn)在主要的監(jiān)管方是衛(wèi)健委嗎?

王小川:是的。

Q:跟你們合作的主要醫(yī)院是哪家?

王小川:兒童醫(yī)院,現(xiàn)在也在和東腫合作,就是以藥廠的身份跟他們聯(lián)合研發(fā),進入Clinical Trial,合同已經(jīng)簽完了,但發(fā)現(xiàn)還沒有人注冊。

Q:你們的人去醫(yī)院還是醫(yī)院的人來這里?

王小川:都有,他們也有人駐扎在我們這里,副院長帶隊。

Q:會不會出海?

王小川:肯定會出海,不能出海的醫(yī)療公司不是好公司。

Q:要是有個超過中國最頂尖兒科醫(yī)生的模型,你們會用來干嘛?你們比中國最頂尖的兒科醫(yī)生厲害。

王小川:我們不會講比他們厲害,比醫(yī)生厲害這件事情在某些維度上一定是這幾年在迅速達到的,目的是讓大家更健康。

Q:你們會重點在一線嗎?還是在二三線、四五線?

王小川:我們會試探,但嚴肅場景還是得從一線開始。

Q:你們在安全和加密方面的等級是怎么做的?因為用戶也會害怕自己的數(shù)據(jù)被泄露。

王小川:我們在安全能力上肯定有做這些基礎(chǔ)工作,也是我們的一種承諾,你們的數(shù)據(jù)只是為個人服務(wù),內(nèi)部的文化也要小心,內(nèi)部員工都要尊重這件事情,就是文化和技術(shù)能力都要做到。公司越大,用戶就會越信任,要是泄露你的數(shù)據(jù),公司就掛了,他們就沒有動力干這個活了,因為數(shù)億人的數(shù)據(jù)都在里面。

Q:如果攻擊者把這些數(shù)據(jù)拿到了呢?

王小川:攻擊者可能會去攻擊銀行這種地方,他們要這些數(shù)據(jù)干什么?我是不會要這些數(shù)據(jù),沒什么用。

Q:張文宏拒絕把AI引入自己醫(yī)院的系統(tǒng),因為引用AI以后,醫(yī)生的訓(xùn)練完全改變了,沒有經(jīng)過疾病診斷系統(tǒng)訓(xùn)練的實習醫(yī)生,通過AI也可以得出跟自己一樣的結(jié)論,如果醫(yī)生缺乏這種系統(tǒng)性的訓(xùn)練,無法鑒別AI給出的結(jié)論是對是錯。如何看待引入AI以后產(chǎn)生的矛盾?

王小川:專業(yè)領(lǐng)域都會遇到這種問題,人與機器共生以后,相不相信AI會降低自己的能力?能駕馭AI的醫(yī)生就是好醫(yī)生,思考如何幫助患者才是正道。

Q:剛才您提到今年會有新的產(chǎn)品發(fā)布,是不是面向C端,上線初始會免費是嗎?

王小川:剛開始肯定會有免費。

Q:你們最開始為什么選擇兒科?

王小川:我們的第一個切入點其實是院外,不想往院內(nèi)去做,希望做的是比較輕的病。兒科屬于長期騷擾你,但沒有什么大的問題,就是從焦慮感出發(fā),之后我們就會逐步擴展到腫瘤這種最核心的疾病。

Q:會不會繼續(xù)在兒科重點投入?

王小川:慢性病、兒科和腫瘤,“一老一小”。

Q:你們會不會做硬件?

王小川:目前正在做睡眠。

Q:按照百川對于模型訓(xùn)練的探索,未來有沒有可能涌現(xiàn)出某種Idea,能夠解決目前人類解決不了的疑難雜癥?

王小川:現(xiàn)在來看是不能,就是把現(xiàn)有知識學(xué)會,并不是創(chuàng)造新知識。醫(yī)學(xué)主要是靠經(jīng)驗總結(jié),不是基礎(chǔ)發(fā)現(xiàn),未來要是有長期的數(shù)據(jù)挖掘還是有機會的。

Q:技術(shù)是百川非常核心的差異點,最近你提到和醫(yī)生合作非常必要,但不能只根據(jù)醫(yī)生的需求確定技術(shù)的迭代方向,M1、M2、M3主要是沿著怎樣的方向迭代?

王小川:我們主要的定義是什么叫作模型的好,就是從技術(shù)推理走向臨床需求,既需要足夠懂AI,也需要在具體場景跟醫(yī)生溝通,F(xiàn)在我們主要強調(diào)四個重要方向:醫(yī)療本身的推理能力,能夠給出正確的解決,減少幻覺,醫(yī)療搜索或者循證能力,就是從專業(yè)的知識庫抽取證據(jù),包括臨床指南級別的基礎(chǔ)科研,甚至是監(jiān)管的證據(jù)準確性足夠高,搜集信息的能力就是以問診為核心。M3發(fā)布以后,四個方向已經(jīng)補全了。

Q:很多醫(yī)療問題不只是技術(shù)的問題,你們在技術(shù)之外,有沒有和監(jiān)管機構(gòu)建立信任?

王小川:會有,我們跟三甲醫(yī)院、基層醫(yī)院都有溝通。我們在藥廠都有臨床試驗,沒有哪個互聯(lián)網(wǎng)AI公司在干這個。我們就是以藥廠的身份和醫(yī)院合作,把我們的產(chǎn)品當作藥物驗證安全性和臨床性,都會有Clinical Trial。

Q:30億好像不夠燒。

王小川:夠燒,要看是什么標準。我們是患者的Companion,可能一款藥十年十億美金,成功率10%,那肯定不夠燒,但美國FDA正在鼓勵一個Digital Companion指導(dǎo)用藥,藥效就會提升。一款老藥的有效性是70%,通過算法可以提到75%,相當于發(fā)明一款新藥,既不需要十年十億美金也不會成功率只有10%,就是范式變化帶來的結(jié)果。我們就是藥物伴隨,F(xiàn)ollow-up。

Q:要讓藥企為服務(wù)買單?

王小川:有可能,我們的群里面會拉五個人,有醫(yī)生,有護士,有AI,有患者,有患者家屬。

Q:相當于CRC的工作。

王小川:類似,我們要告訴患者那是AI,雖然很像人,為了讓患者愿意主動跟AI去聊,其他的真人還要裝扮成AI的樣子。

Q:你們是從哪個腫瘤開始做?

王小川:應(yīng)該是從肺開始做起。

Q:AI屬于一個黑盒,會不會有額外的難度?

王小川:AI其實是有思維鏈的,可以真正像人一樣思考。要看危害性有多大,有效性有多大。

Q:之前你很少發(fā)聲,為什么現(xiàn)在愿意把大家聚在一起聊一聊?

王小川:就是跟大家重新建立連接,之前被罵慘了。

Q:可能因為行業(yè)到了爆發(fā)的節(jié)點。

王小川:我們從第一天開始就想做醫(yī)療,但被裹挾以后干了很多醫(yī)療以外的事情,現(xiàn)在吸取教訓(xùn),每個新人都要直接面試,看一看是不是想做醫(yī)療。

Q:你們?yōu)槭裁聪胱鲠t(yī)療?不是什么好干的事情。

王小川:生命本身就很有意思,規(guī)律已經(jīng)很顯著了。原來我是學(xué)計算機的,研究的是高強度計算,搞的是天氣預(yù)報,但我覺得天氣預(yù)報太不靠譜了,有一點變化結(jié)果就會不同。老板問我,那你想干什么?我說就搞人類基因組計劃吧。

真的是從2000年開始搞基因拼接算法,發(fā)現(xiàn)這個比天氣預(yù)報還天氣預(yù)報,更復(fù)雜更混沌,但結(jié)論又更清楚。一個細胞有細胞膜、細胞核,十個月以后受精卵就會變成嬰兒,跟爸媽長得很像。

我當時的好奇心就在于生命比天氣預(yù)報還復(fù)雜,憑什么背后有規(guī)律?所以花時間去研究,總想找到背后的數(shù)學(xué)模型,現(xiàn)在就需要數(shù)據(jù)驅(qū)動,語言模型能夠解決智力問題,這就是我最初的動力。理論不能解釋現(xiàn)象,你能說現(xiàn)象不對嗎?只有理論不對,所以這是特別有意思的話題。這個時代已經(jīng)很好了,前面二十年干互聯(lián)網(wǎng),這二十年就干人類基因。(作者|李程程,編輯|李玉鵬)

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
據(jù)說:市面上90%的烤鴨都是用這種做的?你還吃嗎?

據(jù)說:市面上90%的烤鴨都是用這種做的?你還吃嗎?

今朝牛馬
2026-01-08 18:32:41
吃他汀猝死的人增多?醫(yī)生含淚告誡:天冷吃他汀,必須多關(guān)注6點

吃他汀猝死的人增多?醫(yī)生含淚告誡:天冷吃他汀,必須多關(guān)注6點

健康之光
2026-01-13 10:51:03
歷史唯一!湖人為了詹姆斯主動在球衣上放騎士和熱火的元素!

歷史唯一!湖人為了詹姆斯主動在球衣上放騎士和熱火的元素!

氧氣是個地鐵
2026-01-13 11:06:26
59歲女子成功誕下4斤4兩男嬰,產(chǎn)婦:因大女兒長期定居國外,夫妻倆感到寂寞,57歲開始備孕

59歲女子成功誕下4斤4兩男嬰,產(chǎn)婦:因大女兒長期定居國外,夫妻倆感到寂寞,57歲開始備孕

觀威海
2026-01-13 15:34:07
Here we go!羅馬諾:羅馬將以總價2500萬歐簽下18歲前鋒瓦斯

Here we go!羅馬諾:羅馬將以總價2500萬歐簽下18歲前鋒瓦斯

懂球帝
2026-01-13 18:04:23
這只會裝死的羊火了,有人出1萬高價買它,羊主人拒絕:多少不賣

這只會裝死的羊火了,有人出1萬高價買它,羊主人拒絕:多少不賣

三農(nóng)雷哥
2026-01-13 17:36:24
蘇州多地突聞巨響,窗戶震動,像“炸雷”!相關(guān)部門回應(yīng):非爆炸事故,原因正調(diào)查

蘇州多地突聞巨響,窗戶震動,像“炸雷”!相關(guān)部門回應(yīng):非爆炸事故,原因正調(diào)查

揚子晚報
2026-01-13 19:45:13
TA:巴薩更衣室完全沒預(yù)料到阿隆索會下課;弗里克地位被鞏固

TA:巴薩更衣室完全沒預(yù)料到阿隆索會下課;弗里克地位被鞏固

懂球帝
2026-01-14 00:45:08
“搖人按豬”女孩呆呆最新回應(yīng):今日家里不再舉辦刨豬宴;當?shù)匚穆茫嚎紤]把1月11日設(shè)立為合川“殺豬節(jié)”

“搖人按豬”女孩呆呆最新回應(yīng):今日家里不再舉辦刨豬宴;當?shù)匚穆茫嚎紤]把1月11日設(shè)立為合川“殺豬節(jié)”

大風新聞
2026-01-13 12:03:03
我把女客戶當成妻子發(fā)了條照片,1小時后她回:500萬的合同取消了

我把女客戶當成妻子發(fā)了條照片,1小時后她回:500萬的合同取消了

今天說故事
2026-01-12 13:03:43
又大又白!韓國極品“奶!

又大又白!韓國極品“奶牛”

碧波萬覽
2026-01-14 00:26:32
我同居過5位女性,發(fā)現(xiàn)女性40歲過后,找伴侶都有三個共同點

我同居過5位女性,發(fā)現(xiàn)女性40歲過后,找伴侶都有三個共同點

千秋文化
2026-01-13 20:35:52
東航MU5735三周年祭,民航局回復(fù):相關(guān)信息不予公開

東航MU5735三周年祭,民航局回復(fù):相關(guān)信息不予公開

干史人
2025-12-17 19:00:05
楊瀚森被棄因禍得福,開拓者超巨傷退球隊或擺爛,小楊轉(zhuǎn)正成基石

楊瀚森被棄因禍得福,開拓者超巨傷退球隊或擺爛,小楊轉(zhuǎn)正成基石

二哥聊球
2026-01-13 11:22:35
上世紀40年代,日本只差285米就能發(fā)現(xiàn)大慶油田,最后為何放棄了

上世紀40年代,日本只差285米就能發(fā)現(xiàn)大慶油田,最后為何放棄了

文史道
2026-01-10 18:44:25
多家存儲封測廠漲價:漲幅約三成 后續(xù)不排除啟動第二波漲價

多家存儲封測廠漲價:漲幅約三成 后續(xù)不排除啟動第二波漲價

財聯(lián)社
2026-01-12 09:18:10
安徽一市3人被通報!另有4人被查,其中1人系主動投案

安徽一市3人被通報!另有4人被查,其中1人系主動投案

鳳凰網(wǎng)安徽
2026-01-13 18:09:45
離婚才3個月,高調(diào)談?wù)撛倩榈睦顏嗼i,沒給海哈金喜留一絲體面

離婚才3個月,高調(diào)談?wù)撛倩榈睦顏嗼i,沒給海哈金喜留一絲體面

人間無味啊
2026-01-14 00:15:59
A股,一個“重磅利空”信號傳來,明天,或?qū)⒂瓉泶笞儽P!

A股,一個“重磅利空”信號傳來,明天,或?qū)⒂瓉泶笞儽P!

另子維愛讀史
2026-01-13 19:40:36
見證歷史!50萬億存款搬家, 相當于40%GDP, 錢正瘋狂流向兩大方向

見證歷史!50萬億存款搬家, 相當于40%GDP, 錢正瘋狂流向兩大方向

現(xiàn)代小青青慕慕
2026-01-12 16:43:32
2026-01-14 01:32:49
鈦媒體APP incentive-icons
鈦媒體APP
獨立財經(jīng)科技媒體
128890文章數(shù) 861627關(guān)注度
往期回顧 全部

科技要聞

每年10億美元!谷歌大模型注入Siri

頭條要聞

李在明訪日與高市早苗會談 提到中國

頭條要聞

李在明訪日與高市早苗會談 提到中國

體育要聞

他帶出國乒世界冠軍,退休后為愛徒返場

娛樂要聞

蔡卓妍承認新戀情,與男友林俊賢感情穩(wěn)定

財經(jīng)要聞

"天量存款"將到期 資金會否搬入股市?

汽車要聞

限時9.99萬元起 2026款啟辰大V DD-i虎鯨上市

態(tài)度原創(chuàng)

家居
時尚
親子
公開課
軍事航空

家居要聞

現(xiàn)代簡逸 尋找生活的光

今年春天,外套長一點會更美!

親子要聞

孕激素的威力算是見識到了!網(wǎng)友:喝不下水,膽汁吐沒了就吐泡泡

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

美媒:美對伊朗行動選項"遠超傳統(tǒng)空襲"

無障礙瀏覽 進入關(guān)懷版