国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

“百萬Token一分錢”,徐冰的AI算力新賭局

0
分享至



4月20日,一家名叫曦望(Sunrise)的國產(chǎn)GPU公司宣布完成超10億元新一輪融資,估值突破百億。對(duì)這家成立僅一年多、從商湯科技分拆出來的公司來說,這已經(jīng)是它的第七輪融資,累計(jì)融資約40億。

但真正讓人意外的不是這個(gè)數(shù)字。

翻開曦望的產(chǎn)品手冊(cè),你會(huì)發(fā)現(xiàn)一個(gè)奇怪的事實(shí):它的旗艦芯片啟望S3,居然“不會(huì)”訓(xùn)練大模型——它只做推理,徹底放棄了訓(xùn)練能力。

這在國產(chǎn)GPU公司競(jìng)相標(biāo)榜“訓(xùn)推一體”或“算力領(lǐng)先”的語境里,就像是自斷一臂。

曾有人私下問曦望董事長(zhǎng)徐冰:這不是把一半市場(chǎng)拱手讓人嗎?

他則回答說:“訓(xùn)練是巨頭的游戲,推理的需求看不到天花板?!?/p>

放棄訓(xùn)練,押注推理——這位商湯聯(lián)合創(chuàng)始人,押上了一盤誰也沒看懂的棋。

01

在創(chuàng)立曦望之前,徐冰是商湯科技最核心的創(chuàng)始團(tuán)隊(duì)成員之一。

2012年,徐冰在香港中文大學(xué)多媒體實(shí)驗(yàn)室攻讀博士,師從深度學(xué)習(xí)領(lǐng)域先驅(qū)湯曉鷗。彼時(shí),湯曉鷗團(tuán)隊(duì)剛剛發(fā)布了GaussianFace和DeepID兩套算法,人臉識(shí)別效果首次超越人類,登上了《自然》《科學(xué)》的報(bào)道。

2014年,徐冰和徐立、楊帆等人隨湯曉鷗共同創(chuàng)辦商湯科技,徐冰在其中負(fù)責(zé)資本運(yùn)作,主導(dǎo)了商湯累計(jì)超66億美元的融資,還操盤了港交所IPO,創(chuàng)下全球AI融資紀(jì)錄。

十年間,商湯從一個(gè)學(xué)術(shù)實(shí)驗(yàn)室成長(zhǎng)為亞洲最大的AI軟件公司之一。但徐冰很快發(fā)現(xiàn),商湯被同一個(gè)難題反復(fù)“卡脖子”:算力成本。

“在商湯的時(shí)候,我們每年要花大量資金采購算力,而且絕大部分流向海外?!币晃唤咏毂娜耸炕貞?,這個(gè)痛點(diǎn)始終沒有找到解法。

2020年,商湯下定決心在內(nèi)部組建大芯片部門,投入自研AI推理芯片。

五年過去,商湯的芯片團(tuán)隊(duì)成功量產(chǎn)了兩代產(chǎn)品,S1視覺推理芯片和S2大模型推理芯片,累計(jì)投入超20億研發(fā),交付量突破1萬片。但大芯片部門在上市公司體系內(nèi)始終面臨兩難:既無法像外部創(chuàng)業(yè)公司那樣靈活融資,又難以吸引最頂尖的芯片人才。

2024年底,商湯推出了“1+X”戰(zhàn)略,將芯片業(yè)務(wù)分拆獨(dú)立,命名為“曦望”。徐冰做出了一個(gè)大膽決定:辭去商湯執(zhí)行董事職務(wù),親自下場(chǎng)做芯片。

他還拉來了兩位關(guān)鍵人物:前AMD全球GPU首席架構(gòu)師、百度昆侖芯核心設(shè)計(jì)師王勇,以及百度創(chuàng)始團(tuán)隊(duì)成員、“鳳巢之父”王湛。

三人的分工也堪稱教科書級(jí)配置,王勇管技術(shù),王湛管產(chǎn)品和商業(yè)化,徐冰則統(tǒng)籌全局。2025年4月,為了說服王湛加入,徐冰在北京設(shè)了一場(chǎng)飯局,兩人從加微信到敲定合作,不到24小時(shí)。

02

所謂“曦望”,曦,破曉之光;望,遠(yuǎn)方的期許。但開局就選擇All-in推理、放棄訓(xùn)練,徐冰賭對(duì)了嗎?

要理解徐冰的選擇,得先看清AI算力市場(chǎng)正在發(fā)生什么。

過去幾年,大模型的競(jìng)爭(zhēng)圍繞一個(gè)詞展開:訓(xùn)練。誰的模型參數(shù)更大、誰的訓(xùn)練速度更快,誰就能贏。這催生了英偉達(dá)H100、A100等高端GPU的軍備競(jìng)賽。但徐冰的判斷是,游戲規(guī)則正在翻轉(zhuǎn)。

“訓(xùn)練市場(chǎng)是頭部玩家的游戲,門檻越來越高,收斂得很快?!彼f,“但推理是百花齊放的,需求看不到天花板?!?/p>

數(shù)據(jù)支撐了這個(gè)判斷。德勤預(yù)計(jì),2026年推理算力占整體AI計(jì)算的比例將達(dá)到約三分之二。中國市場(chǎng)更甚,2026年3月日均Token調(diào)用量已突破140萬億,較2024年初的1000億增長(zhǎng)超千倍。曦望測(cè)算,2026年AI推理計(jì)算需求將達(dá)到訓(xùn)練需求的4-5倍,推理算力租賃價(jià)格半年漲幅近40%。



訓(xùn)練是“一次性爆發(fā)”,即做一次訓(xùn)練花幾千萬,做完就結(jié)束了。推理則是“持續(xù)性消耗”,每一次用戶提問、每一次AI生成,都在消耗算力。調(diào)用規(guī)模一旦上來,成本就會(huì)成為決定企業(yè)能否盈利的關(guān)鍵。

但問題來了:市場(chǎng)上已有的GPU,幾乎都是“訓(xùn)推一體”的通用型產(chǎn)品。曦望聯(lián)席CEO王勇曾講過一個(gè)關(guān)鍵發(fā)現(xiàn):在做上一代產(chǎn)品S2的過程中,盡管實(shí)驗(yàn)室測(cè)試表現(xiàn)優(yōu)異,但到了客戶那里,芯片最終幾乎全部被用于推理場(chǎng)景。

原因很簡(jiǎn)單。訓(xùn)推一體芯片為了兼顧訓(xùn)練,采用了昂貴的高級(jí)封裝和HBM(高帶寬內(nèi)存),芯片成本和功耗居高不下。但在推理場(chǎng)景中,這些昂貴的算力資源實(shí)際利用率往往只有5%到10%,造成了巨大的電力浪費(fèi)和持有成本。

用王勇的話說:“用為訓(xùn)練優(yōu)化的昂貴芯片來做推理,性價(jià)比太低了。”

徐冰的解法是三個(gè)字:做減法。

啟望S3徹底砍掉了為訓(xùn)練準(zhǔn)備的冗余模塊。它沒有采用昂貴的HBM,而是選了成本低得多、但容量更大的LPDDR6內(nèi)存,顯存容量較上一代提升4倍。在計(jì)算核心上,S3將絕大部分面積用來加強(qiáng)FP4低精度算力,因?yàn)楝F(xiàn)在絕大部分推理運(yùn)算已經(jīng)是FP4了。

這套減法邏輯的成果令人咋舌:在DeepSeek V3/R1等主流大模型推理場(chǎng)景中,S3的單位Token成本較上一代產(chǎn)品下降約90%,整體性價(jià)比提升超過10倍。

徐冰的目標(biāo)是:“將推理成本降至‘百萬Token一分錢’,讓AI像水電一樣成為普惠基礎(chǔ)設(shè)施?!?/p>

03

曦望的策略,在國產(chǎn)GPU圈子里引發(fā)了不少爭(zhēng)議。

“不做訓(xùn)練,你的芯片會(huì)不會(huì)被客戶嫌‘不夠全面’?”有人當(dāng)面問王勇。

他的回答很硬核:“我們拒絕做‘跑分黨’。不希望用benchmark來定義芯片,而是希望能夠做到幫客戶賺錢的算力?!?/p>

這句話背后,藏著曦望與主流國產(chǎn)GPU廠商的根本分歧。過去幾年,國產(chǎn)GPU的競(jìng)爭(zhēng)邏輯很簡(jiǎn)單:參數(shù)對(duì)標(biāo)英偉達(dá)。誰家的FP16算力更高、誰家的顯存帶寬更大,誰就更“能打”。但徐冰和王勇認(rèn)為,推理場(chǎng)景的邏輯完全不同。推理的本質(zhì)不是“算得更快”,而是“算得更便宜、更穩(wěn)定”。

啟望S3針對(duì)兩個(gè)核心算子——GEMM和Flash Attention——做了深度優(yōu)化,算子利用率分別推至約99%與98%,標(biāo)稱算力幾乎全部轉(zhuǎn)化為有效吞吐。

它還圍繞Agent(智能體)的原生需求重新設(shè)計(jì)了指令集和微架構(gòu),精準(zhǔn)匹配智能體的復(fù)雜控制流,大幅提升多輪推理效率。

“推理側(cè)的效率瓶頸已不再是‘算力不夠’,而是‘算力用不滿’?!毙毂J(rèn)為,這恰恰是國產(chǎn)芯片可以彎道超車的地方。



當(dāng)然,僅僅有芯片遠(yuǎn)遠(yuǎn)不夠。任何一塊國產(chǎn)GPU要真正打入市場(chǎng),最大的攔路虎是英偉達(dá)的CUDA生態(tài)。全球數(shù)百萬開發(fā)者已經(jīng)習(xí)慣了在CUDA上寫代碼、跑模型,遷移成本高得驚人。

曦望的策略很務(wù)實(shí):打不過就兼容。

它在軟件棧上做到了95%的CUDA兼容,開發(fā)者幾乎可以無縫遷移。目前,曦望的軟件體系已適配ModelScope平臺(tái)90%以上的主流大模型形態(tài),包括DeepSeek、通義千問等。

但兼容只是第一步。曦望真正的野心,是重新定義算力的交付方式。

傳統(tǒng)模式下,客戶買GPU卡、搭服務(wù)器、做集群、適配模型,每一層都要自己折騰。徐冰提出的商業(yè)模式是“Token as a Service”——算力不再按卡賣,而是按Token消耗量計(jì)價(jià)。

用王湛的話說:“我們的競(jìng)爭(zhēng)不是‘又一個(gè)芯片’,而是‘重寫中國AI產(chǎn)業(yè)的損益表’?!?/p>

04

故事講到這里,聽起來一切都很順。但芯片創(chuàng)業(yè)從來不是童話。

曦望最大的挑戰(zhàn)不在技術(shù),而在生態(tài)。一位行業(yè)分析師直言不諱:“Hugging Face上有200萬個(gè)模型,頂尖國產(chǎn)GPU能順暢支持的只有幾十到幾百個(gè)?!奔幢汴赝龅搅?5%的CUDA兼容,要讓大量開發(fā)者真正遷移過來,還需要投入海量的生態(tài)建設(shè)成本——不是幾千萬,是幾十億。

競(jìng)爭(zhēng)對(duì)手也在提速。英偉達(dá)在2026年GTC大會(huì)上釋放了強(qiáng)烈的“防守”信號(hào)。它不再只賣GPU,而是推出包含CPU、DPU、NVLink、光子以太網(wǎng)的完整計(jì)算系統(tǒng),用全棧優(yōu)勢(shì)來抹平單一維度的成本優(yōu)勢(shì)。英偉達(dá)甚至花200億美元收購了AI推理初創(chuàng)公司Groq,補(bǔ)強(qiáng)推理能力。

國內(nèi)競(jìng)爭(zhēng)同樣激烈。摩爾線程、沐曦已相繼上市,華為昇騰910C也在推理市場(chǎng)試水,天數(shù)智芯公布了四代架構(gòu)路線圖,號(hào)稱2027年超越英偉達(dá)。曦望雖然率先聚焦推理賽道,但窗口期可能只有兩到三年。

徐冰的回應(yīng)很克制:“AI算力基建的重心已徹底切換。我們的目標(biāo)不是做最大的,而是做推理場(chǎng)景里最好的?!?/p>

曦望已規(guī)劃好未來三年的產(chǎn)品路線:2026年啟望S3量產(chǎn),2027年高性能推理芯片S4上市,2028年安全可控推理芯片S5上市。2026年的核心任務(wù)是推進(jìn)S3量產(chǎn)交付,完成與國內(nèi)外主流大模型、多模態(tài)模型和Agent框架的全面適配。



在中國科技創(chuàng)業(yè)的敘事里,我們習(xí)慣了“做大做強(qiáng)”的劇本:做全棧、做平臺(tái)、做生態(tài),恨不得把所有賽道都占滿。但徐冰和曦望的故事,給出了一個(gè)反向的啟示,有時(shí)候,戰(zhàn)略的關(guān)鍵不在于你做什么,而在于你不做什么。

放棄訓(xùn)練,不是能力不夠,而是看清了訓(xùn)練市場(chǎng)已被巨頭瓜分殆盡的現(xiàn)實(shí)。做減法,不是偷工減料,而是把所有資源押注在一個(gè)真正能發(fā)揮優(yōu)勢(shì)的細(xì)分戰(zhàn)場(chǎng)。

曦望的芯片不再追求“訓(xùn)練性能”這個(gè)虛名,而是直擊客戶最真實(shí)的痛點(diǎn)——單位Token成本。

這種“聚焦”的思維方式,在當(dāng)下中國商業(yè)環(huán)境中尤為珍貴。當(dāng)所有人都往同一個(gè)方向擁擠時(shí),敢于逆流而上的人,才可能開辟新路。

當(dāng)然,徐冰的賭局還遠(yuǎn)未到揭曉勝負(fù)的時(shí)刻。曦望的百億估值,既是市場(chǎng)對(duì)其技術(shù)路線的認(rèn)可,也是對(duì)其商業(yè)化能力的前置考驗(yàn)。400人的團(tuán)隊(duì)、40億的融資彈藥,真正的戰(zhàn)斗才剛剛打響。

百萬Token一分錢——這個(gè)聽起來像童話的目標(biāo),徐冰能把它變成現(xiàn)實(shí)嗎?

答案不在發(fā)布會(huì)上,而在接下來每一片芯片的流片良率里,在每一行驅(qū)動(dòng)代碼的適配效率里,在每一個(gè)客戶的信任與遷移里。

但至少,他選擇了那條更難、也更有可能贏的路。在中國AI芯片這條漫長(zhǎng)而崎嶇的征途上,敢于做減法,本身就是一種罕見的勇氣。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
公開開炮!文班亞馬炮轟NBA官方:賽季結(jié)束再來問我

公開開炮!文班亞馬炮轟NBA官方:賽季結(jié)束再來問我

體育妞世界
2026-04-28 00:50:03
80歲不管存款多少,記得提前給自己準(zhǔn)備4樣?xùn)|西,建議了解

80歲不管存款多少,記得提前給自己準(zhǔn)備4樣?xùn)|西,建議了解

小談食刻美食
2026-04-27 07:57:04
終于等到這一天!中國國防部發(fā)出最強(qiáng)音!

終于等到這一天!中國國防部發(fā)出最強(qiáng)音!

做個(gè)平凡的軒友
2026-04-27 06:55:08
山西澤州發(fā)生重大刑事案件,33歲嫌犯潛逃,警方發(fā)布協(xié)查通報(bào)

山西澤州發(fā)生重大刑事案件,33歲嫌犯潛逃,警方發(fā)布協(xié)查通報(bào)

極目新聞
2026-04-27 17:56:03
上海兩女子地鐵打架后續(xù):原視頻曝光,難怪年輕女孩不給老人讓座

上海兩女子地鐵打架后續(xù):原視頻曝光,難怪年輕女孩不給老人讓座

奇思妙想草葉君
2026-04-27 17:04:00
米飯被點(diǎn)名!醫(yī)生直言:米飯冷凍24小時(shí),抗性淀粉翻倍控糖護(hù)腸

米飯被點(diǎn)名!醫(yī)生直言:米飯冷凍24小時(shí),抗性淀粉翻倍控糖護(hù)腸

路醫(yī)生健康科普
2026-04-26 19:55:03
伊朗外長(zhǎng):美方請(qǐng)求談判,伊方正在考慮

伊朗外長(zhǎng):美方請(qǐng)求談判,伊方正在考慮

界面新聞
2026-04-27 22:24:15
美媒:以色列總統(tǒng)暫不赦免內(nèi)塔尼亞胡,尋求促成認(rèn)罪協(xié)議

美媒:以色列總統(tǒng)暫不赦免內(nèi)塔尼亞胡,尋求促成認(rèn)罪協(xié)議

澎湃新聞
2026-04-27 15:06:07
一場(chǎng)硬核風(fēng)力實(shí)驗(yàn),一見這屆頂級(jí)游戲本散熱有多強(qiáng)?

一場(chǎng)硬核風(fēng)力實(shí)驗(yàn),一見這屆頂級(jí)游戲本散熱有多強(qiáng)?

極果酷玩
2026-04-23 23:13:17
普京:俄羅斯將全力推動(dòng)中東盡快實(shí)現(xiàn)和平

普京:俄羅斯將全力推動(dòng)中東盡快實(shí)現(xiàn)和平

澎湃新聞
2026-04-28 04:11:05
斯諾克世錦賽:吳宜澤13-11塞爾比晉級(jí)8強(qiáng),等待特魯姆普和瓦菲的勝者

斯諾克世錦賽:吳宜澤13-11塞爾比晉級(jí)8強(qiáng),等待特魯姆普和瓦菲的勝者

懂球帝
2026-04-28 00:19:06
偉偉道來 | 伊朗為什么越來越強(qiáng)硬

偉偉道來 | 伊朗為什么越來越強(qiáng)硬

經(jīng)濟(jì)觀察報(bào)
2026-04-27 12:08:53
現(xiàn)在就業(yè)環(huán)境真的這么嚴(yán)峻嗎?

現(xiàn)在就業(yè)環(huán)境真的這么嚴(yán)峻嗎?

慧翔百科
2026-04-27 17:34:09
慘!請(qǐng)13個(gè)外國演員撐場(chǎng)面,上映2天虧了1億,這電影就是個(gè)笑話

慘!請(qǐng)13個(gè)外國演員撐場(chǎng)面,上映2天虧了1億,這電影就是個(gè)笑話

靠譜電影君
2026-04-26 22:14:35
生氣到砸桿,吳宜澤13-11塞爾比進(jìn)世錦賽8強(qiáng),從沒見這么差的比賽

生氣到砸桿,吳宜澤13-11塞爾比進(jìn)世錦賽8強(qiáng),從沒見這么差的比賽

真理是我親戚
2026-04-28 00:29:51
一大批高校,將搬遷!

一大批高校,將搬遷!

吉刻新聞
2026-04-27 16:08:43
菲政壇大地震,莎拉取消五國行,67億贓款被扒,父女倆徹底栽了?

菲政壇大地震,莎拉取消五國行,67億贓款被扒,父女倆徹底栽了?

影孖看世界
2026-04-27 23:40:49
5月1日起抽煙買煙迎來變化,6條紅線碰不得,違規(guī)就罰款!

5月1日起抽煙買煙迎來變化,6條紅線碰不得,違規(guī)就罰款!

老特有話說
2026-04-27 17:43:49
曼聯(lián)2-1險(xiǎn)勝:臨時(shí)主帥的歐冠門票,靠對(duì)手浪費(fèi)刷出來

曼聯(lián)2-1險(xiǎn)勝:臨時(shí)主帥的歐冠門票,靠對(duì)手浪費(fèi)刷出來

賽場(chǎng)速報(bào)局
2026-04-28 05:18:18
央視曝光兒童彩妝玩具問題,汕頭澄海區(qū)開展專項(xiàng)整治行動(dòng)

央視曝光兒童彩妝玩具問題,汕頭澄海區(qū)開展專項(xiàng)整治行動(dòng)

環(huán)球網(wǎng)資訊
2026-04-27 17:21:34
2026-04-28 05:51:00
觀瀾人物 incentive-icons
觀瀾人物
在這里看見不一樣的內(nèi)容!
124文章數(shù) 7關(guān)注度
往期回顧 全部

科技要聞

DeepSeek V4上線三天,第一批實(shí)測(cè)出來了

頭條要聞

普京就中東局勢(shì)明確表態(tài) 伊朗外長(zhǎng)當(dāng)面感謝

頭條要聞

普京就中東局勢(shì)明確表態(tài) 伊朗外長(zhǎng)當(dāng)面感謝

體育要聞

人類馬拉松"破二"新紀(jì)元,一場(chǎng)跑鞋軍備競(jìng)賽

娛樂要聞

黃楊鈿甜為“耳環(huán)風(fēng)波”出鏡道歉:謠言已澄清

財(cái)經(jīng)要聞

Meta 140億收購Manus遭中國發(fā)改委否決

汽車要聞

不那么小眾也可以 smart的路會(huì)越走越寬

態(tài)度原創(chuàng)

手機(jī)
房產(chǎn)
本地
教育
公開課

手機(jī)要聞

一加Nord CE6 Lite官宣5月7日發(fā)布,7000mAh電池

房產(chǎn)要聞

信號(hào)!海南商業(yè)版圖,迎來大變局!

本地新聞

云游中國|逛世界風(fēng)箏都 留學(xué)生探秘中國傳統(tǒng)文化

教育要聞

地理干貨|高中地理18類題型規(guī)范答題模板

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版