国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

首發(fā)|杭州GPU獨角獸再獲超10億融資,要把百萬Token成本壓至一分錢

0
分享至


芯東西(公眾號:aichip001)
作者 程茜
編輯 漠影

芯東西4月20日報道,剛剛,浙江杭州GPU創(chuàng)企曦望完成新一輪超10億元融資,這是2026年AI產(chǎn)業(yè)全面邁入”推理落地、智能體普及”時代后,國內(nèi)GPU賽道誕生的最大單筆融資之一。

本輪資金將用于新一代S3推理GPU的規(guī)?;慨a(chǎn)交付、全棧軟件生態(tài)建設(shè),以及S4/S5后續(xù)芯片的研發(fā)迭代。

此次融資由多家產(chǎn)業(yè)方戰(zhàn)投、地方國資及頭部財務(wù)機構(gòu)共同參與。豪華投資方陣容正用真金白銀,押注這家主攻推理的國產(chǎn)GPU創(chuàng)企。至此,分拆獨立僅一年多的曦望已累計完成7輪融資,總?cè)谫Y額約40億元,成為國內(nèi)首家估值超百億的純推理GPU獨角獸。

作為國內(nèi)首家All in推理的GPU企業(yè)、首批實現(xiàn)推理GPU萬卡級交付的芯片公司,曦望成立于2020年,前身是商湯科技大芯片部門,2024年底分拆獨立運營,目前其團隊規(guī)模約400余人,集結(jié)來自英偉達、AMD、昆侖芯、商湯等企業(yè)的研發(fā)人才。

如今其已悉數(shù)亮相三顆芯片,最新的啟望S3是曦望為下一代大模型推理打造的高性價比GPU芯片,致力于以極致的單位算力成本,全面開啟AI推理的“一分錢時代”。


智能體時代,企業(yè)損益表正被全面重構(gòu)。智能體已然成為核心生產(chǎn)力,以O(shè)penClaw為代表的智能體應(yīng)用迅速走紅,數(shù)據(jù)中心也隨之轉(zhuǎn)型為持續(xù)吞吐海量數(shù)據(jù)、輸出智能內(nèi)容的“Token工廠”。在未來的AI服務(wù)體系中,Token將成為可直接計價的數(shù)字商品,AI服務(wù)也將依據(jù)吞吐量、速率、智能密度等維度對其進行分層定價。

在這樣的行業(yè)邏輯下,成本與效率成為競爭的關(guān)鍵勝負手,誰能將單位Token成本壓至更低、讓能效比達到更高,誰就能占據(jù)市場主導地位。

而從創(chuàng)立之初便深耕推理領(lǐng)域的曦望,恰好踩中了智能體時代的核心命門:正如芯片領(lǐng)域?qū)摹⑿阅?、面積的極致追求一樣,若能將AI推理成本大幅降低90%,同時保障服務(wù)穩(wěn)定可靠,便能真正改寫中國AI產(chǎn)業(yè)的損益結(jié)構(gòu),讓AI從高投入的燒錢模式走向可持續(xù)的商業(yè)化正循環(huán)。

一、智能體時代,Token成本成企業(yè)關(guān)鍵運營指標

過去數(shù)年,AI發(fā)展核心圍繞訓練展開,參數(shù)、集群、算力投入決定模型能力上限;如今AI深度參與各類復雜工作,直接推動行業(yè)焦點轉(zhuǎn)向推理。

這一趨勢的重要性,被一組關(guān)鍵數(shù)據(jù)印證:英偉達創(chuàng)始人、CEO黃仁勛在GTC 2026大會稱,過去兩年AI推理計算量增長約一萬倍、使用量增長約一百倍。


▲英偉達創(chuàng)始人兼CEO黃仁勛GTC大會演講

2026年初的OpenClaw熱則直接改寫了Token消耗邏輯,AI智能體一次復雜任務(wù)會觸發(fā)數(shù)十次連續(xù)推理請求,Token消耗由此呈現(xiàn)指數(shù)級爆發(fā)的態(tài)勢。


▲OpenRouter平臺上AI模型每周使用量趨勢

這背后對企業(yè)而言就是不可預估的成本。本月初,外媒The Information拿到一份Meta內(nèi)部追蹤員工Token使用量的數(shù)據(jù),過去30天內(nèi),Meta全員Token總消耗量超過60萬億個,若按照當時Claude Opus 4.6的公開定價估算,其排名第一月均使用2810億Token的用戶,一個月的成本就超過140萬美元(約合人民幣954萬元)。

更值得警惕的是,大量Token并未被有效利用,而是被無效浪費,成為企業(yè)算力賬單的隱形成本。Hyperbolic聯(lián)合創(chuàng)始人金宇晨曾在社交平臺X平臺上吐槽,GPT-5.4 Pro是他用過最愛“過度思考”的模型,他僅發(fā)了一句簡單的“Hi”,模型直接燒掉80美元。


這進一步推高云廠商硬件與運營成本,導致全球云廠商集體漲價。3月至今,阿里云、百度云、騰訊等國內(nèi)云廠商紛紛官宣調(diào)價,阿里云平頭哥真武810E等算力卡產(chǎn)品上漲5%—34%,文件存儲CPFS(智算版)上漲30%;百度智能云AI算力相關(guān)產(chǎn)品上調(diào)約5%—30%,并行文件存儲上調(diào)約30%。云廠商的一系列調(diào)價動作,本質(zhì)上都是推理成本壓力的直接傳導。

Token爆發(fā)、云廠商漲價的雙重作用下,企業(yè)推理成本壓力愈發(fā)凸顯。推理服務(wù)能否長期穩(wěn)定運行、實現(xiàn)高效吞吐、控制合理成本,已成為企業(yè)核心的訴求。

與之對應(yīng),行業(yè)不再單純追逐芯片峰值算力,而是通過系統(tǒng)級創(chuàng)新,重新定義“每瓦Token”這一核心KPI,以此破解成本困局。

對企業(yè)而言,過去比拼的是工人、設(shè)備與廠房規(guī)模;而在智能體時代,核心競爭力將取決于單位成本能調(diào)用多少有效Token、每個智能決策能創(chuàng)造多少價值。

“每瓦Token”不僅是技術(shù)指標,更是企業(yè)關(guān)鍵的運營成本指標。同等電力、同等機柜空間下,能產(chǎn)出更多有效Token,意味著企業(yè)可以用更少機房、更低電費支撐更大業(yè)務(wù)規(guī)模,在算力密集型競爭中構(gòu)筑顯著的成本壁壘。

這一背景下,中國已成為這場全球算力革命的核心戰(zhàn)場。根據(jù)OpenRouter數(shù)據(jù),中國大模型周調(diào)用量已連續(xù)6周超美國,周調(diào)用量達?12.96萬億Token?,是?美國的4.28倍。中國已成為全球AI推理最大市場,推理成本的壓力與機遇在此集中顯現(xiàn)。

一方面,國內(nèi)擁有旺盛的推理算力需求和海量豐富的應(yīng)用場景,為推理技術(shù)的迭代與落地提供了堅實基礎(chǔ);另一方面,企業(yè)對低成本AI的迫切訴求,也倒逼行業(yè)加速探索成本優(yōu)化的路徑。

AI要實現(xiàn)像水電一樣普及,第一道必須攻克的關(guān)口,就是將推理成本從“元級”壓縮至“分級”。而破解這一困局的關(guān)鍵解法之一,便是打造一類為推理而生、為成本優(yōu)化、為規(guī)?;渴鹆可矶ㄖ频膶貵PU。

二、能落地、能萬卡、能省錢,才是下一代推理算力的真正門檻

作為國內(nèi)首家All-in推理的GPU企業(yè),曦望是在行業(yè)集體卷訓練、拼參數(shù)時,基于產(chǎn)業(yè)發(fā)展判斷做出的反共識但極具前瞻性的戰(zhàn)略選擇。

其核心目標不是取代、對標訓推一體GPU或通用AI芯片,而是只做推理分流側(cè)翼與成本優(yōu)化層,在不改動客戶現(xiàn)有技術(shù)棧的前提下,直接實現(xiàn)降本增效,用更高的推理性能重構(gòu)AI產(chǎn)業(yè)成本結(jié)構(gòu)。

如今曦望已形成芯片、解決方案、生態(tài)三位一體布局,而這整套體系直接回答的就是一個問題:推理GPU,究竟該強在哪里?

今年1月,曦望發(fā)布的新一代推理GPU芯片啟望S3,正是對這一問題的有力回應(yīng)。作為國內(nèi)首款搭載LPDDR6且兼容LPDDR5X內(nèi)存的推理GPU,S3從AI Core計算架構(gòu)到內(nèi)存IO系統(tǒng)進行了全鏈路重構(gòu)

在計算層,S3進行了深度定制,其推理性能較上一代S2提升5倍,目標是實現(xiàn)Token成本下降90%

S3實現(xiàn)了極致算子利用率、智能體原生微架構(gòu)、全鏈路FP4低精度三大核心突破。包括128-bit、3D指令集搭配獨立線程調(diào)度,配合片上數(shù)據(jù)復用技術(shù),適配智能體復雜推理;原生支持FP16到FP4低精度運算,主流大模型推理效果接近無損,吞吐量較FP16提升3~4倍,直接提升客戶盈利空間;將GEMM、Flash Attention利用率分別提升至約99%、98%,硬件有效算力與并發(fā)能力大幅提升。


在系統(tǒng)層,S3集成LPDDR6內(nèi)存接口技術(shù)、高速SerDes+SUE融合互聯(lián)技術(shù)、PCIe Gen6接口技術(shù)三大先進高速接口,解決了智能體三大核心瓶頸。

首先LPDDR6方案使得S3帶寬充足、容量大幅提升、功耗降50%+;兼容 LPDDR5x,可靈活推出多規(guī)格產(chǎn)品,覆蓋邊緣至云端推理,可以破解推理場景大容量、高性價比、低功耗的核心需求。

其次, S3采用了片上原生融合Scale-Up+Scale-Out雙模底座;以太網(wǎng)超節(jié)點引擎支持一跳直達、硬件加速集合通信,利舊交換機并可壓延遲至百納秒級;集成RDMA引擎,優(yōu)化KV Cache零拷貝傳輸,支持32–256彈性組網(wǎng)。這一系列創(chuàng)新是針對智能體多模型協(xié)同瓶頸的有效解法。

最后PCIe Gen6接口技術(shù)下,S3帶寬較Gen5翻倍,支撐多路高速網(wǎng)卡與NVMe 集群;構(gòu)建顯存-DRAM-NVMe三層異構(gòu)KV Cache,實現(xiàn)熱溫冷數(shù)據(jù)分層管理,高效擴展容量;同時兼容業(yè)界標準,無縫融入云原生高性能體系。這對應(yīng)解決的是智能體的資源碎片化問題。

由此可見,S3押注的是,徹底剝離訓練能力,專為大模型推理做原生深度優(yōu)化。其砍掉訓練相關(guān)模塊后,節(jié)省的晶體管與功耗全部傾斜于推理,讓單位面積有效算力效率提升超5倍。

因此一定程度上可以說,S3是更適合智能體時代的原生芯片。在曦望董事長徐冰看來,S3不是簡單的性能升級,而是一次對AI推理成本曲線的重構(gòu)。他們的目標是將推理成本降至“百萬Token一分錢”,讓AI像水電一樣成為普惠基礎(chǔ)設(shè)施。

這與當下的智能體浪潮不謀而合,智能體時代真正的瓶頸不在模型能力,而在規(guī)?;?、低成本、高穩(wěn)定的推理供給。

在芯片之外,曦望已構(gòu)建起完整硬件矩陣,包括寰望超節(jié)點集群、辰望計算平臺、寰望AI計算集群,其中,寰望SC3-256超節(jié)點可支持千億、萬億級參數(shù)多模態(tài)MoE推理,同?量級下,成本僅為千萬元級別。

曦望并未止步于硬件層,而是持續(xù)向上延伸,構(gòu)建起完備的算法與生態(tài)能力,實現(xiàn)大模型適配優(yōu)化、AI算法平臺、場景定制算法,同時自研AI軟件棧、CUDA兼容生態(tài)、主流框架支持。

從芯片到集群,從底層軟件到上層算法,可以看出,曦望的All-in推理不是口號,而是真正從芯片到系統(tǒng)的全棧重構(gòu)。

三、芯片基因+AI洞察,曦望領(lǐng)跑推理算力時代

對算力發(fā)展清晰研判需要對AI和芯片的洞察都更清晰。從商湯大芯片部門獨立而來的曦望,就自帶“芯片基因+AI應(yīng)用經(jīng)驗”,為其切入新一代算力賽道構(gòu)筑了先天壁壘。

其領(lǐng)導團隊精準搭建了以AI產(chǎn)業(yè)布局、芯片頂尖研發(fā)、互聯(lián)網(wǎng)產(chǎn)品商業(yè)化為核心的“黃金三角”架構(gòu):

曦望董事長徐冰是商湯聯(lián)合創(chuàng)始人,曾于?港中??學博?在讀期間與導師湯曉鷗教授共同創(chuàng)辦商湯。商湯不僅是彼時國內(nèi)AI領(lǐng)域的標桿企業(yè),更在2021年成功登陸港股,成為“港股AI第一股”,其在AI算法、場景應(yīng)用上積累了經(jīng)驗。

負責研發(fā)的曦望聯(lián)席CEO王勇,是前AMD、昆侖芯的核心架構(gòu)師,有20年芯片研發(fā)經(jīng)驗,主導昆侖芯及曦望多代芯?的研發(fā)量產(chǎn)。2020年加入商湯后,他帶領(lǐng)百人團隊主導了曦望兩代芯片的研發(fā)和量產(chǎn),均實現(xiàn)一次性成功點亮。

與王勇的技術(shù)研發(fā)能力形成互補,另一位聯(lián)席CEO王湛擁有憑借豐富的互聯(lián)網(wǎng)產(chǎn)品運營經(jīng)驗,王湛是百度創(chuàng)始團隊成員、前資深副總裁,曾領(lǐng)導數(shù)千?團隊打造了百度搜索引擎產(chǎn)品。


▲曦望董事長徐冰、曦望聯(lián)席CEO王勇、曦望聯(lián)席CEO王湛(從左至右)

憑借核心團隊的獨特優(yōu)勢,曦望在算力與AI賽道中形成了差異化競爭力。

其核心團隊親身經(jīng)歷國內(nèi)最早一批大規(guī)模AI應(yīng)用、人臉識別、自動駕駛、多模態(tài)等多個技術(shù)周期與應(yīng)用場景,歷經(jīng)用戶需求的反復打磨捶打,對AI技術(shù)的落地痛點、算力需求的核心痛點有著更為精準的洞察,也讓曦望成為更懂AI的GPU芯片企業(yè)。

在這樣的布局下,曦望目前的團隊規(guī)模已經(jīng)達到400余人,研發(fā)人員占比超過80%,匯聚了英偉達、AMD、華為海思、百度昆侖芯、阿里巴巴、商湯等各賽道的頭部企業(yè)人才,且核心技術(shù)人才平均擁有15年行業(yè)經(jīng)驗。

基于對AI和芯片賽道的判斷,曦望從創(chuàng)立之初便立足企業(yè)業(yè)務(wù)需求側(cè),聚焦為客戶核算實際價值賬,而非單純比拼參數(shù),由此搶先卡位推理時代。

曦望董事長徐冰透露,2026年,曦望將圍繞”落地、兌現(xiàn)、增長”核心原則,全力推進S3芯片量產(chǎn)交付,完成與國內(nèi)外主流大模型、多模態(tài)模型和Agent框架的全面適配。同時,該公司已完成S4高性能推理GPU和S5安全可控推理GPU的技術(shù)路線規(guī)劃,持續(xù)加碼近存計算、光電共封等前沿技術(shù)探索。

曦望的資本化布局正在穩(wěn)步推進,2026年2月,其完成股份制改造,成為浙江省首家完成股改的GPU企業(yè),深度融入杭州爭創(chuàng)全國AI創(chuàng)新發(fā)展第一城的發(fā)展大局。

本次投資方的代表為杭州資本,這是其緊扣杭州“296X”先進制造業(yè)集群建設(shè)戰(zhàn)略、深耕AI能萬億級產(chǎn)業(yè)賽道的重要布局,他們認為,曦望“All-in推理”的戰(zhàn)略選擇具備行業(yè)前瞻性,其在技術(shù)創(chuàng)新和產(chǎn)品商業(yè)化方面的能力,是他們決定投資的重要原因。作為長期資本,杭州資本更看重企業(yè)在關(guān)鍵技術(shù)方向上的持續(xù)投入與落地能力。

結(jié)語:AI產(chǎn)業(yè)進入能效決勝時代

當下AI產(chǎn)業(yè)已從拼參數(shù)、堆算力的粗放階段,進入單位Token成本與能效比的精細化競賽。對企業(yè)而言,Token成本不斷下探,就意味著其商業(yè)化邊界能不斷拓寬。

未來,智能體帶來的鏈式調(diào)用與并發(fā)爆發(fā),將直接推動Token需求增長10倍乃至百倍,推理算力的缺口只會持續(xù)拉大。最終,這場以Token效率為核心的革命,將讓AI真正融入千行百業(yè),從技術(shù)概念變?yōu)閷嶓w經(jīng)濟的增長引擎。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
認罪剛一天!許家印長子每月4100萬生活費,家族資產(chǎn)黑幕全揭開

認罪剛一天!許家印長子每月4100萬生活費,家族資產(chǎn)黑幕全揭開

番外行
2026-04-20 12:46:52
售價55.98萬元!理想L9 Livis定檔5月15日上市并開啟交付

售價55.98萬元!理想L9 Livis定檔5月15日上市并開啟交付

CNMO科技
2026-04-20 18:20:15
女子酒窩大被網(wǎng)友質(zhì)疑是AI特效 本人:是真的 一直都被人說大

女子酒窩大被網(wǎng)友質(zhì)疑是AI特效 本人:是真的 一直都被人說大

快科技
2026-04-20 16:40:42
“劉儀偉,我們的百億去哪了?”大片投資騙局受害人聯(lián)名質(zhì)問

“劉儀偉,我們的百億去哪了?”大片投資騙局受害人聯(lián)名質(zhì)問

文娛春秋Plus
2026-04-20 09:00:08
2000噸英國潛艇消失,我國暗中打撈拆解研究,39年后首相卻上門討要

2000噸英國潛艇消失,我國暗中打撈拆解研究,39年后首相卻上門討要

睡前講故事
2026-03-30 13:48:58
多名院士調(diào)查發(fā)現(xiàn):吃一口放久變軟的香蕉,或等于進一次毒?真假

多名院士調(diào)查發(fā)現(xiàn):吃一口放久變軟的香蕉,或等于進一次毒?真假

今日養(yǎng)生之道
2026-04-21 00:21:19
細節(jié)流出!銀行行長被恒大歌舞團圍獵!許家印的“紅樓”往事

細節(jié)流出!銀行行長被恒大歌舞團圍獵!許家印的“紅樓”往事

大江看潮
2026-04-21 09:50:44
重慶交運物流有限公司因違規(guī)轉(zhuǎn)包被暫停全軍物資工程服務(wù)采購資格

重慶交運物流有限公司因違規(guī)轉(zhuǎn)包被暫停全軍物資工程服務(wù)采購資格

齊魯壹點
2026-04-21 11:07:25
伊朗外交部發(fā)言人:美方蓄意封鎖已構(gòu)成戰(zhàn)爭罪和反人類罪

伊朗外交部發(fā)言人:美方蓄意封鎖已構(gòu)成戰(zhàn)爭罪和反人類罪

環(huán)球網(wǎng)資訊
2026-04-19 20:48:11
湖人官方:東契奇和里夫斯缺陣與火箭的系列賽G2

湖人官方:東契奇和里夫斯缺陣與火箭的系列賽G2

懂球帝
2026-04-21 08:03:19
悲催!網(wǎng)傳陜西一女子因丈夫婚內(nèi)出軌后輕生,逝者已40天未入土…

悲催!網(wǎng)傳陜西一女子因丈夫婚內(nèi)出軌后輕生,逝者已40天未入土…

火山詩話
2026-04-21 06:02:18
總裁外派我三年后召我回國,秘書悄悄說:您太太在瑞士有家了

總裁外派我三年后召我回國,秘書悄悄說:您太太在瑞士有家了

曉艾故事匯
2026-04-18 15:18:37
大量硼砂,別再給家里人吃了!這10類食物最易摻硼砂,超危險

大量硼砂,別再給家里人吃了!這10類食物最易摻硼砂,超危險

笑熬漿糊111
2026-04-13 00:05:12
58股今日獲機構(gòu)買入評級

58股今日獲機構(gòu)買入評級

證券時報
2026-04-21 18:04:05
突發(fā)!002837暴大雷了,21萬股民放聲大哭!

突發(fā)!002837暴大雷了,21萬股民放聲大哭!

新浪財經(jīng)
2026-04-21 18:09:24
快訊!外媒連夜熱議中國首過橫當后或?qū)⒂腥箬F拳繼續(xù)教訓日本

快訊!外媒連夜熱議中國首過橫當后或?qū)⒂腥箬F拳繼續(xù)教訓日本

達文西看世界
2026-04-21 12:00:49
“中年返貧三件套”,正在吞掉一代人的存款

“中年返貧三件套”,正在吞掉一代人的存款

十點讀書
2026-04-18 18:36:15
尷尬!董宇輝被吐槽:喜歡支教,一天沒去;不喜歡帶貨,一天沒停

尷尬!董宇輝被吐槽:喜歡支教,一天沒去;不喜歡帶貨,一天沒停

火山詩話
2026-04-21 06:59:47
6月1日起全國工地統(tǒng)一用工新規(guī),明確60歲以上農(nóng)民工上崗標準

6月1日起全國工地統(tǒng)一用工新規(guī),明確60歲以上農(nóng)民工上崗標準

阿嚼影視評論
2026-04-20 21:02:56
69年陳云下放江西,時任省委書記拒不見面,陳云:此人膽子很大

69年陳云下放江西,時任省委書記拒不見面,陳云:此人膽子很大

鑒史錄
2026-04-20 22:03:41
2026-04-21 20:16:49
芯東西 incentive-icons
芯東西
專注AI芯片、半導體產(chǎn)業(yè)媒體
2288文章數(shù) 8153關(guān)注度
往期回顧 全部

財經(jīng)要聞

現(xiàn)實是最大的荒誕:千億平臺的沖突始末

頭條要聞

挪用1700萬打賞主播女生已自首 警方:能否立案需調(diào)查

頭條要聞

挪用1700萬打賞主播女生已自首 警方:能否立案需調(diào)查

體育要聞

62歲,成為中國足壇最火的人

娛樂要聞

周潤發(fā)時隔16年再賣樓,變現(xiàn)數(shù)億資產(chǎn)

科技要聞

創(chuàng)造4萬億帝國、訪華20次,庫克留下了什么

汽車要聞

全新坦克700正式上市 售價42.8萬-50.8萬元

態(tài)度原創(chuàng)

親子
時尚
藝術(shù)
旅游
公開課

親子要聞

專注力對孩子的影響超乎想象,你可能錯過了一個學霸

今年春夏最流行的4組通勤穿搭,誰穿誰時髦!

藝術(shù)要聞

任伯年寫竹,真帶勁

旅游要聞

軟萌來襲!三只黑天鵝寶寶亮相翠湖公園

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版