国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

八位AI算力CEO:2026,算力舊規(guī)則正在作廢

0
分享至



AI越厲害,面臨的瓶頸越「降維」。

作者丨趙之齊 劉伊倫

編輯丨包永剛

自DeepSeek在去年春節(jié)出圈以來,春節(jié)已然成了AI行業(yè)的“狂歡季”。

各大晚會連番登臺的機器人、科技從業(yè)者們在代碼堆里守歲,本身就是一種隱喻:AI正逐漸長成社會運轉中不能停下的“基礎設施”。

站在馬年的新起點,雷峰網(wǎng)對話了算力產(chǎn)業(yè)鏈上八家標桿企業(yè)的CEO,探討AI給算力產(chǎn)業(yè)帶來的種種邏輯重塑。

有趣的是,如今,行業(yè)看待AI的方式正在經(jīng)歷一場集體“降維”:當技術紅利階段性觸達天花板,真正決定行業(yè)生死的命題變得更加具體且真實——

電力缺口、存儲產(chǎn)能瓶頸、算力利用率與成本、硬件連接與算法協(xié)同,乃至AI給組織架構帶來的深層顛覆等等……(算力鏈面臨挑戰(zhàn)的更多細節(jié),歡迎添加作者微信Ericazhao23交流)

作為這場變革的親歷者,CEO們親述的八個片段互為印證,共同拼湊出算力產(chǎn)業(yè)當下最核心、真實的命題。

01

需求狂飆,基建托底

當算力需求越來越大,IDC基建作為根基,會面臨什么新的挑戰(zhàn)?

秦淮數(shù)據(jù) CEO 吳華鵬:GW級智算不是蓋「完美大樓」,而是搭「可拆裝積木」


我是一個有著強烈技術信仰的人。

親歷互聯(lián)網(wǎng)和移動互聯(lián)網(wǎng)風起云涌的30年,在當前,我強烈感受到數(shù)據(jù)中心行業(yè)正站在由AI重構產(chǎn)業(yè)格局的新起點上。

過去一年,GW(吉瓦,10億瓦特)級智算園區(qū)這一“新物種”,已成為行業(yè)發(fā)展的重要方向,但超大規(guī)模算力如何與電力體系適配、協(xié)同,依然挑戰(zhàn)重重。

這一瓶頸的核心在于:算力需求和建設規(guī)模在爆發(fā)式增長,但新能源體系的支撐能力,尚未完全匹配發(fā)展需求。

具體來看,矛盾主要集中在三個層面:

一方面,GW級園區(qū)一年的耗電量堪比一座中等城市,傳統(tǒng)分步拓建的電力基建模式,面對“整體規(guī)劃預留、分階段規(guī)?;桓丁钡慕ㄔO需求,已經(jīng)很難滿足。

其二,GW級園區(qū)要求高比例綠電,但高比例新能源接入后,在負荷波動、熱源管理、智能控制等方面,都還沒有足夠成熟的方案應對。

而在如此龐大的用電基數(shù)下,效率每提升一個百分點,都意味著巨大的商業(yè)價值——這也讓效率優(yōu)化擁有了前所未有的緊迫性。

而外部的技術供應和市場競爭,仍在給行業(yè)帶來不確定性。

GPU 產(chǎn)能、進口相關因素,會直接影響算力部署節(jié)奏。同時,頭部企業(yè)扎堆涌入烏蘭察布、中衛(wèi)這類核心節(jié)點,讓優(yōu)質電力、土地資源的爭奪越來越激烈,企業(yè)拿資源的難度明顯加大。

整體看下來,行業(yè)競爭的核心,已經(jīng)從“拼規(guī)?!保D向“規(guī)?!迸c“質量”并重。相對完善的能源解決方案,是當下數(shù)據(jù)中心企業(yè)突破瓶頸的關鍵一環(huán)。

在這方面,我們通過與東陽光集團的戰(zhàn)略整合,已經(jīng)取得實質性進展。去年9月,東陽光牽頭的銀團以280億元現(xiàn)金收購秦淮數(shù)據(jù)中國區(qū)全部業(yè)務,今年1月完成股權交割。

過去幾個月,我們已在韶關、烏蘭察布、宜昌簽約重點項目,“東數(shù)西算”十大集群,秦淮已落子過半。目前,我們投運及在建IT容量近1GW,儲備與規(guī)劃容量達到4GW。接下來還將在烏蘭察布,和東陽光聯(lián)手打造國內首個GW級超大規(guī)模綠電直供垂直一體化產(chǎn)業(yè)示范區(qū)。

此外,我們還聯(lián)合東陽光以及產(chǎn)業(yè)鏈伙伴,推出全球首個基于SST(固態(tài)變壓器)的算力中心智能直流供電商業(yè)化方案,將于今年4月在張家口懷來正式投運。

這個方案能讓電力轉換效率達到98.5%,是業(yè)內最高水平;單功率柜輸出功率達1MW,占地面積僅1㎡,相較傳統(tǒng)方案減少50%以上。與此同時,面對AI GPU負載的劇烈波動,這個系統(tǒng)還能主動調節(jié)供電策略,實時智能應對。

這些業(yè)務進展,為我們建設GW級園區(qū)奠定了堅實基礎。但我也深知,打造GW級AI算力中心,不是蓋一棟一步到位、極致完美的樓,而是搭一套“可拆裝的積木”——

面對算力、電力、技術的多重不確定性,解決方法是采用模塊化、分期建設和能力解耦,達成彈性交付。

AI革命將掀起一場持續(xù)20年的技術浪潮,在這之中,焦慮和壓力都在所難免,堅守初心就更為關鍵。結合我的體悟,我也想與管理者們共勉:

堅持做行業(yè)中的“良幣”,錨定底層邏輯、持續(xù)創(chuàng)新、走長期主義,才能在這場AI革命里立得住、走得遠。

作為基建中同樣重要的參與者,云廠商在AI時代的護城河會是什么?

UCloud CEO 季昕華:AI迭代進入「月更」時代,云廠商面臨跨學科的認知重塑


當下,AI技術迭代速度極快,幾乎每隔一個月就會出現(xiàn)一次行業(yè)級突破,行業(yè)模型與應用的市場熱度呈指數(shù)級增長,這些都要求我們云廠商具備高頻、高強度持續(xù)學習的能力深入理解跨學科、跨行業(yè)的產(chǎn)業(yè)鏈條,在理解AI技術本質的基礎上,推動業(yè)務聯(lián)動與生態(tài)合作,才能實現(xiàn)商業(yè)價值的最大化。

我和團隊觀察下來,目前限制行業(yè)突破的核心瓶頸,在于對AI的認知水平

對AI技術發(fā)展的認知,決定我們跟進的速度;對AI使用效果的認知,決定我們使用的廣度;對AI商業(yè)發(fā)展的認知,決定我們投入的力度;對AI影響能力的認知,決定我們成長的高度。

去年,我們負責了一項海外千卡智算中心項目,這本身就是一個復雜度極高的綜合性工程。

我們不僅需要把控產(chǎn)品本身的能力,還必須統(tǒng)籌各類場外因素——從前期的工地勘察、架構建設,到中期的物流運輸、測試模擬,再到后期的集群構建和優(yōu)化保障,每個環(huán)節(jié)都要統(tǒng)籌到位,挑戰(zhàn)很大。

而在海外落地,難度還要再上一個量級。

我們面對的是多樣化的國家政策與市場環(huán)境,前期要投入大量精力調研和實地考察;到交付階段,還會遇到許多不可控因素——國際政治形勢、當?shù)胤煞ㄒ?guī)、極端天氣、海關流程等,都可能成為棘手的挑戰(zhàn),導致項目延期。

好在,團隊頂住了壓力,穩(wěn)步推進著項目。當客戶最終完成壓力測試,系統(tǒng)平穩(wěn)上線運行的那一刻,我們連續(xù)數(shù)月緊繃的神經(jīng)終于得以放松。

在海外拓展布局的過程中,客戶一直很理解、支持我們。許多新節(jié)點資源一上線,就迅速被客戶采購一空。我們對此深懷感激,并對未來的合作與市場前景保持樂觀。

但與此同時,業(yè)界也普遍感受到:由于內存、存儲、CPU等核心硬件產(chǎn)能不足,供應鏈正出現(xiàn)顯著波動。這可能引發(fā)各行業(yè)在傳統(tǒng)IT支出上出現(xiàn)結構性調整,后續(xù)走勢仍需持續(xù)觀察。

并且,每次具有突破性的新模型發(fā)布,都可能重塑競爭格局,使得資源有限的中小企業(yè)面臨更大壓力。正如當年GPT系列的出現(xiàn),導致大量傳統(tǒng)NLP公司被洗牌出局,持續(xù)的迭代浪潮可能令類似的歷史再次上演。

做難而正確的事,有如推石上山。我們清醒地知曉其重量與反復,而真正的選擇在于:手不松,步不止。價值,就在這持續(xù)的攀登之中。

在2026年,我們將堅定AI和全球化兩大戰(zhàn)略。

AI層面,我們將圍繞六大方向繼續(xù)深入:基礎模型、行業(yè)模型、AI應用、AI+硬件、機器人和無人駕駛,以及Agent拓展。例如,AI創(chuàng)新應用層面,我們將繼續(xù)以UModelVerse模型服務平臺為載體,通過token計費方式,讓初創(chuàng)企業(yè)在AI成本支出更為可控;同時,我們推出的Agent Sandbox可以降低AI Agent的生產(chǎn)應用門檻,為AI真正自主處理高復雜度、高風險任務提供基礎設施級保障。

全球化層面,我們將加速完善全球云計算服務網(wǎng)絡,計劃在2026年新增更多海外服務節(jié)點,重點助力中國企業(yè)、尤其是一帶一路沿線市場的出海業(yè)務發(fā)展。

02

算力決勝點:場景與成本

算力資源完成初步沉淀后,如何將裸金屬高效轉化為開發(fā)者可用的“數(shù)字燃料”,成了算力運營商必須回答的命題。

并行科技董事長、CEO 陳?。篈I Coding主導Token需求,「高效、穩(wěn)定、低成本」將成為算力服務競爭焦點


2025年,人工智能領域經(jīng)歷了一場由規(guī)模化應用驅動的深刻變革,大模型Token調用量爆炸式增長,這一變化直接引發(fā)了算力供需關系、技術優(yōu)化焦點和產(chǎn)業(yè)競爭格局的連鎖反應。

作為衡量大模型應用規(guī)模的核心指標,日均Token調用量在2025年實現(xiàn)驚人突破,全市場Token使用量同比增長300倍,且全球Token技術標準統(tǒng)一,采用開源模型的企業(yè)呈現(xiàn)一致發(fā)展態(tài)勢。

一方面,Token需求暴漲的重要場景是AI Coding,業(yè)界預測到2030年,絕大多數(shù)代碼將由AI自動生成,這既是IT行業(yè)的自我革新,也是AI成為通用技術的基礎。2025年全年,Token使用量的一半集中在AI Coding領域,也標志著大模型正式進入規(guī)?;a(chǎn)階段。

不過,在我看來,Token使用量激增的核心誘因是成本優(yōu)化。2025年初,DeepSeek憑借極高的性能與成本優(yōu)勢,實現(xiàn)了Token成本10倍的性價比提升,將大模型使用門檻降低一個數(shù)量級。

在這波浪潮中,并行科技也成功將在線服務的Token成本大幅降低,從一百多元降至幾元,離線模式更是可能降至1元以下,主力Token成本整體下降近30倍,TPS(每秒Token輸出量)也提升10倍,達到行業(yè)前沿水平。

回望2025年,市場呈現(xiàn)“一卡難求——供大于求——年底優(yōu)質卡一卡難求”的快速輪回。需求端看,我和團隊認為,當前主要分為三類:頭部大模型企業(yè)的超大規(guī)模訓練需求(企業(yè)數(shù)量縮減至不足20家,但單家需求量翻倍)、推理服務需求(含Token生成,達萬卡級別且快速增長)、科研研發(fā)需求(穩(wěn)步增長)。但供給端一側,則因2023-2024年小規(guī)模智算中心無序建設、供應鏈不穩(wěn)定等影響,供給形勢多次反轉。

對此,并行科技采取“彈性供給”和高效資源調度策略,使自有GPU算力利用率在2025年上半年達到85%-90%的飽和狀態(tài),且在12月市場轉向供不應求前,通過多次大規(guī)模采購提前鎖定優(yōu)質算力資源,從容應對2026年初優(yōu)質算力“一卡難求”的格局。

但2025年算力市場帶來的挑戰(zhàn)仍在繼續(xù):受AI需求暴漲與產(chǎn)能不足的雙重影響,全球顯存、GPU顯存、內存及閃存等存儲產(chǎn)品大幅漲價,直接導致服務器成本翻倍,嚴重制約了算力資源的擴建進程。

不過,在這之中,也蘊含著國產(chǎn)算力的重要發(fā)展機遇。從政策層面和資本市場資金流向來看,國產(chǎn)算力正在呈現(xiàn)出百花齊放的態(tài)勢,從小規(guī)模適配邁向大規(guī)模單集群生態(tài)建設的新階段,既強調“大規(guī)?!辈季?,也注重“生態(tài)”適配,加速與國際市場接軌。

2026年,行業(yè)對未來已經(jīng)達成這些共識:一是推理需求持續(xù)主導,隨著模型大規(guī)模部署,推理所需的算力規(guī)模和復雜度將遠超訓練,成為算力消耗的絕對主體;二是Agent成為主流形態(tài),大模型應用正從單一問答向能規(guī)劃、執(zhí)行、使用工具的智能體演進,要求底層服務架構重構;三是價值重心上移,未來競爭焦點不在于單純擁有算力,而在于能否提供高效、穩(wěn)定、低成本的模型服務和AI應用。

總結而言,2026年將是AI大規(guī)模商業(yè)化應用的元年。

成本之外,門檻仍在。如何讓非技術背景的企業(yè)能在多樣化的算力架構上,自由地生長出屬于自己的Agent生態(tài)?

九章云極 CEO 方磊:摒棄「規(guī)模噱頭」,場景適配才是智算產(chǎn)業(yè)的關鍵「勝負手」


站在2026年的新起點回望,2025年算力市場最大的變化,就是徹底告別了“盲目堆硬件”的狂熱,從“CPU云主導”邁入“GPU云崛起”的關鍵轉型期。

我和團隊最直觀的體會是,2025年行業(yè)核心瓶頸集中于“供需錯配”與“效率不足”。

一方面,傳統(tǒng)CPU云適配通用計算,與AI高并行、密集型需求存在本質矛盾,而“CPU+GPU混合數(shù)據(jù)中心” 既抬高了成本,又制約了GPU性能的釋放;

另一方面,算法從“深度學習”向“強化學習”躍遷,算力呈十倍、百倍級增長,但行業(yè)GPU平均利用率僅70%左右,且“裸金屬租賃”模式門檻高,導致中小企業(yè)與開發(fā)者難以高效使用算力,抑制產(chǎn)業(yè)創(chuàng)新活力。

同時,算力需求已進入集中爆發(fā)期:端到端模型訓練、仿真測試、車路協(xié)同等場景,都需要10倍以上的算力支撐,對算力的穩(wěn)定性、泛在性提出了更高要求。從全球格局看,國外頭部企業(yè)聚焦超大規(guī)模算力集群與專用芯片研發(fā),核心服務于高端訓練場景,但高昂的成本與封閉的生態(tài)體系,讓廣大中小企業(yè)難以觸及算力資源。

因此,算力的“普惠化”行動勢在必行

2025年,九章云極推出智算云平臺,依托Serverless與強化學習相關技術,實現(xiàn)了萬卡至十萬卡級異構算力的統(tǒng)一調度,將AI智能體訓推流程簡化至一行代碼即可啟動,讓更多主體能夠參與到AI創(chuàng)新中來。

與此同時,行業(yè)正經(jīng)歷關鍵躍遷:競爭核心從預訓練時期的“拼規(guī)?!钡胶笥柧殨r期的“拼效率”,強化學習作為驅動模型進化的核心引擎,已成為下一代智算基礎設施的剛性需求;智能體已從“純對話交互”,轉向“復雜任務執(zhí)行”,工業(yè)控制、流程自動化、城市治理等實景場景,催生出海量碎片化、動態(tài)化的算力訴求。

基于此,我們團隊也在兩個方向上發(fā)力:

一方面,繼續(xù)推進強化學習云的工業(yè)級落地,以全異步訓練架構、離線回放算法等核心技術,讓中小企業(yè)無需承擔高昂投入即可完成專家模型訓練;

另一方面,針對智能體“執(zhí)行化”轉型需求,打通強化學習云與工具調用、復雜工作流的適配,延續(xù)按度計費的模式,支持一行代碼啟動訓練、推理、執(zhí)行,從而匹配從機器人調度到城市規(guī)劃的多元動態(tài)算力需求。

雖然當下行業(yè)里仍有“算力過?!薄捌髽I(yè)無真實算力需求”的聲音,市場也在糾結“是否要加速推進大規(guī)模、大體量算力布局”。

但我們始終堅持自己的判斷是,AI基礎設施仍處于發(fā)展上升期,長期潛力巨大。未來有能力開展模型訓練的主體會持續(xù)增多,算力需求的增長空間遠未觸頂,所謂“算力過?!敝皇嵌唐诠┬璨▌拥碾A段性現(xiàn)象,而非行業(yè)終局。

市場的反饋與實際體感也在印證我們的判斷:Forrester調研顯示,45%的中小企業(yè)選擇智算云服務,12%的獨立開發(fā)者將其作為核心支撐,企業(yè)對AI算力的使用邏輯已轉向“經(jīng)濟、彈性”,依托我們的智算云,部分客戶成本直接降低了40%。

最后,我想說說我對這個行業(yè)的理解:行業(yè)的勝負手不是誰的GPU更多,而是誰能放下“規(guī)模噱頭”,深耕場景適配,把算力變成企業(yè)“算著清、用得好”的基礎設施。

03

軟硬件新戰(zhàn)場

Context Window帶來巨大內存消耗、高帶寬DRAM走向供需失衡,需求端的反向施壓,為創(chuàng)新性技術方案的實現(xiàn)提供機遇。

昉擎科技 CEO 梁軍:Agent爆發(fā)與供應趨緊,AI基礎設施迎來「創(chuàng)新發(fā)展」窗口期


2025年年初,DeepSeek R1的發(fā)布引起巨大反響,Sparse MoE(稀疏混合專家模型)迅速成為主流。過去一年里,模型能力持續(xù)躍升、迭代速度顯著加快,各類應用也隨之快速普及。

然而,上層應用的繁榮與底層算力的就緒之間存在明顯的時間差。

針對Sparse MoE模型的計算特性,AI Infra在過去一年里實現(xiàn)了多層面的深度優(yōu)化,但由于芯片有固定的開發(fā)節(jié)奏,除了華為超節(jié)點方案外,國內其他芯片廠商的對應產(chǎn)品仍處于開發(fā)階段,這也制約了相關業(yè)務的增長。

瓶頸的出現(xiàn),讓行業(yè)在設計、部署Scale-Up集群上迅速達成共識。UALink、SUE及ESUN等Scale-Up通信協(xié)議標準進展非常迅速,產(chǎn)業(yè)鏈配套的通信協(xié)議IP、Switch、支持Scale-Up接口的算力芯片,以及Scale-Up集群硬件等各種產(chǎn)品的開發(fā)進展也全面提速。

另一方面,行業(yè)供應形勢持續(xù)趨緊:除了眾所周知的高帶寬DRAM供需失衡,還有不少部件、材料都面臨供應緊張的境況。

這一緊張態(tài)勢并非單純的周期性波動,而是應用范式變革對資源需求的結構性重塑。

Agent應用的爆發(fā)式增長,既要滿足超長Context Window(上下文窗口)帶來的巨大內存消耗,又需將Token成本壓縮至極致。

與此同時,Agent普及帶來的low latency(低時延推理)需求,正從需求端反向施壓,對系統(tǒng)軟硬件設計產(chǎn)生深遠影響。

這些變化讓行業(yè)面臨很大挑戰(zhàn),但也帶來發(fā)展機遇。

從模型、應用、AI Infra到底層軟硬件,各層面均在高速迭代演進,客觀上催生了巨大的市場機會,也為創(chuàng)新性技術方案的落地提供了寶貴的窗口期。

這一窗口屬于敢于冒險、擅長系統(tǒng)性思維的團隊。在諸多難題與挑戰(zhàn)之下,我們始終堅持以高標準方案和更基礎性的方式求解,這也讓我們團隊收獲超出預期的成果。

過去一年我們的多次實踐,都在不斷驗證這一方法論的有效性,也讓我們面對未來的信心更加堅定。

Token需求進入爆發(fā)期后,底層硬件碎片化的“互聯(lián)墻”不容小覷,行業(yè)要如何避免讓算力集群淪為性能孤島?

奇異摩爾 CEO 田陌晨:「互聯(lián)碎片化」成超節(jié)點瓶頸,AI下一戰(zhàn)拼的是交付


這波AI的發(fā)展,對硬件提出了雙重挑戰(zhàn):

一方面,市場上AI大模型數(shù)量快速增長,要求芯片廠商能廣泛且高效地適配;

另一方面,大模型領域技術迭代極快,多模態(tài)、世界模型等創(chuàng)新層出不窮,如今,市場重心也已經(jīng)明顯轉向:一是從追求規(guī)模擴張,轉向深耕性能;二是從“生成式AI”,轉向“AI Agent”這一形態(tài)。

尤其在推理場景中,不同應用場景對Prefill(預填充)與Decode(解碼)階段的需求不同,對時延、精度、功耗、可靠性等方面的側重點也不同,這些都會直接影響計算、互聯(lián)與存儲等各個模塊的設計

這也直接拉高了對硬件團隊的要求:

軟件技術演進常以“季度”甚至“月”為單位,芯片等硬件的迭代周期卻通常長達數(shù)年,因此,硬件研發(fā)團隊不僅要精通軟硬件深度技術、具備跨領域視野,還需具備前瞻性,能夠預判未來兩至三年的技術需求,以提前規(guī)劃硬件設計。

我們從2021年起,就預見到AI快速發(fā)展將面臨的網(wǎng)絡互聯(lián)瓶頸,在布局片內互聯(lián)芯粒產(chǎn)品后,也逐步構建起面向AI網(wǎng)絡互聯(lián)的全棧解決方案。

然而,這一路并非坦途:

2024年,我們已前瞻性地在超節(jié)點領域進行了技術和資源布局,但那時候“超節(jié)點”概念還沒有火起來,我們的工作顯得有些“超前”,這使得公司當時的資本化進程一度有些阻力。好在,有中科創(chuàng)星等早期投資人始終如一的信任,以及客戶和合作伙伴的并肩同行,到2025年,超節(jié)點成為AI訓推集群的關鍵技術焦點。

不過,制約超節(jié)點部署效率與可擴展性的核心瓶頸,也隨之顯現(xiàn):

超節(jié)點內部的各個計算單元,要依賴統(tǒng)一、高效的互聯(lián)協(xié)議,才能實現(xiàn)協(xié)同。然而,目前還沒有出現(xiàn)像以太網(wǎng)或移動通信那樣成熟且被廣泛接納的標準體系,這就導致不同廠家的設備很難兼容、互通,交換機和計算節(jié)點之間的對接方式,都是各家自己定制,這讓系統(tǒng)集成和后期維護都變得更復雜且麻煩。

盡管最近兩年間,國內外已涌現(xiàn)出多項致力于推進標準化的倡議與規(guī)范,如SUE、OISA、ETH-X、UALink等。然而,“生態(tài)碎片化”的解決并非單純的技術競賽,而是要依賴于產(chǎn)業(yè)鏈上下游的緊密協(xié)作。在我看來,短期內,多元技術標準并存的格局還會持續(xù)。

針對這一情況,奇異摩爾推出超節(jié)點互聯(lián)芯粒Kiwi G2G IOD——基于我們獨創(chuàng)的HPDE可編程架構,能支持不同的協(xié)議類型及其升級。

并且,早在2023年,奇異摩爾便作為首批核心生態(tài)成員,深度參與由中國移動牽頭的OISA 1.0協(xié)議制定工作。2025年,公司進一步參與到OISA 2.0協(xié)議的制定中,負責制定了協(xié)議中互聯(lián)芯粒部分的標準設計,還開發(fā)了業(yè)界首個OISA Scale up協(xié)議的驗證平臺。

2026年,我相信超節(jié)點的熱度仍會繼續(xù),且會進一步產(chǎn)業(yè)化。這背后也指向一個關鍵共識:AI時代的競技場,勝負在于交付——無論是觸達用戶的最終應用,還是支撐一切的底層硬件,真正拉開差距的,都是交付。

如今,硬件問題也不能僅靠硬件解決,如果無法在指令集與精度層面實現(xiàn)芯片與大模型的深度協(xié)同,算力天花板依然近在咫尺。

清程極智 CEO 湯雄超:「單向適配」不是終局,未來模型與芯片架構設計要互相指導


去年,我們比較關注大模型的推理部署場景。

印象里最焦慮的時候,可能是春節(jié)后在各種平臺上適配優(yōu)化DeepSeek模型:當時我們發(fā)現(xiàn),DeepSeek在一些平臺上很容易能運行起來,但在另一些平臺上卻會面臨很多挑戰(zhàn),算力平臺之間的差距非常大。

經(jīng)過團隊的努力,我們在幾個月后終于實現(xiàn)了計劃中的近10種算力平臺的推理部署方案。對比當時,其實可以明顯感受到,國產(chǎn)算力對新發(fā)布模型的支持速度已經(jīng)大幅提升——

從最初模型發(fā)布數(shù)月后才能完成適配,到后來往往新模型發(fā)布后幾天即可適配。去年WAIC大會期間,清程極智的“赤兔”推理引擎更是實現(xiàn)了國產(chǎn)算力對新模型的0 Day支持,讓GLM4.5模型發(fā)布當天就能在華為昇騰算力上推理部署。

適配速度的加快,體現(xiàn)了國產(chǎn)算力上的軟件生態(tài)不斷成熟。今年初,我們和T-One孵化器聯(lián)合發(fā)布了一份大模型API服務行業(yè)報告,在和幾十家做大模型API服務的伙伴溝通后發(fā)現(xiàn),國產(chǎn)算力是真實可用的,但與此同時,硬件架構差異帶來的問題,無法通過軟件手段完全解決。

以往大家認為,軟硬件分別面臨生態(tài)成熟度與絕對性能上的差異,但到了2025年,新興大模型算法架構與國際先進算力的硬件架構綁定得更加緊密,其影響已經(jīng)超出通常意義上的“軟件生態(tài)”范疇。

例如,去年初開源的DeepSeek-V3/R1模型,是基于FP8數(shù)據(jù)精度原生訓練與推理的,但當時國產(chǎn)算力硬件架構并不支持FP8。我們預感到后續(xù)會有更多模型采用FP8、FP4這類新興低精度數(shù)據(jù)類型,于是,清程極智就通過軟件的方式,在國產(chǎn)算力上實現(xiàn)了FP8精度的計算,后來又進一步完成了FP4精度的軟件支持。

但這僅僅解決了易用性問題,讓用戶能在國產(chǎn)算力平臺上快速跟進最新大模型與數(shù)據(jù)精度,卻無法從硬件底層真正提升模型的實際運算速度。

而現(xiàn)在,低精度算力已逐漸成為智能算力的主流配置。在海外高端算力芯片中,F(xiàn)P4算力普遍能達到BF16算力的6-8倍。如果國產(chǎn)算力只是在BF16算力上追平海外產(chǎn)品,卻沒有在硬件層面補齊對FP4精度的支持,那么其真實有效算力依然只有海外芯片的零頭,很難形成性價比優(yōu)勢。

好在去年很多國產(chǎn)算力廠商在下一代芯片規(guī)劃中,都提出將支持低精度的算力類型,比如昇騰950就支持FP4。預計2026年,硬件架構的差異有望進一步縮小。

但在我看來,國產(chǎn)算力在硬件架構上逐步對齊海外特性,還只是早期階段。根本的解決方案,應該是國產(chǎn)算力和大模型研發(fā)機構更緊密地合作:讓大模型算法的發(fā)展需求指導芯片架構的設計,芯片架構也反過來指導大模型的算法設計。

放眼2026,大模型推理對算力的需求仍將保持高速增長,并且,無論是大模型算法架構還是底層硬件設計,都會更加多樣化——

模型方面,去年主流還是基于自回歸解碼的文本類模型,今年則會出現(xiàn)更多擴散模型與多模態(tài)模型;算力方面,除了類GPU架構和NPU架構,一些架構更激進的算力也將開始量產(chǎn)。在這樣百花齊放的格局下,可能會碰撞出新的“硬件-算法”協(xié)同的行業(yè)最優(yōu)解。

國產(chǎn)算力在功能上已經(jīng)能滿足大量實際場景的需求,但在絕對性能和性價比上,仍需進一步提升,才能真正建立商業(yè)優(yōu)勢。這需要全行業(yè)共同努力,實現(xiàn)市場化的正向循環(huán)。

04

顛覆全棧

最后,當?shù)讓蛹夹g棧逐步打通、Agent 真正成長為新一代操作系統(tǒng),一個更重磅、更根本的命題也隨之到來:

人類,是否已準備好向 AI 移交決策權?

PPIO CEO 姚欣:敢不敢放權給AI,是屬于人類的「奇點時刻」


過去業(yè)界將2045年視為“奇點臨近”,認為跨過奇點后,智能將指數(shù)級迭代、機器進化速度會遠超人類。但在我看來,2025年已經(jīng)過了奇點的拐點。

回看去年,DeepSeek的爆發(fā)讓我們團隊很興奮。一季度我們快速加碼算力、對接需求,全力沖刺MaaS業(yè)務增長。但到了五六月,市場風向突然轉變——開發(fā)者更傾向選擇海外價格更高的閉源模型。

這一度讓我們陷入焦慮:PPIO核心業(yè)務MaaS,跟開源模型生態(tài)息息相關,只有開源模型足夠強,才能帶動MaaS和算力需求增長。但我始終對開源非常堅定——從PC互聯(lián)網(wǎng)到移動互聯(lián)網(wǎng),歷次浪潮幾乎都遵循“閉源開辟、開源統(tǒng)治”的規(guī)律,這一輪AI浪潮也不會例外。

所以我們堅持到九月十月,終于,國內大模型迎來爆發(fā)。臨近春節(jié)這段時間,我們也幾乎每天都在對接新模型,春節(jié)大家可能也休息不了。這個過程對我們來說,痛并快樂著。

不過,模型能力只是單點突破,我們始終相信Agent層才是開發(fā)者真正的“操作系統(tǒng)”。去年Agent技術棧還不成熟,大多停留在概念與雛形階段;但春節(jié)前OpenClaw的誕生,已經(jīng)讓行業(yè)看到全新的機會和希望。

最近還讓我震撼的是,Cursor的CEO拿GPT 5.2寫了三百多萬行代碼,基本復現(xiàn)了chromium 瀏覽器,要知道寫瀏覽器的難度挑戰(zhàn)和操作系統(tǒng)是一個級別的,由此可以看出,AI已經(jīng)幾乎沒有寫不了的代碼。

在這背后,我也看到了技術方向上的“會師”:OpenClaw這類Agent的“權力”太大了,有很大的安全隱患??梢?,今天的AI基礎設施,已經(jīng)不再僅僅是為人設計,同時也要為AI服務——高彈性、高并發(fā)、高任務響應、甚至長時記憶能力,都是AI原生的核心需求。

作為經(jīng)歷過互聯(lián)網(wǎng),移動互聯(lián)網(wǎng)多個時代的連續(xù)創(chuàng)業(yè)者,我認為當下又是一個重大的技術范式變遷,我們過去的各類軟硬件都是針對人的使用體驗設計的,但是行業(yè)正從“以人使用為中心設計Infra”,轉向“以AI或機器為中心設計的Infra”。我們去年推出的Agent沙箱系統(tǒng),恰好就可以成為Agent Infra的核心組件——在保障高效運行的同時,實現(xiàn)安全隔離與風險可控。

與此同時,在需求爆發(fā)的背景下,算力的梯次利用與精細化調度也變得至關重要。未來算力需求的增長速度會大幅領先于今天算力供應速度,行業(yè)會進入一段長期供不應求的時段。

而一個愈發(fā)清晰的趨勢是:越是傳統(tǒng)的組件,越容易成為新的瓶頸。

我在本屆CES觀察到,GPU行業(yè)已在為產(chǎn)能實現(xiàn)十倍、百倍增長做準備,但其他組件完全沒跟上,比如硬盤,過去20年每年的產(chǎn)能只上漲平均3%-5%。這就意味著,我們已經(jīng)進入到基礎設施的綜合博弈,木桶短板效應會集中爆發(fā)。

因此,我們今年的目標也很明確:全?;腿蚧?。前者是打通從IaaS、MaaS到Agent Infra的端到端技術能力;后者則是依托不同區(qū)域的資源優(yōu)勢,在日本、歐洲、東南亞等地進一步布局,挖掘更多元的算力供給與市場機會。

我還有個觀察:未來制約AI普及與應用深度的關鍵,不在于技術或算力,而在于企業(yè)組織能力能否跟上AI的迭代速度

今年我會在公司內部推進全面向AI Native組織轉型。這背后是一個根本性命題:當機器在效率與智能水平上全面超越人類時,組織與管理者是否敢于放權

如果我們的決策依然依賴冗長流程、追求100%絕對安全、所有事項最終都需要CEO簽字確認,決策效率必然被嚴重制約。這就是人類史上又一把 “達摩克利斯之劍”:在安全與效率、穩(wěn)定與進化之間,如何做出抉擇?

這將是人類自身的奇點時刻。

作者長期關注AI算力鏈條,歡迎添加作者微信Ericazhao23交流。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
人有沒有腸息肉,看吃飯就知道?腸內長息肉,吃飯或有這5個表現(xiàn)

人有沒有腸息肉,看吃飯就知道?腸內長息肉,吃飯或有這5個表現(xiàn)

小童歷史
2025-10-11 14:26:11
今年返程自駕為何這么堵?7小時變20小時,真相扎心了

今年返程自駕為何這么堵?7小時變20小時,真相扎心了

石辰搞笑日常
2026-02-26 00:10:03
香港第一風水師陳朗,因助人改命受天譴,李嘉誠花費千萬為他續(xù)命

香港第一風水師陳朗,因助人改命受天譴,李嘉誠花費千萬為他續(xù)命

郁郁乎文
2024-07-07 22:25:36
百合立大功?研究發(fā)現(xiàn):百合可在 24 小時清除 45% 炎癥因子?

百合立大功?研究發(fā)現(xiàn):百合可在 24 小時清除 45% 炎癥因子?

醫(yī)哥聊健康
2026-02-16 10:17:18
馬筱梅說出玥兒箖箖不能回北京上學原因,表示老三會在北京上學

馬筱梅說出玥兒箖箖不能回北京上學原因,表示老三會在北京上學

到此為止的印象
2025-12-31 03:40:43
發(fā)現(xiàn)奇怪的現(xiàn)象:你呵斥了孩子,孩子敢回嘴,說明這個家庭還有救

發(fā)現(xiàn)奇怪的現(xiàn)象:你呵斥了孩子,孩子敢回嘴,說明這個家庭還有救

明智家庭教育
2026-02-03 13:04:26
1968年,林彪想換北京軍區(qū)司令,毛主席只問了一句話,林彪徹底啞火

1968年,林彪想換北京軍區(qū)司令,毛主席只問了一句話,林彪徹底啞火

老杉說歷史
2026-01-09 22:00:17
不再看俄羅斯臉色!普京攔不住,第二個巴鐵誕生,防空全換中國造

不再看俄羅斯臉色!普京攔不住,第二個巴鐵誕生,防空全換中國造

劉森森
2026-02-26 01:04:23
深度揭秘?|?“種樹市長”的雙面人生:1.55億受賄款與40億綠化工程的黑色幽默

深度揭秘?|?“種樹市長”的雙面人生:1.55億受賄款與40億綠化工程的黑色幽默

一分為三看人生
2026-02-26 00:07:35
黃金突然變臉,2月25日之后,行情徹底不一樣了!

黃金突然變臉,2月25日之后,行情徹底不一樣了!

別人都叫我阿腈
2026-02-25 13:59:45
唯一參加四次起義的中共高級將領,受處分后脫黨,85歲在香港去世

唯一參加四次起義的中共高級將領,受處分后脫黨,85歲在香港去世

海佑講史
2026-02-12 07:00:11
3-5月好運上榜!這3個生肖人緣爆棚,機會主動找上門!

3-5月好運上榜!這3個生肖人緣爆棚,機會主動找上門!

毅談生肖
2026-02-25 12:28:44
段永平,加倉巨頭超1110%

段永平,加倉巨頭超1110%

證券之星
2026-02-25 16:56:04
哇塞!庫里杜蘭特又可能在一隊了!

哇塞!庫里杜蘭特又可能在一隊了!

柚子說球
2026-02-24 21:34:35
韓媒披露:韓軍方抗議駐韓美軍訓練時與中方戰(zhàn)機對峙,美軍司令向韓方道歉

韓媒披露:韓軍方抗議駐韓美軍訓練時與中方戰(zhàn)機對峙,美軍司令向韓方道歉

環(huán)球網(wǎng)資訊
2026-02-25 15:09:46
讓春晚導演給全國道歉,入美國籍回中國撈金,她到底有什么來頭?

讓春晚導演給全國道歉,入美國籍回中國撈金,她到底有什么來頭?

開著車去流浪
2026-02-20 00:41:31
76年周總理逝世,張春橋建議葉劍英致悼詞,葉拒絕:我情緒不穩(wěn)定

76年周總理逝世,張春橋建議葉劍英致悼詞,葉拒絕:我情緒不穩(wěn)定

微野談寫作
2026-02-22 07:25:09
57歲TVB御用師奶割雙眼皮爆哭,遠赴韓國改造盼重回黃金期

57歲TVB御用師奶割雙眼皮爆哭,遠赴韓國改造盼重回黃金期

TVB劇評社
2026-02-25 17:45:41
日本退將大膽預測:中日必有一戰(zhàn),日本很可能成為下一個烏克蘭

日本退將大膽預測:中日必有一戰(zhàn),日本很可能成為下一個烏克蘭

音樂時光的娛樂
2026-02-25 19:50:44
他們的勾當——警惕日本軍國主義在文體領域的滲透

他們的勾當——警惕日本軍國主義在文體領域的滲透

環(huán)球網(wǎng)資訊
2026-02-08 16:09:33
2026-02-26 03:27:00
雷峰網(wǎng) incentive-icons
雷峰網(wǎng)
關注智能與未來!
68592文章數(shù) 656079關注度
往期回顧 全部

科技要聞

“機器人只跳舞,沒什么用”

頭條要聞

女子爬山失聯(lián)10天后遺體被找到 丈夫:她登頂神情恐懼

頭條要聞

女子爬山失聯(lián)10天后遺體被找到 丈夫:她登頂神情恐懼

體育要聞

勇士爆冷惜敗鵜鶘 梅爾頓28分賽季新高

娛樂要聞

黃曉明新戀情!與小22歲美女同游新加坡

財經(jīng)要聞

上海樓市放大招,地產(chǎn)預期別太大

汽車要聞

750km超長續(xù)航 2026款小鵬X9純電版將于3月2日上市

態(tài)度原創(chuàng)

房產(chǎn)
健康
教育
數(shù)碼
軍事航空

房產(chǎn)要聞

海南樓市春節(jié)熱銷地圖曝光!三亞、陵水又殺瘋了!

轉頭就暈的耳石癥,能開車上班嗎?

教育要聞

2026馬年的中國境外留學市場會提速嗎?

數(shù)碼要聞

蘋果或年底發(fā)布觸屏OLED MacBook Pro 配M6系列芯片

軍事要聞

俄烏沖突四周年:和平談判希望渺茫

無障礙瀏覽 進入關懷版