国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

當云計算開始在硅谷“造星”,一場自我革命開始了

0
分享至


作者 | 陳姚戈、王一鵬

亞馬遜云科技是 AI 時代最大的“造星平臺”嗎?

恐怕是的。

在拉斯維加斯 re:Invent 2025 的主舞臺上,年輕 AI 公司的接連登場,再次驗證了這位云計算老大哥的號召力:在啤酒和輪盤的烘托下,亞馬遜云科技在新一代創(chuàng)業(yè)者眼中依舊性感,還沒有成為年輕人口中的 “Boring Old Guy”。


比如,成立不到兩年、估值已達 31 億美元的 Decart AI,憑借全球首個實時視頻生成模型迅速躥紅。其創(chuàng)始人在 re:Invent 上表示:“Amazon Trainium3 是我們創(chuàng)造出‘實時視覺智能’這一全新技術(shù)的關(guān)鍵推動力?!?/p>

另一家以視頻理解見長的 TwelveLabs,則把自己的數(shù)據(jù)基礎(chǔ)設(shè)施核心建立在 Amazon S3 之上。創(chuàng)始人 Jay Lee 形容公司是“誕生于亞馬遜云科技的公司”,Amazon S3 Vectors 的加入,讓他們具備了規(guī)模化交付視頻智能解決方案的能力。

更搶戲的是蘋果的再次現(xiàn)身。

去年,蘋果首次站臺,宣布采用亞馬遜云科技芯片訓練 Apple Intelligence。今年,蘋果進一步分享了一項技術(shù)實踐成果:蘋果已經(jīng)將部分核心服務(wù)用 Swift 語言重寫,并將工作負載遷移至 Amazon Gravition 芯片運行,最終實現(xiàn) 40% 的性能提升與 30% 的成本降低。


“從 x86 架構(gòu)的過渡幾乎是無縫的,Java 服務(wù)的遷移近乎直接替換,這要歸功于 Amazon Graviton,”云系統(tǒng)和平臺部門副總裁 Payam Mirrashidi 分享,“蘋果早在十多年前就已轉(zhuǎn)向 ARM 架構(gòu)以驅(qū)動我們的設(shè)備。如今,我們同樣看到了基于 ARM 的 Amazon Graviton 在基礎(chǔ)設(shè)施層面帶來的價值——它讓我們從基礎(chǔ)設(shè)施中獲得了更高回報。更高的吞吐量意味著所需實例更少、成本更低、環(huán)境足跡更小,這對我們的客戶和地球而言是一場雙贏?!?/p>

可以說,這些估值飆升的新銳和謹慎的大廠,都對亞馬遜云科技的考量達成了共識。這種共識這可能來自亞馬遜云科技于基礎(chǔ)設(shè)施層面,大膽的自我革命和不知疲倦的工程優(yōu)化。

一場果決的自我革命

都說“船大難掉頭”,但對于奉行“兩個披薩原則”的亞馬遜云科技而言,倒也未必如此。當 AI 工作負載的復(fù)雜性與苛刻要求,撞上云計算固有的服務(wù)形態(tài),亞馬遜云科技幾乎沒什么猶豫——作為曾經(jīng)最堅定的無服務(wù)器(Serverless)倡導(dǎo)者,他們主動打破了親手建立的概念邊界。

2014 年,亞馬遜云科技推出 Amazon Lambda ,初衷是讓開發(fā)者徹底擺脫“服務(wù)器管理”這件繁重又低效的事情。

隨著云計算進入更復(fù)雜、更大規(guī)模的應(yīng)用場景,亞馬遜云科技發(fā)現(xiàn)客戶的需求已經(jīng)遠遠超出了當年的假設(shè)——他們一方面希望希望接入 Amazon EC2 技術(shù)、需要大規(guī)模場景下的可預(yù)測性能、更高的網(wǎng)絡(luò)吞吐量、亞毫秒級延遲 ,也不愿為了這些需求犧牲 Amazon Lambda 與生俱來的簡潔性。

亞馬遜云科技很早意識到這一結(jié)構(gòu)性矛盾。幾年前,它就將 Amazon Lambda 團隊與 Amazon EC2 團隊整合到同一個組織下,不再將計算僵硬地分類為 “服務(wù)器、容器、無服務(wù)器” ,而是將其看作一個選擇光譜。

今年的 re:Invent,亞馬遜云科技給出了這一戰(zhàn)略的關(guān)鍵拼圖——Amazon Lambda 托管實例(Amazon Lambda Managed Instances)。它允許開發(fā)者在專用的 Amazon EC2 上運行 Lambda 函數(shù);在用戶自主選擇實例類型和硬件規(guī)格的同時,仍能享受到 Amazon Lambda 帶來的便利。


這是一項足以改變 Serverless 定義的更新。亞馬遜云科技實際上為大型企業(yè)開辟了一條從 Amazon EC2 平滑進入 Amazon Lambda 的遷移路徑,讓那些原本因性能、成本或硬件需求而必須留在 Amazon EC2 上的穩(wěn)態(tài)工作負載,也能無縫銜接 Amazon Lambda。

FaaS 與容器服務(wù)的界線也因此進一步模糊。無服務(wù)器不再是一個要么接受,要么放棄的選擇,而是一系列可按需調(diào)節(jié)的服務(wù)。

亞馬遜云科技的第二場自我革命,則來自底層硬件。

在本屆 re:Invent 大會上,亞馬遜云科技發(fā)布了迄今為止性能最強、集成度最高的 CPU Amazon Graviton5。


Amazon Graviton5 最顯著的變化,是從 Amazon Graviton4 的雙芯片設(shè)計,回歸到單封裝架構(gòu)。這一調(diào)整帶來了根本性的提升:192 個核心共享統(tǒng)一的內(nèi)存訪問路徑,消除了跨芯片通信帶來的結(jié)構(gòu)性延遲。相比之下, Amazon Graviton4 的兩顆芯片之間雖然 Coherent Link 鏈接,但跨芯片訪問仍會引入?yún)f(xié)議開銷與排隊等待,某些場景下延遲甚至可能增加兩倍。

在單封裝的基礎(chǔ)上, Amazon Graviton5 實現(xiàn)了規(guī)模與效率的飛躍:在單個封裝內(nèi)集成 192 個核心,并將 L3 緩存容量提升至前代的 5 倍以上。實際測試中,基于 Amazon Graviton5 的新一代 M9g 實例,性能比基于 Amazon Graviton4 的 M8g 實例提升約 25%。憑借這一表現(xiàn), Amazon Graviton5 已具備與 AMD 的 192 核、Intel 的 144 核服務(wù)器芯片直接競爭的規(guī)模與實力。

展示性能參數(shù)之外,蘋果又一次站上了 re:Invent 的主舞臺。

去年,蘋果 AI 與機器學習高級總監(jiān) Benoit Dupin 曾透露,與傳統(tǒng)的 x86 實例相比,使用亞馬遜云科技的 Amazon Graviton 和 Amazon Inferentia 芯片后,處理機器學習工作負載的效率提升超過 40%。

蘋果云系統(tǒng)和平臺部門副總裁 Payam Mirrashidi 這次則披露了更多合作內(nèi)容:運行在 Amazon Graviton 上的 Swift 應(yīng)用,每天處理著數(shù)十億次請求;蘋果已將多項核心服務(wù)用 Swift 重寫并遷移至 Amazon Graviton 平臺,最終獲得了 40% 的性能提升與 30% 的成本降低。

與蘋果的合作釋放出重要信號: Amazon Graviton 的價值已超越單純算力或性價比,x86 向 ARM 的遷移不再只是早期嘗試者的冒險,而是成熟企業(yè)可以大規(guī)模推進的選擇。

極致的性能壓榨和工程優(yōu)化

亞馬遜云科技實用計算高級副總裁 Peter DeSantis,和亞馬遜云科技計算與機器學習服務(wù)副總裁 Dave Brown 的主題演講,歷來是觀察云基礎(chǔ)設(shè)施演進的標尺。2025 年,當 AI 成為一切工作負載的核心,亞馬遜云科技在基礎(chǔ)設(shè)施上的創(chuàng)新,都指向一個明確靶心——為 AI 重塑成本和效率。

從硅基芯片、軟件棧再到核心服務(wù),亞馬遜云科技正以前所未有的深度,對 AI 的算力、推理與數(shù)據(jù)基礎(chǔ)設(shè)施進行“性能壓榨”。

性能優(yōu)化的起點,是對算力單元的重構(gòu)。Amazon Trainium3 芯片及以其為核心的 Amazon EC2 Trn3 UltraServers,共同構(gòu)成了為超大規(guī)模 AI 訓練而生的系統(tǒng)級答案。


Amazon EC2 Trn3 UltraServers 是由 144 顆 Amazon Trainium3 芯片構(gòu)成的單一 AI 超級計算機,提供 360 petaflops 的 FP8 計算能力與 20 TB 高帶寬內(nèi)存,計算與內(nèi)存帶寬相比前代分別提升 4.4 倍與 3.9 倍。實際效能更為關(guān)鍵:運行 GPT-OSS-120B 模型時,每兆瓦功耗輸出的 Token 數(shù)量是 Amazon Trainium2 的 5 倍以上。

在發(fā)布 Amazon Trainium3 同時,Peter DeSantis 披露 Amazon Trainium4 正在開發(fā)中,承諾提供比 Amazon Trainium3 高 6 倍的 FP4 計算性能、4 倍內(nèi)存帶寬和 2 倍高帶寬內(nèi)存容量。這將確保亞馬遜云科技在 AI 芯片領(lǐng)域的長期領(lǐng)先地位。

比一系列令人眼花繚亂的性能數(shù)字更有“殺傷力”的指標是,投資 Amazon Trainium3 是個省錢的“生意”,Peter DeSantis 在演講中表示,Amazon Trainium3 可以將訓練成本降低 40%。

如果一款芯片可以同時實現(xiàn)性能升級、成本降低、效率提升,那對于 AI Infra 構(gòu)建者而言無異于“夢中情人”。頂尖 AI 公司因此齊聚 Amazon Trainium 生態(tài)下,驗證了這條路徑的價值: Anthropic 在 Amazon Trainium 上訓練和運行 Claude 最新一代模型。Decart AI 則借助 Amazon Trainium3 與 NKI 優(yōu)化實時視頻生成模型,實現(xiàn)了 4 倍幀率性能提升和 80% 的張量核心利用率,遠超傳統(tǒng) GPU 系統(tǒng)。


談及對 AI 落地工程的優(yōu)化,向量能力是另一個不可或缺的維度。

此次發(fā)布會中,亞馬遜云科技給足了誠意,宣布向量搜索在全平臺落地,客戶無需學習全新的技術(shù)棧,也無需管理復(fù)雜流水線,亞馬遜云科技將向量能力集成到各類服務(wù)中,例如 Amazon OpenSearch。

向量搜索能力的全平臺落地,在效率和成本上都帶來的優(yōu)勢——客戶無需重新學習全新的向量數(shù)據(jù)庫,也無需為新的服務(wù)付費。

向量服務(wù)的底座支撐,是此次全新發(fā)布的 Amazon Nova 多模態(tài)嵌入模型。它實現(xiàn)了向量跨模型搜索的功能,支持文本、文檔、圖像、視頻和音頻,將所有這些概念轉(zhuǎn)換為共享向量空間,創(chuàng)建對數(shù)據(jù)的統(tǒng)一理解。


最令人感到振奮的應(yīng)用,莫過于 Amazon S3 Vectors。它將向量存儲能力整合至亞馬遜云科技最大的數(shù)據(jù)服務(wù) Amazon S3 中,Amazon S3 的原生成本結(jié)構(gòu)與海量規(guī)模為向量數(shù)據(jù)庫提供了強力支撐,可實現(xiàn)數(shù)十億級向量的亞 100 毫秒級查詢響應(yīng)。

Amazon S3 Vectors 的核心功能,已經(jīng)滋養(yǎng)出了前文提到的 TwelveLabs 這般的頂尖視頻模型公司。

TwelveLabs 將其核心數(shù)據(jù)平臺構(gòu)建于 Amazon S3 之上。借助 Amazon S3 Vectors,該公司得以直接在存儲原始視頻的 S3 存儲桶中,處理并存儲數(shù)十億個向量嵌入。這消除了數(shù)據(jù)遷移與架構(gòu)重構(gòu)的復(fù)雜性,使其能夠高效處理數(shù)百萬小時的視頻數(shù)據(jù)。


此外,在 2024 年作為“傳聞”見諸媒體的“地幔計劃 Project Mantle”,在 2025 年被正式發(fā)布,成為了現(xiàn)實。

從芯片到實例,再到 Amazon Neuron SDK ,完成高效 AI 推理的組件已經(jīng)齊全,但管理方法和平臺尚有不足,面對即將到來的海量并發(fā)推理任務(wù),亞馬遜云科技顯然不準備把管理的復(fù)雜性完全留給客戶。

此次發(fā)布的 Amazon Project Mantle 推理引擎,則通過構(gòu)建能實時自適應(yīng)的架構(gòu),應(yīng)對推理請求的各階段流程需求不同、高并發(fā)狀態(tài)下客戶需求多樣的挑戰(zhàn)。


Amazon Project Mantle 通過三通道的優(yōu)先級管理、獨立客戶隊列、基于日志的持久化狀態(tài)恢復(fù)等機制,將充滿不確定性的推理過程轉(zhuǎn)變得可預(yù)測。

在服務(wù)層級上,系統(tǒng)讓客戶自主定義推理需求層級,并將請求分配到不同優(yōu)先級的通道:Priority 通道面向?qū)崟r、延遲敏感的交互場景,Standard 通道適用于穩(wěn)定可預(yù)測的工作負載,F(xiàn)lex 通道適合后臺任務(wù)、更注重成本效率。

公平性問題上,Amazon Project Mantle 為每位客戶分配獨立隊列,確保一個客戶的突發(fā)情況不會影響其他客戶性能。

同時,為了在長時間運行請求下保證架構(gòu)的可靠性,Amazon Project Mantle 引入了日志系統(tǒng),使 Amazon Bedrock 可以持續(xù)捕獲每個請求的狀態(tài),一旦出現(xiàn)問題,就能從斷點處精確恢復(fù)。日志系統(tǒng)也使得更精細的微調(diào)策略得以實現(xiàn):在 Amazon Bedrock 中,微調(diào)被視為一項長時間運行的任務(wù),實時流量激增時暫停,流量回落微調(diào)會從斷點處繼續(xù)執(zhí)行。

在重新設(shè)置推理引擎時,亞馬遜云科技還重點考慮了有嚴格隱私與合規(guī)要求的企業(yè)。Amazon Bedrock 集成了機密計算(Confidential Computing)技術(shù),使運維人員無法訪問運行環(huán)境,確保請求在經(jīng)過客戶認證的環(huán)境中執(zhí)行。

考慮到與蘋果、OpenAI 以及一種硅谷獨角獸廣泛的、深度的合作,在所有參與構(gòu)建未來 AI 的公司面前,亞馬遜云科技實質(zhì)上正成為最值得依賴、也最具前瞻性的云計算伙伴。

首先,亞馬遜云科技擁有“自我重構(gòu)”的決心。 從打破無服務(wù)器邊界、推出 Amazon Lambda 托管實例,到改變 Amazon Graviton5 芯片架構(gòu),亞馬遜云科技不惜解構(gòu)自己確立的產(chǎn)品形態(tài)與規(guī)則。這清晰傳遞出一個信號:在 AI 重塑一切的未來,任何固有的架構(gòu)、概念與教條,都必須為更高的效率、更強的性能和更切實的客戶價值讓路。放下包袱,方能定義未來。

其次,在過去幾天的發(fā)布中,亞馬遜云科技的高管們多次提到,公司在很多模塊都擁有全棧自主生產(chǎn)、調(diào)優(yōu)的工程能力,考慮到大部分云計算企業(yè)仍然執(zhí)拗于“堆卡”“GPU 優(yōu)先分配權(quán)”,這為亞馬遜云科技帶來了難得的“工程縱深”。 亞馬遜云科技拒絕捷徑,從芯片、服務(wù)器到服務(wù)層,建立起極致的性能與效率優(yōu)勢。它同時投入專用 AI 算力與通用 CPU 算力,表明其理解 AI 革命的基石依然是堅實、可靠且高效的基礎(chǔ)設(shè)施。

第三層,則是不斷擴大的生態(tài)壁壘。從芯片到模型,從數(shù)據(jù)到開發(fā)工具,亞馬遜云科技提供的是一套可托付、可擴展、持續(xù)進化的“全棧能力地圖”——它不僅提供算力,更提供確定性。

最終,這一切技術(shù)創(chuàng)新與戰(zhàn)略選擇,都指向亞馬遜云科技一直堅持的一點:AI 的形態(tài)在變,應(yīng)用的寫法在變,但云計算最基本的價值——安全、可用、彈性、成本與敏捷性——從未過時,反而愈發(fā)成為決定性競爭力。亞馬遜云科技在這一點上重新把行業(yè)的注意力拉回了基礎(chǔ):AI 的未來,必須建立在一個穩(wěn)固的地基之上。


2025 亞馬遜云科技re:Invent 中國行即將啟幕!12月18日開始,北京、上海、深圳、成都四城線下巡演及線上專場將同步開啟,無論你是云計算新手還是技術(shù)老兵,都將從高階演講、實戰(zhàn)內(nèi)容、技術(shù)分享和專家互動中受益。點擊【閱讀原文】立即注冊,搶占席位,把握Agentic AI時代的新機遇!

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
曾師說的赤馬紅羊到了,人多的地方不要去,用三帖心藥,安然無恙

曾師說的赤馬紅羊到了,人多的地方不要去,用三帖心藥,安然無恙

山九
2025-12-14 08:10:09
一醫(yī)院通知:主治以上醫(yī)生強制開通短視頻認證,每周發(fā)3條,醫(yī)生:比夜班還勤?

一醫(yī)院通知:主治以上醫(yī)生強制開通短視頻認證,每周發(fā)3條,醫(yī)生:比夜班還勤?

華醫(yī)網(wǎng)
2025-12-27 14:37:00
戚薇穿絲襪上熱搜,有人說她太敢,有人夸她真颯

戚薇穿絲襪上熱搜,有人說她太敢,有人夸她真颯

車窗起霧q
2025-12-26 22:52:17
萊萬:巴薩讓我停止進球是真的,我猶豫過

萊萬:巴薩讓我停止進球是真的,我猶豫過

體壇周報
2025-12-27 12:05:10
AI已經(jīng)能暢玩幾乎所有游戲了,那還要我干啥?

AI已經(jīng)能暢玩幾乎所有游戲了,那還要我干啥?

差評XPIN
2025-12-27 00:11:52
洪森最大的失誤:低估了西哈莫尼國王,高估了兒子洪瑪奈!

洪森最大的失誤:低估了西哈莫尼國王,高估了兒子洪瑪奈!

阿柒的訊
2025-12-23 18:22:55
看到模仿者和宋小寶的合影,突然覺得宋小寶還挺帥。

看到模仿者和宋小寶的合影,突然覺得宋小寶還挺帥。

可樂談情感
2025-12-27 08:34:55
佩服!山東隊外援鮑威爾,大贊廣東隊1人:他關(guān)鍵時候很強勢

佩服!山東隊外援鮑威爾,大贊廣東隊1人:他關(guān)鍵時候很強勢

體育哲人
2025-12-27 13:53:03
攤牌!美國搶中國180萬桶原油,要絞殺人民幣?中方反殺已就位

攤牌!美國搶中國180萬桶原油,要絞殺人民幣?中方反殺已就位

現(xiàn)代小青青慕慕
2025-12-24 22:12:19
80輛油罐車駛?cè)肜蠐耄伤葡蚣砥艺斔停砉I(yè)體系究竟有多爛?

80輛油罐車駛?cè)肜蠐?,疑似向柬埔寨輸送,柬工業(yè)體系究竟有多爛?

百科密碼
2025-12-26 14:21:30
中超動態(tài)!邦本宜裕續(xù)約,非體育因素成遼寧鐵人放棄核心主因

中超動態(tài)!邦本宜裕續(xù)約,非體育因素成遼寧鐵人放棄核心主因

智商已欠費啦
2025-12-27 16:10:16
不忍了,特朗普親侄女下場開罵:整個美國共和黨全被我叔叔毀了!

不忍了,特朗普親侄女下場開罵:整個美國共和黨全被我叔叔毀了!

動漫里的童話
2025-12-27 14:50:08
回顧探花大神:害人害己,多位女主被親戚認出當場“社死”

回顧探花大神:害人害己,多位女主被親戚認出當場“社死”

就一點
2025-10-09 12:19:42
1960年春節(jié),周總理請溥儀吃飯,酒桌上溥儀講了個慈禧的“笑話”,總理聽完,當場陷入了沉思

1960年春節(jié),周總理請溥儀吃飯,酒桌上溥儀講了個慈禧的“笑話”,總理聽完,當場陷入了沉思

歷史回憶室
2025-12-24 10:29:12
日本今年逾2萬種食品漲價 明年初再漲近3600種

日本今年逾2萬種食品漲價 明年初再漲近3600種

財聯(lián)社
2025-12-26 21:21:09
首富馬斯克最新身家7519億美元,超第二近5000億美元

首富馬斯克最新身家7519億美元,超第二近5000億美元

魯中晨報
2025-12-26 17:05:03
最快護士張水華遭中國田協(xié)除名?官方競賽系統(tǒng)業(yè)余跑者唯獨沒有她

最快護士張水華遭中國田協(xié)除名?官方競賽系統(tǒng)業(yè)余跑者唯獨沒有她

楊華評論
2025-12-27 13:10:15
今冬最冷時間表出爐了,最冷是啥時候?2026年春節(jié)冷不冷?早知道

今冬最冷時間表出爐了,最冷是啥時候?2026年春節(jié)冷不冷?早知道

戶外阿嶄
2025-12-27 14:46:49
黃金、白銀、鉑金齊創(chuàng)歷史新高,“狂飆”還能持續(xù)多久

黃金、白銀、鉑金齊創(chuàng)歷史新高,“狂飆”還能持續(xù)多久

澎湃新聞
2025-12-27 14:56:02
一鍵回暖 下一場冷空氣預(yù)定→

一鍵回暖 下一場冷空氣預(yù)定→

上海預(yù)警發(fā)布
2025-12-27 10:38:40
2025-12-27 17:00:49
InfoQ incentive-icons
InfoQ
有內(nèi)容的技術(shù)社區(qū)媒體
11879文章數(shù) 51659關(guān)注度
往期回顧 全部

科技要聞

小米也漲價了!業(yè)界稱終端再不漲明年必虧

頭條要聞

男子戒毒后隨領(lǐng)導(dǎo)出差被警察帶走驗?zāi)?回家后工作沒了

頭條要聞

男子戒毒后隨領(lǐng)導(dǎo)出差被警察帶走驗?zāi)?回家后工作沒了

體育要聞

NBA教練圈的布朗尼,花了22年證明自己

娛樂要聞

張昊唯逃稅涉黃風波落幕:法院認定朋友造謠

財經(jīng)要聞

注意,開始拉物價了!

汽車要聞

好音響比大屏更重要?車企開始“聽”用戶的

態(tài)度原創(chuàng)

家居
健康
藝術(shù)
教育
軍事航空

家居要聞

格調(diào)時尚 智慧品質(zhì)居所

這些新療法,讓化療不再那么痛苦

藝術(shù)要聞

砸50億!廣東驚現(xiàn)“全球最大爛尾醫(yī)院”,連窗框都沒裝完

教育要聞

附加題難倒了學霸!陰影部分面積為90,求空白正方形的面積

軍事要聞

英法德三國領(lǐng)導(dǎo)人通話 重申對烏支持

無障礙瀏覽 進入關(guān)懷版