国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網易首頁 > 網易號 > 正文 申請入駐

Databricks與袋鼠云,兩個故事、一個方向

0
分享至



“中國的Data+AI平臺,不僅僅是復制Databricks那么簡單。

過去兩年,關于AI的敘事有一個明顯的轉折點。

一開始,所有人都在看參數量、模型榜單和Demo效果——誰的模型更大、更“聰明”,就能多占據幾天話題中心。很快,行業(yè)發(fā)現:真正決定AI能走多遠的,除了模型有多好,還包括“業(yè)務到底敢不敢、能不能用起來”。

從“大模型卷參數”,到“智能體上崗”,AI產業(yè)進入了第二階段。這個階段的主角,不再只是模型公司,還包括那些能夠把數據、算力、模型、應用串成閉環(huán)的平臺型玩家。

在全球市場上,Databricks是這類玩家的典型代表,這也是支撐其上千億美元估值的基礎。

在中國,也有一家走上類似路徑的公司——袋鼠云。這家公司最早以“數據中臺”起家,如今正把自己重構成一個“多模態(tài)數據智能中臺+AI應用開發(fā)平臺”的提供者。

如果我們把Databricks看作“美國式Data+AI平臺”的代表,那么袋鼠云顯然正在探索一種“中國式的同類物”。

現在,問題就變成:

·為什么Databricks能被視為AI時代的“數據基礎設施標桿”?

·袋鼠云又憑什么被拿來和Databricks放在同一個坐標系里討論?

·在Data+AI這條路上,它們到底是“對標者”,還是在不同土壤中生長出的“同路人”?

要回答這些問題,需要先把時間撥回各自的起點。

類似的成長經歷
指向共同的方向

Databricks和袋鼠云的成長軌跡中,第一個共同點,是都從“數據工程效率”這個問題出發(fā)。

Databricks成立于2013年,創(chuàng)始團隊來自加州大學伯克利的AMPLab,也是 Apache Spark的核心研發(fā)者。它最早要解決的問題,其實非常樸素:在 Hadoop之后,能不能有一套更快、更靈活,同時又更適合開發(fā)者使用的大數據處理引擎?Spark因此誕生,也因為Databricks的推動,逐漸從實驗室走向大規(guī)模商用。

袋鼠云的起點,則扎根在中國企業(yè)數字化的現場。公司成立于2015年,從一開始就圍繞“企業(yè)數據中臺”來做產品和項目。一端對接的是復雜的業(yè)務系統(tǒng)和歷史IT遺留,一端是各地不斷冒出的新型數據需求,袋鼠云要做的,是用一套“數?!逼脚_,把分散的存算資源和數據資產統(tǒng)起來,再疊加可用的數據開發(fā)與治理能力。

一個站在開源社區(qū)和云生態(tài)的中心,一個泡在政企、金融、能源等行業(yè)里。它們的起點不同,但共通之處很明顯:都在試圖解決“數據底座不好用”這件事,都在著力提升數據開發(fā)效率。

從這個意義上說,它們做的其實是同一種生意:先把“數據的地板”鋪平,再談上面的AI與應用。

第二個共同點,發(fā)生在它們的發(fā)展“拐點”階段——當純粹的大數據平臺,開始感知到AI時代的到來。

這兩家公司都不滿足于止步于“數據層”。Databricks往上走,做了Unity Catalog、MLflow和后來一系列Mosaic AI能力,目標是把數據、特征、模型和Agent統(tǒng)一在一套平臺里。

袋鼠云則往上疊AIMetrics智能指標平臺、AIWorks智能體開發(fā)應用平臺等產品,從多模態(tài)數據的開發(fā)治理、數據資產、指標體系構建到AI應用編排,形成一整套從數據到智能的縱向棧。



袋鼠云Data+AI產品體系

如果用一句話概括,它們都在完成同一件事:從“給工程師用的數據平臺”,變成“給業(yè)務用的Data+AI平臺”。

第三個共同點,在于它們今天想扮演的角色——不限于做某個環(huán)節(jié)的工具,而是企業(yè)內部“智能生產力系統(tǒng)”的中樞。

袋鼠云VSDatabricks
有幾分“神似”?

當我們把Databricks和袋鼠云放進一個對照表里,會發(fā)現兩者在產品結構上的“相似點”,比我們想象的多。



核心平臺——工具組合背后的平臺野心

Databricks的核心組件,被拆開來看是一串熟悉的名字:Delta Lake管存儲與事務,Unity Catalog管元數據與權限,MLflow管模型全生命周期,Notebook是開發(fā)與協(xié)作的工作空間。這些組件一個個看并不新鮮,但組合之后,就變成了一個高度一體化的平臺。

袋鼠云今天的產品體系,也走向了類似的組合方式:底層是數棧DataZen(多模態(tài)數據智能中臺),負責結構化與非結構化、多模態(tài)數據的采集、開發(fā)、治理與統(tǒng)一管理,其中也包含用于資產管理與治理的DataAssets能力模塊。在這一底座之上,是構建指標體系與智能分析鏈路的AIMetrics,將多模態(tài)數據加工為可描述業(yè)務的指標體系,并支持問數、歸因、預測等能力;以及企業(yè)級AIWorks 智能體應用開發(fā)平臺,承接模型、知識庫、指標體系與上下游業(yè)務流程,通過應用編排與工作流,將數據資產、指標體系與模型能力組合成可落地的AI應用。

整體來看,袋鼠云的技術棧邏輯從“多模態(tài)數據中臺→數據資產治理→指標體系構建→AI應用編排”逐層向上推進,形成數據與智能深度融合的縱向技術閉環(huán)。

本質上,兩家公司都在做同樣的事情:用一套可持續(xù)演進的平臺,把零散的工具和能力“熔”成一個體系。

數據底座——一個偏“云原生”,一個更適配中國環(huán)境

Databricks的數據底座是Spark+Delta Lake。它站在公有云的中心,假設環(huán)境相對統(tǒng)一:主流芯片和操作系統(tǒng)相對標準,客戶更關心的是性能、彈性與協(xié)作效率。

袋鼠云的EasyMR,則是在中國復雜的基礎設施現實中長出來的:既要承接 Hadoop/Hive等老系統(tǒng)的數據和作業(yè),又要兼容Spark/Flink等新型引擎;既要在公有云跑,也要在信創(chuàng)環(huán)境里跑,適配鯤鵬、麒麟、統(tǒng)信UOS等軟硬件組合。私有化部署能力,讓其具備更嚴格的數據安全保障。湖倉一體對它來說,不只是技術架構的選擇,更是工程落地的剛需。

從技術觀感上看,一個更“云原生”,一個某種意義上更適配中國產業(yè)環(huán)境的落地要求。

但在更高的抽象層面,它們做的是同一件事——為AI和數據工作負載提供一個統(tǒng)一、穩(wěn)定、可擴展的運行底座。

治理與資產化——從“能用”到“好用、可管、可追溯”

隨著模型與應用在企業(yè)里擴散,數據治理不再是一個“合規(guī)部門的問題”,而是平臺的基礎功能。

Databricks用Unity Catalog做統(tǒng)一的目錄與權限管理,把誰能看什么數據、數據從哪來、被哪些作業(yè)引用、在什么環(huán)境中被調用,都納入到一個中樞里管理。這讓企業(yè)在大規(guī)模使用數據和模型時,至少知道“自己在用什么”。

袋鼠云的DataAssets,則在此基礎上加入了更多“資產化”的思考:除了元數據、血緣、權限之外,它還強調數據與指標的統(tǒng)一管理,將不同系統(tǒng)、不同應用、不同部門的口徑拉回到同一套目錄下,再疊加質量評估與資產評估機制,以適應中國企業(yè)對“統(tǒng)一口徑”“審計可追溯”“資產入表”等更具體的治理訴求。

可以說,Unity Catalog更偏“技術治理中樞”,DataAssets更像是“業(yè)務視角下的數據資產經營平臺”。這背后體現的是兩種制度環(huán)境、兩種企業(yè)文化下對“治理”的不同理解。

智能體與應用開發(fā)——Agent是起點,不是終點

Agent已經成了過去一年最熱的關鍵詞之一。

Databricks通過Mosaic AI提供Agent Framework與RAG工具鏈,幫助客戶利用企業(yè)內部數據構建對話式、任務型智能體應用,從而把大模型能力“裝進”業(yè)務流程。

袋鼠云則在AIWorks中,提供了模型管理、知識庫構建、應用編排、MCP服務等能力。對于很多已經有數據中臺、指標平臺的客戶來說,AIWorks更像是在原有基礎上加的一層“智能力場”:可以直接調數據資產與指標體系,去組裝一個個針對具體業(yè)務場景的AI應用。

兩者的思路都很清晰:Agent不只是一個新的“產品形態(tài)”,而是“數據+模型+業(yè)務”的編排方式。真正重要的,是誰能提供那套“把東西串起來的工具”。

多模態(tài)與行業(yè)方案——誰離業(yè)務更近

在多模態(tài)能力上,Databricks更偏向“平臺集成”:通過與第三方工具、模型與服務對接,來支持非結構化數據的處理與分析。它的優(yōu)勢在于開放度高、生態(tài)豐富。

袋鼠云則在DataZen中把多模態(tài)視為“內建能力”:同一平臺里既有結構化數據的采集與開發(fā),也有文本、圖片、視頻等非結構化數據的處理,加上指標、API、AI應用開發(fā)的能力,形成一整套“多模態(tài)數據中臺+應用工廠”。這套組合,與它在能源礦產、新銳零售、先進制造等行業(yè)的實踐緊密綁定。

在行業(yè)方案上,這種差異更明顯:Databricks提供的是偏通用的平臺能力,由生態(tài)伙伴和客戶自行完成最后一公里;袋鼠云則采用“平臺+交付”的模式,在央國企、能源礦產、新銳零售、先進制造、金融等領域深度參與項目,直接對業(yè)務結果負責。

信創(chuàng)與出?!獌蓚€極端下的同一命題

Databricks不需要考慮國產替代問題,它更關注的是如何在AWS、Azure、GCP上跑得更快、覆蓋更多客戶、連接更多ISV/SI伙伴。

袋鼠云則恰恰相反:它必須首先適應中國復雜的信創(chuàng)環(huán)境,確保在本地芯片、本地操作系統(tǒng)、本地數據庫上穩(wěn)定運行,并在此基礎上,再去探索在AWS等海外云上的部署實踐,與Snowflake、BigQuery等海外云數倉進行數據協(xié)同。

如果說Databricks面對的是“如何更好地融入全球云生態(tài)”,那袋鼠云面前的問題,則是“如何在滿足本地合規(guī)與信創(chuàng)要求的前提下,仍然保持技術演進速度”。兩者都在解的是“生態(tài)嵌入”這道題,只是解法不同。

兩個故事,一個方向

從表面看,Databricks和袋鼠云有足夠多的相似之處:都誕生于大數據時代的“基礎設施建設潮”,都經歷了從數據平臺向Data+AI平臺的轉型,都在構建覆蓋數據、模型、應用的縱向一體化架構。

但真正重要的,是要真正看清楚這兩家公司,看清整個市場,我們需要理解幾件事情:

第一點,是市場本身在發(fā)生結構性變化。

在早期,大模型廠商主打的是MaaS(模型即服務,Model-as-a-Service):企業(yè)可以按調用量買模型,用它來做生成、問答、摘要等。但實踐證明,模型能力可以通過API復用,真正稀缺的,是“數據+治理+智能+交互”一體化的平臺能力——也就是我們可以稱之為DIaaS(數據智能即服務,Data Intelligence-as-a-Service)。

企業(yè)更關注的是:能不能把內部雜亂的數據真正治理好、連起來;能不能在統(tǒng)一的平臺上,讓業(yè)務能提問、模型能理解、系統(tǒng)能執(zhí)行;能不能讓數據從靜態(tài)資產,變成在指標、AI應用、決策鏈之間流動的“智能資產”。

Databricks與袋鼠云所做的事情,本質上都是在填補這一空白。

第二點,是它們所代表的“新范式”——數據治理為本,AI為用。

Databricks正在構建的是一種“美國式企業(yè)AI協(xié)作平臺”:假設企業(yè)已經有成熟的云基礎設施,有一定規(guī)模的數據團隊與工程團隊,平臺的任務是把這些人和資源高效組織在一起,降低從數據到智能應用的摩擦。

袋鼠云則構建的是一種“國產可控+行業(yè)融合+AI應用”的中國式范式:它必須同時面對信創(chuàng)要求、行業(yè)復雜性、本地服務與交付壓力,在這樣的環(huán)境下,平臺不僅要“好用”,更要“可控、可監(jiān)管、可落地”。

共同之處在于,兩者都在強調:數據治理是前提,AI是其上的“使用層”;平臺是結構,行業(yè)是落點。

第三點,是未來的增長空間。

大模型已經證明了泛化能力,但在企業(yè)側的真正落地,往往卡在“數據接不進去,結果用不出來”。于是,越來越多的企業(yè)開始意識到:真正的壁壘不僅僅在于“有沒有模型”,還在于“有沒有一條打通從數據資產到AI應用的管道”。

這條管道,如果被某一類平臺穩(wěn)定掌握,它們就會變成AI時代的“水電公司”:

·一端接企業(yè)的數據資產與業(yè)務系統(tǒng);

·一端接模型、算力與新一代AI技術;

·中間則是源源不斷流動的數據流、特征流、模型流和決策流。

Databricks和袋鼠云,正在不同的區(qū)域、不同的制度與技術環(huán)境中,嘗試扮演這樣的角色。

從這個意義上說,兩家公司都是在同一條技術演化曲線上、不同坐標點上的“同行者”。

寫在最后——不只是簡單平替,更是時代的共鳴

在很多傳播語境中,把袋鼠云稱作“中國版Databricks”是一個高效的類比——它能迅速幫人建立坐標感。但如果只看到這個類比,就會忽略掉一個更重要的事實:中國的技術土壤與產業(yè)結構,決定了不可能有一個“一模一樣的 Databricks”。

真正有價值的,不是去尋找誰復制了誰,而是去觀察:在同一個“Data+AI”時代命題下,不同地區(qū)、不同制度、不同客戶需求,如何塑造出各自的基礎設施玩家。

Databricks提供的是一個答案,袋鼠云則在給出另一個。

如果說大模型是這場浪潮最耀眼的“前臺演員”,那么像Databricks和袋鼠云這樣的平臺公司,更多時候是在燈光之外——他們鋪設地板、搭起舞臺,把一個個模型、算法和應用,嵌入真正復雜的現實世界。

而這場關于“數據智能基礎設施”的遠征,現在才剛剛開始。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
云南這一醫(yī)院,明起試運行!

云南這一醫(yī)院,明起試運行!

云南網絡廣播電視臺
2025-12-22 08:09:13
第20場圣誕節(jié)大戰(zhàn),詹姆斯的偉大毋庸置疑

第20場圣誕節(jié)大戰(zhàn),詹姆斯的偉大毋庸置疑

油潑辣不辣
2025-12-22 12:54:44
將暫停辦理、使用!深圳官方通知

將暫停辦理、使用!深圳官方通知

深圳晚報
2025-12-22 12:14:32
沖上熱搜!未來兩周,46條中日航線取消全部航班,1月取消班次已超2000個

沖上熱搜!未來兩周,46條中日航線取消全部航班,1月取消班次已超2000個

每日經濟新聞
2025-12-22 15:49:04
離婚14年后,謝霆鋒做夢也沒想到,45歲張柏芝依然給他留足了體面

離婚14年后,謝霆鋒做夢也沒想到,45歲張柏芝依然給他留足了體面

白面書誏
2025-12-22 17:35:20
怎么這么多年了,國內二手車還是這副德行?

怎么這么多年了,國內二手車還是這副德行?

差評XPIN
2025-12-22 00:06:42
研究發(fā)現:糖尿病患者若經常喝白酒,用不了多長時間,有這6壞處

研究發(fā)現:糖尿病患者若經常喝白酒,用不了多長時間,有這6壞處

王曉愛體彩
2025-12-22 15:22:57
快扔掉!戴一天,輻射量相當于拍117次胸片

快扔掉!戴一天,輻射量相當于拍117次胸片

FM93浙江交通之聲
2025-10-28 00:01:43
暴跌25%!曾經一包難求的頂級“奢侈品”,如今五折甩賣都沒人要

暴跌25%!曾經一包難求的頂級“奢侈品”,如今五折甩賣都沒人要

夜深愛雜談
2025-12-22 17:39:31
海南會成為下一個新加坡嗎?錯,海南將成為整個東南亞的貿易中心

海南會成為下一個新加坡嗎?錯,海南將成為整個東南亞的貿易中心

長野星河散去了
2025-12-22 04:44:25
2026年元旦起駕照年齡限制調整!超這個歲數不能開,你還能開幾年

2026年元旦起駕照年齡限制調整!超這個歲數不能開,你還能開幾年

復轉這些年
2025-12-22 16:42:10
新股陜西旅游發(fā)行申購,發(fā)行價80.44元,小散打新或許會擔心!

新股陜西旅游發(fā)行申購,發(fā)行價80.44元,小散打新或許會擔心!

數據挖掘分析
2025-12-22 07:35:05
沈周:仇英出生后才四歲我就亡故,如何給《江南春卷》作“跋”?

沈周:仇英出生后才四歲我就亡故,如何給《江南春卷》作“跋”?

作家方曉莉
2025-12-21 01:16:29
絕跡27年!曾是國宴上的食材,25年專家在內蒙古黃旗海再次探測到

絕跡27年!曾是國宴上的食材,25年專家在內蒙古黃旗海再次探測到

萬象硬核本尊
2025-12-22 16:15:38
離婚12年前妻早已二嫁,曾和體操冠軍傳緋聞的普京,今有了新戀情

離婚12年前妻早已二嫁,曾和體操冠軍傳緋聞的普京,今有了新戀情

攬星河的筆記
2025-12-21 17:12:00
越扒越有!古代書畫鑒定實錄顯示,南博在85年就已不見《江南春》

越扒越有!古代書畫鑒定實錄顯示,南博在85年就已不見《江南春》

火山詩話
2025-12-20 06:02:25
馬云的預言將成真?2026年手上還握有存款的人,或將面臨三大挑戰(zhàn)

馬云的預言將成真?2026年手上還握有存款的人,或將面臨三大挑戰(zhàn)

墨蘭史書
2025-12-18 05:10:02
男子銀行內放聲大哭:買房貸款208萬,每月還9100,還了9年本金一分沒少,全是利息!銀行:跟我們無關!

男子銀行內放聲大哭:買房貸款208萬,每月還9100,還了9年本金一分沒少,全是利息!銀行:跟我們無關!

譚老師地理大課堂
2025-12-22 18:37:08
深圳少年烤雞被質疑用肉寶王和冷凍雞,帶火他的是李維剛

深圳少年烤雞被質疑用肉寶王和冷凍雞,帶火他的是李維剛

映射生活的身影
2025-12-21 20:02:34
別再亂穿了!白吊帶配瑜伽褲才是絕絕子,運動風里藏滿了勾人曲線

別再亂穿了!白吊帶配瑜伽褲才是絕絕子,運動風里藏滿了勾人曲線

小喬古裝漢服
2025-12-22 17:40:58
2025-12-22 19:20:49
數據猿DataYuan incentive-icons
數據猿DataYuan
數據智能產業(yè)創(chuàng)新服務媒體
2491文章數 599關注度
往期回顧 全部

科技要聞

商湯聯(lián)創(chuàng)親自下場 痛批主流機器人技術大錯

頭條要聞

東部戰(zhàn)區(qū)司令員楊志斌等2人晉升上將

頭條要聞

東部戰(zhàn)區(qū)司令員楊志斌等2人晉升上將

體育要聞

戴琳,中國足球的反向代言人

娛樂要聞

張柏芝不再隱瞞,三胎生父早有答案?

財經要聞

央行信用新政:為失信者提供"糾錯"通道

汽車要聞

可享88元抵2000元等多重權益 昊鉑A800開啟盲訂

態(tài)度原創(chuàng)

教育
本地
房產
手機
數碼

教育要聞

不會弱混VS掌握弱混

本地新聞

云游安徽|走進銅陵,照見三千年不滅的爐火

房產要聞

封關之后!第一波先漲起來的,是海南股市!

手機要聞

麒麟9系回歸!一圖讀懂華為nova 15系列:2699元起

數碼要聞

追覓電視技術榮獲中國電子視像行業(yè)協(xié)會“科技創(chuàng)新獎”

無障礙瀏覽 進入關懷版