国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

日本公司10年堆出991張表,CTO用1個(gè)搜索框讓全員能查

0
分享至


10年積累,15個(gè)數(shù)據(jù)庫(kù)模式,991張表,11個(gè)SQL數(shù)據(jù)庫(kù)加6個(gè)MongoDB實(shí)例。airCloset的CTO Ryan Tsuji最近公開了他們內(nèi)部的一個(gè)工具:DB Graph MCP。這東西讓員工用自然語(yǔ)言就能跨庫(kù)搜索,不需要知道任何表名。

「Find tables related to returns」,輸入這個(gè),系統(tǒng)就能在15個(gè)模式里找出所有相關(guān)表。不是簡(jiǎn)單的關(guān)鍵詞匹配,是語(yǔ)義搜索。更關(guān)鍵的是,它能安全地查詢生產(chǎn)環(huán)境數(shù)據(jù)。

這聽起來(lái)像是個(gè)內(nèi)部效率工具。但Tsuji講了一個(gè)真實(shí)場(chǎng)景,讓我意識(shí)到問題的嚴(yán)重性。

一個(gè)退貨查詢,要4張表+2個(gè)數(shù)據(jù)庫(kù)+0個(gè)外鍵

客服收到投訴:用戶App顯示退貨已完成,但倉(cāng)庫(kù)真的收到貨了嗎?

要查這個(gè),你需要知道:

App端的退貨狀態(tài)在aircloset模式的delivery order表里,狀態(tài)為RETURNED時(shí)前端顯示完成。但倉(cāng)庫(kù)端的確認(rèn)在bridge模式的receive record表里,狀態(tài)為COMPLETE才代表實(shí)物已入庫(kù)。

這兩個(gè)表在兩個(gè)不同的數(shù)據(jù)庫(kù)里,沒有外鍵關(guān)聯(lián)。中間靠一個(gè)varchar字段硬連:aircloset的warehouse mapping表里存著warehouse_order_code,對(duì)應(yīng)bridge的shipping order表里的shipping_order_code。字符串匹配,純靠人腦記憶。

Tsuji的原話:「Four tables, two schemas, a foreign-key-less varchar join. How many people in the company know this path? You could count them on one hand.」

公司知道這條路徑的人,一只手?jǐn)?shù)得過(guò)來(lái)。他們休假,調(diào)查就卡死。

這不是「不知道表名」的問題。是表與表之間的連接關(guān)系只存在于特定人的腦子里。991張表×15個(gè)模式,每天都是這樣。

DB Graph MCP怎么解決:把隱式知識(shí)變成顯式圖

Tsuji團(tuán)隊(duì)的做法是構(gòu)建一個(gè)數(shù)據(jù)庫(kù)元數(shù)據(jù)圖譜(Database Metadata Graph),然后用MCP(Model Context Protocol,模型上下文協(xié)議)把它接到Claude Code里。


核心組件分三層:

第一層是圖譜本身。節(jié)點(diǎn)是表、列、枚舉值。邊是外鍵關(guān)系、命名相似性、共現(xiàn)模式。他們用了pg_dump、INFORMATION_SCHEMA、手工文檔三種來(lái)源,把10年的 schema 歷史爬了一遍。

第二層是語(yǔ)義層。表和列的描述向量化,支持自然語(yǔ)言搜索。你搜「return processing confirmation」,它找的是語(yǔ)義相近的表,不是字符串匹配。

第三層是MCP服務(wù)器。把圖譜暴露給Claude Code,提供search_tables、get_table_details、execute_query三個(gè)工具。AI根據(jù)對(duì)話上下文決定調(diào)用哪個(gè)。

實(shí)際操作流程是這樣的:用戶用自然語(yǔ)言提問 → Claude選擇工具 → MCP服務(wù)器查詢圖譜 → 返回結(jié)構(gòu)化結(jié)果 → AI解釋給用戶。

Tsuji展示了真實(shí)的工具響應(yīng)格式。search_tables返回表名、schema、相似度分?jǐn)?shù)、匹配理由。get_table_details返回列定義、樣本數(shù)據(jù)、關(guān)聯(lián)表。execute_query返回查詢結(jié)果,但受權(quán)限系統(tǒng)管控。

權(quán)限設(shè)計(jì):不是能不能查,是誰(shuí)能在什么場(chǎng)景下查什么

生產(chǎn)數(shù)據(jù)查詢是紅線。Tsuji的方案是分層的:

只讀訪問是基線。所有查詢通過(guò)只讀副本執(zhí)行,物理上阻斷寫入可能。

動(dòng)態(tài)脫敏是默認(rèn)。敏感列(郵箱、電話、地址)自動(dòng)哈?;蚪?cái)唷颖緮?shù)據(jù)隨機(jī)采樣,避免逐行泄露。

審批流是兜底。非敏感查詢自動(dòng)通過(guò)。涉及用戶明細(xì)的查詢,需要直屬上級(jí)在Slack里點(diǎn)確認(rèn)。審批記錄進(jìn)審計(jì)日志。

查詢水印是追溯。每個(gè)查詢嵌入執(zhí)行者ID和時(shí)間戳,泄露可溯源。

Tsuji特別強(qiáng)調(diào):「We don't just block. We make safe access possible.」不是一刀切禁止,是讓安全訪問變得可能。


這個(gè)設(shè)計(jì)思路很產(chǎn)品經(jīng)理。風(fēng)險(xiǎn)不是來(lái)自查詢本身,來(lái)自無(wú)約束的查詢。給查詢加上上下文約束(誰(shuí)、何時(shí)、為什么),風(fēng)險(xiǎn)就變得可管理。

技術(shù)細(xì)節(jié):圖怎么構(gòu)建,怎么更新

圖譜構(gòu)建分三步。第一步,schema提取。PostgreSQL用pg_dump,MongoDB用手工維護(hù)的映射文檔。第二步,關(guān)系推斷。顯式外鍵直接連,隱式關(guān)系用命名相似度(Levenshtein距離)和共現(xiàn)頻率補(bǔ)全。第三步,人工校驗(yàn)。核心業(yè)務(wù)流程的表關(guān)系,必須有DBA簽字確認(rèn)。

更新機(jī)制是事件驅(qū)動(dòng)。DDL變更觸發(fā)自動(dòng)重爬,每天凌晨全量比對(duì)一次。Tsuji說(shuō)他們的圖譜延遲通常在5分鐘以內(nèi)。

一個(gè)有趣的細(xì)節(jié):他們故意保留了「歷史僵尸表」。10年積累里有大量廢棄表,直接刪除會(huì)丟信息,標(biāo)記為deprecated留在圖里,搜索時(shí)降權(quán)但不消失。Tsuji的解釋是:「Someone always asks about that old table eventually.」總會(huì)有人問到那張老表的。

性能方面,991張表的圖譜,節(jié)點(diǎn)數(shù)約12萬(wàn),邊數(shù)約8萬(wàn)。全內(nèi)存加載,查詢延遲P99在200ms以內(nèi)。向量化搜索用pgvector,索引占用約400MB。

效果:從「等人回答」到「自己搞定」

Tsuji給了一組內(nèi)部數(shù)據(jù)。工具上線3個(gè)月,客服團(tuán)隊(duì)的數(shù)據(jù)查詢工單下降67%。不是因?yàn)樗麄冏兩倭?,是客服自己用Claude Code查掉了。

更隱蔽的變化是溝通模式。以前查一個(gè)跨庫(kù)問題,要在Slack里@三個(gè)人,等時(shí)區(qū)對(duì)齊?,F(xiàn)在一個(gè)人對(duì)著AI問,5分鐘出結(jié)果。Tsuji說(shuō):「The knowledge graph didn't just capture schema. It captured the implicit wiring between teams.」

這個(gè)表述很關(guān)鍵。DB Graph解決的不是技術(shù)問題,是組織問題。10年積累的知識(shí)孤島,用圖譜+AI的方式重新連接。

但也有邊界。Tsuji坦誠(chéng)說(shuō)了不工作的場(chǎng)景:復(fù)雜聚合查詢、實(shí)時(shí)性要求高的監(jiān)控、需要業(yè)務(wù)判斷的決策。這些還是得人來(lái)做。

工具的定位是「降低門檻」,不是「取代專家」。知道那條varchar連接路徑的人仍然有價(jià)值,但他們的知識(shí)現(xiàn)在可以被復(fù)制和加速了。

Tsuji最后放了一個(gè)用戶反饋截圖。某個(gè)工程師的評(píng)價(jià):「I finally understand why our returns data is always weird.」

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
太扎心!遼寧一中年男子小便怒斥妻子舉布遮擋稍高,就撒手人寰了

太扎心!遼寧一中年男子小便怒斥妻子舉布遮擋稍高,就撒手人寰了

火山詩(shī)話
2026-03-26 06:16:11
真不能怪祖院長(zhǎng),就曾醫(yī)生這顏值、這才華和魅力,誰(shuí)遭的???

真不能怪祖院長(zhǎng),就曾醫(yī)生這顏值、這才華和魅力,誰(shuí)遭的?。?/a>

吃瓜局
2025-11-11 16:23:49
人類史上最高級(jí)零元購(gòu),榨干印度200年,留下45萬(wàn)億天價(jià)賬單

人類史上最高級(jí)零元購(gòu),榨干印度200年,留下45萬(wàn)億天價(jià)賬單

掠影后有感
2026-03-26 10:39:36
參數(shù)全贏,銷量沒贏:尚界Z7銷量輸給小米SU7!差哪呢?

參數(shù)全贏,銷量沒贏:尚界Z7銷量輸給小米SU7!差哪呢?

生活魔術(shù)專家
2026-03-26 18:07:46
美伊沖突,已經(jīng)出現(xiàn)了3個(gè)贏家,10個(gè)輸家,都是誰(shuí)?

美伊沖突,已經(jīng)出現(xiàn)了3個(gè)贏家,10個(gè)輸家,都是誰(shuí)?

七號(hào)說(shuō)三國(guó)
2026-03-25 21:11:29
陰跌兩個(gè)月后放量跌停,今日最慘股,開板后又把博反包的套了進(jìn)去

陰跌兩個(gè)月后放量跌停,今日最慘股,開板后又把博反包的套了進(jìn)去

有范又有料
2026-03-26 17:22:20
中央紅軍御林軍,長(zhǎng)征中戴鋼盔配沖鋒槍,一個(gè)團(tuán)2名大將3名上將

中央紅軍御林軍,長(zhǎng)征中戴鋼盔配沖鋒槍,一個(gè)團(tuán)2名大將3名上將

云霄紀(jì)史觀
2026-03-26 17:16:00
新郎婚禮遲到2個(gè)小時(shí),婆婆大方宣布:彩禮全退,新娘竟當(dāng)場(chǎng)退婚

新郎婚禮遲到2個(gè)小時(shí),婆婆大方宣布:彩禮全退,新娘竟當(dāng)場(chǎng)退婚

白云故事
2025-03-21 17:50:07
NBA西部:前10確定了,馬刺有望爭(zhēng)第1,快船搶7,湖人首輪遇火箭

NBA西部:前10確定了,馬刺有望爭(zhēng)第1,快船搶7,湖人首輪遇火箭

鐵甲西奇
2026-03-26 16:43:09
袁家軍會(huì)見王興興

袁家軍會(huì)見王興興

新京報(bào)政事兒
2026-03-26 16:45:34
為什么中國(guó)要發(fā)射東風(fēng)-41,必須要提前告知俄羅斯,這是咋回事?

為什么中國(guó)要發(fā)射東風(fēng)-41,必須要提前告知俄羅斯,這是咋回事?

阿器談史
2026-03-19 18:11:39
燒了18.6萬(wàn)美元讓AI連軸肝了17天,它產(chǎn)出了166篇論文

燒了18.6萬(wàn)美元讓AI連軸肝了17天,它產(chǎn)出了166篇論文

酷玩實(shí)驗(yàn)室
2026-03-25 18:25:49
卡爾森:壞了!原來(lái)小丑不是特朗普,而是我自己

卡爾森:壞了!原來(lái)小丑不是特朗普,而是我自己

朝廷心腹
2026-03-26 09:07:14
譚松韻本人跟銀幕上差距很大,個(gè)子好矮小小一只,真人并不年輕

譚松韻本人跟銀幕上差距很大,個(gè)子好矮小小一只,真人并不年輕

庭小娛
2026-03-24 11:53:09
電飯鍋哪個(gè)牌子質(zhì)量好?2026電飯煲排名前十盤點(diǎn)!大眾主流精選

電飯鍋哪個(gè)牌子質(zhì)量好?2026電飯煲排名前十盤點(diǎn)!大眾主流精選

小柱解說(shuō)游戲
2026-03-25 17:56:15
為何美國(guó)敢打伊朗,卻不敢打朝鮮?因?yàn)槌r成功學(xué)到了中國(guó)精髓

為何美國(guó)敢打伊朗,卻不敢打朝鮮?因?yàn)槌r成功學(xué)到了中國(guó)精髓

鑒史錄
2026-03-25 18:19:06
退休不褪色:浸潤(rùn)在莎莎舞里的中年男人堅(jiān)守與百態(tài)

退休不褪色:浸潤(rùn)在莎莎舞里的中年男人堅(jiān)守與百態(tài)

成都人的故事
2026-03-26 23:40:03
66歲大媽喜歡睡前泡腳,不久腦梗去世,專家怒斥:太無(wú)知了

66歲大媽喜歡睡前泡腳,不久腦梗去世,專家怒斥:太無(wú)知了

比利
2026-03-21 13:00:22
哈佛研究:吃一個(gè)西紅柿,就等于喝了一大口可樂,真的還是假的?

哈佛研究:吃一個(gè)西紅柿,就等于喝了一大口可樂,真的還是假的?

泠泠說(shuō)史
2025-11-10 14:17:05
搞笑,步行者主帥在被湖人隊(duì)東契奇狂砍43分后,說(shuō)也有積極的一面

搞笑,步行者主帥在被湖人隊(duì)東契奇狂砍43分后,說(shuō)也有積極的一面

好火子
2026-03-26 23:59:41
2026-03-27 00:39:00
像素與芯片
像素與芯片
有態(tài)度網(wǎng)友ytd
513文章數(shù) 2關(guān)注度
往期回顧 全部

科技要聞

美團(tuán)發(fā)布外賣大戰(zhàn)后成績(jī)單:虧損超200億

頭條要聞

張雪峰留巨額遺產(chǎn):二婚妻子或拿50% 剩下的女兒占1/3

頭條要聞

張雪峰留巨額遺產(chǎn):二婚妻子或拿50% 剩下的女兒占1/3

體育要聞

申京努力了,然而杜蘭特啊

娛樂要聞

劉曉慶妹妹發(fā)聲!稱姐姐受身邊人挑撥

財(cái)經(jīng)要聞

油價(jià)"馴服"特朗普?一到100美元就TACO

汽車要聞

一汽奧迪A6L e-tron開啟預(yù)售 CLTC最大續(xù)航815km

態(tài)度原創(chuàng)

親子
家居
教育
公開課
軍事航空

親子要聞

看看把孩子嚇得哈哈哈

家居要聞

傍海而居 靜觀蝴蝶海

教育要聞

天天學(xué)習(xí)|走進(jìn)課堂的“大朋友”

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

擔(dān)心特朗普突然停戰(zhàn) 以總理下令48小時(shí)盡力摧毀伊設(shè)施

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版