国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

低調(diào)霸榜全球最難SQL榜單超兩月,國產(chǎn)AI這次選擇高調(diào)開源!

0
分享至

  • 金磊 發(fā)自 凹非寺
  • 量子位 | 公眾號 QbitAI

不鳴則已,一鳴驚人。

沒想到一個低調(diào)霸榜了全球最權(quán)威SQL榜單超過兩個月的國產(chǎn)AI,這一次選擇了高調(diào)開源



如此反差劇情的主角正是螞蟻數(shù)科,在第二屆CCF中國數(shù)據(jù)大會上,它正式宣布:

  • 開源旗下數(shù)據(jù)智能體關(guān)鍵技術(shù)——Agentar-SQL系列。

此次開源不僅包含實時文本轉(zhuǎn)SQL(Text-to-SQL)框架的全套論文、代碼、模型和使用指南,后期還將陸續(xù)開源數(shù)據(jù)庫理解與挖掘、行業(yè)知識挖掘、實時多輪交互技術(shù)框架,覆蓋意圖理解、業(yè)務(wù)理解到數(shù)據(jù)理解的全鏈路數(shù)據(jù)能力。

如果你關(guān)注AI數(shù)據(jù)分析領(lǐng)域,大概率聽說過BIRD-Bench。這是目前全球公認最具權(quán)威性的NL2SQL評測基準。

就在今年9月,螞蟻數(shù)科的Agentar-Scale-SQL在BIRD榜單上以執(zhí)行準確率(81.67%)和執(zhí)行效率(77%),雙料第一的成績登頂一舉超越了谷歌、亞馬遜等國際科技巨頭。



自然語言轉(zhuǎn)SQL(NL2SQL)在實際落地中面臨四大嚴峻挑戰(zhàn):理解模糊多義的人類口語、注入龐大的行業(yè)專業(yè)知識、解析復雜的數(shù)據(jù)庫結(jié)構(gòu)與關(guān)聯(lián),以及生成準確無誤的復雜SQL語句。這些挑戰(zhàn)意味著,簡單的模型“套殼”遠不足以滿足企業(yè)級應(yīng)用的可靠性與準確性要求。

螞蟻數(shù)科的Agentar-SQL核心思想在于,不是追求單一“完美”的SQL生成,而是通過系統(tǒng)化工程方法,真正讓AI賦能生產(chǎn),讓數(shù)據(jù)結(jié)果懂需求、懂業(yè)務(wù)。在某頭部城商行試運營期間,螞蟻數(shù)科Agentar SQL多個工具的平均查詢準確率超92%,較傳統(tǒng)查詢方案提升超3倍。

但這樣的成績,還不足以形容螞蟻數(shù)科。

一直以來,螞蟻數(shù)科的AI發(fā)展可謂非常“低調(diào)”。如果深挖今年的動作會發(fā)現(xiàn),螞蟻數(shù)科的AI版圖已經(jīng)非常成熟與豐富,走出了一條中國AI“非常識”但又價值巨大的新路徑。

螞蟻數(shù)科CEO趙聞飆近日在生態(tài)伙伴大會上的一番話,道出了螞蟻數(shù)科AI布局上的真實“野心”:

  • AI的真正價值不僅在于技術(shù)的先進性,更在于能否深入產(chǎn)業(yè)一線、解決實際問題。


△螞蟻數(shù)科CEO趙聞飆

之所以會有這番言論,是因為這個AI誕生的地方,正是在金融行業(yè)這個最復雜、數(shù)據(jù)門檻最高的業(yè)務(wù)場景,它經(jīng)受住了比任何公開榜單都嚴酷的考驗——

從登榜到開源,從金融到各行各業(yè),螞蟻數(shù)科正在用一套務(wù)實的方法論,回答產(chǎn)業(yè)AI如何真正用起來。

從一場非共識的死磕說起

讓我們先把時間撥回到2024年初。

那是百模大戰(zhàn)打得最兇的時候,市面上的AI公司大多在做兩件事:要么在刷各種通用榜單,證明自己的模型智商有多高;要么在做Chatbot,試圖讓AI變得更像一個陪聊伙伴。

但螞蟻數(shù)科的CEO趙聞飆和他的團隊的做法,卻顯得有些“格格不入”——

一頭扎數(shù)據(jù)門檻最高、合規(guī)要求最嚴的金融領(lǐng)域,這個被普遍認為是AI落地的“深水區(qū)”。

這個戰(zhàn)略從表面上來看是一點也不性感的,它意味著團隊必須要與“兩高一長”相伴:高風險、高投入、長回報周期。

因為這里沒有“差不多”,只有“百分百”。一個錯誤的回答不僅僅是用戶體驗下降這么簡單,更可能意味著巨額資金的損失,甚至是監(jiān)管的紅牌罰下。

金融場景的極端復雜性,體現(xiàn)在三個維度:

  • 數(shù)據(jù)高度敏感且孤島化:客戶資產(chǎn)、交易流水、風控規(guī)則等關(guān)鍵數(shù)據(jù)分散在多個系統(tǒng),互不打通;
  • 業(yè)務(wù)邏輯極其嚴謹:如“重點客戶”不是模糊標簽,而是“本季度活躍度大于80分”的明確定義;
  • 合規(guī)要求近乎苛刻:所有AI推理必須可解釋、可審計、可回溯,不允許“黑箱決策”。

每一項對AI來說都是老大難的問題。

換言之,一個AI若是能精準地搞定最難領(lǐng)域的問題,那它再身處別的領(lǐng)域時就會變得從從容容游刃有余。

但螞蟻數(shù)科偏偏選擇了死磕,事實證明,這場豪賭,他們贏了。

因為最新的成績單顯示:螞蟻數(shù)科的服務(wù)已經(jīng)覆蓋了100%的國有股份制銀行,以及超過60%的地方性商業(yè)銀行。

可以說中國金融體系的毛細血管里,已經(jīng)流淌著螞蟻數(shù)科的代碼。

不僅如此,他們還悄然躋身了IDC《中國智能體開發(fā)平臺2025年廠商評估》的領(lǐng)導者象限,意味著在市場份額和技術(shù)實力上,他們已經(jīng)站到了第一梯隊。

但光有戰(zhàn)略定力是不夠的,AI發(fā)展到現(xiàn)在的階段,更看重的好不好用。

在寧波銀行,雙方合作打造的智能化決策系統(tǒng),便徹底打破了傳統(tǒng)金融服務(wù)的知識孤島。

過去,客戶經(jīng)理面對一個復雜的投資咨詢,需要在多個系統(tǒng)間來回切換,答案常常是模糊的、滯后的。

新系統(tǒng)通過“規(guī)劃-檢索-推理”的智能機制,實現(xiàn)了從模糊匹配到精準推理的跨越。復雜問題回答準確率從68%躍升至91%,響應(yīng)速度進入百毫秒級。

更關(guān)鍵的是,系統(tǒng)能清晰呈現(xiàn)推理過程與數(shù)據(jù)來源,在強監(jiān)管的金融場景中實現(xiàn)AI黑箱白化。

上海銀行推出的AI手機銀行,則是另一種維度的革新。

它以對話即服務(wù)為核心,用戶通過自然語言交互即可辦理轉(zhuǎn)賬、理財咨詢、養(yǎng)老金查詢等業(yè)務(wù)。這不再是簡單的功能堆砌,而是體驗的重構(gòu),從“人找服務(wù)”到“服務(wù)找人”。

配合千人千面的個性化推薦與適老化設(shè)計,它已經(jīng)成為了行業(yè)數(shù)智化轉(zhuǎn)型的典型樣本。

已經(jīng)從金融級外溢到了產(chǎn)業(yè)級

金融領(lǐng)域的成功實踐,為螞蟻數(shù)科積累了可遷移的產(chǎn)業(yè)AI方法論,也推動其能力向更多民生領(lǐng)域延伸。

在南京,螞蟻數(shù)科與南京公交聯(lián)合打造的公交智能體小藍鯨,便是這一能力外溢的典型案例。



它將金融領(lǐng)域驗證過的“規(guī)劃-檢索-推理”邏輯,應(yīng)用到了城市交通的復雜系統(tǒng)中。

從分析客流到生成線路,再到輸出經(jīng)濟可行性報告,小藍鯨展現(xiàn)的是一種通用的、可遷移的產(chǎn)業(yè)AI能力。

210路公交車的開通,可謂是一下子把之前這片區(qū)域的公交線網(wǎng)空白給填上了,單日最高客流達2168人次,老年卡使用占比近50%。

不僅如此,類似210路這樣在AI建議下開通的公交,在南京已經(jīng)有30多個,還新增了84個招呼站!



據(jù)悉,這是國內(nèi)首次將AI智能體技術(shù)深度應(yīng)用于公共交通調(diào)度系統(tǒng),根據(jù)站點、客流、線路等多維數(shù)據(jù)分析,實現(xiàn)從經(jīng)驗決策到智能規(guī)劃的全面升級。

能源領(lǐng)域,這種能力同樣鋒利。

螞蟻數(shù)科的 EnergyTS 能源電力時序大模型,能夠精準預測發(fā)電量和市場供需變化。

在投前決策環(huán)節(jié),它能將原本需要2–3天的人工投資測算,縮短為十余分鐘,決策效率提升超60倍,已助力協(xié)鑫能科、霍普等企業(yè)實現(xiàn)數(shù)智化升級。

由此可見,從最難的場景切入,延伸到更廣的場景,用最硬的指標說話,這就是螞蟻數(shù)科在過去一年里上演的非共識劇本。

還敢按效果付費

技術(shù)再牛,如果賣不出去,也是白搭。

在To B的軟件市場,傳統(tǒng)的收費模式無非兩種:要么按項目制收費,要么是按訂閱制收費。

但這兩種模式都有痛點:甲方覺得我花了錢,萬一效果不好怎么辦?乙方覺得我投入了這么多人力,利潤薄如刀片。

螞蟻數(shù)科在付費模式上采取的做法也是一種非共識的打法——按效果付費。

這種模式,極大地降低了中小機構(gòu)應(yīng)用AI的門檻和風險??蛻舨辉傩枰獮椴淮_定的技術(shù)前景買單,而是為確定的業(yè)務(wù)結(jié)果付費。

這就倒逼了技術(shù)提供商必須真正深入業(yè)務(wù)一線,理解客戶的痛點,將技術(shù)能力轉(zhuǎn)化為可量化的商業(yè)價值。這是一種對自身能力的極度自信,也是一種對產(chǎn)業(yè)伙伴的真誠負責。

要規(guī)模化地實現(xiàn)這種模式,單打獨斗是行不通的,螞蟻數(shù)科深諳這一道理,因此,生態(tài)共榮,成為它必然選擇。

據(jù)了解,截至今年,螞蟻數(shù)科已與300家合作伙伴建立深度合作,共同服務(wù)超13000家終端客戶。

在這次的大會上,螞蟻數(shù)科正式升級了“星瀾計劃”,從技術(shù)賦能、運營支持、商機共享、資金扶持四個維度,全面提升伙伴能力,推動整個生態(tài)的全域升級。



一位合作伙伴在現(xiàn)場分享,今年其30%的營收來自與螞蟻數(shù)科的合作業(yè)務(wù)。這不僅僅是數(shù)字,更是市場對這套“技術(shù)+生態(tài)+商業(yè)化”組合拳的有力投票。伙伴們通過合作,沉淀出了一套AI賦能垂直場景的方法論,共同推動產(chǎn)業(yè)AI的規(guī)?;涞?。

這種生態(tài)的視野,甚至延伸到了全球。

螞蟻數(shù)科的技術(shù)方案,已服務(wù)南洋商業(yè)銀行、渣打銀行等超百家海外金融機構(gòu)。今年10月,其入選香港金融管理局生成式AI沙盒項目,為沙盒提供AI智能體服務(wù)與AI安全產(chǎn)品。

這標志著源自中國嚴苛金融場景打磨出的AI方案,正獲得國際市場的認可,展現(xiàn)出強大的全球競爭力。

在通用AI的喧囂之后,產(chǎn)業(yè)AI的務(wù)實革命才剛剛開始;而這場革命的主角,必將是那些敢于用效果說話的實干者。

— 完 —

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
21號就是冬至了!為什么說今年的冬至可不一般,60年一遇?

21號就是冬至了!為什么說今年的冬至可不一般,60年一遇?

阿天愛旅行
2025-12-17 00:16:32
巴特勒空砍31分,勇士慘遭罰球絕殺!庫里低迷,一戰(zhàn)認清三位球星

巴特勒空砍31分,勇士慘遭罰球絕殺!庫里低迷,一戰(zhàn)認清三位球星

老梁體育漫談
2025-12-19 12:45:23
東京峰會倒計時!中方立場傳全球,高市早苗心虛避談涉臺謬論

東京峰會倒計時!中方立場傳全球,高市早苗心虛避談涉臺謬論

滄海旅行家
2025-12-19 12:45:30
后續(xù)!教育部下死命令:嚴禁學校購買試卷,斬斷千億灰色利益鏈

后續(xù)!教育部下死命令:嚴禁學校購買試卷,斬斷千億灰色利益鏈

奇思妙想草葉君
2025-12-18 23:45:44
泰柬炮火暴露執(zhí)政漏洞,洪森為兒子掃平天下,卻高估了洪瑪奈能力

泰柬炮火暴露執(zhí)政漏洞,洪森為兒子掃平天下,卻高估了洪瑪奈能力

滄海旅行家
2025-12-19 12:41:19
笑噴了!38歲張雨綺,參加盛典險被認錯,整張臉垮掉,丟失辨識度

笑噴了!38歲張雨綺,參加盛典險被認錯,整張臉垮掉,丟失辨識度

丁丁鯉史紀
2025-12-18 12:23:23
日本天皇親自出山,對中國的反擊正式開始,高市早苗憋出一毒招

日本天皇親自出山,對中國的反擊正式開始,高市早苗憋出一毒招

離離言幾許
2025-12-19 12:26:38
“不差錢”的固德電材募資補流,IPO前實控人因妻子代持被罰

“不差錢”的固德電材募資補流,IPO前實控人因妻子代持被罰

野馬財經(jīng)
2025-12-19 08:36:19
直升機失事!55歲美國傳奇車手不幸離世,妻子兒女均遇難

直升機失事!55歲美國傳奇車手不幸離世,妻子兒女均遇難

全景體育V
2025-12-19 08:14:51
明星全家福,誰丑遺傳誰,丑基因是一點沒浪費,白瞎了好基因

明星全家福,誰丑遺傳誰,丑基因是一點沒浪費,白瞎了好基因

翰林濤濤
2025-12-19 10:01:23
阿里納斯:若湖人能得到約基奇或字母哥,得趁高價售出里夫斯

阿里納斯:若湖人能得到約基奇或字母哥,得趁高價售出里夫斯

懂球帝
2025-12-19 00:45:05
不是迷信!明日十一月初一,記得:1不起、2要做、3不問、4要看

不是迷信!明日十一月初一,記得:1不起、2要做、3不問、4要看

阿龍美食記
2025-12-19 05:39:50
拒絕合同!曾凡博下家定了!

拒絕合同!曾凡博下家定了!

聚焦光輝與陰暗
2025-12-19 12:42:56
不裝了!公開支持保羅+曝光快船混亂內(nèi)幕,科林斯,你大膽啊

不裝了!公開支持保羅+曝光快船混亂內(nèi)幕,科林斯,你大膽啊

球童無忌
2025-12-18 22:56:00
高市早苗天塌了,中國發(fā)布第18號令,特朗普在臺海問題上站隊

高市早苗天塌了,中國發(fā)布第18號令,特朗普在臺海問題上站隊

可樂愛微笑
2025-12-19 10:41:02
傷勢反復?缺陣13場,火箭隊伊森仍未復出!為保險起見,或再缺戰(zhàn)

傷勢反復?缺陣13場,火箭隊伊森仍未復出!為保險起見,或再缺戰(zhàn)

熊哥愛籃球
2025-12-19 13:18:55
中美俄國防開支斷崖差距:美國9000億,俄羅斯1720億,中國是多少

中美俄國防開支斷崖差距:美國9000億,俄羅斯1720億,中國是多少

歷史求知所
2025-12-18 10:05:09
太突然:湖南一知名大醫(yī)院破產(chǎn)

太突然:湖南一知名大醫(yī)院破產(chǎn)

時刻
2025-12-19 10:48:45
郭富城稱一天只吃“1.5餐”:除了度蜜月已堅持了10年

郭富城稱一天只吃“1.5餐”:除了度蜜月已堅持了10年

紅星新聞
2025-12-18 12:42:51
香港再無董建華

香港再無董建華

華人星光
2025-11-25 12:01:27
2025-12-19 14:08:49
量子位 incentive-icons
量子位
追蹤人工智能動態(tài)
11879文章數(shù) 176340關(guān)注度
往期回顧 全部

科技要聞

2025新一代人工智能創(chuàng)業(yè)大賽總決賽收官

頭條要聞

團播女生私下賣力維護"大哥":經(jīng)常擦邊 有女生會被約走

頭條要聞

團播女生私下賣力維護"大哥":經(jīng)常擦邊 有女生會被約走

體育要聞

沒有塔圖姆,還有塔禿姆

娛樂要聞

曲協(xié)表態(tài)僅6天,郭德綱擔心的事還是發(fā)生

財經(jīng)要聞

非法集資911億!"金融大鱷"終審被判無期

汽車要聞

最便宜GLS 2026款奔馳GLS經(jīng)典版售96.8萬

態(tài)度原創(chuàng)

健康
親子
家居
時尚
藝術(shù)

這些新療法,讓化療不再那么痛苦

親子要聞

很多家長問支具鋁板是什么,名字叫指鋁板,網(wǎng)上都能搜到

家居要聞

高端私宅 理想隱居圣地

“煙管褲”今年冬天爆火,怎么搭都時髦!

藝術(shù)要聞

諸樂三的寫意花鳥

無障礙瀏覽 進入關(guān)懷版