国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

數(shù)說故事 ×IDEA 共創(chuàng)成果再登 ACL!「PARSQL 推理」直擊應(yīng)用痛點(diǎn)

0
分享至

近日,數(shù)說故事×IDEA數(shù)說故事實(shí)驗(yàn)室(以下簡稱IDEA實(shí)驗(yàn)室)聯(lián)合研究團(tuán)隊(duì)共創(chuàng)的學(xué)術(shù)論文《PARSQL: Enhancing Text-to-SQL through SQL Parsing and Reasoning》被國際學(xué)術(shù)頂會ACL 2025收錄,繼此前雙方合力研究的「細(xì)粒度情感四元組識別 (ASQP) 任務(wù)」成果被收錄后,再度躋身 ACL 國際學(xué)術(shù)舞臺。

ACL大會由國際計(jì)算語言學(xué)協(xié)會主辦,是自然語言處理與計(jì)算語言學(xué)領(lǐng)域最高級別的學(xué)術(shù)會議。ACL 2025是中國計(jì)算機(jī)學(xué)會(CCF)推薦的唯一A類的自然語言領(lǐng)域國際學(xué)術(shù)會議。

本次研究成果入選 ACL國際頂會,不僅是對「PARSQL」技術(shù)在輕量模型語義解析領(lǐng)域創(chuàng)新突破的國際認(rèn)可,更是對數(shù)說故事與IDEA實(shí)驗(yàn)室產(chǎn)學(xué)研深度融合技術(shù)創(chuàng)新的肯定。

在企業(yè)數(shù)據(jù)量呈爆炸式增長的當(dāng)下,數(shù)據(jù)洞察早已從「加分項(xiàng)」變成核心剛需。品牌投放反饋、大促期間流量瞬變、跨境市場&政策波動等場景,要求數(shù)據(jù)查詢分析具備「秒級反饋」能力,如何讓數(shù)據(jù)流動起來并創(chuàng)造價(jià)值?以往的Text?to?SQL(NL2SQL)技術(shù),通過聊天的方式就能查詢數(shù)據(jù)庫,但實(shí)際使用時(shí)經(jīng)常遇到尷尬問題:

  • 常常漏掉關(guān)鍵約束。例如運(yùn)營人員查詢「近 30 天微博投放中互動率超 10% 且金額超 5 萬」的內(nèi)容時(shí),模型因漏識 「金額」 條件致結(jié)果含大量低預(yù)算數(shù)據(jù)。
  • 查詢邏輯「翻車」。例如市場團(tuán)隊(duì)想獲取「每個(gè)品牌在小紅書平臺的平均點(diǎn)贊數(shù),并篩選出平均值大于1000的品牌」。模型誤將篩選條件放到SELECT子句中,導(dǎo)致查詢返回全量品牌數(shù)據(jù)而非目標(biāo)品牌。
  • 越復(fù)雜的業(yè)務(wù)需求,越「答非所問」。例如數(shù)據(jù)分析師查詢 2024 年 Q1 連續(xù)三周產(chǎn)生爆文(點(diǎn)贊 > 1 萬)的品牌并分析其投放頻率周變化時(shí),模型因未理解「連續(xù)三周」「爆文定義」「頻率變化」復(fù)合邏輯僅返回所有爆文筆記,偏離分析目標(biāo)。

本次論文中,雙方合力研究的PARSQL(SQL解析與推理增強(qiáng)框架),直擊 Text-to-SQL 技術(shù)在實(shí)際應(yīng)用中的核心痛點(diǎn),當(dāng)面對復(fù)雜查詢時(shí),不是直接「硬闖」,而是先分析、再推理、最后生成,大大提升了準(zhǔn)確性。本次研究中,我們將「PARSQL」技術(shù)的創(chuàng)新應(yīng)用錨定在「輕量模型」上,讓輕量級模型在資源受限環(huán)境下實(shí)現(xiàn)復(fù)雜語義解析、多條件關(guān)聯(lián)查詢的效率提升,開創(chuàng)低算力消耗的數(shù)據(jù)智能新路徑。

01「PARSQL」

讓輕量模型也能應(yīng)對復(fù)雜查詢

相較于傳統(tǒng)的 Text-to-SQL 「一步到位」轉(zhuǎn)換模式,「PARSQL」創(chuàng)新性地拆解為「解析→增強(qiáng)→推理→校對」的四步策略,讓輕量模型也能像資深數(shù)據(jù)分析師一樣,系統(tǒng)化地理解和處理復(fù)雜的查詢需求。

PARSQL的重要技術(shù)創(chuàng)新:解析+推理+選擇

  1. 智能SQL解析
    「PARSQL 」里的SQL解析器PARSer,能夠先把 SQL 拆解成抽象語法樹(AST),逐一提煉出用戶在查詢過程中的每個(gè)約束條件、子查詢片段和關(guān)鍵節(jié)點(diǎn)。接著,「PARSQL 」會依照 SQL 的執(zhí)行順序來「講故事」,從 FROM、WHERE 到 GROUP BY、HAVING,再到 ORDER BY,最后到SELECT,系統(tǒng)化地生成每一步的自然語言解釋,為數(shù)據(jù)增強(qiáng)提供高質(zhì)量訓(xùn)練樣本。
  2. 數(shù)據(jù)增強(qiáng)和多任務(wù)學(xué)習(xí)策略

「New Pairs」訓(xùn)練:將原始問題和 SQL 拆成只帶部分約束的子對,從細(xì)節(jié)開始練起,讓輕量模型在輕量級練習(xí)中敏銳捕捉細(xì)節(jié);

「Reason Pairs」訓(xùn)練:讓模型輸出從問題到推理步驟的完整鏈路,學(xué)會寫出「為什么這么查」,提升邏輯連貫性;

并行優(yōu)化:同一次訓(xùn)練中,并行優(yōu)化Text-to-SQL和Text-to-Reason兩個(gè)任務(wù),讓模型既會寫SQL,也會「說理由」。

3.高效選擇策略
在推理階段,PARSQL會生成多組候選SQL和對應(yīng)的「推理腳本」,通過N-gram相似度計(jì)算,一秒鐘內(nèi)挑出最契合邏輯的那條。這種自我校正機(jī)制,把原本容易跑偏的「認(rèn)知坑」填平。

「PARSQL」技術(shù)已成功落地到數(shù)說故事旗下產(chǎn)品矩陣,以數(shù)說聲吶產(chǎn)品的「智能問數(shù)」功能為例,業(yè)務(wù)人員可通過簡答對話的形式便能實(shí)現(xiàn)自主數(shù)據(jù)探索。從業(yè)務(wù)的視角提出數(shù)據(jù)需求,「智能問數(shù)」能基于業(yè)務(wù)問題進(jìn)行分析和解讀,從數(shù)據(jù)中篩選準(zhǔn)確的數(shù)據(jù),進(jìn)行合理的統(tǒng)計(jì)與總結(jié),給用戶明確的回答。

02 性能突破:「PARSQL」

讓輕量模型追平7B大模型

實(shí)驗(yàn)表明,與其他Text-to-SQL方法相比,「PARSQL」這樣一套「解析→增強(qiáng)→校對」的組合拳,在多個(gè)基準(zhǔn)數(shù)據(jù)集上展示了更高的準(zhǔn)確性和更強(qiáng)的魯棒性。

  • 同等模型規(guī)模下表現(xiàn)更優(yōu):在 BIRD 數(shù)據(jù)集上,PARSQL rule 和 PARSQL llm 相較于 1B 和 3B參數(shù)規(guī)模下均優(yōu)于 SFT CodeS。其中,PARSQL-3Bllm 比 SFT CodeS-3B 的 EX 分?jǐn)?shù)提高了 1.96%,表現(xiàn)接近SFT CodeS-7B,意味著用更少的參數(shù)實(shí)現(xiàn)了相當(dāng)?shù)男阅鼙憩F(xiàn)。
  • 在通用數(shù)據(jù)集上更具競爭力:在Spider基準(zhǔn)上,PARSQL-1B?rule 相比 SFT CodeS?1B 在執(zhí)行準(zhǔn)確率和語法正確性上分別提升 2.8% 和 2.6%,顯著減少了小錯(cuò)誤的產(chǎn)生,體現(xiàn)出其在基礎(chǔ)任務(wù)中的穩(wěn)定性和細(xì)節(jié)處理能力。
  • 在復(fù)雜任務(wù)中更有潛力:在 BIRD 數(shù)據(jù)集上,PARSQL?3B 相較于依賴 GPT?4 的閉源方案,展現(xiàn)出相近的性能,說明在資源受限場景下,輕量模型仍具備良好的拓展?jié)摿Α?/li>

這意味著企業(yè)可以通過「PARSQL」技術(shù),用更少的計(jì)算資源獲得更高的查詢準(zhǔn)確性,大幅降低AI部署和運(yùn)維成本,同時(shí)保證業(yè)務(wù)查詢的精確性。當(dāng) AI 技術(shù)不再是「猛砸算力」,而是通過解析+推理+自我校正的多維度設(shè)計(jì),就能讓「小而美」的模型在千變?nèi)f化的業(yè)務(wù)需求中游刃有余。

03 產(chǎn)業(yè)價(jià)值:重新定義

數(shù)據(jù)查詢的「經(jīng)濟(jì)」模型

對于數(shù)據(jù)服務(wù)提供商和企業(yè)客戶而言,「PARSQL」的技術(shù)突破具有重要的商業(yè)價(jià)值:

1、成本優(yōu)化:輕量模型的資源消耗僅為大模型的幾分之一,顯著降低算力成本和部署門檻;

2、精度保證:通過SQL解析和推理機(jī)制,確保查詢結(jié)果的準(zhǔn)確性,避免業(yè)務(wù)決策偏;

3、本地部署:輕量模型更適合私有化部署,滿足數(shù)據(jù)安全和隱私保護(hù)需求;

4、實(shí)時(shí)響應(yīng):更高的推理效率,支持高并發(fā)、低延時(shí)的查詢場景;

隨著「PARSQL」技術(shù)的產(chǎn)業(yè)化應(yīng)用,將進(jìn)一步降低企業(yè)數(shù)字化轉(zhuǎn)型的技術(shù)門檻,讓更多企業(yè)能夠以更低成本、更高效率地利用數(shù)據(jù)價(jià)值,實(shí)現(xiàn)智能化決策。

未來,數(shù)說故事將繼續(xù)秉承「用數(shù)據(jù)講好商業(yè)故事」的使命,攜手更多合作伙伴持續(xù)推動AI技術(shù)在數(shù)據(jù)服務(wù)領(lǐng)域的創(chuàng)新應(yīng)用,為企業(yè)數(shù)字化轉(zhuǎn)型提供更加智能、高效、經(jīng)濟(jì)的解決方案。

關(guān)于IDEA數(shù)說故事實(shí)驗(yàn)室

IDEA實(shí)驗(yàn)室 DataStory AI Lab由數(shù)說故事攜手 IDEA實(shí)驗(yàn)室共建,基于數(shù)說故事“大數(shù)據(jù)+AI”豐富的技術(shù)棧積累和平臺化能力,結(jié)合 IDEA實(shí)驗(yàn)室國際TOP50的超級計(jì)算集群優(yōu)勢,將聯(lián)合國內(nèi)外頂尖高校和科研院所,圍繞AI知識圖譜、下一代動態(tài)海量事理圖譜技術(shù)等領(lǐng)域展開國際一流的研究和產(chǎn)業(yè)化落地。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
太陽最美忠實(shí)女球迷!本賽季多次場邊觀戰(zhàn) 還是有超棒身材的學(xué)霸

太陽最美忠實(shí)女球迷!本賽季多次場邊觀戰(zhàn) 還是有超棒身材的學(xué)霸

Emily說個(gè)球
2026-01-15 21:51:46
改打法!萊昂納德化身三分機(jī)器 快艇北伐停不下來

改打法!萊昂納德化身三分機(jī)器 快艇北伐停不下來

體壇周報(bào)
2026-01-15 22:10:13
三大賽MVP,公認(rèn)的全美第一控衛(wèi),如今卻在NBA迷失,場均僅6+2+3

三大賽MVP,公認(rèn)的全美第一控衛(wèi),如今卻在NBA迷失,場均僅6+2+3

大衛(wèi)的籃球故事
2026-01-14 21:46:40
重大確認(rèn)!山西發(fā)現(xiàn)4100年前夏朝的都城,有文字!

重大確認(rèn)!山西發(fā)現(xiàn)4100年前夏朝的都城,有文字!

鶴羽說個(gè)事
2026-01-15 15:04:31
拼下卡位戰(zhàn),山東男籃8連勝 邱彪換于德豪展高情商 3外援合砍72分

拼下卡位戰(zhàn),山東男籃8連勝 邱彪換于德豪展高情商 3外援合砍72分

替補(bǔ)席看球
2026-01-15 21:36:07
僅攔截兩枚,16枚彈道導(dǎo)彈突防成功!俄軍無人系統(tǒng)部隊(duì)大擴(kuò)軍

僅攔截兩枚,16枚彈道導(dǎo)彈突防成功!俄軍無人系統(tǒng)部隊(duì)大擴(kuò)軍

鷹眼Defence
2026-01-14 17:39:32
陶哲軒驚嘆!數(shù)學(xué)奇點(diǎn)初現(xiàn),AI首次給出人類無法企及的原創(chuàng)證明

陶哲軒驚嘆!數(shù)學(xué)奇點(diǎn)初現(xiàn),AI首次給出人類無法企及的原創(chuàng)證明

新智元
2026-01-15 21:19:52
廣東為何40分慘?。抠惡蠖配h給出了答案,沒想到又甩鍋了,真無語

廣東為何40分慘???賽后杜鋒給出了答案,沒想到又甩鍋了,真無語

萌蘭聊個(gè)球
2026-01-15 22:35:03
太魔幻!中國隊(duì)是八強(qiáng)中身價(jià)最高球隊(duì),王鈺棟150萬歐領(lǐng)跑個(gè)人榜

太魔幻!中國隊(duì)是八強(qiáng)中身價(jià)最高球隊(duì),王鈺棟150萬歐領(lǐng)跑個(gè)人榜

綠茵舞著
2026-01-15 21:37:27
突發(fā)!又一位院士從中國工程院院士名單中撤下!

突發(fā)!又一位院士從中國工程院院士名單中撤下!

高分子科學(xué)前沿
2026-01-15 21:44:19
1997年的TVB,真是神仙打架,《天龍八部》收視僅排第六

1997年的TVB,真是神仙打架,《天龍八部》收視僅排第六

小李大俠
2026-01-14 18:07:51
57歲江珊現(xiàn)狀讓人心酸,臉垮嘴斜,滿頭白發(fā),一代女神像老太太

57歲江珊現(xiàn)狀讓人心酸,臉垮嘴斜,滿頭白發(fā),一代女神像老太太

一娛三分地
2025-11-29 22:10:18
格力大手筆分紅近56億

格力大手筆分紅近56億

第一財(cái)經(jīng)資訊
2026-01-15 22:08:04
24分大勝!楊瀚森22+7+3,賽后小楊走到對方替補(bǔ)席,逐一握手致意

24分大勝!楊瀚森22+7+3,賽后小楊走到對方替補(bǔ)席,逐一握手致意

擔(dān)酒
2026-01-15 12:10:16
楊瀚森砍22+7發(fā)展聯(lián)盟遭質(zhì)疑水平低 韓國球迷:幸好他沒打世預(yù)賽

楊瀚森砍22+7發(fā)展聯(lián)盟遭質(zhì)疑水平低 韓國球迷:幸好他沒打世預(yù)賽

大嘴爵爺侃球
2026-01-15 17:07:00
中戲院長落馬,牽出明星暗線!寒門藝考生的前路究竟在哪里?

中戲院長落馬,牽出明星暗線!寒門藝考生的前路究竟在哪里?

垛垛糖
2026-01-14 20:33:18
聯(lián)賽第一!廣廈大勝送四川15連敗 孫銘徽14+8胡金秋7中6

聯(lián)賽第一!廣廈大勝送四川15連敗 孫銘徽14+8胡金秋7中6

醉臥浮生
2026-01-15 21:03:26
李在明面見高市,絕口不提日本擴(kuò)軍,反提一個(gè)問題,與中國相關(guān)

李在明面見高市,絕口不提日本擴(kuò)軍,反提一個(gè)問題,與中國相關(guān)

博覽歷史
2026-01-14 22:03:46
一行代碼都不會!花270元、燒光1500次請求,他和5歲兒子一周做出游戲:現(xiàn)在作業(yè)直接“玩上癮”了……

一行代碼都不會!花270元、燒光1500次請求,他和5歲兒子一周做出游戲:現(xiàn)在作業(yè)直接“玩上癮”了……

CSDN
2026-01-15 18:57:51
三人私闖庭院后續(xù):正臉曝光社死,官方賬號淪陷,大理文旅壓力大

三人私闖庭院后續(xù):正臉曝光社死,官方賬號淪陷,大理文旅壓力大

有范又有料
2026-01-14 20:07:45
2026-01-15 23:03:00
數(shù)說故事
數(shù)說故事
數(shù)據(jù)智能與AI營銷科技公司
790文章數(shù) 63關(guān)注度
往期回顧 全部

科技要聞

阿里最狠的一次“自我革命”

頭條要聞

車主稱4S店只賣套餐不給單換:剎車油線下價(jià)是線上3倍

頭條要聞

車主稱4S店只賣套餐不給單換:剎車油線下價(jià)是線上3倍

體育要聞

聶衛(wèi)平:黑白棋盤上的凡人棋圣

娛樂要聞

傳奇棋圣聶衛(wèi)平離世,網(wǎng)友集體悼念

財(cái)經(jīng)要聞

央行再次結(jié)構(gòu)性降息0.25個(gè)百分點(diǎn)

汽車要聞

吉利帝豪/繽越推冠軍一口價(jià) 起售價(jià)4.88萬

態(tài)度原創(chuàng)

旅游
房產(chǎn)
本地
公開課
軍事航空

旅游要聞

人文經(jīng)濟(jì)激活消費(fèi)新動能|重慶魯祖廟傳統(tǒng)風(fēng)貌區(qū):百年老街區(qū)蝶變煙火新潮地

房產(chǎn)要聞

突發(fā)!商業(yè)用房購房貸款最低首付比例下調(diào)至30%

本地新聞

云游內(nèi)蒙|黃沙與碧波撞色,烏海天生會“混搭”

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

美國已正式開始出售委內(nèi)瑞拉石油

無障礙瀏覽 進(jìn)入關(guān)懷版