国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

當(dāng) AI 下場炒 A 股,「推理」成了新的直覺

0
分享至



RETuning:像金融分析師一樣的模型,正在出現(xiàn)。

作者丨鄭佳美

編輯丨馬曉寧

幾天前,一場名為“AI Trading Battle”的實驗在海外社交媒體上火了。主辦方給六個主流大模型(包括 ChatGPT、Gemini、Claude 等)每人一萬美元的虛擬資金,讓它們自由進(jìn)行加密貨幣交易。結(jié)果讓人大跌眼鏡:截至今天,DeepSeek V3.1 實現(xiàn)了超過 126% 的驚人盈利率,而GPT 5 和 Gemini 2.5 Pro 跌破 5,000 美元,虧損率超過 50%。

這場“AI 交易秀”原本旨在展示智能的金融潛力,卻反而揭示了一個更深層的問題:當(dāng)面對復(fù)雜而動態(tài)的金融環(huán)境時,語言模型知不知道他們“為什么下單”呢?

而由香港科技大學(xué)、美國羅格斯大學(xué)和南開大學(xué)聯(lián)合研究團(tuán)隊發(fā)表的最新論文,則是關(guān)于這類問題給出了一個答案。

他們提出了一種名為RETuning的方法,讓大語言模型在做出預(yù)測前,先搜集證據(jù)、分析邏輯、反思推理,再得出結(jié)論。換句話說,模型不再是“憑直覺判斷”,而是學(xué)會了“有理有據(jù)地思考”。

研究團(tuán)隊基于覆蓋中國 A 股市場的大規(guī)模數(shù)據(jù)集,對這一方法進(jìn)行了系統(tǒng)驗證。結(jié)果表明,RETuning 不僅顯著提升了預(yù)測準(zhǔn)確率,還讓模型的推理過程更清晰、更可信,為金融領(lǐng)域的人工智能研究帶來了新的方向。


01

從準(zhǔn)確率到平衡性的顯著提升

在這項研究中,作者利用中國 A 股市場的大規(guī)模股票走勢預(yù)測數(shù)據(jù)集,對他們提出的RETuning(反思式證據(jù)調(diào)優(yōu))方法進(jìn)行了系統(tǒng)驗證,結(jié)果表明這種方法確實顯著提升了大語言模型在金融預(yù)測任務(wù)中的表現(xiàn)。

首先,從總體效果來看,RETuning 模型(如 DeepSeek_R1_14B_SFT_GRPO)在三分類任務(wù):預(yù)測股票“上漲、持平、下跌”中取得了明顯優(yōu)勢。與主流的基礎(chǔ)模型相比(包括 ChatGPT、LLaMA3-8B、Mistral 等),RETuning 的 F1 分?jǐn)?shù)平均高出 10% 到 20%,說明它不僅能更準(zhǔn)確地區(qū)分股票走勢方向,還能在不同類別之間保持更平衡的預(yù)測效果。這種提升在金融任務(wù)中非常罕見,因為股票數(shù)據(jù)噪聲大、隨機(jī)性強(qiáng),能有雙位數(shù)的提升已經(jīng)算是非常顯著的成果。


其次,作者特別測試了模型在時間外數(shù)據(jù)(Out-of-Distribution)上的表現(xiàn),也就是讓模型預(yù)測它沒見過的股票或未來日期的走勢。結(jié)果顯示,RETuning 模型在這種“未來數(shù)據(jù)”上的表現(xiàn)依然穩(wěn)定,沒有明顯掉線,說明它具備一定的泛化能力,能適應(yīng)不同時間段和不同公司的情況,而不僅僅是“記住了訓(xùn)練集”。


推理階段的實驗中,RETuning 還展示了另一個有趣的現(xiàn)象:作者嘗試通過“多次思考”來提升預(yù)測質(zhì)量。具體做法是讓模型在同一問題上生成多次不同的推理過程(即多次采樣),最后再通過多數(shù)投票確定最終答案。結(jié)果發(fā)現(xiàn),當(dāng)生成次數(shù)在 8 到 16 次之間時,預(yù)測準(zhǔn)確率會顯著提升;但如果次數(shù)太多(超過 32 次),效果反而會下降。換句話說,模型多想幾次確實有助于它更慎重地決策,但思考太多則會帶來冗余和噪聲,說明推理時擴(kuò)展存在一個最佳區(qū)間。


此外,RETuning 在可解釋性方面也有明顯進(jìn)步。與傳統(tǒng)的提示式方法(Prompt-Only)不同,RETuning 模型會主動構(gòu)建一套完整的分析邏輯。它會先從輸入信息中整理出支持“上漲”的證據(jù)和支持“下跌”的證據(jù),分別進(jìn)行分析,然后再綜合判斷,得出最終預(yù)測。也就是說,它不僅給出結(jié)果,還會告訴你“為什么這么想”。


在人類專家評估中,這種反思式推理輸出被認(rèn)為更有條理、更符合分析師邏輯。相比之下,傳統(tǒng)模型往往只輸出模糊結(jié)論或含糊理由,而 RETuning 的回答更接近人類投資分析報告的寫法:會明確說明影響因素、權(quán)衡證據(jù)并形成理性的判斷。研究人員指出,這種變化不僅提升了模型的可信度,也讓 LLM 更適合用于需要解釋性和推理深度的金融場景。

最后,RETuning 模型在多個指標(biāo)上都優(yōu)于其他對照模型(如只用提示的模型、僅監(jiān)督微調(diào)的模型、或使用普通強(qiáng)化學(xué)習(xí)的模型),說明它結(jié)合了監(jiān)督微調(diào)、規(guī)則化強(qiáng)化學(xué)習(xí)與推理時擴(kuò)展三種思路的優(yōu)勢,是一種綜合改進(jìn)方案,而不是單一技巧。


02

不僅是結(jié)果,更是過程

顯著的性能提升外,是十分系統(tǒng)的實驗過程。RETuning 的實驗過程涵蓋了從數(shù)據(jù)構(gòu)建到模型訓(xùn)練、再到驗證評估的完整流程。

首先,研究團(tuán)隊自己構(gòu)建了一個叫Fin-2024的大規(guī)模數(shù)據(jù)集,用來模擬真實的中國 A 股市場。這個數(shù)據(jù)集非常龐大,包含 5000 多只股票、20 多萬個樣本。每條樣本都整合了來自多個渠道的信息,比如新聞報道、分析師評論、公司財報、量化指標(biāo)、宏觀經(jīng)濟(jì)數(shù)據(jù),還有類似股票的走勢。然后研究者根據(jù)實際的漲跌幅給樣本打上標(biāo)簽(漲、跌或持平),平均每條數(shù)據(jù)的文本長度能達(dá)到 3 萬多個詞,讓模型能處理非常長的金融文本。


在此基礎(chǔ)上,研究團(tuán)隊采用了三個階段的訓(xùn)練流程。

第一步是監(jiān)督微調(diào)(SFT),這一階段的目標(biāo)是讓模型學(xué)會“怎么分析”。它不直接預(yù)測,而是先建立分析邏輯:先提出分析原則,再整理出支持和反對的證據(jù),最后得出結(jié)論。這里模型使用 DeepSeek 系列作為基礎(chǔ)(7B、14B、32B 參數(shù)量的版本都有),通過 LoRA 微調(diào)來節(jié)省顯存。


第二步是基于規(guī)則的強(qiáng)化學(xué)習(xí)(Rule-based RL),這一步是讓模型變得“更聰明”。研究者設(shè)計了一個有三項評分的獎勵機(jī)制:格式正確、預(yù)測準(zhǔn)確、邏輯一致。模型每次生成結(jié)果后,都會根據(jù)這三項標(biāo)準(zhǔn)被“打分”,然后通過 GRPO 算法(類似 RLHF 但更穩(wěn)定)不斷調(diào)整策略。


為了避免模型在太容易或太難的樣本上浪費時間,他們還引入了課程學(xué)習(xí)(Curriculum Learning)。具體做法是:先讓模型對每個樣本預(yù)測 8 次,根據(jù)預(yù)測正確的次數(shù)判斷難度,只保留“中等難度”的樣本訓(xùn)練,并且按照從簡單到復(fù)雜的順序訓(xùn)練,逐步提高模型的推理能力。

最后一步是推理時擴(kuò)展(Inference-Time Scaling)。這就像是讓模型在做決定前多思考幾次。它會針對同一個問題生成多種不同的推理路徑(比如 8 次、16 次),然后通過多數(shù)投票選出最終預(yù)測。實驗發(fā)現(xiàn),這種“多想幾次再決定”的策略,確實能顯著提高預(yù)測的穩(wěn)定性和準(zhǔn)確率。


整個訓(xùn)練過程在 32 張 NVIDIA H100 GPU 上完成,SFT 階段用了 Xtuner + DeepSpeed 框架,強(qiáng)化學(xué)習(xí)階段則由 verl 實現(xiàn) GRPO。訓(xùn)練數(shù)據(jù)是 2024 年 1 月到 11 月的市場數(shù)據(jù),測試在 2024 年 12 月的樣本上完成,還額外用了 2025 年 6 月的數(shù)據(jù)來測試模型在未來數(shù)據(jù)上的泛化能力。最終,RETuning 的表現(xiàn)遠(yuǎn)超其他模型,比如 ChatGPT、LLaMA3 和 Mistral,不僅預(yù)測更準(zhǔn),還能解釋“為什么這么判斷”。


03

仍有挑戰(zhàn),但方向明確

綜上實驗可以看出,RETuning 不光提升了模型的預(yù)測準(zhǔn)確率,同時也帶來了較為深層的意義。

首先,它讓大語言模型在金融預(yù)測中變得更可解釋了。RETuning 引入了“反思式證據(jù)推理”,讓模型不只是給出結(jié)果,而是能先找證據(jù)、再分析、最后下判斷,讓整個推理過程變得清晰、可信。

其次,研究還驗證了推理時擴(kuò)展這一新思路的可行性。簡單來說,就是讓模型在回答前多想幾次再決定。實驗發(fā)現(xiàn),適度增加思考次數(shù)能顯著提高準(zhǔn)確率,但思考太多反而會帶來計算開銷大、收益遞減的問題。

另外,RETuning 團(tuán)隊還構(gòu)建了一個覆蓋 5000 多只股票的大型 A 股數(shù)據(jù)集,為金融類大模型的訓(xùn)練提供了寶貴資源,也為未來在投資情緒分析、經(jīng)濟(jì)新聞理解等方向打下了基礎(chǔ)。

當(dāng)然,這項研究也有一些局限性。模型的表現(xiàn)依然會受到市場噪聲和非理性波動的影響,暫時還不適合直接用于實盤交易,而訓(xùn)練和推理階段的算力消耗都比較高,尤其是在強(qiáng)化學(xué)習(xí)和多輪采樣階段。目前的實驗也只驗證了 A 股市場,未來還需要在不同市場和時間段上進(jìn)一步測試。

未經(jīng)「AI科技評論」授權(quán),嚴(yán)禁以任何方式在網(wǎng)頁、論壇、社區(qū)進(jìn)行轉(zhuǎn)載!

公眾號轉(zhuǎn)載請先在「AI科技評論」后臺留言取得授權(quán),轉(zhuǎn)載時需標(biāo)注來源并插入本公眾號名片。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
上海至嘉興南高鐵票需936元?12306客服:系環(huán)線列車,途經(jīng)17個站點,選擇旅游次票只需要61元

上海至嘉興南高鐵票需936元?12306客服:系環(huán)線列車,途經(jīng)17個站點,選擇旅游次票只需要61元

極目新聞
2025-12-19 17:46:43
19號收評:日本加息25個基點!所有人都注意,大盤下周開始這樣看

19號收評:日本加息25個基點!所有人都注意,大盤下周開始這樣看

春江財富
2025-12-19 15:16:01
“日入過萬”的16歲深圳燒雞少年壓力來了!稱每天到手只有1000多

“日入過萬”的16歲深圳燒雞少年壓力來了!稱每天到手只有1000多

火山詩話
2025-12-19 11:47:47
曝TikTok交易達(dá)成,美國和字節(jié)跳動各掌握一家公司

曝TikTok交易達(dá)成,美國和字節(jié)跳動各掌握一家公司

爆角追蹤
2025-12-19 18:18:51
嚇一跳?山東釣友野外釣魚釣到巨型魚骨!網(wǎng)友:死魚正口收竿就走

嚇一跳?山東釣友野外釣魚釣到巨型魚骨!網(wǎng)友:死魚正口收竿就走

解說阿洎
2025-12-19 11:37:07
27歲女孩“巧巧”已不幸離世,體重僅35斤,命運坎坷!早年父親去世,母親改嫁,有嚴(yán)重抑郁癥

27歲女孩“巧巧”已不幸離世,體重僅35斤,命運坎坷!早年父親去世,母親改嫁,有嚴(yán)重抑郁癥

新民晚報
2025-12-19 15:05:51
柬埔寨再次故技重施,眼看打不過泰國,隨即公布阿努廷的私人照片

柬埔寨再次故技重施,眼看打不過泰國,隨即公布阿努廷的私人照片

低調(diào)看天下
2025-12-19 12:11:34
俄羅斯正為戰(zhàn)爭付出高昂代價,即使戰(zhàn)爭結(jié)束,也要還債很多年

俄羅斯正為戰(zhàn)爭付出高昂代價,即使戰(zhàn)爭結(jié)束,也要還債很多年

山河路口
2025-12-18 22:29:20
中央戲劇學(xué)院院長郝戎被查,劉燁、章子怡、靳東等為其學(xué)生,曾搭檔王志文、李冰冰演電視劇,被稱"明星導(dǎo)師"

中央戲劇學(xué)院院長郝戎被查,劉燁、章子怡、靳東等為其學(xué)生,曾搭檔王志文、李冰冰演電視劇,被稱"明星導(dǎo)師"

大風(fēng)新聞
2025-12-19 11:54:20
炸裂!26歲女子猥褻12歲侄子,丈夫披露事發(fā)細(xì)節(jié),鑒定結(jié)果引質(zhì)疑

炸裂!26歲女子猥褻12歲侄子,丈夫披露事發(fā)細(xì)節(jié),鑒定結(jié)果引質(zhì)疑

派大星紀(jì)錄片
2025-12-19 11:47:05
中學(xué)生務(wù)工時在公司宿舍被打致死,施暴者無刑責(zé)能力 父母起訴多方索賠144萬,一審判了

中學(xué)生務(wù)工時在公司宿舍被打致死,施暴者無刑責(zé)能力 父母起訴多方索賠144萬,一審判了

紅星新聞
2025-12-19 17:06:17
全球首個!我國發(fā)現(xiàn)新礦物!一塊石頭值千億?

全球首個!我國發(fā)現(xiàn)新礦物!一塊石頭值千億?

李云飛Afey
2025-12-18 22:48:17
鄭麗文宣戰(zhàn)賴清德,蔣萬安果斷站隊,朱立倫回應(yīng),藍(lán)營一人跳反

鄭麗文宣戰(zhàn)賴清德,蔣萬安果斷站隊,朱立倫回應(yīng),藍(lán)營一人跳反

博覽歷史
2025-12-18 18:21:05
600多元天津飛北京,中轉(zhuǎn)30多個小時“特種兵”游成都,無錫飛常州中轉(zhuǎn)重慶跨年省錢近一半,“回旋鏢”機(jī)票火出圈

600多元天津飛北京,中轉(zhuǎn)30多個小時“特種兵”游成都,無錫飛常州中轉(zhuǎn)重慶跨年省錢近一半,“回旋鏢”機(jī)票火出圈

極目新聞
2025-12-19 07:21:26
社評:中國科技進(jìn)步,路透社本不必焦慮

社評:中國科技進(jìn)步,路透社本不必焦慮

環(huán)球網(wǎng)資訊
2025-12-19 00:45:05
南京博物院受捐文物驚現(xiàn)拍賣場:監(jiān)守自盜還是有苦難言

南京博物院受捐文物驚現(xiàn)拍賣場:監(jiān)守自盜還是有苦難言

銀河敘事
2025-12-17 19:24:04
突發(fā)!又一保險公司“人去樓空”,CEO被帶走調(diào)查?

突發(fā)!又一保險公司“人去樓空”,CEO被帶走調(diào)查?

毒sir財經(jīng)
2025-12-18 23:25:25
AVATAR阿凡達(dá)3小時存活確認(rèn)

AVATAR阿凡達(dá)3小時存活確認(rèn)

君笙的拂兮
2025-12-18 16:48:39
女教師咒罵全班得甲流:身份曝光,有編制不怕,停職后報復(fù)舉報者

女教師咒罵全班得甲流:身份曝光,有編制不怕,停職后報復(fù)舉報者

何慕白
2025-12-18 15:23:30
海南封關(guān)背后,真正的意圖!

海南封關(guān)背后,真正的意圖!

子木聊房
2025-12-18 16:23:54
2025-12-19 18:36:49
AI科技評論 incentive-icons
AI科技評論
點評學(xué)術(shù),服務(wù)AI
7014文章數(shù) 20715關(guān)注度
往期回顧 全部

科技要聞

2025新一代人工智能創(chuàng)業(yè)大賽總決賽收官

頭條要聞

日媒披露:日本請求派代表團(tuán)訪華 未獲中方回復(fù)

頭條要聞

日媒披露:日本請求派代表團(tuán)訪華 未獲中方回復(fù)

體育要聞

“惡龍”埃托奧,正在毀滅喀麥隆足球

娛樂要聞

曲協(xié)表態(tài)僅6天,郭德綱擔(dān)心的事還是發(fā)生

財經(jīng)要聞

非法集資911億!"金融大鱷"終審被判無期

汽車要聞

“一體壓鑄”再引熱議 一旦受損真的修不起嗎?

態(tài)度原創(chuàng)

本地
數(shù)碼
藝術(shù)
時尚
公開課

本地新聞

云游安徽|訪黃山云海古村,讀一城山水風(fēng)骨

數(shù)碼要聞

第一款高性能迷你顯卡!七彩虹iGame RTX 5070 Mini OC 12GB評測:烤機(jī)一小時不到75度

藝術(shù)要聞

諸樂三的寫意花鳥

女友BELLA+封面 | Jimmy&Ohm:人生拼圖

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版