国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

寫(xiě)Verilog、調(diào)CUDA,總翻車(chē)?工業(yè)代碼大模型開(kāi)始學(xué)會(huì)先想后寫(xiě)了

0
分享至



代碼大模型會(huì)寫(xiě)代碼,這件事已經(jīng)不新鮮了。

真正新的問(wèn)題是:它會(huì)不會(huì)在寫(xiě)之前先想清楚,這段代碼一旦進(jìn)入真實(shí)系統(tǒng),會(huì)發(fā)生什么?

這個(gè)問(wèn)題在工業(yè)場(chǎng)景里尤其關(guān)鍵。因?yàn)楣I(yè)代碼和普通編程不一樣,它不是 “語(yǔ)法通順、功能差不多” 就算過(guò)關(guān),而是要面對(duì)真實(shí)硬件、真實(shí)工具鏈和真實(shí)約束。一個(gè) Verilog 模塊可能語(yǔ)法沒(méi)問(wèn)題,卻在仿真或綜合階段直接失敗;一個(gè) CUDA kernel 可能邏輯上說(shuō)得通,卻在 grid 配置、索引映射或顯存約束上出錯(cuò);?個(gè)嵌入式程序也可能因?yàn)榧拇嫫黜樞蚧蛑袛噙壿嫴粚?duì),根本跑不起來(lái)。

所以,工業(yè)代碼大模型真正缺的,往往不是 “寫(xiě)” 的能力,而是 “想” 的能力。

最近,北航聯(lián)合多家單位提出的InCoder-32B Thinking,瞄準(zhǔn)的正是這個(gè)問(wèn)題。它不是簡(jiǎn)單把代碼模型再做大,也不是只給模型加?層通用的長(zhǎng)鏈推理,而是試圖讓模型學(xué)會(huì):在工業(yè)環(huán)境里,代碼為什么會(huì)錯(cuò),錯(cuò)了之后環(huán)境會(huì)給出什么反饋,下?步又該怎么改。

一、它不是普通的 thinking model

而是面向工業(yè)代碼的 thinking model



這幾年,thinking model 很火。大家已經(jīng)習(xí)慣了讓模型 “先想?想,再回答”。

但工業(yè)代碼場(chǎng)景有個(gè)特殊問(wèn)題:很多時(shí)候,單靠語(yǔ)言層面的思考并不夠。因?yàn)楣I(yè)任務(wù)的難點(diǎn),不只是邏輯推理,還包括對(duì)工具鏈行為、硬件約束和執(zhí)行反饋的理解。你可以在紙面上分析很多步,但如果根本不知道 GPU 的 shared memory 限制,不知道 Verilog 綜合器如何報(bào)錯(cuò),不知道幾何建模中的非法結(jié)構(gòu)意味著什么,再長(zhǎng)的 reasoning 也可能是空轉(zhuǎn)。

InCoder-32B Thinking 的不同之處,就在于它不是把 “思考” 當(dāng)作純文本技巧,而是直接建立在工業(yè)環(huán)境之上。它試圖讓模型的 reasoning,天然綁定真實(shí)執(zhí)行反饋,而不是脫離系統(tǒng)的 “自洽解釋”。

換句話(huà)說(shuō),它不是?個(gè) “更會(huì)說(shuō)” 的模型,而是?個(gè) “更接近工程實(shí)際” 的 thinking model。

二、真正的新意

是讓模型從 “報(bào)錯(cuò) — 修復(fù)” 里學(xué)會(huì)思考



InCoder-32B Thinking 的核心設(shè)計(jì)之一,是Error-driven Chain-of-Thought(ECoT)。

它的關(guān)鍵點(diǎn)在于:模型的 thinking,不是人為寫(xiě)出來(lái)的,而是從一輪輪 “生成 — 執(zhí)行 — 報(bào)錯(cuò) — 修復(fù)” 的過(guò)程中提煉出來(lái)的。模型學(xué)習(xí)的,不只是最終答案,而是工程師如何一步步定位問(wèn)題、修復(fù)錯(cuò)誤、再驗(yàn)證結(jié)果。

這在工業(yè)代碼中尤為重要。因?yàn)楹芏鄦?wèn)題并不是 “不會(huì)寫(xiě)”,而是 “哪?寫(xiě)錯(cuò)了”。比如 GPU kernel 越界,本質(zhì)可能是 shape 和索引映射不一致;RTL 編譯失敗,可能是端口聲明或位寬不規(guī)范。

ECoT 做的事情,就是把這些真實(shí)失敗和修復(fù)過(guò)程中的 reasoning 保留下來(lái),讓模型學(xué)會(huì)從錯(cuò)誤中思考,而不是只記住正確答案。

三、讓模型先 “預(yù)判結(jié)果”

再去寫(xiě)代碼



如果說(shuō) ECoT 讓模型學(xué)會(huì) “如何改錯(cuò)”,那么另?個(gè)關(guān)鍵設(shè)計(jì) Industrial Code World Model(ICWM),則讓模型學(xué)會(huì) “提前預(yù)判”。

可以把 ICWM 理解為?個(gè)工業(yè)代碼的 “世界模擬器”:給定任務(wù)環(huán)境和候選代碼,它會(huì)預(yù)測(cè)這段代碼在真實(shí)工具鏈中的結(jié)果 —— 是通過(guò)、編譯失敗、運(yùn)行報(bào)錯(cuò),還是性能不達(dá)標(biāo),并生成相應(yīng)的診斷信息。

這帶來(lái)的變化很關(guān)鍵:模型不再只是寫(xiě)代碼,而是開(kāi)始預(yù)估代碼進(jìn)入真實(shí)系統(tǒng)后的后果。

論文顯示,ICWM 在多個(gè)工業(yè)場(chǎng)景中的結(jié)果預(yù)測(cè)準(zhǔn)確率達(dá)到 96.7%,多輪軌跡?致性達(dá)到 94.4%。這意味著,它已經(jīng)能夠在相當(dāng)程度上替代真實(shí)執(zhí)行環(huán)境,用于大規(guī)模數(shù)據(jù)生成和推理訓(xùn)練。

更重要的是,這也改變了訓(xùn)練數(shù)據(jù)的來(lái)源。

InCoder-32B Thinking 的 reasoning 數(shù)據(jù),不是人工構(gòu)造的解釋?zhuān)峭ㄟ^(guò)真實(shí)執(zhí)行流程 “跑出來(lái)的”:任務(wù)生成 → 代碼執(zhí)行 → 收集報(bào)錯(cuò) → 多輪修復(fù) → 記錄完整軌跡。

GPU、芯片、嵌?式、3D 建模等任務(wù),都在對(duì)應(yīng)的真實(shí)工具鏈中驗(yàn)證。

最終保留下來(lái)的,不只是正確答案,而是完整的錯(cuò)誤 — 修復(fù)路徑。這種數(shù)據(jù)天然包含工業(yè)系統(tǒng)最關(guān)鍵的信息:代碼在真實(shí)環(huán)境中的行為反饋。

四、工業(yè)代碼不是統(tǒng)?模板能解決的

它需要 “自適應(yīng)思考深度”



論文還有一個(gè)很有意思的發(fā)現(xiàn):不同任務(wù)的思考深度差異極大。

GPU kernel 優(yōu)化的中位 thinking 長(zhǎng)度達(dá)到19015 個(gè)字符,而 agentic coding 單步只有91 個(gè)字符,差距超過(guò)200 倍。

這說(shuō)明,工業(yè)代碼并不存在一個(gè)統(tǒng)一的 “思考模板”。有些問(wèn)題需要長(zhǎng)鏈路推理(比如性能優(yōu)化、硬件約束),有些則適合短決策(比如多輪 agent 操作)。

InCoder-32B Thinking 學(xué)到的,不是固定長(zhǎng)度的 CoT,而是根據(jù)任務(wù)復(fù)雜度和環(huán)境反饋,動(dòng)態(tài)調(diào)整思考深度 —— 復(fù)雜問(wèn)題深推理,簡(jiǎn)單問(wèn)題快速?zèng)Q策。

這種能力,更接近真實(shí)工程師,而不是模板化的語(yǔ)言模型。

五、結(jié)果說(shuō)明:工業(yè)代碼模型的競(jìng)爭(zhēng)

已經(jīng)開(kāi)始從 “會(huì)寫(xiě)” 轉(zhuǎn)向 “會(huì)驗(yàn)證”



從結(jié)果來(lái)看,這條路線是有效的。

InCoder-32B Thinking 在14 個(gè)通用代碼 benchmark和9 個(gè)工業(yè)代碼 benchmark上進(jìn)行了評(píng)測(cè)。在通用任務(wù)上保持競(jìng)爭(zhēng)力,在工業(yè)場(chǎng)景中則取得顯著提升,包括CAD Coder 84.0%、KernelBench L2 38.0%等指標(biāo)。

更關(guān)鍵的是,這些提升是跨領(lǐng)域的 —— 芯片設(shè)計(jì)、GPU 優(yōu)化、嵌入式、編譯器、3D 建模都受益。

這說(shuō)明它學(xué)到的,不是某個(gè)領(lǐng)域技巧,而是?種更底層的能力:

理解執(zhí)行反饋 → 組織推理 → 完成修復(fù)

如果說(shuō)過(guò)去大家比的是誰(shuí) “寫(xiě)得更像人”,那么現(xiàn)在,工業(yè)代碼模型開(kāi)始比的是誰(shuí) “更像工程師”。

開(kāi)源信息

模型與代碼現(xiàn)已開(kāi)源。

Hugging Face:https://huggingface.co/Multilingual-Multimodal-NLP/IndustrialCoder



GitHub:https://github.com/CSJianYang/Industrial-Coder

當(dāng)代碼大模型開(kāi)始不只生成代碼,而是開(kāi)始預(yù)測(cè)代碼進(jìn)入真實(shí)工業(yè)環(huán)境后的后果,工業(yè)代碼智能的門(mén)檻,也就從 “會(huì)寫(xiě)程序” 抬高到了 “會(huì)理解系統(tǒng)”。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
剛剛,利好來(lái)了!直線爆拉,中東大消息!

剛剛,利好來(lái)了!直線爆拉,中東大消息!

中國(guó)基金報(bào)
2026-04-14 15:58:32
回京第2天,馬筱梅崩潰大哭,自曝家丑,婆婆張?zhí)m大別墅沒(méi)她房間

回京第2天,馬筱梅崩潰大哭,自曝家丑,婆婆張?zhí)m大別墅沒(méi)她房間

阿纂看事
2026-04-14 14:39:50
多地新能源車(chē)牌綠色變白色?有博主發(fā)布“車(chē)牌褪色”教程;交管部門(mén):不合法

多地新能源車(chē)牌綠色變白色?有博主發(fā)布“車(chē)牌褪色”教程;交管部門(mén):不合法

上觀新聞
2026-04-14 11:34:06
美俄同時(shí)對(duì)匈牙利新當(dāng)選領(lǐng)導(dǎo)人說(shuō)“不”,馬扎爾亮出對(duì)烏克蘭立場(chǎng)

美俄同時(shí)對(duì)匈牙利新當(dāng)選領(lǐng)導(dǎo)人說(shuō)“不”,馬扎爾亮出對(duì)烏克蘭立場(chǎng)

史政先鋒
2026-04-14 19:54:51
金正恩表態(tài)了!

金正恩表態(tài)了!

西樓飲月
2026-04-14 21:36:14
暴跌!價(jià)格幾乎腰斬!一女子連吃?xún)商?,劇烈腹痛胃底被堵死!很多人?ài)吃

暴跌!價(jià)格幾乎腰斬!一女子連吃?xún)商?,劇烈腹痛胃底被堵死!很多人?ài)吃

南方都市報(bào)
2026-04-13 16:44:33
曝NBA至少有5支球隊(duì)邀請(qǐng)徐昕試訓(xùn) 2米26小巨人離開(kāi)廣東徹底起飛

曝NBA至少有5支球隊(duì)邀請(qǐng)徐昕試訓(xùn) 2米26小巨人離開(kāi)廣東徹底起飛

狼叔評(píng)論
2026-04-14 13:40:03
46天損失2700億,伊朗扛不???中東5國(guó)收通知,必須賠償戰(zhàn)爭(zhēng)損失

46天損失2700億,伊朗扛不住?中東5國(guó)收通知,必須賠償戰(zhàn)爭(zhēng)損失

頭條爆料007
2026-04-14 19:06:45
5月1日起嚴(yán)打!8類(lèi)灰色行為入刑,人人都要心中有數(shù)

5月1日起嚴(yán)打!8類(lèi)灰色行為入刑,人人都要心中有數(shù)

混沌錄
2026-04-14 20:16:16
最嚴(yán)芯片法案來(lái)了,美國(guó)越卡,中國(guó)越漲

最嚴(yán)芯片法案來(lái)了,美國(guó)越卡,中國(guó)越漲

南風(fēng)窗
2026-04-14 14:51:27
這居然是任泉?網(wǎng)友:真認(rèn)不出來(lái)了

這居然是任泉?網(wǎng)友:真認(rèn)不出來(lái)了

木子愛(ài)娛樂(lè)大號(hào)
2026-04-14 10:52:36
43歲英超名帥官宣離任 率隊(duì)客勝阿森納+12輪不敗 2大豪門(mén)或成下家

43歲英超名帥官宣離任 率隊(duì)客勝阿森納+12輪不敗 2大豪門(mén)或成下家

我愛(ài)英超
2026-04-14 21:49:43
廣東逆轉(zhuǎn)寧波!奎因+徐杰轟53分,崔永熙統(tǒng)治防守,內(nèi)線卻被暴虐

廣東逆轉(zhuǎn)寧波!奎因+徐杰轟53分,崔永熙統(tǒng)治防守,內(nèi)線卻被暴虐

籃球資訊達(dá)人
2026-04-14 21:39:04
2026一季度居民部門(mén)新增貸款僅2967億元,同比暴跌71.5%

2026一季度居民部門(mén)新增貸款僅2967億元,同比暴跌71.5%

知識(shí)圈
2026-04-14 20:47:13
封鎖霍爾木茲,特朗普的“膽小鬼游戲”能玩多久 | 京釀館

封鎖霍爾木茲,特朗普的“膽小鬼游戲”能玩多久 | 京釀館

新京報(bào)評(píng)論
2026-04-14 14:59:35
向華強(qiáng)自曝與向太分房睡十多年,“她凌晨刷短劇,我剛醒她正要睡”,網(wǎng)友:相愛(ài)和尊重不矛盾

向華強(qiáng)自曝與向太分房睡十多年,“她凌晨刷短劇,我剛醒她正要睡”,網(wǎng)友:相愛(ài)和尊重不矛盾

臺(tái)州交通廣播
2026-04-14 19:33:51
記者:知情人士透露張涵泊改名為李沂澤,家庭變故帶來(lái)的改名行為

記者:知情人士透露張涵泊改名為李沂澤,家庭變故帶來(lái)的改名行為

狼叔評(píng)論
2026-04-14 21:20:16
尹錫悅雙眼通紅地望著金建希,金建希沒(méi)看他

尹錫悅雙眼通紅地望著金建希,金建希沒(méi)看他

天真無(wú)牙
2026-04-14 17:44:27
中國(guó)油輪首次突破美國(guó)封鎖,直接穿過(guò)霍爾木茲

中國(guó)油輪首次突破美國(guó)封鎖,直接穿過(guò)霍爾木茲

桂系007
2026-04-14 15:01:07
最新數(shù)據(jù):美國(guó)從中國(guó)進(jìn)口的智能手機(jī)比例從90%驟降至25%,組裝中心加速轉(zhuǎn)移

最新數(shù)據(jù):美國(guó)從中國(guó)進(jìn)口的智能手機(jī)比例從90%驟降至25%,組裝中心加速轉(zhuǎn)移

風(fēng)向觀察
2026-04-14 14:25:12
2026-04-15 02:12:49
機(jī)器之心Pro incentive-icons
機(jī)器之心Pro
專(zhuān)業(yè)的人工智能媒體
12762文章數(shù) 142628關(guān)注度
往期回顧 全部

科技要聞

離職同事"煉化"成AI?這屆公司不需要活人了

頭條要聞

54歲班主任帶15歲女孩到賓館開(kāi)房猥褻:將她壓到床上

頭條要聞

54歲班主任帶15歲女孩到賓館開(kāi)房猥褻:將她壓到床上

體育要聞

帶出中超最大黑馬!他讓球迷們“排隊(duì)道歉”

娛樂(lè)要聞

網(wǎng)曝鐘麗緹代孕要了個(gè)男孩 備孕近10年

財(cái)經(jīng)要聞

許家印認(rèn)罪,他和恒大還有多少欠債?

汽車(chē)要聞

售12.99萬(wàn)起/續(xù)航2000km 風(fēng)云T9L上市

態(tài)度原創(chuàng)

健康
親子
房產(chǎn)
藝術(shù)
教育

干細(xì)胞抗衰4大誤區(qū),90%的人都中招

親子要聞

中泰寶寶和外公打電話(huà),一個(gè)小動(dòng)作讓娃瞬間害羞~

房產(chǎn)要聞

改善標(biāo)桿,1.5w+起橫掃國(guó)興!??跇鞘?,打出最猛一張牌!

藝術(shù)要聞

她的水彩畫(huà)竟讓億萬(wàn)男人傾倒,你絕對(duì)想不到!

教育要聞

他們眼里的光被點(diǎn)燃!中華中學(xué)首屆南大班學(xué)習(xí)成果匯報(bào)

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版