網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

用大模型揍黑客？恐怕得先跟人腦學(xué)兩招騷的！

2025-03-20 11:10:42　來源: 淺黑科技官方

北京舉報(bào)

分享至

淺友們好~我是史中，我的日常生活是開撩五湖四海的科技大牛，我會(huì)嘗試用各種姿勢，把他們的無邊腦洞和溫情故事講給你聽。如果你想和我做朋友，不妨加微信（shizhongmax）。

用大模型揍黑客？

恐怕得先跟人腦學(xué)兩招騷的！

文｜史中

家人們， AI 已經(jīng)不滿足于自己卷，而是開始禍禍各行各業(yè)了。。。

最近跟人聊天，只要三句之內(nèi)你還沒提到你們行業(yè)“大模型怎么代替人類牛馬”，人家就覺得你這行藥丸。

但這事兒怎么可能這么簡單？要知道，各行業(yè)對(duì)人類技能的要求本就千差萬別：

設(shè)計(jì)師得懂得視覺語言，理解空間規(guī)劃；文學(xué)編輯得理解語義空間，懂得搜索和引用信息；工程師得有嚴(yán)謹(jǐn)?shù)臎Q策和推理能力。

所以，不是隨便裝個(gè) AI 就能起飛。

針對(duì)每個(gè)行業(yè)，AI 都得反復(fù)摩擦，選定非常特別的姿勢切入才可能成功。

這里藏著真知識(shí)，值得愛智求真的淺友們研究！

最近我剛和一位網(wǎng)絡(luò)安全硬核老師傅聊天，他和團(tuán)隊(duì)正在把大模型作為機(jī)械戰(zhàn)士，用子彈和鎧甲守衛(wèi)我們的網(wǎng)絡(luò)空間。

這位師傅就是潘劍鋒，他也被同事稱為“潘神”。

當(dāng)年，他是影響一代網(wǎng)絡(luò)安全研究者的安全工具“冰刃（IceSword）”的作者，如今，他是 360 集團(tuán)的首席科學(xué)家，360 數(shù)字安全集團(tuán)的首席技術(shù)官。

潘劍鋒

潘神從小就是學(xué)霸，恨不能直接把卷子翻過來做大題那種。所以他比較反對(duì)有些人“為了用大模型而用大模型”，就蹭點(diǎn)兒步驟分。。。

他覺得：

要么就不用大模型，要用就讓它真的比人更猛！

嗯，主打一個(gè)童叟無欺。

為此，他的思路是：遇事不決，照著人學(xué)！人有多騷，AI 照抄！

這不，團(tuán)隊(duì)這兩年總算用這個(gè)姿勢撞開一條小裂縫，看到一絲光明透進(jìn)來。

說起這段故事，潘神決定從一個(gè)人工智能幾乎無解的“弱點(diǎn)”聊起。

（一）AI 腦袋里的“坑”

幾天前，馬斯克剛剛祭出了據(jù)說是地表最強(qiáng) AI——Grok 3。

有人立刻把那道經(jīng)典送命題遞了上去：

你看，這就是地表最強(qiáng) AI 的水平。棒棒！

話說其他 AI 對(duì)于這個(gè)問題的回答也一個(gè)鳥樣，就算能答對(duì)，恐怕也只是針對(duì)性地打了補(bǔ)丁。

因?yàn)楝F(xiàn)在的 AI 訓(xùn)練方法的基礎(chǔ)是統(tǒng)計(jì)學(xué)，所以 AI 對(duì)世界的理解也是“統(tǒng)計(jì)性理解”，而非“本質(zhì)性理解”。

潘神給我解釋。

啥是“統(tǒng)計(jì)性理解”和“本質(zhì)性理解”嘞？

我給你舉個(gè)例子。

假設(shè)三體人派質(zhì)子來到地球研究我們的生活。

他們偷拍了 1 萬張日常照片，發(fā)現(xiàn)了我們會(huì)在一起吃“生日蛋糕” ↓↓↓

他們饞了，也想試著做出來嘗嘗。

于是挑出了幾張含有生日蛋糕的圖片，做了個(gè)簡單統(tǒng)計(jì)：

這種玩意兒大概率是矮圓柱形，滑滑膩膩的，插著一些可燃物。

然后用三體星球上現(xiàn)成的原料，照貓畫虎把這個(gè)東西做出來：

而后，質(zhì)子又從地球多拍了 100 萬張照片傳回去，里面有更多生日蛋糕的圖片。

三體人又一統(tǒng)計(jì)，發(fā)現(xiàn)出問題了：

生日蛋糕的內(nèi)部結(jié)構(gòu)和外部并不一樣！

在里面是一坨軟軟的帶有空洞的物質(zhì)，外面才是滑滑膩膩的材料。

他們于是又一頓忙活，從更多的數(shù)據(jù)里總結(jié)更多特征，改進(jìn)了自己的蛋糕。

這回從里到外都更像地球的蛋糕了。

三體人學(xué)做蛋糕的過程，就類似于人工智能模仿人腦的過程。它展現(xiàn)了統(tǒng)計(jì)性學(xué)習(xí)的兩個(gè)特點(diǎn)：

1、學(xué)生不是想學(xué)啥就能學(xué)，而是只有本體的某種性質(zhì) 展現(xiàn)出了統(tǒng)計(jì)上的特征，才能被學(xué)生注意到，才能被學(xué)會(huì)。 2、隨著描述本體的數(shù)據(jù)不斷增加，可能會(huì)有新的特征凸顯出來，學(xué)生學(xué)到的特征越多，表現(xiàn)就越接近本體。

但是！這里隱藏了一個(gè)讓人脊背發(fā)涼的大問題：

就算三體人再拍 1 億張生日蛋糕的照片，把蛋糕做得再惟妙惟肖，只要他們來不了地球，無法親自品嘗，他們就永遠(yuǎn)不敢肯定自己的蛋糕和地球蛋糕的味道是完全一樣的！

完全存在一種可能：

我們放的是糖，他們放的是鹽，我們放的是蛋糕胚，他們放的是發(fā)泡塑料。。。

殘酷的事實(shí)是：在特定的數(shù)據(jù)采樣體系下，有些本質(zhì)是不會(huì)展現(xiàn)出統(tǒng)計(jì)學(xué)特征的。

也就是說，“統(tǒng)計(jì)性理解”原則上能不斷逼近“本質(zhì)性理解”。但推到終極，你卻無法證明“統(tǒng)計(jì)性理解”達(dá)到了“本質(zhì)性理解”↓↓↓

于是 Bug 暗伏其中。

三體人拿出塑料蛋糕的一瞬間，不就像極了 AI 說出 9.11 比 9.9 大的那一刻么？想想看，是不是還挺恐怖的？

更恐怖的是，你不知道 AI 的腦袋里還有哪些“坑”，也不知道這些坑什么時(shí)候會(huì)出來把哪個(gè)老鐵給坑了。

這個(gè)問題沒有“特效藥”，只有“廣譜藥”，就是：

不斷給 AI 學(xué)習(xí)更多、更好的數(shù)據(jù)，祈禱新的數(shù)據(jù)里恰好含有重要的統(tǒng)計(jì)學(xué)特征，“未亡羊先補(bǔ)牢”唄。

但在最近，即便是廣譜藥也快失效了——我們遇到了“數(shù)據(jù)墻”。

人類幾百年積累的知識(shí)數(shù)據(jù)，該喂給 AI 吃的都已經(jīng)喂了。

地主家也沒有余糧了。接下來只能靠 AI 自己合成數(shù)據(jù)繼續(xù)訓(xùn)練，這樣自己拉自己吃。。。最后會(huì)不會(huì)吃出毛病，學(xué)術(shù)界還頗有爭議。

訓(xùn)練 AI 的數(shù)據(jù)，無法突破人類既有知識(shí)的極限，也就是“數(shù)據(jù)墻”。

基于以上，潘神的眼神開始犀利起來：

既然 AI 短期存在無法突破的能力極限，那就可以把網(wǎng)絡(luò)安全的問題分成兩類，用大模型做出兩套不同的體系來解決。

一套是“快思考”，一套是“慢思考”。

1、“快思考”用來做判斷題，不用絞盡腦汁解釋為啥，以對(duì)服人，適合放開手腳讓 AI 用自己的方式去干。

主打一個(gè)：人能干，但 AI 更便宜。

2、“慢思考”用來做證明題，必須展現(xiàn)復(fù)雜的思考步驟，以理服人。AI 自己搞不定，可以遵循人類老師傅已有的經(jīng)驗(yàn)框架去干。

主打一個(gè)：AI 不夠，祖?zhèn)髦R(shí)來湊。

這個(gè)思路，其實(shí)就是從人腦的思維方式抄的！接下來我給你展開說說。

（二）快思考像一把火

老鐵們估計(jì)都知道，“快思考”、“慢思考”的分類來自于心理學(xué)家丹尼爾·卡尼曼對(duì)人腦的研究。

一個(gè)最經(jīng)典的例子就是：

你在叢林里遇到一個(gè)長條形的東西，形勢容不得你花時(shí)間分析它到底是啥�？焖伎紩�(huì)在第一時(shí)間輸出“危險(xiǎn)”這個(gè)信號(hào)，給你的指令就一個(gè)字——跑！等你跑開了一段安全距離，慢思考才跟上來。你可以詳細(xì)觀察這個(gè)東西的紋理、動(dòng)作，然后綜合判斷它到底是蛇還是翔，以決定接下來的計(jì)劃。

打個(gè)比方：

快思考就像一把火，短暫而絢爛地燃燒；

慢思考就像一條河，帶著小船時(shí)急時(shí)緩地漂流，一段時(shí)間后才奔流入海。

在網(wǎng)絡(luò)安全領(lǐng)域，快慢思考也都有用武之地。

咱們這一趴先說個(gè)“快思考”的例子：

假設(shè)中哥開了家公司，辦公網(wǎng)就像一個(gè)工業(yè)園區(qū)，里面安裝的 360 安全系統(tǒng)就像保安大隊(duì)，負(fù)責(zé)監(jiān)視園區(qū)里的一舉一動(dòng)，以防有人搞事情。

黑客偷來一張工牌，為了尋找敏感資料，他想拿著這個(gè)工牌混入檔案大樓。

黑客走到檔案樓門口，這位保安只有幾十毫秒的時(shí)間做出判斷。如果感覺這個(gè)人不對(duì)勁就要果斷攔截，否則就得放行，不能耽誤人家的事��！

傳統(tǒng)的做法是，把所有已知的黑客行為特點(diǎn)都提前總結(jié)成一條條的規(guī)則，放進(jìn)一個(gè)大的“規(guī)則集”里。

來了一個(gè)人，保安只要無腦對(duì)照規(guī)則集里所有的規(guī)則查一遍，就有了結(jié)論，這不就很快了嗎？

但是，規(guī)則終歸是死板的。

它就像特工電影里那種會(huì)觸發(fā)警報(bào)的紅外射線，即使數(shù)量再多，中間還是會(huì)有縫隙，聰明的特工總能找到方法繞過。

這不保險(xiǎn)。。。

人類大腦就很靈活。

老保安隊(duì)長和壞人眼神一對(duì)，就感覺他有問題。

具體哪兒有問題一時(shí)說不清，但沒關(guān)系，只要覺得他有問題，就可以攔下來慢慢盤問！

現(xiàn)在咱有了大模型，直接用它模擬老保安隊(duì)長那種說不清道不明的“直覺”來做判斷，不就直接吊打黑客了嗎？

聽上去不錯(cuò)，但操作起來沒那么簡單。

咱們的大腦看似是一坨，實(shí)際做復(fù)雜判斷時(shí)，是里面很多“腦區(qū)”相互配合的結(jié)果，就像病人的疑難雜癥需要不同科室的專家會(huì)診一樣。

如果要模擬人腦識(shí)別高級(jí)入侵，“一把火”不夠，得把網(wǎng)絡(luò)安全所需的不同腦區(qū)都給訓(xùn)練到一個(gè)大模型中↓↓↓

這些腦區(qū)有的是看代碼，有的是看日志，有的是做推理，有的是讀語言，知識(shí)體系和功能都差異很大。

偏偏目前的均質(zhì)大模型結(jié)構(gòu)存在一個(gè)天生缺陷。

那就是，同時(shí)學(xué)習(xí)多個(gè)差異很大的知識(shí)體系，就會(huì)形成蹺蹺板效應(yīng)：A 領(lǐng)域?qū)W會(huì)了，有可能 B 領(lǐng)域就學(xué)廢了，反之亦然。

其實(shí)這個(gè)缺陷人腦也存在，你讀一個(gè)博士都費(fèi)勁，同時(shí)讀五個(gè)風(fēng)馬牛不相及的博士你試試，不走火入魔才怪。

但網(wǎng)絡(luò)安全的場景非常復(fù)雜，要想攔住頂級(jí)黑客，你還真就得讀五個(gè)博士。

不搞定這個(gè) Bug，大模型就無法在網(wǎng)絡(luò)安全領(lǐng)域落地。。。

老師傅們只好退而求其次：

把不同的專家徹底分開——獨(dú)立訓(xùn)練幾個(gè)“安全專家模型”，每個(gè)專家的腦袋瓜只思考一件特定的事情，然后讓他們組成一個(gè)“專家組”。

遇到復(fù)雜問題，抽調(diào)團(tuán)隊(duì)里相關(guān)的安全專家模型分別思考，再把結(jié)論綜合起來，這不就行了嗎？

行是行，但這樣獨(dú)立模型聯(lián)合起來的團(tuán)隊(duì)，未免太奢華了。。。

（三）可以“拔下來”的火柴頭

每一個(gè)專家模型都要有語言和邏輯思維能力，這意味著它們分別要在大模型的基礎(chǔ)上訓(xùn)練而成——比如是 72B 的模型。

而干一件事兒可能需要 10-20 個(gè)專家模型配合。這么一來，系統(tǒng)里等于是并行跑著 10 個(gè)大模型。

運(yùn)行一個(gè) 72B 的模型，怎么也得需要一個(gè)裝滿 4 張 L20 推理卡的服務(wù)器，價(jià)格最低也要 20 多萬。要是跑 10 個(gè)模型，光是機(jī)器就要 200 多萬。

對(duì)于絕大多數(shù)企業(yè)來說，這都是一筆巨額開銷��！

想想看，哪個(gè)工業(yè)園區(qū)也不會(huì)把日常支出的 20% 用于給“豪華旗艦版保安隊(duì)”開工資吧？？

看到?jīng)]，這才是大模型進(jìn)入產(chǎn)業(yè)的真實(shí)困境。。。

看來，人腦的作業(yè)也不是這么好抄的，得上點(diǎn)兒狠活！

說到這，潘神終于搬出了他們的一些探索成果：

360 數(shù)字安全團(tuán)隊(duì)也會(huì)訓(xùn)練很多“安全專家腦區(qū)”，但不同的是，他們對(duì)這些腦區(qū)“提取最大公約數(shù)”——彼此共用一套大模型底座。

具體來說就是：

1、每類任務(wù)都交給一個(gè)特定的“專家腦區(qū)”，平時(shí)把這個(gè)腦區(qū)外掛在大模型底座上訓(xùn)練； 2、每次訓(xùn)練的過程中，把底座大模型的參數(shù)鎖死，只改動(dòng)“外掛腦區(qū)”的參數(shù)； 3、訓(xùn)練好 A 專家腦區(qū)，就把 A 從底座上拔下來，再插上 B 腦區(qū)，訓(xùn)練 B 任務(wù)。

你可以這樣想象：一根火柴梗，上面能搭配很多火柴頭。

這樣一來，所有的專家共用了一套語言邏輯中樞，也就是那個(gè)大模型底座。每個(gè)專家腦區(qū)只負(fù)責(zé)特定的思考，腦容量就能大大縮小，大概只有 1 億個(gè)參數(shù)。

然后，設(shè)置一個(gè)路由模塊。

系統(tǒng)思考的時(shí)候，它會(huì)根據(jù)任務(wù)的不同給它指派“火柴頭”。

每次指派之后，信息流就從大模型基座（火柴梗）燒向這個(gè)專家腦區(qū)（火柴頭）。

在思考下一趴的時(shí)候，路由器會(huì)重新指派“專家腦區(qū)”。以此循環(huán)，直到所有的思考結(jié)束，最終答案呈現(xiàn)在眼前。

這樣一來，火柴是用到哪根點(diǎn)哪根，火柴頭平時(shí)也不占地方。

同樣是一臺(tái) 20 萬的機(jī)器，原本只能驅(qū)動(dòng)一個(gè)專家，現(xiàn)在卻驅(qū)動(dòng) 10 個(gè)專家也沒問題。

這個(gè)架構(gòu)，被 360 稱為 CCoE（緊湊型多專家協(xié)同大模型）↓↓↓

潘神告訴我，現(xiàn)在他們訓(xùn)練了很多個(gè)“火柴頭”專家，企業(yè)客戶根據(jù)自己的情況，用到哪個(gè)專家就買哪個(gè)專家，跟自助餐一樣豐儉由人，非常方便。

但別高興太早。

“快思考”只能解決一半兒的問題。

我們剛才說過：快思考雖然能快速做判斷題，但它的判斷“不保熟”。

保安看一個(gè)人像壞蛋，雖然可以用直覺判斷拒絕他進(jìn)入園區(qū)。但如果背后沒有理性邏輯支撐的”慢思考”，終究會(huì)存在兩種問題：

一來，可能誤傷好人，次數(shù)多了人家會(huì)投訴你，保安就得下崗；二來，壞蛋痛定思痛，下次喬裝打扮得更好，你可能又給放進(jìn)去了，保安還是得下崗！

為了不下崗，保安必須得有環(huán)環(huán)相扣的邏輯推理能力，這在大模型技術(shù)中被叫做——思維鏈。

（四）慢思考像一條河

如果你用過 DeepSeek，就不會(huì)對(duì)“思維鏈”太陌生。

DeepSeek 在正式回答你之前，會(huì)走一段內(nèi)心 OS，這個(gè) OS，就是它的思維鏈。

那么，只要用這個(gè)思維鏈思考，就是潘神所說的慢思考了嗎？

他的答案是：No。

掌握了思維鏈，就像學(xué)會(huì)了功夫。

首先說，練過拳腳的人和沒練過拳腳的人肯定不在一個(gè)量級(jí)，一打一個(gè)服氣。

這不，DeepSeek 利用思維鏈給出的回答，相比之前直覺大模型（例如 GPT-4o）的不假思索直接出答案，更加有理有據(jù)，令人信服。

但功夫這件事兒，是分段位的。白帶打不過黑帶，黑帶打不過紅帶，山外有山，進(jìn)無止境。

咱們不妨具體看一下 DeepSeek 的功夫，它的絕招是“反思”：

你問 DeepSeek 一個(gè)問題，它會(huì)把問題拆成步驟，一步一步地往下推導(dǎo)。

這個(gè)思維鏈原本像一條河流。

小船自然地隨著水勢自然流淌，永遠(yuǎn)不會(huì)意識(shí)到自己在隨波逐流，更不會(huì)“主動(dòng)”倒船選擇更順的路↓↓↓

但是，DeepSeek 不同，如果推導(dǎo)過程中出現(xiàn)了矛盾，它居然會(huì)倒帶，修改之前的思考方向。這就是反思！

直到它撇出一條順滑的結(jié)論，才算是走通了一條思維鏈↓↓↓

用同樣的方法，它還會(huì)給出幾條思維鏈，最后再反思一下，沿著最順滑的那條思維鏈給你輸出答案。

這很不尋常。

因?yàn)�，只有在思維之河之外存在某種監(jiān)督機(jī)制，才能對(duì)小船的航向有感知和反思。

這種監(jiān)督機(jī)制，恰恰是人腦的特色。

DeepSeek 之所以被全世界豎大拇指，最大的功勞就是：工程師沒有把這種反思能力強(qiáng)加于模型，而是找到了方法，讓模型自己進(jìn)化出來。

在 DeepSeek R1 的論文中，老師傅展示了一段思維鏈，AI 在思考過程中，直接用人類的口吻來了個(gè)“aha”，這意味著它有了反思，開始重整思維鏈。

但潘神提示我：作為人類，咱可不只有“反思”這一個(gè)絕招。

人在為思考按下暫停鍵時(shí)，除了“閉眼向內(nèi)求”——通過自省來重新修正自己的思維鏈，還會(huì)“睜眼向外看”——借助工具和信息渠道，從開放世界拿回最新鮮的數(shù)據(jù)，輔助生成接下來的思維鏈。

據(jù)此，有關(guān)思維鏈的段位，潘神總結(jié)了三級(jí)：

第一級(jí)：類似于 GPT-4o 這樣用直覺輸出答案，是 “快思考” ；第二級(jí)：類似于 DeepSeek 和 GPT-o1 這樣有向內(nèi)看能力的思維鏈，可以叫 “深度思考” ；第三級(jí)：在反思型思維鏈的基礎(chǔ)上，還能主動(dòng)吸收外部信息，一邊向外看一邊想，才是更完整的 “慢思考” 。

要達(dá)到第三級(jí)，才能處理網(wǎng)絡(luò)安全的諸多問題。

但現(xiàn)實(shí)很殘酷。DeepSeek 的訓(xùn)練資源和技巧已經(jīng)是當(dāng)前世界頂級(jí)了，要想在它的基礎(chǔ)上改進(jìn)，技術(shù)難度提升可不止一點(diǎn)半點(diǎn)。

但他不打算坐在原地抱怨，而是想辦法使“巧勁兒”。

（五）“不斷有支流匯入”的思維之河

遇事不決，照著人學(xué)。

讓我們觀察一下自身，咱們思考問題的時(shí)候，啥時(shí)候會(huì)去查一些信息？

一般是我們“拿不準(zhǔn)”的時(shí)候。換句話說，當(dāng)我們需要“不能錯(cuò)的信息”時(shí)。

咱們就以網(wǎng)絡(luò)安全場景為例，不能錯(cuò)的信息大概有四種：

1、精確的通識(shí)。比如：網(wǎng)絡(luò)安全行業(yè)處理黑客攻擊的《最佳流程手冊》。 2、專有的數(shù)據(jù)。比如：L 黑客組織，360 公司歷年捕獲到的它曾用過的攻擊手法。 3、實(shí)時(shí)的事態(tài)。比如：W 系統(tǒng)最新爆出的漏洞詳情代碼。 4、工具的輸出結(jié)果。比如：利用掃描工具檢查網(wǎng)域內(nèi)的設(shè)備后，繪制的網(wǎng)絡(luò)地圖。

這幾種信息的來源也不同：

通識(shí)一般以知識(shí)圖譜的形式存在，專有數(shù)據(jù)在數(shù)據(jù)庫里，實(shí)時(shí)事態(tài)一般要聯(lián)網(wǎng)查詢，工具一般要靠智能體去調(diào)用。

潘神他們索性把這幾種東西打包起來，做成了一個(gè)“外腦”↓↓↓

AI 在思維鏈的形成過程中，可以隨時(shí)停下，調(diào)用這個(gè)外腦來補(bǔ)充信息，然后再繼續(xù)思考，就好像人的“聯(lián)想”一樣！

看到這你也許會(huì)疑惑：DeepSeek 不是有個(gè)“聯(lián)網(wǎng)搜索”功能嗎？這不已經(jīng)是聯(lián)想了嗎？

還是有區(qū)別的：

DeepSeek 是在思考之前先搜索，然后帶著搜索內(nèi)容開始生成思維鏈。思維鏈在延展的過程中，是不能停下吸納新信息的。

這就好比只在河流的發(fā)源地匯入一股水流。

你沒辦法預(yù)測后續(xù)具體會(huì)用到什么信息，只能不管后面有用沒用，先一股腦多輸入一些。

而“聯(lián)想”則是在河流流淌的過程中，隨時(shí)匯入支流。

由于前面已經(jīng)完成了一部分思考，此時(shí)應(yīng)該非常清楚急需什么，可以有針對(duì)性地搜索、納入這些信息，讓接下來的思考更鋒利。

顯然，聯(lián)想這個(gè)特點(diǎn)更擬人。

但問題是，目前還沒有一種方法，可以讓大模型在思考的過程中主動(dòng)產(chǎn)生聯(lián)想的“欲望”。

這咋辦？

潘神團(tuán)隊(duì)研究出一個(gè)看上去粗暴，但著實(shí)有用的方案：既然敬酒不吃，那就吃罰酒唄！

在模型思考的框架里加入“強(qiáng)行聯(lián)想”的功能。

具體來說就是，思維鏈每行進(jìn)一步，都有一個(gè)外部的算法對(duì)它進(jìn)行評(píng)估，一旦發(fā)現(xiàn)思考的內(nèi)容符合條件，二話不說直接激活外腦。

這個(gè)算法其實(shí)沒那么復(fù)雜，甚至也不是一個(gè)大模型。

你可以把它想象成河流當(dāng)中的浮標(biāo)，只要思維的深度觸碰到浮標(biāo)，就主動(dòng)開閘，引入一條支流，把新信息合并進(jìn)來繼續(xù)作為下一層思考的輸入。

這個(gè)帶有實(shí)時(shí)聯(lián)想功能的思維鏈，被他們稱作CoAT（Chain-of-Associated-Thoughts），也就是“聯(lián)想思維鏈”。

你感受一下全過程↓↓↓

高級(jí)的食材只需簡單的烹飪，雖說 CoAT 實(shí)現(xiàn)方法并不復(fù)雜，但效果還挺顯著的。

潘神給我看了一個(gè)例子，分別用 CoAT 架構(gòu)的“慢思考大模型”和 DeepSeek 的“深度思考大模型”來解答同一個(gè)問題。

問題是這樣的：

我們應(yīng)該如何看待人工智能在當(dāng)代國際競爭中的作用？哪些國家在這一領(lǐng)域擁有領(lǐng)先的優(yōu)勢？

DeepSeek 發(fā)揮穩(wěn)定，答案很詳細(xì)，但美中不足是例證較少。

CoAT 的不同點(diǎn)是，它列舉了幾個(gè)具體國家的 AI 策略，并且提供了美國 AI 研究的具體項(xiàng)目和中國的“新一代人工智能發(fā)展計(jì)劃”。

之所以會(huì)有這樣的區(qū)別，大概正是因?yàn)?DeepSeek 只在最開始的時(shí)候搜索了外部信息，而 CoAT 是在思考的每一步都通過外腦查詢相關(guān)的信息，從而可以更具體。

這是回答上述問題的完整思維鏈生成過程，可以看到在每一步都和紅圈內(nèi)的外腦交互，進(jìn)行了“聯(lián)想”。（點(diǎn)擊看大圖）

潘神告訴我，這種優(yōu)勢在思考網(wǎng)絡(luò)安全的專業(yè)問題上會(huì)表現(xiàn)得更明顯，他們正在緊鑼密鼓把這些能力加持在 360 的大模型安全產(chǎn)品里，客戶很快就能體驗(yàn)到。

但天下武功都有走火入魔的可能，這種“強(qiáng)行匯入支流”的操作也暗藏危險(xiǎn)：

在思考中添加外腦的信息，并不一定總是會(huì)讓思考結(jié)果更好。原因很簡單，如果匯入的支流里面有泥沙，就會(huì)讓本來一條清澈的河流變得渾濁。

所以，如何篩選和精簡外腦的“信息水流”，是至關(guān)重要的。

他們于是在每一條匯入的支流入口處，都加了一道“水閘”。

這個(gè)水閘其實(shí)就是一個(gè)評(píng)估算法，來計(jì)算內(nèi)容和已有思維鏈生成內(nèi)容的相關(guān)程度。

只把最相關(guān)最核心的內(nèi)容放進(jìn)主河流，其他的信息主動(dòng)放棄，主打一個(gè)寧缺毋濫！

潘神特別提醒我，CoAT 只是一種技術(shù)框架，里面所有的參數(shù)都是可以調(diào)整的：

在網(wǎng)絡(luò)安全領(lǐng)域，對(duì)思維鏈的聚焦度要求比較高，就可以決定只在關(guān)鍵節(jié)點(diǎn)匯入支流，匯入的水流也少而精確；而在其他領(lǐng)域，比如輔助寫作，完全可以更多地匯入信息，每次加入豐富的數(shù)據(jù)，讓結(jié)果變得更加發(fā)散，更有趣味。

360 的老師傅合計(jì)了一下，覺得這些研究對(duì)很多行業(yè)都有用，于是把一部分研究成果寫成了論文分享了出來。

這個(gè)操作很快引來了一些“自來水”。有人錄視頻、寫文章分享他們對(duì)這個(gè)技術(shù)進(jìn)展的解讀。

一位外國程序員小哥做的視頻解讀。

這并不太意外，畢竟如今 Made in China 的技術(shù)也是品質(zhì)的保證嘛。

實(shí)際上，隨著前幾天 DeepSeek 對(duì)技術(shù)的披露，人們逐漸意識(shí)到：

“顛覆性創(chuàng)新”很多時(shí)候是由一系列“實(shí)踐創(chuàng)新”集合而成的。

DeepSeek 的每一個(gè)創(chuàng)新都很具體，比如 GPU 優(yōu)化、通信庫、文件系統(tǒng)。。。但合在一起就有奇效！

如此說來，像 360 老師傅這樣的實(shí)踐型創(chuàng)新同樣值得被我們點(diǎn)贊。

無數(shù)這樣的大小創(chuàng)新集結(jié)起來，才把我們一步步推向那個(gè)“智械黎明”。

（六）“智械黎明”

網(wǎng)絡(luò)安全也許是大模型的光亮最難照射進(jìn)去的幾個(gè)行業(yè)之一。

它是戰(zhàn)爭的線上版本，是全人類最頂尖頭腦之間的攻防。人腦尚且不夠用，怎么輪到 AI 多嘴？

但大模型的光芒一旦照進(jìn)去，網(wǎng)絡(luò)安全行業(yè)又會(huì)是最閃耀的。

因?yàn)榫W(wǎng)絡(luò)安全行業(yè)是“賽博原生”的。

它自古就能觸及浩如煙海的底層日志，能見識(shí)最多走位風(fēng)騷的攻擊路徑。而大模型本就是數(shù)據(jù)驅(qū)動(dòng)的。如果能夠找到方法完整、高效地利用這些獨(dú)門數(shù)據(jù)，做出來的機(jī)械戰(zhàn)士將強(qiáng)的可怕。

只是，黎明之前的暗夜太長，不知誰能堅(jiān)持穿過。

大模型已經(jīng)橫空出世三四年了，雖然幾乎所有的網(wǎng)絡(luò)安全公司都說自己用了大模型，看上去一片火熱，但如人飲水冷暖自知。

很多安全公司使用大模型的原動(dòng)力都來自于行業(yè)的內(nèi)卷和焦慮——本來生意就不好做，別人吹牛說用了大模型，你不說，生意就更不好做了。

在很長的時(shí)間里，殘酷的迷霧一直籠罩：全行業(yè)都沒有找到“特別適合大模型的任務(wù)”。

有些任務(wù)大模型能干，小模型也能干，但小模型的性價(jià)比更高；有些任務(wù)小模型確實(shí)干不了，但人干更便宜，性價(jià)比仍然比大模型高。

現(xiàn)實(shí)很殘酷，各個(gè)企業(yè)中的網(wǎng)絡(luò)安全部門雖然客觀上肩頭責(zé)任重大，但一般卻是公司里存在感最低的部門。

老板天然更注重業(yè)務(wù)，誰愿意天天關(guān)注保安隊(duì)呢？

一般是哪種安保措施性價(jià)比高，人家就選哪種方法。

未來，即使是這么嚴(yán)苛的標(biāo)準(zhǔn)，“大模型驅(qū)動(dòng)的保安”也可能被挑中！

舉一個(gè)在安全運(yùn)營中的例子吧：

網(wǎng)絡(luò)流量中的一種分析任務(wù)，如果放一個(gè)人類專家在這，工資成本也不低�，F(xiàn)在，CCoE 框架下的大模型能達(dá)到人類準(zhǔn)確率的 90%，但運(yùn)行成本遠(yuǎn)低于人類專家。

在這種表現(xiàn)下，無論怎么算賬，大模型加持的機(jī)械戰(zhàn)士都是這個(gè)崗位的最優(yōu)選項(xiàng)——不出意外，它即將成為這個(gè)崗位上的釘子戶。

如果從遠(yuǎn)處眺望，網(wǎng)絡(luò)安全系統(tǒng)就像一艘戰(zhàn)艦。

未來的日子里，大模型有希望在越來越多的位置上成為釘子戶。一點(diǎn)點(diǎn)替代傳統(tǒng)的規(guī)則引擎，替代人類的專家判斷——如忒修斯之船一樣每天替換掉一個(gè)部件。

某一天，當(dāng)太陽再次升起，戰(zhàn)艦的輪廓顯形，我們也許會(huì)見證一個(gè)“智械黎明”。

我不知道這個(gè)黎明還有多遠(yuǎn)。

但我知道的是，那個(gè)黎明來自過往的每一天，來自行業(yè)中無數(shù)頭鐵的老師傅用微小而堅(jiān)定的創(chuàng)新一點(diǎn)點(diǎn)撞開的裂縫。

人有多騷

AI 照抄

再自我介紹一下吧。我叫史中，是一個(gè)傾心故事的科技記者。我的日常是和各路大神聊天。如果想和我做朋友，可以搜索微信：shizhongmax。

哦對(duì)了，如果喜歡文章，請(qǐng)別吝惜你的“在看”或“分享”。讓有趣的靈魂有機(jī)會(huì)相遇，會(huì)是一件很美好的事情。

Thx with in Beijing

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.