国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

用大模型揍黑客?恐怕得先跟人腦學(xué)兩招騷的!

0
分享至

淺友們好~我是史中,我的日常生活是開撩五湖四海的科技大牛,我會(huì)嘗試用各種姿勢(shì),把他們的無邊腦洞和溫情故事講給你聽。如果你想和我做朋友,不妨加微信(shizhongmax)。

用大模型揍黑客?

恐怕得先跟人腦學(xué)兩招騷的!

文|史中

家人們, AI 已經(jīng)不滿足于自己卷,而是開始禍禍各行各業(yè)了。。。

最近跟人聊天, 只要三句之內(nèi)你還沒提到你們行業(yè)“大模型怎么代替人類牛馬”,人家就覺得你這行藥丸。

但這事兒怎么可能這么簡(jiǎn)單?要知道,各行業(yè)對(duì)人類技能的要求本就千差萬別:

設(shè)計(jì)師得懂得視覺語言,理解空間規(guī)劃; 文學(xué)編輯得理解語義空間,懂得搜索和引用信息; 工程師得有嚴(yán)謹(jǐn)?shù)臎Q策和推理能力。

所以,不是隨便裝個(gè) AI 就能起飛。

針對(duì)每個(gè)行業(yè),AI 都得反復(fù)摩擦,選定非常特別的姿勢(shì)切入才可能成功。

這里藏著真知識(shí),值得愛智求真的淺友們研究!

最近我剛和一位網(wǎng)絡(luò)安全硬核老師傅聊天,他和團(tuán)隊(duì)正在把大模型作為機(jī)械戰(zhàn)士,用子彈和鎧甲守衛(wèi)我們的網(wǎng)絡(luò)空間。

這位師傅就是潘劍鋒,他也被同事稱為“潘神”。

當(dāng)年,他是影響一代網(wǎng)絡(luò)安全研究者的安全工具“冰刃(IceSword)”的作者,如今,他是 360 集團(tuán)的首席科學(xué)家,360 數(shù)字安全集團(tuán)的首席技術(shù)官。

潘劍鋒

潘神從小就是學(xué)霸, 恨不能直接把卷子翻過來做大題那種。所以他比較反對(duì)有些人“為了用大模型而用大模型”,就蹭點(diǎn)兒步驟分。。。

他覺得:

要么就不用大模型,要用就讓它真的比人更猛!

嗯,主打一個(gè)童叟無欺。

為此,他的思路是:遇事不決,照著人學(xué)!人有多騷,AI 照抄!

這不, 團(tuán)隊(duì)這兩年 總算用這個(gè)姿勢(shì)撞開一條小裂縫,看到一絲光明透進(jìn)來。

說起這段故事,潘神決定從一個(gè)人工智能幾乎無解的“弱點(diǎn)”聊起。

(一)AI 腦袋里的“坑”

幾天前,馬斯克剛剛祭出了據(jù)說是地表最強(qiáng) AI——Grok 3。

有人立刻把那道經(jīng)典送命題遞了上去:

你看,這就是地表最強(qiáng) AI 的水平。棒棒!

話說其他 AI 對(duì)于這個(gè)問題的回答也一個(gè)鳥樣,就算能答對(duì),恐怕也只是針對(duì)性地打了補(bǔ)丁。

因?yàn)楝F(xiàn)在的 AI 訓(xùn)練方法的基礎(chǔ)是統(tǒng)計(jì)學(xué),所以 AI 對(duì)世界的理解也是“統(tǒng)計(jì)性理解”,而非“本質(zhì)性理解”。

潘神給我解釋。

啥是“統(tǒng)計(jì)性理解”“本質(zhì)性理解”嘞?

我給你舉個(gè)例子。

假設(shè)三體人派質(zhì)子來到地球研究我們的生活。

他們偷拍了 1 萬張日常照片,發(fā)現(xiàn)了我們會(huì)在一起吃“生日蛋糕” ↓↓↓

他們饞了,也想試著做出來嘗嘗。

于是挑出了幾張含有生日蛋糕的圖片,做了個(gè)簡(jiǎn)單統(tǒng)計(jì):

這種玩意兒大概率是矮圓柱形,滑滑膩膩的,插著一些可燃物。

然后用三體星球上現(xiàn)成的原料,照貓畫虎把這個(gè)東西做出來:

而后,質(zhì)子又從地球多拍了 100 萬張照片傳回去,里面有更多生日蛋糕的圖片。

三體人又一統(tǒng)計(jì),發(fā)現(xiàn)出問題了:

生日蛋糕的內(nèi)部結(jié)構(gòu)和外部并不一樣!

在里面是一坨軟軟的帶有空洞的物質(zhì),外面才是滑滑膩膩的材料。

他們于是又一頓忙活,從更多的數(shù)據(jù)里總結(jié)更多特征,改進(jìn)了自己的蛋糕。

這回從里到外都更像地球的蛋糕了。

三體人學(xué)做蛋糕的過程,就類似于人工智能模仿人腦的過程。它展現(xiàn)了統(tǒng)計(jì)性學(xué)習(xí)的兩個(gè)特點(diǎn):

1、學(xué)生不是想學(xué)啥就能學(xué),而是只有本體的某種性質(zhì) 展現(xiàn)出了統(tǒng)計(jì)上的特征 ,才能被學(xué)生注意到,才能被學(xué)會(huì)。 2、隨著描述本體的數(shù)據(jù)不斷增加, 可能會(huì)有新的特征凸顯出來 ,學(xué)生學(xué)到的特征越多,表現(xiàn)就越接近本體。

但是!這里隱藏了一個(gè)讓人脊背發(fā)涼的大問題:

就算三體人再拍 1 億張生日蛋糕的照片,把蛋糕做得再惟妙惟肖,只要他們來不了地球,無法親自品嘗,他們就永遠(yuǎn)不敢肯定自己的蛋糕和地球蛋糕的味道是完全一樣的!

完全存在一種可能:

我們放的是糖,他們放的是鹽,我們放的是蛋糕胚,他們放的是發(fā)泡塑料。。。

殘酷的事實(shí)是:在特定的數(shù)據(jù)采樣體系下,有些本質(zhì)是不會(huì)展現(xiàn)出統(tǒng)計(jì)學(xué)特征的。

也就是說,“統(tǒng)計(jì)性理解”原則上能不斷逼近“本質(zhì)性理解”。但推到終極,你卻無法證明“統(tǒng)計(jì)性理解”達(dá)到了“本質(zhì)性理解”↓↓↓

于是 Bug 暗伏其中。

三體人拿出塑料蛋糕的一瞬間,不就像極了 AI 說出 9.11 比 9.9 大的那一刻么?想想看,是不是還挺恐怖的?

更恐怖的是,你不知道 AI 的腦袋里還有哪些“坑”,也不知道這些坑什么時(shí)候會(huì)出來把哪個(gè)老鐵給坑了。

這個(gè)問題沒有“特效藥”,只有“廣譜藥”,就是:

不斷給 AI 學(xué)習(xí)更多、更好的數(shù)據(jù),祈禱新的數(shù)據(jù)里恰好含有重要的統(tǒng)計(jì)學(xué)特征,“未亡羊先補(bǔ)牢”唄。

但在最近,即便是廣譜藥也快失效了——我們遇到了“數(shù)據(jù)墻”。

人類幾百年積累的知識(shí)數(shù)據(jù),該喂給 AI 吃的都已經(jīng)喂了。

地主家也沒有余糧了。接下來只能靠 AI 自己合成數(shù)據(jù)繼續(xù)訓(xùn)練,這樣自己拉自己吃。。。最后會(huì)不會(huì)吃出毛病,學(xué)術(shù)界還頗有爭(zhēng)議。

訓(xùn)練 AI 的數(shù)據(jù),無法突破人類既有知識(shí)的極限,也就是“數(shù)據(jù)墻”。

基于以上,潘神的眼神開始犀利起來:

既然 AI 短期存在無法突破的能力極限,那就可以把網(wǎng)絡(luò)安全的問題分成兩類,用大模型做出兩套不同的體系來解決。

一套是“快思考”,一套是“慢思考”。

1、“快思考”用來做判斷題,不用絞盡腦汁解釋為啥,以對(duì)服人,適合放開手腳讓 AI 用自己的方式去干。

主打一個(gè):人能干,但 AI 更便宜。

2、“慢思考”用來做證明題,必須展現(xiàn)復(fù)雜的思考步驟,以理服人。AI 自己搞不定,可以遵循人類老師傅已有的經(jīng)驗(yàn)框架去干。

主打一個(gè):AI 不夠,祖?zhèn)髦R(shí)來湊。

這個(gè)思路,其實(shí)就是從人腦的思維方式抄的!接下來我給你展開說說。

(二)快思考像一把火

老鐵們估計(jì)都知道,“快思考”、“慢思考”的分類來自于心理學(xué)家丹尼爾·卡尼曼對(duì)人腦的研究。

一個(gè)最經(jīng)典的例子就是:

你在叢林里遇到一個(gè)長(zhǎng)條形的東西,形勢(shì)容不得你花時(shí)間分析它到底是啥。快思考會(huì)在第一時(shí)間輸出“危險(xiǎn)”這個(gè)信號(hào),給你的指令就一個(gè)字——跑! 等你跑開了一段安全距離,慢思考才跟上來。你可以詳細(xì)觀察這個(gè)東西的紋理、動(dòng)作,然后綜合判斷它到底是蛇還是翔,以決定接下來的計(jì)劃。

打個(gè)比方:

快思考就像一把火,短暫而絢爛地燃燒;

慢思考就像一條河,帶著小船時(shí)急時(shí)緩地漂流,一段時(shí)間后才奔流入海。

在網(wǎng)絡(luò)安全領(lǐng)域,快慢思考也都有用武之地。

咱們這一趴先說個(gè)“快思考”的例子:

假設(shè)中哥開了家公司,辦公網(wǎng)就像一個(gè)工業(yè)園區(qū),里面安裝的 360 安全系統(tǒng)就像保安大隊(duì),負(fù)責(zé)監(jiān)視園區(qū)里的一舉一動(dòng),以防有人搞事情。

黑客偷來一張工牌,為了尋找敏感資料,他想拿著這個(gè)工牌混入檔案大樓。

黑客走到檔案樓門口,這位保安只有幾十毫秒的時(shí)間做出判斷。如果感覺這個(gè)人不對(duì)勁就要果斷攔截,否則就得放行,不能耽誤人家的事!

傳統(tǒng)的做法是,把所有已知的黑客行為特點(diǎn)都提前總結(jié)成一條條的規(guī)則,放進(jìn)一個(gè)大的“規(guī)則集”里。

來了一個(gè)人,保安只要無腦對(duì)照規(guī)則集里所有的規(guī)則查一遍,就有了結(jié)論,這不就很快了嗎?

但是,規(guī)則終歸是死板的。

它就像特工電影里那種會(huì)觸發(fā)警報(bào)的紅外射線,即使數(shù)量再多,中間還是會(huì)有縫隙,聰明的特工總能找到方法繞過。

這不保險(xiǎn)。。。

人類大腦就很靈活。

老保安隊(duì)長(zhǎng)和壞人眼神一對(duì),就感覺他有問題。

具體哪兒有問題一時(shí)說不清,但沒關(guān)系,只要覺得他有問題,就可以攔下來慢慢盤問!

現(xiàn)在咱有了大模型,直接用它模擬老保安隊(duì)長(zhǎng)那種說不清道不明的“直覺”來做判斷,不就直接吊打黑客了嗎?

聽上去不錯(cuò),但操作起來沒那么簡(jiǎn)單。

咱們的大腦看似是一坨,實(shí)際 做復(fù)雜判斷時(shí),是里面很多“腦區(qū)”相互配合的結(jié)果,就像病人的疑難雜癥需要不同科室的專家會(huì)診一樣。

如果要模擬人腦識(shí)別高級(jí)入侵,“一把火”不夠,得把網(wǎng)絡(luò)安全所需的不同腦區(qū)都給訓(xùn)練到一個(gè)大模型中↓↓↓

這些腦區(qū)有的是看代碼,有的是看日志,有的是做推理,有的是讀語言,知識(shí)體系和功能都差異很大。

偏偏目前的均質(zhì)大模型結(jié)構(gòu)存在一個(gè)天生缺陷。

那就是,同時(shí)學(xué)習(xí)多個(gè)差異很大的知識(shí)體系,就會(huì)形成蹺蹺板效應(yīng):A 領(lǐng)域?qū)W會(huì)了,有可能 B 領(lǐng)域就學(xué)廢了,反之亦然。

其實(shí)這個(gè)缺陷人腦也存在,你讀一個(gè)博士都費(fèi)勁,同時(shí)讀五個(gè)風(fēng)馬牛不相及的博士你試試,不走火入魔才怪。

但網(wǎng)絡(luò)安全的場(chǎng)景非常復(fù)雜,要想攔住頂級(jí)黑客,你還真就得讀五個(gè)博士。

不搞定這個(gè) Bug,大模型就無法在網(wǎng)絡(luò)安全領(lǐng)域落地。。。

老師傅們只好退而求其次:

把不同的專家徹底分開——獨(dú)立訓(xùn)練幾個(gè)“安全專家模型”,每個(gè)專家的腦袋瓜只思考一件特定的事情,然后讓他們組成一個(gè)“專家組”。

遇到復(fù)雜問題,抽調(diào)團(tuán)隊(duì)里相關(guān)的安全專家模型分別思考,再把結(jié)論綜合起來,這不就行了嗎?

行是行,但這樣獨(dú)立模型聯(lián)合起來的團(tuán)隊(duì),未免太奢華了。。。

(三)可以“拔下來”的火柴頭

每一個(gè)專家模型都要有語言和邏輯思維能力,這意味著它們分別要在大模型的基礎(chǔ)上訓(xùn)練而成——比如是 72B 的模型。

而干一件事兒可能需要 10-20 個(gè)專家模型配合。 這么一來,系統(tǒng)里等于是并行跑著 10 個(gè)大模型。

運(yùn)行一個(gè) 72B 的模型,怎么也得需要一個(gè)裝滿 4 張 L20 推理卡的服務(wù)器,價(jià)格最低也要 20 多萬。要是跑 10 個(gè)模型,光是機(jī)器就要 200 多萬。

對(duì)于絕大多數(shù)企業(yè)來說,這都是一筆巨額開銷!

想想看,哪個(gè)工業(yè)園區(qū)也不會(huì)把日常支出的 20% 用于給“豪華旗艦版保安隊(duì)”開工資吧??

看到?jīng)],這才是大模型進(jìn)入產(chǎn)業(yè)的真實(shí)困境。。。

看來,人腦的作業(yè)也不是這么好抄的,得上點(diǎn)兒狠活!

說到這,潘神終于搬出了他們的一些探索成果:

360 數(shù)字安全團(tuán)隊(duì)也會(huì)訓(xùn)練很多“安全專家腦區(qū)”,但不同的是,他們對(duì)這些腦區(qū)“提取最大公約數(shù)”——彼此共用一套大模型底座。

具體來說就是:

1、每類任務(wù)都交給一個(gè)特定的“專家腦區(qū)”,平時(shí)把這個(gè)腦區(qū)外掛在大模型底座上訓(xùn)練; 2、每次訓(xùn)練的過程中,把底座大模型的參數(shù)鎖死,只改動(dòng)“外掛腦區(qū)”的參數(shù); 3、訓(xùn)練好 A 專家腦區(qū),就把 A 從底座上拔下來,再插上 B 腦區(qū),訓(xùn)練 B 任務(wù)。

你可以這樣想象:一根火柴梗,上面能搭配很多火柴頭。

這樣一來,所有的專家共用了一套語言邏輯中樞,也就是那個(gè)大模型底座。每個(gè)專家腦區(qū)只負(fù)責(zé)特定的思考,腦容量就能大大縮小,大概只有 1 億個(gè)參數(shù)。

然后,設(shè)置一個(gè)路由模塊。

系統(tǒng)思考的時(shí)候,它會(huì)根據(jù)任務(wù)的不同給它指派“火柴頭”。

每次指派之后,信息流就從大模型基座(火柴梗)燒向這個(gè)專家腦區(qū)(火柴頭)。

在思考下一趴的時(shí)候,路由器會(huì)重新指派“專家腦區(qū)”。以此循環(huán),直到所有的思考結(jié)束,最終答案呈現(xiàn)在眼前。

這樣一來,火柴是用到哪根點(diǎn)哪根,火柴頭平時(shí)也不占地方。

同樣是一臺(tái) 20 萬的機(jī)器,原本只能驅(qū)動(dòng)一個(gè)專家,現(xiàn)在卻驅(qū)動(dòng) 10 個(gè)專家也沒問題。

這個(gè)架構(gòu),被 360 稱為 CCoE(緊湊型多專家協(xié)同大模型)↓↓↓

潘神告訴我,現(xiàn)在他們訓(xùn)練了很多個(gè)“火柴頭”專家,企業(yè)客戶根據(jù)自己的情況,用到哪個(gè)專家就買哪個(gè)專家,跟自助餐一樣豐儉由人,非常方便。

但別高興太早。

“快思考”只能解決一半兒的問題。

我們剛才說過:快思考雖然能快速做判斷題,但它的判斷“不保熟”。

保安看一個(gè)人像壞蛋,雖然可以用直覺判斷拒絕他進(jìn)入園區(qū)。但如果背后沒有理性邏輯支撐的”慢思考”,終究會(huì)存在兩種問題:

一來,可能誤傷好人,次數(shù)多了人家會(huì)投訴你,保安就得下崗; 二來,壞蛋痛定思痛,下次喬裝打扮得更好,你可能又給放進(jìn)去了,保安還是得下崗!

為了不下崗,保安必須得有環(huán)環(huán)相扣的邏輯推理能力,這在大模型技術(shù)中被叫做——思維鏈。

(四)慢思考像一條河

如果你用過 DeepSeek,就不會(huì)對(duì)“思維鏈”太陌生。

DeepSeek 在正式回答你之前,會(huì)走一段內(nèi)心 OS,這個(gè) OS,就是它的思維鏈。

那么,只要用這個(gè)思維鏈思考, 就是潘神所說的慢思考了嗎?

他的答案是:No。

掌握了思維鏈,就像學(xué)會(huì)了功夫。

首先說,練過拳腳的人和沒練過拳腳的人肯定不在一個(gè)量級(jí),一打一個(gè)服氣。

這不,DeepSeek 利用思維鏈給出的回答,相比之前直覺大模型(例如 GPT-4o)的不假思索直接出答案,更加有理有據(jù),令人信服。

但功夫這件事兒,是分段位的。白帶打不過黑帶,黑帶打不過紅帶,山外有山,進(jìn)無止境。

咱們不妨具體看一下 DeepSeek 的功夫,它的絕招是“反思”

你問 DeepSeek 一個(gè)問題,它會(huì)把問題拆成步驟,一步一步地往下推導(dǎo)。

這個(gè)思維鏈原本像一條河流。

小船自然地隨著水勢(shì)自然流淌,永遠(yuǎn)不會(huì)意識(shí)到自己在隨波逐流,更不會(huì)“主動(dòng)”倒船選擇更順的路↓↓↓

但是,DeepSeek 不同,如果推導(dǎo)過程中出現(xiàn)了矛盾,它居然會(huì)倒帶,修改之前的思考方向。這就是反思!

直到它撇出一條順滑的結(jié)論,才算是走通了一條思維鏈↓↓↓

用同樣的方法,它還會(huì)給出幾條思維鏈,最后再反思一下,沿著最順滑的那條思維鏈給你輸出答案。

這很不尋常。

因?yàn),只有在思維之河之外存在某種監(jiān)督機(jī)制,才能對(duì)小船的航向有感知和反思。

這種監(jiān)督機(jī)制,恰恰是人腦的特色。

DeepSeek 之所以被全世界豎大拇指,最大的功勞就是:工程師沒有把這種反思能力強(qiáng)加于模型,而是找到了方法,讓模型自己進(jìn)化出來。

在 DeepSeek R1 的論文中,老師傅展示了一段思維鏈,AI 在思考過程中,直接用人類的口吻來了個(gè)“aha”,這意味著它有了反思,開始重整思維鏈。

但潘神提示我:作為人類,咱可不只有“反思”這一個(gè)絕招。

人在為思考按下暫停鍵時(shí),除了“閉眼向內(nèi)求”——通過自省來重新修正自己的思維鏈,還會(huì)“睜眼向外看”——借助工具和信息渠道,從開放世界拿回最新鮮的數(shù)據(jù),輔助生成接下來的思維鏈。

據(jù)此,有關(guān)思維鏈的段位,潘神總結(jié)了三級(jí):

第一級(jí):類似于 GPT-4o 這樣用直覺輸出答案,是 “快思考” ; 第二級(jí):類似于 DeepSeek 和 GPT-o1 這樣有向內(nèi)看能力的思維鏈,可以叫 “深度思考” ; 第三級(jí):在反思型思維鏈的基礎(chǔ)上,還能主動(dòng)吸收外部信息,一邊向外看一邊想,才是更完整的 “慢思考” 。

要達(dá)到第三級(jí),才能處理網(wǎng)絡(luò)安全的諸多問題。

但現(xiàn)實(shí)很殘酷。DeepSeek 的訓(xùn)練資源和技巧已經(jīng)是當(dāng)前世界頂級(jí)了,要想在它的基礎(chǔ)上改進(jìn),技術(shù)難度提升可不止一點(diǎn)半點(diǎn)。

但他不打算坐在原地抱怨,而是想辦法使“巧勁兒”。

(五)“不斷有支流匯入”的思維之河

遇事不決,照著人學(xué)。

讓我們觀察一下自身,咱們思考問題的時(shí)候,啥時(shí)候會(huì)去查一些信息?

一般是我們“拿不準(zhǔn)”的時(shí)候。換句話說,當(dāng)我們需要“不能錯(cuò)的信息”時(shí)。

咱們就以網(wǎng)絡(luò)安全場(chǎng)景為例,不能錯(cuò)的信息大概有四種:

1、精確的通識(shí)。 比如:網(wǎng)絡(luò)安全行業(yè)處理黑客攻擊的《最佳流程手冊(cè)》。 2、專有的數(shù)據(jù)。 比如:L 黑客組織,360 公司歷年捕獲到的它曾用過的攻擊手法。 3、實(shí)時(shí)的事態(tài)。 比如:W 系統(tǒng)最新爆出的漏洞詳情代碼。 4、工具的輸出結(jié)果。 比如:利用掃描工具檢查網(wǎng)域內(nèi)的設(shè)備后,繪制的網(wǎng)絡(luò)地圖。

這幾種信息的來源也不同:

通識(shí)一般以知識(shí)圖譜的形式存在,專有數(shù)據(jù)在數(shù)據(jù)庫里,實(shí)時(shí)事態(tài)一般要聯(lián)網(wǎng)查詢,工具一般要靠智能體去調(diào)用。

潘神他們索性把這幾種東西打包起來,做成了一個(gè)“外腦”↓↓↓

AI 在思維鏈的形成過程中,可以隨時(shí)停下,調(diào)用這個(gè)外腦來補(bǔ)充信息,然后再繼續(xù)思考,就好像人的“聯(lián)想”一樣!

看到這你也許會(huì)疑惑:DeepSeek 不是有個(gè)“聯(lián)網(wǎng)搜索”功能嗎?這不已經(jīng)是聯(lián)想了嗎?

還是有區(qū)別的:

DeepSeek 是在思考之前先搜索,然后帶著搜索內(nèi)容開始生成思維鏈。思維鏈在延展的過程中,是不能停下吸納新信息的。

這就好比只在河流的發(fā)源地匯入一股水流。

你沒辦法預(yù)測(cè)后續(xù)具體會(huì)用到什么信息,只能不管后面有用沒用,先一股腦多輸入一些。

而“聯(lián)想”則是在河流流淌的過程中,隨時(shí)匯入支流。

由于前面已經(jīng)完成了一部分思考,此時(shí)應(yīng)該非常清楚急需什么, 可以有針對(duì)性地搜索、納入這些信息,讓接下來的思考更鋒利。

顯然,聯(lián)想這個(gè)特點(diǎn)更擬人。

但問題是,目前還沒有一種方法,可以讓大模型在思考的過程中主動(dòng)產(chǎn)生聯(lián)想的“欲望”。

這咋辦?

潘神團(tuán)隊(duì)研究出一個(gè)看上去粗暴,但著實(shí)有用的方案:既然敬酒不吃,那就吃罰酒唄!

在模型思考的框架里加入“強(qiáng)行聯(lián)想”的功能。

具體來說就是,思維鏈每行進(jìn)一步,都有一個(gè)外部的算法對(duì)它進(jìn)行評(píng)估,一旦發(fā)現(xiàn)思考的內(nèi)容符合條件,二話不說直接激活外腦。

這個(gè)算法其實(shí)沒那么復(fù)雜,甚至也不是一個(gè)大模型。

你可以把它想象成河流當(dāng)中的浮標(biāo),只要思維的深度觸碰到浮標(biāo), 就主動(dòng)開閘,引入一條支流,把新信息合并進(jìn)來繼續(xù)作為下一層思考的輸入。

這個(gè)帶有實(shí)時(shí)聯(lián)想功能的思維鏈,被他們稱作CoAT(Chain-of-Associated-Thoughts),也就是“聯(lián)想思維鏈”。

你感受一下全過程↓↓↓

高級(jí)的食材只需簡(jiǎn)單的烹飪,雖說 CoAT 實(shí)現(xiàn)方法并不復(fù)雜,但效果還挺顯著的。

潘神給我看了一個(gè)例子,分別用 CoAT 架構(gòu)的“慢思考大模型”和 DeepSeek 的“深度思考大模型”來解答同一個(gè)問題。

問題是這樣的:

我們應(yīng)該如何看待人工智能在當(dāng)代國際競(jìng)爭(zhēng)中的作用?哪些國家在這一領(lǐng)域擁有領(lǐng)先的優(yōu)勢(shì)?

DeepSeek 發(fā)揮穩(wěn)定,答案很詳細(xì),但美中不足是例證較少。

CoAT 的不同點(diǎn)是,它列舉了幾個(gè)具體國家的 AI 策略,并且提供了美國 AI 研究的具體項(xiàng)目和中國的“新一代人工智能發(fā)展計(jì)劃”。

之所以會(huì)有這樣的區(qū)別,大概正是因?yàn)?DeepSeek 只在最開始的時(shí)候搜索了外部信息,而 CoAT 是在思考的每一步都通過外腦查詢相關(guān)的信息,從而可以更具體。

這是回答上述問題的完整思維鏈生成過程,可以看到在每一步都和紅圈內(nèi)的外腦交互,進(jìn)行了“聯(lián)想”。(點(diǎn)擊看大圖)

潘神告訴我,這種優(yōu)勢(shì)在思考網(wǎng)絡(luò)安全的專業(yè)問題上會(huì)表現(xiàn)得更明顯,他們正在緊鑼密鼓把這些能力加持在 360 的大模型安全產(chǎn)品里,客戶很快就能體驗(yàn)到。

但天下武功都有走火入魔的可能,這種“強(qiáng)行匯入支流”的操作也暗藏危險(xiǎn):

在思考中添加外腦的信息,并不一定總是會(huì)讓思考結(jié)果更好。 原因很簡(jiǎn)單,如果匯入的支流里面有泥沙,就會(huì)讓本來一條清澈的河流變得渾濁。

所以,如何篩選和精簡(jiǎn)外腦的“信息水流”,是至關(guān)重要的。

他們于是在每一條匯入的支流入口處,都加了一道“水閘”。

這個(gè)水閘其實(shí)就是一個(gè)評(píng)估算法,來計(jì)算內(nèi)容和已有思維鏈生成內(nèi)容的相關(guān)程度。

只把最相關(guān)最核心的內(nèi)容放進(jìn)主河流,其他的信息主動(dòng)放棄,主打一個(gè)寧缺毋濫!

潘神特別提醒我,CoAT 只是一種技術(shù)框架,里面所有的參數(shù)都是可以調(diào)整的:

在網(wǎng)絡(luò)安全領(lǐng)域,對(duì)思維鏈的聚焦度要求比較高,就可以決定只在關(guān)鍵節(jié)點(diǎn)匯入支流,匯入的水流也少而精確; 而在其他領(lǐng)域,比如輔助寫作,完全可以更多地匯入信息,每次加入豐富的數(shù)據(jù),讓結(jié)果變得更加發(fā)散,更有趣味。

360 的老師傅合計(jì)了一下,覺得這些研究對(duì)很多行業(yè)都有用,于是 把一部分研究成果寫成了論文分享了出來。

這個(gè)操作很快引來了一些“自來水”。有人錄視頻、寫文章分享他們對(duì)這個(gè)技術(shù)進(jìn)展的解讀。

一位外國程序員小哥做的視頻解讀。

這并不太意外,畢竟如今 Made in China 的技術(shù)也是品質(zhì)的保證嘛。

實(shí)際上,隨著前幾天 DeepSeek 對(duì)技術(shù)的披露,人們逐漸意識(shí)到:

“顛覆性創(chuàng)新”很多時(shí)候是由一系列“實(shí)踐創(chuàng)新”集合而成的。

DeepSeek 的每一個(gè)創(chuàng)新都很具體,比如 GPU 優(yōu)化、通信庫、文件系統(tǒng)。。。但合在一起就有奇效!

如此說來,像 360 老師傅這樣的實(shí)踐型創(chuàng)新同樣值得被我們點(diǎn)贊。

無數(shù)這樣的大小創(chuàng)新集結(jié)起來,才把我們一步步推向那個(gè)“智械黎明”。

(六)“智械黎明”

網(wǎng)絡(luò)安全也許是大模型的光亮最難照射進(jìn)去的幾個(gè)行業(yè)之一。

它是戰(zhàn)爭(zhēng)的線上版本,是全人類最頂尖頭腦之間的攻防。人腦尚且不夠用,怎么輪到 AI 多嘴?

但大模型的光芒一旦照進(jìn)去,網(wǎng)絡(luò)安全行業(yè)又會(huì)是最閃耀的。

因?yàn)榫W(wǎng)絡(luò)安全行業(yè)是“賽博原生”的。

它自古就能觸及浩如煙海的底層日志,能見識(shí)最多走位風(fēng)騷的攻擊路徑。而大模型本就是數(shù)據(jù)驅(qū)動(dòng)的。如果能夠找到方法完整、高效地利用這些獨(dú)門數(shù)據(jù),做出來的機(jī)械戰(zhàn)士將強(qiáng)的可怕。

只是,黎明之前的暗夜太長(zhǎng),不知誰能堅(jiān)持穿過。

大模型已經(jīng)橫空出世三四年了,雖然幾乎所有的網(wǎng)絡(luò)安全公司都說自己用了大模型,看上去一片火熱,但如人飲水冷暖自知。

很多安全公司使用大模型的原動(dòng)力都來自于行業(yè)的內(nèi)卷和焦慮——本來生意就不好做,別人吹牛說用了大模型,你不說,生意就更不好做了。

在很長(zhǎng)的時(shí)間里,殘酷的迷霧一直籠罩:全行業(yè)都沒有找到“特別適合大模型的任務(wù)”。

有些任務(wù)大模型能干,小模型也能干,但小模型的性價(jià)比更高; 有些任務(wù)小模型確實(shí)干不了,但人干更便宜,性價(jià)比仍然比大模型高。

現(xiàn)實(shí)很殘酷,各個(gè)企業(yè)中的網(wǎng)絡(luò)安全部門雖然客觀上肩頭責(zé)任重大,但一般卻是公司里存在感最低的部門。

老板天然更注重業(yè)務(wù),誰愿意天天關(guān)注保安隊(duì)呢?

一般是哪種安保措施性價(jià)比高,人家就選哪種方法。

未來,即使是這么嚴(yán)苛的標(biāo)準(zhǔn),“大模型驅(qū)動(dòng)的保安”也可能被挑中!

舉一個(gè)在安全運(yùn)營中的例子吧:

網(wǎng)絡(luò)流量中的一種分析任務(wù),如果放一個(gè)人類專家在這,工資成本也不低,F(xiàn)在,CCoE 框架下的大模型能達(dá)到人類準(zhǔn)確率的 90%,但運(yùn)行成本遠(yuǎn)低于人類專家。

在這種表現(xiàn)下,無論怎么算賬,大模型加持的機(jī)械戰(zhàn)士都是這個(gè)崗位的最優(yōu)選項(xiàng)——不出意外,它即將成為這個(gè)崗位上的釘子戶。

如果從遠(yuǎn)處眺望,網(wǎng)絡(luò)安全系統(tǒng)就像一艘戰(zhàn)艦。

未來的日子里,大模型有希望在越來越多的位置上成為釘子戶。一點(diǎn)點(diǎn)替代傳統(tǒng)的規(guī)則引擎,替代人類的專家判斷——如忒修斯之船一樣每天替換掉一個(gè)部件。

某一天,當(dāng)太陽再次升起,戰(zhàn)艦的輪廓顯形,我們也許會(huì)見證一個(gè)“智械黎明”。

我不知道這個(gè)黎明還有多遠(yuǎn)。

但我知道的是,那個(gè)黎明來自過往的每一天,來自行業(yè)中無數(shù)頭鐵的老師傅用微小而堅(jiān)定的創(chuàng)新一點(diǎn)點(diǎn)撞開的裂縫。

人有多騷

AI 照抄

再自我介紹一下吧。我叫史中,是一個(gè)傾心故事的科技記者。我的日常是和各路大神聊天。如果想和我做朋友,可以搜索微信:shizhongmax。

哦對(duì)了,如果喜歡文章,請(qǐng)別吝惜你的“在看”“分享”。讓有趣的靈魂有機(jī)會(huì)相遇,會(huì)是一件很美好的事情。

Thx with in Beijing

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
原來林心如沒了美顏長(zhǎng)這樣,比普通人耐看,到底是明星。

原來林心如沒了美顏長(zhǎng)這樣,比普通人耐看,到底是明星。

動(dòng)物奇奇怪怪
2026-01-22 11:23:18
1億鋒霸急速隕落:7場(chǎng)0球,西蒙尼太失望:連續(xù)3次提前換下他

1億鋒霸急速隕落:7場(chǎng)0球,西蒙尼太失望:連續(xù)3次提前換下他

足球狗說
2026-01-22 07:22:24
同樣在路上跑,電車為啥不用交養(yǎng)路費(fèi)?2026年養(yǎng)路費(fèi)新規(guī)落地!

同樣在路上跑,電車為啥不用交養(yǎng)路費(fèi)?2026年養(yǎng)路費(fèi)新規(guī)落地!

老特有話說
2026-01-20 15:57:30
很多你以為不該存在的,只是你沒看懂

很多你以為不該存在的,只是你沒看懂

記憶承載
2026-01-22 11:18:52
WTT常規(guī)賽:向鵬出師不利!首局連丟7分被逆轉(zhuǎn),卡爾伯格11-5大勝

WTT常規(guī)賽:向鵬出師不利!首局連丟7分被逆轉(zhuǎn),卡爾伯格11-5大勝

劉姚堯的文字城堡
2026-01-22 16:32:42
離譜數(shù)據(jù)!東契奇單節(jié)408分>AD本賽季總得分,湖人血賺

離譜數(shù)據(jù)!東契奇單節(jié)408分>AD本賽季總得分,湖人血賺

夜白侃球
2026-01-22 16:10:49
冉瑩穎窮到晚上不敢開燈!兒子穿破洞鞋、節(jié)約餐費(fèi),滿墻名包諷刺

冉瑩穎窮到晚上不敢開燈!兒子穿破洞鞋、節(jié)約餐費(fèi),滿墻名包諷刺

探索新高度
2026-01-21 12:12:44
無緣挑戰(zhàn)德約科維奇!商竣程連丟三盤出局,止步澳網(wǎng)男單第2輪

無緣挑戰(zhàn)德約科維奇!商竣程連丟三盤出局,止步澳網(wǎng)男單第2輪

全景體育V
2026-01-22 13:49:51
比 “斬殺線” 更恐怖,美國每年失蹤36萬兒童,且僅是被正式記錄在案數(shù)據(jù)

比 “斬殺線” 更恐怖,美國每年失蹤36萬兒童,且僅是被正式記錄在案數(shù)據(jù)

不掉線電波
2026-01-21 19:59:28
兩年了,為何許家印遲遲不判刑?真相比你想象的更復(fù)雜!

兩年了,為何許家印遲遲不判刑?真相比你想象的更復(fù)雜!

李云飛Afey
2026-01-20 11:43:34
威少轟23+3+3+3仍無緣今日最佳!對(duì)不起,你碰到創(chuàng)紀(jì)錄的SGA了

威少轟23+3+3+3仍無緣今日最佳!對(duì)不起,你碰到創(chuàng)紀(jì)錄的SGA了

世界體育圈
2026-01-22 13:41:23
新四軍剛沖出日軍包圍圈,旅長(zhǎng)卻下令:打回去,日軍人數(shù)不對(duì)勁!

新四軍剛沖出日軍包圍圈,旅長(zhǎng)卻下令:打回去,日軍人數(shù)不對(duì)勁!

史之銘
2026-01-22 06:29:44
2026年財(cái)神偏愛!這3大生肖事業(yè)攀升,衣食無憂,家庭美好

2026年財(cái)神偏愛!這3大生肖事業(yè)攀升,衣食無憂,家庭美好

人閒情事
2026-01-22 15:58:06
嫣然活動(dòng)現(xiàn)場(chǎng)曝光,王菲和李亞鵬媽媽同框,離婚7年稱對(duì)方自家人

嫣然活動(dòng)現(xiàn)場(chǎng)曝光,王菲和李亞鵬媽媽同框,離婚7年稱對(duì)方自家人

甜檸聊史
2026-01-22 16:18:20
事發(fā)南通,網(wǎng)友實(shí)名舉報(bào),大雪紛飛中,易家橋中學(xué)學(xué)生被體罰

事發(fā)南通,網(wǎng)友實(shí)名舉報(bào),大雪紛飛中,易家橋中學(xué)學(xué)生被體罰

尋墨閣
2026-01-22 14:08:38
吳京、李連杰新片遭受抵制,網(wǎng)友的吐槽方向一致,不約而同

吳京、李連杰新片遭受抵制,網(wǎng)友的吐槽方向一致,不約而同

林輕吟
2026-01-19 19:59:16
你見過最暖的撿奶茶現(xiàn)場(chǎng)嗎?一車奶茶傾瀉,路人集體變身“撿購俠”;網(wǎng)友:陜西人“嫽咋咧”!

你見過最暖的撿奶茶現(xiàn)場(chǎng)嗎?一車奶茶傾瀉,路人集體變身“撿購俠”;網(wǎng)友:陜西人“嫽咋咧”!

大風(fēng)新聞
2026-01-22 10:57:04
特朗普大鬧達(dá)沃斯,全世界哭笑不得

特朗普大鬧達(dá)沃斯,全世界哭笑不得

牛彈琴
2026-01-22 07:56:12
小縣城的消費(fèi)究竟能有多高?網(wǎng)友:越小的地方東西越貴,這是真的

小縣城的消費(fèi)究竟能有多高?網(wǎng)友:越小的地方東西越貴,這是真的

解讀熱點(diǎn)事件
2026-01-19 00:05:09
廣東今日早報(bào)!威姆斯公布重要決定,薩林杰或被裁,徐杰兌現(xiàn)承諾

廣東今日早報(bào)!威姆斯公布重要決定,薩林杰或被裁,徐杰兌現(xiàn)承諾

多特體育說
2026-01-22 06:40:03
2026-01-22 17:24:49
淺黑科技官方 incentive-icons
淺黑科技官方
科技有溫情
284文章數(shù) 22967關(guān)注度
往期回顧 全部

科技要聞

幾千億只是開胃菜,AI基建還得再砸?guī)兹f億

頭條要聞

浙江有人領(lǐng)走88888888馬年紀(jì)念鈔 銀行員工:隨機(jī)分配

頭條要聞

浙江有人領(lǐng)走88888888馬年紀(jì)念鈔 銀行員工:隨機(jī)分配

體育要聞

跑個(gè)步而已,他們?cè)谌际裁矗?/h3>

娛樂要聞

鐘麗緹土耳其高空落淚 與張倫碩擁吻

財(cái)經(jīng)要聞

申通快遞創(chuàng)始人被前夫索要股份

汽車要聞

配備多塊娛樂屏 極氪8X內(nèi)飾曝光

態(tài)度原創(chuàng)

旅游
房產(chǎn)
健康
親子
手機(jī)

旅游要聞

赴一場(chǎng)冰雪之約!看見新疆的冬日浪漫

房產(chǎn)要聞

超千畝!三亞基建大幕開啟!崖州灣科技城向北猛擴(kuò)!

打工人年終總結(jié)!健康通關(guān)=贏麻了

親子要聞

家長(zhǎng)因孩子發(fā)燒,深夜帶老師cosplay“大薩滿”,評(píng)論區(qū)太精彩了

手機(jī)要聞

iPhone存儲(chǔ)空間被誰偷走?系統(tǒng)數(shù)據(jù)異常堆積與應(yīng)用體積暴增是主因

無障礙瀏覽 進(jìn)入關(guān)懷版