国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

馬斯克罕見低頭:開源推薦算法,自嘲“很爛”不過未來月更

0
分享至

就現(xiàn)在,GitHub已經(jīng)能完整看到馬斯克開源的推薦算法系統(tǒng)了。

開源文件里明確表示,這是一個(gè)幾乎完全由AI模型驅(qū)動(dòng)的算法系統(tǒng)。

  • 我們移除了所有人工設(shè)計(jì)特征和絕大多數(shù)啟發(fā)式規(guī)則。



消息一出,整個(gè)社區(qū)立刻沸騰了,最高贊上去就是一頓猛夸:

  • incredible!沒有其他平臺(tái)能做到如此透明。



馬斯克本人也火速轉(zhuǎn)發(fā)了工程團(tuán)隊(duì)原帖,不過一向言辭高調(diào)的老馬,此番卻低調(diào)表示:

  • 我們知道這個(gè)算法很蠢(dumb),需要大幅改進(jìn),但至少您可以實(shí)時(shí)、透明地看到我們?yōu)楦倪M(jìn)它而努力。
  • 其他社交媒體公司都沒有這樣做。



早在2022年收購(原Twitter)之前,馬斯克就多次批評(píng)該平臺(tái)過于封閉。

自收購之后,他也兌現(xiàn)承諾多次公開Twitter核心推薦算法,這一次也算是不忘初心了。

原來純AI驅(qū)動(dòng)的推薦系統(tǒng),是這樣運(yùn)作的!

話不多說,咱這就扒一扒整套系統(tǒng)的運(yùn)作機(jī)制。

一句話概括這個(gè)系統(tǒng)即為:

基于Grok-1同款Transformer架構(gòu)打造,能通過學(xué)習(xí)你的歷史互動(dòng)行為(點(diǎn)贊/回復(fù)/轉(zhuǎn)發(fā)過什么),來決定給你推薦什么內(nèi)容。

從用戶打開“For You”開始,客戶端會(huì)向服務(wù)器發(fā)送一個(gè)請(qǐng)求,觸發(fā)整個(gè)算法流程。



然后系統(tǒng)會(huì)先做一件事——搞清楚你是誰、你最近在干什么、你平時(shí)對(duì)什么內(nèi)容有反應(yīng)。

為實(shí)現(xiàn)這一目的,系統(tǒng)會(huì)拉取兩類用戶信息:

  • 行為序列(Action Sequence):一類代表最直接、最強(qiáng)烈的興趣信號(hào),比如最近點(diǎn)贊、回復(fù)、轉(zhuǎn)發(fā)、點(diǎn)進(jìn)、停留過什么。
  • 屬性(Features):另一類代表長期屬性,比如關(guān)注列表、聲明的興趣主題、地理位置、使用設(shè)備等。

這一步的目標(biāo)并不是人工構(gòu)造特征,而是盡可能真實(shí)地構(gòu)建“實(shí)時(shí)用戶畫像”——

以前工程師可能會(huì)假設(shè)“某些屬性很重要”,然后手動(dòng)編寫規(guī)則或公式去計(jì)算一個(gè)“用戶興趣得分”。

但這本質(zhì)上是工程師的猜想,而非用戶真實(shí)狀態(tài)的反映。

于是馬斯克的這套算法就決定不做任何預(yù)設(shè)假設(shè),而是盡可能多地、原始地收集用戶最真實(shí)的行為反應(yīng),然后將這堆數(shù)據(jù)直接喂給后續(xù)的模型,從而讓模型自己去從原始數(shù)據(jù)中學(xué)習(xí)和發(fā)現(xiàn)規(guī)律。(即“去人工化”和“端到端”)

而拿到實(shí)時(shí)用戶畫像后,系統(tǒng)會(huì)接著兵分兩路,從整個(gè)平臺(tái)的海量推文中快速篩選出幾千條“可能相關(guān)”的推文

一條是通過熟人圈。即從Thunder模塊,直接抓取你關(guān)注的所有人的最新推文。

另一條是通過外部。利用Phoenix Retrieval這一核心檢索模塊,抓取那些你可能感興趣、但來自未關(guān)注賬號(hào)的推文。



以上兩類來源不同的信息,會(huì)在后續(xù)階段被統(tǒng)一對(duì)待。

需要提醒,此時(shí)篩選出來的還只是推文ID。

于是系統(tǒng)會(huì)通過Hydration模塊,補(bǔ)全每條候選推文的信息,包括推文全文、作者詳情、圖片/視頻、歷史互動(dòng)數(shù)據(jù)等,以便后續(xù)深度評(píng)估。

而且在正式開始計(jì)算前,還會(huì)進(jìn)一步通過Filtering模塊淘汰那些明顯不要的內(nèi)容,例如:

  • 重復(fù)或過期的帖子
  • 用戶自己發(fā)布的內(nèi)容
  • 來自拉黑或靜音賬號(hào)的帖子
  • 包含用戶屏蔽關(guān)鍵詞的內(nèi)容
  • 已經(jīng)看過或在當(dāng)前會(huì)話中展示過的帖子
  • 用戶無權(quán)限訪問的訂閱內(nèi)容

記住,這一步只做一件事:回答某條內(nèi)容“能不能出現(xiàn),而不是值不值得推薦”。



鋪墊到這里,最終剩下來的內(nèi)容會(huì)被逐條送入Phoenix排序模型進(jìn)行打分。

這個(gè)模型是一個(gè)基于Transformer的模型,它會(huì)同時(shí)接收:

  • 用戶的行為序列與屬性信息
  • 單條候選帖子的內(nèi)容與作者信息

然后模型會(huì)預(yù)測(cè)用戶對(duì)某條推文執(zhí)行各種操作的概率,并將各種概率按照預(yù)設(shè)權(quán)重進(jìn)行加權(quán)組合(如點(diǎn)贊類正向行為加分、拉黑類負(fù)向行為減分),并形成最終排序分?jǐn)?shù)。

基于此,系統(tǒng)還會(huì)進(jìn)行少量工程層面的調(diào)節(jié)——

比如控制作者多樣性,避免單一賬號(hào)在信息流中占據(jù)過高比例(防止某一大V刷屏)。

這里也需要提醒,為了保證送入的每條帖子都是獨(dú)立評(píng)分的,所以系統(tǒng)還特意設(shè)置了“不允許候選帖子相互看見”(推文之間沒有交叉注意力機(jī)制)。



所有候選帖子按最終得分排序,系統(tǒng)從中選出Top-K條帖子,作為本次請(qǐng)求的推薦結(jié)果。

而且在返回客戶端之前,系統(tǒng)還會(huì)進(jìn)行最后一輪校驗(yàn),確保內(nèi)容符合平臺(tái)安全規(guī)范——

例如,移除任何已刪除、被標(biāo)記為垃圾信息或包含暴力血腥等違規(guī)內(nèi)容的推文。

最終,經(jīng)歷重重篩選后的信息會(huì)根據(jù)分?jǐn)?shù)高低,依次展示給客戶端用戶。



總結(jié)下來,這套系統(tǒng)能夠成功運(yùn)轉(zhuǎn)的五大關(guān)鍵在于(官方劃重點(diǎn)版):

(1)純數(shù)據(jù)驅(qū)動(dòng),拒絕人工規(guī)則。

徹底摒棄人工定義“什么內(nèi)容算好”的復(fù)雜規(guī)則,改由AI模型直接從原始用戶數(shù)據(jù)中學(xué)習(xí)。

(2)采用候選隔離機(jī)制,獨(dú)立評(píng)分。

AI模型在給內(nèi)容打分時(shí),每條內(nèi)容“看不見”其他候選內(nèi)容,只能看到用戶信息。這確保了每條帖子的分?jǐn)?shù)不會(huì)因?yàn)橥纹渌佣兓?,分?jǐn)?shù)一致且可高效緩存復(fù)用。

(3)哈希嵌入,實(shí)現(xiàn)高效檢索。

檢索和排序都使用多個(gè)哈希函數(shù)進(jìn)行向量嵌入查找,提高效率。

(4)預(yù)測(cè)多元行為,而非單一分?jǐn)?shù)。

AI模型不直接輸出一個(gè)模糊的“推薦值”,而是對(duì)多種用戶行為同時(shí)預(yù)測(cè)。

(5)模塊化流水線,支撐快速迭代。

整個(gè)推薦系統(tǒng)采用模塊化設(shè)計(jì),各個(gè)組件可以獨(dú)立開發(fā)、測(cè)試、替換。

“是的,這算法太爛了”

不過,雖然眾人對(duì)老馬開源的姿態(tài)表達(dá)了贊賞,但奈何這套算法還是有一些“缺陷”。

有網(wǎng)友就在推薦算法開源后吐槽道:

  • 由于API訪問受限且成本高昂,現(xiàn)在屏蔽列表的做法已經(jīng)很少見了,但以前這種做法非常普遍。
  • 算法必須讓較舊的屏蔽列表隨著時(shí)間推移而逐漸消失,這樣這些較舊的屏蔽列表就不會(huì)再被惡意利用。

言下之意是,算法代碼顯示“被大量用戶屏蔽”是一個(gè)強(qiáng)負(fù)面信號(hào),會(huì)直接導(dǎo)致賬號(hào)被“降權(quán)”,即內(nèi)容更難獲得推薦,但代碼中沒有明確看到針對(duì)“屏蔽”信號(hào)的時(shí)間衰減機(jī)制

這意味著,歷史上的屏蔽記錄可能至今仍在影響賬號(hào)的推薦分?jǐn)?shù)。

此番言論也引得馬斯克本人現(xiàn)身評(píng)論區(qū)吐槽:

  • 是的,這算法太爛了。



但不管怎樣,老馬想要改變的態(tài)度已經(jīng)明確——

不僅過去開源、現(xiàn)在開源,而且接下來還會(huì)持續(xù)開源,未來每4周將重復(fù)一次開源更新。

開源倉庫:
https://github.com/xai-org/x-algorithm

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
演都不演了?沈夢(mèng)辰自曝與何炅真實(shí)關(guān)系,撕下了杜海濤的“體面”

演都不演了?沈夢(mèng)辰自曝與何炅真實(shí)關(guān)系,撕下了杜海濤的“體面”

林雁飛
2026-01-15 17:50:19
Model YL獲“北上廣深”認(rèn)可,為什么越發(fā)達(dá)地區(qū)越喜歡特斯拉?

Model YL獲“北上廣深”認(rèn)可,為什么越發(fā)達(dá)地區(qū)越喜歡特斯拉?

據(jù)說無據(jù)
2026-01-19 10:36:21
三人行,必有我?guī)?>
    </a>
        <h3>
      <a href=貴圈真亂
2026-01-21 10:45:49
男足U23進(jìn)決賽!韓媒直呼瘋狂,李昊征服日媒,全平臺(tái)贊安東尼奧

男足U23進(jìn)決賽!韓媒直呼瘋狂,李昊征服日媒,全平臺(tái)贊安東尼奧

籃球資訊達(dá)人
2026-01-21 02:12:56
國家發(fā)改委:進(jìn)一步清理消費(fèi)領(lǐng)域不合理的限制措施 加快培育消費(fèi)新的增長點(diǎn)

國家發(fā)改委:進(jìn)一步清理消費(fèi)領(lǐng)域不合理的限制措施 加快培育消費(fèi)新的增長點(diǎn)

財(cái)聯(lián)社
2026-01-20 10:47:13
劉漢想要承包綿陽機(jī)場(chǎng),地頭蛇王永成從中搗亂,第二天就被團(tuán)滅

劉漢想要承包綿陽機(jī)場(chǎng),地頭蛇王永成從中搗亂,第二天就被團(tuán)滅

呆呆文化
2024-10-28 16:09:45
李亞鵬翻紅了!帶貨金額和打賞收入,全網(wǎng)第一

李亞鵬翻紅了!帶貨金額和打賞收入,全網(wǎng)第一

金牌娛樂
2026-01-19 09:47:35
鄭麗文四度申請(qǐng)赴陸,國臺(tái)辦罕見回應(yīng),信號(hào)不一般!

鄭麗文四度申請(qǐng)赴陸,國臺(tái)辦罕見回應(yīng),信號(hào)不一般!

吃貨的分享
2026-01-20 12:44:41
宗慶后母親去世,享年101歲,晚年瘦了太多,住大房子裝修豪華!

宗慶后母親去世,享年101歲,晚年瘦了太多,住大房子裝修豪華!

古希臘掌管松餅的神
2026-01-20 18:24:34
貝克漢姆兒媳曬娘家5.3億莊園,70歲超模母親也很美,碾壓了婆家

貝克漢姆兒媳曬娘家5.3億莊園,70歲超模母親也很美,碾壓了婆家

笑傲春秋
2026-01-20 13:52:11
美國急壞了:中國為什么遮住神舟20的舷窗?有什么不想讓人看到?

美國急壞了:中國為什么遮住神舟20的舷窗?有什么不想讓人看到?

軍機(jī)Talk
2026-01-21 10:57:17
TOP14位身高170以上的女神,有顏有燈有演技

TOP14位身高170以上的女神,有顏有燈有演技

素然追光
2026-01-02 02:45:02
官宣!國乒公布教練組分配名單:王曼昱主管教練曝光,最年輕一人去女隊(duì) 邱貽可繼續(xù)帶孫穎莎

官宣!國乒公布教練組分配名單:王曼昱主管教練曝光,最年輕一人去女隊(duì) 邱貽可繼續(xù)帶孫穎莎

好乒乓
2026-01-21 12:37:44
馬斯克和全球最大廉價(jià)航空老板互懟“白癡”,最終世界首富以“買你們要多少錢”KO對(duì)手

馬斯克和全球最大廉價(jià)航空老板互懟“白癡”,最終世界首富以“買你們要多少錢”KO對(duì)手

問問馬斯克AskMusk
2026-01-20 22:01:10
從免費(fèi)聽到付費(fèi),中國音樂非但沒進(jìn)步,反而把聽眾“作”沒了?

從免費(fèi)聽到付費(fèi),中國音樂非但沒進(jìn)步,反而把聽眾“作”沒了?

草莓解說體育
2026-01-20 04:16:58
福建通報(bào):438人違法乘機(jī)被拘留

福建通報(bào):438人違法乘機(jī)被拘留

澎湃新聞
2026-01-21 00:53:04
70歲費(fèi)玉清近況曝光!與56歲知己相依為伴,無兒無女一生癡等一人

70歲費(fèi)玉清近況曝光!與56歲知己相依為伴,無兒無女一生癡等一人

代軍哥哥談娛樂
2026-01-20 11:21:43
41歲仍能平框暴扣!勒布朗在場(chǎng)+13助湖人重返第六 轟19+9+8超全面

41歲仍能平框暴扣!勒布朗在場(chǎng)+13助湖人重返第六 轟19+9+8超全面

顏小白的籃球夢(mèng)
2026-01-21 13:38:37
我國為何拋棄4萬華人?央求哭訴也不接受,只因30年前太不是人!

我國為何拋棄4萬華人?央求哭訴也不接受,只因30年前太不是人!

老范談史
2026-01-20 15:09:23
“俄羅斯暴雪,積雪有9層樓高”?中國留學(xué)生:假的,系A(chǔ)I生成!

“俄羅斯暴雪,積雪有9層樓高”?中國留學(xué)生:假的,系A(chǔ)I生成!

揚(yáng)子晚報(bào)
2026-01-21 12:46:04
2026-01-21 15:16:49
量子位 incentive-icons
量子位
追蹤人工智能動(dòng)態(tài)
12040文章數(shù) 176360關(guān)注度
往期回顧 全部

科技要聞

中芯國際等巨頭集體提價(jià),8英寸芯片最高漲20%

頭條要聞

男子到民營醫(yī)院看男科7天花1.7萬 公立醫(yī)院稱無需手術(shù)

頭條要聞

男子到民營醫(yī)院看男科7天花1.7萬 公立醫(yī)院稱無需手術(shù)

體育要聞

只會(huì)防守反擊?不好意思,我們要踢決賽了

娛樂要聞

李亞鵬2天獲1291萬網(wǎng)友力挺

財(cái)經(jīng)要聞

消失的投資金 起底華文映像電影投資騙局

汽車要聞

新一代理想L9電池加碼體型加大 重奪高端話語權(quán)

態(tài)度原創(chuàng)

教育
藝術(shù)
時(shí)尚
數(shù)碼
公開課

教育要聞

山東2026高考人數(shù)過百萬!15萬復(fù)讀生!

藝術(shù)要聞

一百多年前的中國,太雄偉震撼了!

告別93歲時(shí)尚傳奇Valentino:他留下了全世界最美的“紅”

數(shù)碼要聞

蘋果Fitness+登陸日本 支持AI日語配音與多設(shè)備聯(lián)動(dòng)

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版