馬斯克開源X推薦算法 透明度再升級!馬斯克再次開源了X推薦算法。X工程團(tuán)隊(duì)在X平臺上宣布,正式開源X推薦算法,該算法為X上的“為你推薦”信息流提供支持。它結(jié)合了用戶關(guān)注賬戶的內(nèi)容和通過機(jī)器學(xué)習(xí)檢索發(fā)現(xiàn)的內(nèi)容,并使用基于Grok的Transformer模型對所有內(nèi)容進(jìn)行排名。這個算法采用了與Grok相同的Transformer架構(gòu)。
X的推薦算法負(fù)責(zé)生成用戶在主界面看到的“為你推薦”內(nèi)容。它從兩個主要來源獲取候選帖子:用戶關(guān)注的賬號和其他平臺上的帖子。這些候選內(nèi)容隨后被統(tǒng)一處理、過濾并按相關(guān)性排序。
算法首先從兩類來源抓取候選內(nèi)容,目標(biāo)是找出可能相關(guān)的帖子。系統(tǒng)會自動去除低質(zhì)量、重復(fù)、違規(guī)或不合適的內(nèi)容,確保最終排序時只處理有價值的候選內(nèi)容。此次開源的算法核心是使用一個Grok-based Transformer模型對每條候選帖子進(jìn)行評分。根據(jù)用戶的歷史行為(如點(diǎn)贊、回復(fù)、轉(zhuǎn)發(fā)、點(diǎn)擊等)預(yù)測每種行為的概率,然后將這些行為概率加權(quán)組合成一個綜合得分,得分越高的帖子越有可能被推薦給用戶。
這不是馬斯克第一次開源X推薦算法。早在2023年3月31日,馬斯克已將Twitter部分源代碼正式開源,其中包括在用戶時間線中推薦推文的算法。當(dāng)時該項(xiàng)目在GitHub上收獲了10k+顆Star。馬斯克表示希望獨(dú)立第三方能夠以合理的準(zhǔn)確性確定Twitter可能向用戶展示的內(nèi)容。
如今距離初次開源X算法已經(jīng)過去了近三年的時間。馬斯克在X上發(fā)帖稱,將在7天內(nèi)將新的X算法開源,包括用于確定向用戶推薦哪些自然搜索內(nèi)容和廣告內(nèi)容的所有代碼。此流程將每4周重復(fù)一次,并附有詳細(xì)的開發(fā)者說明,以幫助用戶了解發(fā)生了哪些變化。
外界對馬斯克再次開源算法的反應(yīng)并不完全是技術(shù)理想主義,而是現(xiàn)實(shí)壓力。過去一年里,X因其內(nèi)容分發(fā)機(jī)制屢次陷入爭議,被批評在算法層面偏袒右翼觀點(diǎn)。去年發(fā)布的一份研究報告指出,X的推薦系統(tǒng)在政治內(nèi)容傳播上出現(xiàn)了明顯的新偏見。在這種背景下,馬斯克強(qiáng)調(diào)算法透明性很難被簡單解讀為一次純粹的技術(shù)決策。
X推薦算法開源后,有用戶總結(jié)了五點(diǎn)推薦機(jī)制的關(guān)鍵點(diǎn): - 回復(fù)評論對曝光率有很大影響。 - 鏈接會降低曝光率,應(yīng)放在個人簡介或置頂帖里。 - 觀看時長至關(guān)重要,視頻/帖子需要吸引用戶停留。 - 堅(jiān)守細(xì)分領(lǐng)域,偏離領(lǐng)域會影響分銷渠道。 - 屏蔽或默不作聲會大幅降低分?jǐn)?shù),要有爭議但不要令人討厭。
盡管架構(gòu)開源,但還有一些內(nèi)容未公開,如權(quán)重參數(shù)、隱藏模型權(quán)重和訓(xùn)練數(shù)據(jù)。對于普通用戶而言,更高的透明度可以解釋為什么有些帖子能獲得曝光而另一些則無人問津,并使研究人員能夠研究平臺如何對內(nèi)容進(jìn)行排名。
推薦系統(tǒng)是互聯(lián)網(wǎng)巨頭商業(yè)模式的重要組成部分。亞馬遜、Netflix、YouTube和Meta等公司都依賴推薦系統(tǒng)來推動購買、觀看時長和商業(yè)轉(zhuǎn)化。然而,傳統(tǒng)推薦系統(tǒng)面臨著工程復(fù)雜度極高的問題。大型語言模型的出現(xiàn)為推薦系統(tǒng)提供了一條新的可能路徑,簡化了工程復(fù)雜度并帶來了交叉學(xué)習(xí)的潛力。
專家傅聰認(rèn)為,X的這套推薦系統(tǒng)依然遵循傳統(tǒng)的多階段漏斗篩選架構(gòu),grok沒有參與中間過程,只是作為排序模型。他指出,實(shí)現(xiàn)每日處理上億條內(nèi)容并進(jìn)行實(shí)時多模態(tài)理解需要極其充足的GPU算力和高并發(fā)處理引擎。此外,成本效益方面,Grok方法需要大量計(jì)算資源,這使得這種方式目前只屬于極少數(shù)平臺。他還提到,大語言模型有自己的偏好,可能會構(gòu)建新的信息繭房。開源代碼對工業(yè)交流有一定參考意義,但對學(xué)術(shù)研究價值不大。