耿同學(xué)是怎么用AI降維打擊學(xué)術(shù)圈的 開源工具揭露學(xué)術(shù)不端!一個退學(xué)博士憑借一臺電腦和幾個開源軟件,揭露了多位杰出青年學(xué)者和長江學(xué)者的學(xué)術(shù)不端行為。這個故事發(fā)生在2026年4月至5月間,一名從北航博士五年級退學(xué)的年輕人使用簡單的數(shù)學(xué)方法和免費軟件,仔細檢查發(fā)表在《Nature》上的論文數(shù)據(jù)末位是否偏愛0和5,以及圖片是否在不同文章中反復(fù)使用。他將這些發(fā)現(xiàn)制作成視頻,并點名道姓地公開。

同濟大學(xué)生命科學(xué)學(xué)院原院長王平首先被舉報,學(xué)校隨后確認其學(xué)術(shù)不端屬實,免去其院長職務(wù)并降級,第一作者也被解聘。接著,南開大學(xué)、中山大學(xué)和上海大學(xué)也相繼被曝光。5月17日,他又發(fā)布了一條視頻,一口氣指出了四所高校的五名杰出青年學(xué)者。

這位年輕人之所以能夠成功打假,是因為他利用了一套技術(shù)組合拳。首先是AI圖片查重工具,如ImageJ和ForensicImageAnalysis,可以檢測圖片中的重復(fù)區(qū)域、亮度異常和PS痕跡?!禨cience》期刊在2024年引入了Proofig商業(yè)AI軟件,該軟件能自動檢測論文中的“欺詐性圖像”,準確識別經(jīng)過裁剪、旋轉(zhuǎn)或更改對比度的圖像。

同濟大學(xué)王平團隊的論文中,14張核心圖表中有10張未客觀計數(shù)免疫熒光陽性細胞,3張圖片存在重復(fù)誤用,1張記錄不規(guī)范。這些“克隆”痕跡在AI面前無處遁形。
其次是對數(shù)據(jù)的審查。他質(zhì)疑南開大學(xué)生命科學(xué)學(xué)院院長陳佺團隊的一篇論文中,一組64個實驗數(shù)據(jù)的小數(shù)點后兩位完全相同,違背了生物實驗數(shù)據(jù)應(yīng)有的隨機性。在上海大學(xué)轉(zhuǎn)化醫(yī)學(xué)院院長蘇某某的論文中,71個數(shù)據(jù)里有51個的結(jié)尾數(shù)字是0或5,還呈現(xiàn)等差數(shù)列排列。這涉及兩個統(tǒng)計學(xué)原理:末位數(shù)字分析(本福特定律)和異常分布檢測。
傳統(tǒng)學(xué)術(shù)監(jiān)督機制在這種情況下顯得乏力。同行評審?fù)鶗r間有限且信任前置,專注于邏輯與創(chuàng)新性而非原始數(shù)據(jù)的真實性核查。校內(nèi)及出版后的監(jiān)督也因利益關(guān)系而難以發(fā)揮作用。杰青對高校的價值遠不止幾篇論文,他們能帶來大量經(jīng)費和資源,讓學(xué)校自己查處自己的“績優(yōu)股”變得困難。
技術(shù)方法的優(yōu)勢在于其客觀性和可重復(fù)性,工具結(jié)果不因人而異,流程可被任何人復(fù)現(xiàn)驗證。此外,這些方法聚焦于那些以為僅靠修飾、拼湊就能蒙混過關(guān)的造假行為。開源工具降低了監(jiān)督的技術(shù)門檻,使外部個體具備了一定的審核能力。
然而,技術(shù)并非萬能。耿同學(xué)的方法擅長識別數(shù)據(jù)捏造和圖像不當(dāng)處理等“硬造假”,但對于p-hacking——操作科學(xué)數(shù)據(jù)以使其具有統(tǒng)計學(xué)意義的行為,作用有限。許多期刊的補充材料政策不完善,也是主要障礙??萍疾吭?025年部署開展學(xué)術(shù)不端撤稿論文專項整治行動,但原始數(shù)據(jù)的公開透明仍是關(guān)鍵瓶頸。
如果每個研究生都學(xué)會這套方法,學(xué)術(shù)圈可能會變得更加透明,但也可能增加不必要的猜疑氛圍。理想的路徑是推動期刊將部分技術(shù)核查流程化、自動化,作為投稿前置關(guān)卡,從源頭減少低級造假。技術(shù)篩查應(yīng)作為強有力的補充工具,而非取代傳統(tǒng)的同行評議和倫理教育。
如今,監(jiān)督學(xué)術(shù)的不再是老教授,而是一群退學(xué)生、程序員和高中生,他們用開源工具和短視頻加上基礎(chǔ)統(tǒng)計方法,搞起了草根同行評審。這場透明度革命已經(jīng)到來,學(xué)術(shù)圈是否準備好迎接這一變革?