我之前也做過打假的視頻,依據(jù)都是一些公開現(xiàn)象,比如本科生一年發(fā)了40多篇sci、論文結(jié)論是“益生菌產(chǎn)品可以解酒”這種。在今年之前,我壓根就沒有意識(shí)到,還能從論文原始數(shù)據(jù)下手。
一方面,以我正常人的思維去理解,根本想不到有人能假成這樣;另一方面,這個(gè)問題有一定的隱蔽性。原始數(shù)據(jù)不是放在論文正文里的,而是單獨(dú)的Excel表格,需要單獨(dú)下載。
我是學(xué)生物專業(yè)的,我自己做了這么多年科研,讀到了博五,都極少會(huì)去下載原始數(shù)據(jù)。只有一種情況,老師說這個(gè)論文很好,要求你不止要看論文的主要內(nèi)容,還要把整個(gè)論文里的實(shí)驗(yàn)方法都給學(xué)了。那我就得把原始數(shù)據(jù)下下來,按照論文的方法去走一遍。
(圖源:@耿同學(xué)講故事)
而且,一般只有好的期刊,一區(qū)二區(qū)那種,才會(huì)強(qiáng)制要求上傳原始數(shù)據(jù)。所以,看起來現(xiàn)在我打假打的都是知名學(xué)者,但這不是我有意為之,是因?yàn)橹挥兴麄兊脑旒倌鼙话l(fā)現(xiàn)。這些“特別優(yōu)秀”的論文,老師會(huì)讓學(xué)生去當(dāng)榜樣論文學(xué)習(xí)??催@些論文的人群足夠大,問題被發(fā)現(xiàn)的可能性也就越大。
我本來以為,打假這一篇就到此為止了,但因?yàn)檫@個(gè)視頻火了,有很多網(wǎng)友給我投稿各種各樣的論文,說覺得它們?cè)紨?shù)據(jù)有問題,讓我?guī)椭纯?。所以后面發(fā)的幾個(gè)打假視頻,其實(shí)都是網(wǎng)友的投稿,我再篩選分析一遍。
這些論文都是生物醫(yī)學(xué)領(lǐng)域的,一是我對(duì)這個(gè)領(lǐng)域比較了解,另一個(gè)原因是,這個(gè)領(lǐng)域的造假相對(duì)好分辨一些。生物醫(yī)學(xué)做實(shí)驗(yàn)比較多,很多零散的數(shù)據(jù)需要?jiǎng)邮秩ビ涗洠瑪?shù)據(jù)量相對(duì)有限,而且數(shù)據(jù)通常是一個(gè)系列的,你通過紙面看出數(shù)據(jù)不對(duì),可以反推實(shí)驗(yàn)室操作有問題。但像計(jì)算機(jī)這種領(lǐng)域,數(shù)據(jù)量龐大,數(shù)據(jù)大部分是機(jī)器自動(dòng)生成的,如果你不去實(shí)驗(yàn)室看源代碼,光看論文和原始數(shù)據(jù),無論如何也判斷不出是不是有人在造假。