在大模型領(lǐng)域,近期發(fā)生了一起引人注目的事件。斯坦福大學(xué)的一個(gè)AI研究團(tuán)隊(duì)被指控抄襲了面壁智能的開(kāi)源研究成果,二者在模型結(jié)構(gòu)和代碼上的高度相似性引發(fā)了“套殼”疑云。
對(duì)此,知乎CTO及面壁智能CEO李大海表達(dá)了公司的立場(chǎng),既感遺憾又略帶無(wú)奈。他指出,這從一個(gè)側(cè)面反映出國(guó)際團(tuán)隊(duì)對(duì)該公司成果的認(rèn)可,但同時(shí)強(qiáng)調(diào)應(yīng)共同營(yíng)造一個(gè)開(kāi)放、合作且基于信任的行業(yè)生態(tài)。
李大海進(jìn)一步透露,經(jīng)過(guò)內(nèi)部核查,他們發(fā)現(xiàn)被指抄襲的模型Llama3V展現(xiàn)出了與面壁智能產(chǎn)品“小鋼炮”極為相近的特征,包括在處理特定清華簡(jiǎn)樣本時(shí)的錯(cuò)誤表現(xiàn)完全一致。值得注意的是,這部分訓(xùn)練數(shù)據(jù)并未公之于眾,其背后凝聚了團(tuán)隊(duì)成員數(shù)月的努力,從海量的清華簡(jiǎn)文獻(xiàn)中逐字掃描并細(xì)致標(biāo)注,精心整合至模型中。更加微妙的是,即便在引入高斯擾動(dòng)的驗(yàn)證環(huán)節(jié),兩個(gè)模型的正確與錯(cuò)誤反饋模式依舊高度吻合。
該事件起源于5月29日,斯坦福團(tuán)隊(duì)高調(diào)發(fā)布Llama3V項(xiàng)目,聲稱(chēng)僅需500美元就能訓(xùn)練出性能可比肩頂尖大模型的產(chǎn)品。憑借其親民的成本和團(tuán)隊(duì)的優(yōu)良背景,該項(xiàng)目在社交媒體上迅速吸引了廣泛關(guān)注。
然而,在聚光燈下,網(wǎng)友們的火眼金睛發(fā)現(xiàn)了Llama3V與面壁智能新近推出的MiniCPM-Llama3-V 2.5之間存在諸多雷同之處。隨著抄襲指控的聲浪漸高,起初嘗試辯解的斯坦福團(tuán)隊(duì)最終選擇刪除項(xiàng)目資料并回避爭(zhēng)議,從而使得這場(chǎng)風(fēng)波逐漸平息。
李大海在事后反思中表示,技術(shù)創(chuàng)新之路充滿(mǎn)艱辛,每一分成就都是團(tuán)隊(duì)不懈努力的結(jié)晶,也是在有限資源下對(duì)全球科技創(chuàng)新的誠(chéng)摯貢獻(xiàn)。他希望團(tuán)隊(duì)的辛勤工作能夠獲得更廣泛的認(rèn)可,但應(yīng)當(dāng)基于其原創(chuàng)價(jià)值,而非通過(guò)此類(lèi)負(fù)面事件。
6月3日,面壁智能CEO李大海針對(duì)近期熱議的斯坦福大學(xué)AI團(tuán)隊(duì)涉嫌抄襲其公司項(xiàng)目的事件作出回應(yīng)。
2024-06-05 13:34:26抄襲面壁智能被錘近期,人工智能領(lǐng)域內(nèi)的一起學(xué)術(shù)誠(chéng)信事件引起了全球科技行業(yè)的密切關(guān)注。
2024-06-04 15:54:36斯坦福AI團(tuán)隊(duì)抄襲國(guó)產(chǎn)大模型?連識(shí)別“清華簡(jiǎn)”都抄了!清華系團(tuán)隊(duì)回應(yīng)