近期,斯坦福大學(xué)AI項(xiàng)目團(tuán)隊(duì)陷入一場(chǎng)爭議,其開源模型Llama3-V被指抄襲了中國大模型公司面壁智能與清華大學(xué)共同推出的“小鋼炮”MiniCPM-Llama3-V 2.5。對(duì)此,兩位項(xiàng)目負(fù)責(zé)人森德哈斯·沙瑪和阿克沙·加格在6月4日通過社交平臺(tái)公開道歉,并宣布將撤下涉事模型。事件中,面壁智能的首席科學(xué)家、清華大學(xué)副教授劉知遠(yuǎn)指出,雖然這一事件令人遺憾,但它側(cè)面反映了中國AI研發(fā)水平的提升,尤其體現(xiàn)在創(chuàng)業(yè)公司的大模型產(chǎn)品正日益獲得國際認(rèn)可。
事件起因于5月29日,斯坦福大學(xué)AI團(tuán)隊(duì)聲稱以極低成本訓(xùn)練出了高性能的多模態(tài)模型Llama3-V,并迅速引起關(guān)注。然而,不久后就有用戶發(fā)現(xiàn)Llama3-V與MiniCPM-Llama3-V 2.5存在高度相似性,不僅模型結(jié)構(gòu)和配置相同,就連特有的分詞器也一致。盡管團(tuán)隊(duì)成員穆斯塔法·阿爾賈德里辯解稱使用MiniCPM-V的配置僅是為了修復(fù)bug,非抄襲行為,但眾多證據(jù)指向Llama3-V確實(shí)基于MiniCPM-Llama3-V 2.5進(jìn)行了改頭換面。
隨著抄襲指控的增多,斯坦福團(tuán)隊(duì)最終承認(rèn)錯(cuò)誤并致歉,強(qiáng)調(diào)對(duì)未能驗(yàn)證項(xiàng)目原創(chuàng)性的失望,并承擔(dān)全部責(zé)任。此次風(fēng)波也引發(fā)了行業(yè)內(nèi)的深刻反思,斯坦福人工智能實(shí)驗(yàn)室主任曼寧對(duì)抄襲行為表示譴責(zé),并對(duì)MiniCPM模型給予了正面評(píng)價(jià)。
近年來,中美在大模型領(lǐng)域的競爭日趨激烈,美國在模型數(shù)量和技術(shù)層面上保持領(lǐng)先,而中國則在應(yīng)用場(chǎng)景、算法優(yōu)化及數(shù)據(jù)資源上展現(xiàn)出獨(dú)特優(yōu)勢(shì)。據(jù)統(tǒng)計(jì),中國人工智能領(lǐng)域的獨(dú)角獸企業(yè)不斷涌現(xiàn),特別是在AIGC和大模型相關(guān)領(lǐng)域,新晉公司數(shù)量顯著增加,表明中國在該領(lǐng)域的追趕速度正在加快。
零一萬物的李開復(fù)在對(duì)比中美大模型發(fā)展時(shí)提到,兩國間的差距已從一年前的約7至10年縮短至目前的6個(gè)月左右,顯示出中國在大模型研發(fā)上的快速進(jìn)步。清華大學(xué)的劉知遠(yuǎn)教授則通過個(gè)人經(jīng)歷回顧了中國AI科研從追求國際論文發(fā)表到實(shí)現(xiàn)國際前沿成果的轉(zhuǎn)變,強(qiáng)調(diào)當(dāng)前國內(nèi)大模型團(tuán)隊(duì)正通過持續(xù)的開源共享贏得國際關(guān)注。
此外,清華大學(xué)與生數(shù)科技聯(lián)合發(fā)布的視頻大模型Vidu,被視為中國在多模態(tài)大模型領(lǐng)域的突破,進(jìn)一步證明了中國在大模型賽道上積極探索的潛力。然而,啟明創(chuàng)投的周志峰和生數(shù)科技的唐家渝均指出,盡管多模態(tài)大模型研究尚處初期,面臨技術(shù)成熟度不高的挑戰(zhàn),但也是國內(nèi)團(tuán)隊(duì)實(shí)現(xiàn)趕超的重要機(jī)遇。北京智源人工智能研究院的林詠華則強(qiáng)調(diào),數(shù)據(jù)質(zhì)量與數(shù)量仍是多模態(tài)模型發(fā)展的關(guān)鍵,盡管存在挑戰(zhàn),但中國在這一領(lǐng)域內(nèi)實(shí)現(xiàn)彎道超車的可能性不容忽視。