一夜之間,OpenAI和Claude母公司Anthropic對(duì)DeepSeek發(fā)起了指責(zé)。據(jù)《金融時(shí)報(bào)》報(bào)道,OpenAI聲稱發(fā)現(xiàn)證據(jù),證明DeepSeek利用其模型進(jìn)行訓(xùn)練,涉嫌侵犯知識(shí)產(chǎn)權(quán)。具體而言,他們發(fā)現(xiàn)了DeepSeek“蒸餾”O(jiān)penAI模型的跡象,即使用更大模型的輸出來(lái)提高較小模型的性能,以較低成本在特定任務(wù)上取得類似結(jié)果。微軟也開始調(diào)查DeepSeek是否使用了OpenAI的API。
消息一出,引來(lái)了一波嘲諷。紐約大學(xué)教授馬庫(kù)斯表示,OpenAI需要免費(fèi)使用所有藝術(shù)家和作家的作品訓(xùn)練模型,然后用省下的錢去起訴DeepSeek。知名技術(shù)媒體404 Media創(chuàng)始人及主編Jason也諷刺OpenAI只許州官放火。
另一方面,Anthropic創(chuàng)始人Dario Amodei發(fā)表長(zhǎng)文稱,說(shuō)DeepSeek構(gòu)成威脅太夸張了,只是達(dá)到了他們7-10個(gè)月前的水平,Claude 3.5 Sonnet在許多評(píng)估中依然領(lǐng)先。不過(guò),為了保持領(lǐng)先,他建議設(shè)置更多限制。
相比之下,微軟的做法顯得耐人尋味。就在指控DeepSeek涉嫌侵權(quán)后不久,微軟的AI平臺(tái)上接入了DeepSeek模型。網(wǎng)友調(diào)侃道,否認(rèn)是接受的第一步。
目前,微軟和OpenAI對(duì)DeepSeek的質(zhì)疑仍處于調(diào)查階段。根據(jù)微軟工作人員的說(shuō)法,DeepSeek可能在去年秋天調(diào)用了OpenAI的API,導(dǎo)致數(shù)據(jù)泄露。按照OpenAI的服務(wù)條款,任何人都可以注冊(cè)使用其API,但不能使用輸出數(shù)據(jù)訓(xùn)練對(duì)其造成競(jìng)爭(zhēng)威脅的模型。OpenAI拒絕進(jìn)一步置評(píng),也不愿提供證據(jù)細(xì)節(jié)。
模型蒸餾是一種壓縮技術(shù),通過(guò)將復(fù)雜的大模型的知識(shí)轉(zhuǎn)移到更小、更高效的模型中。這種技術(shù)在學(xué)術(shù)界和工業(yè)界非常普遍且被認(rèn)可。例如,Together AI曾將Llama 3蒸餾到Mamba,實(shí)現(xiàn)推理速度提升。IBM的文章也提到,知識(shí)蒸餾已成為生成式AI普惠化的重要工具。
臺(tái)退將:臺(tái)民眾不要迷信美國(guó)會(huì)出兵。這位臺(tái)退將的話一語(yǔ)中的,頭腦清醒。
2024-09-26 10:17:28臺(tái)退將:臺(tái)民眾不要迷信美國(guó)會(huì)出兵臺(tái)退將感慨我們中國(guó)有多強(qiáng)遭民進(jìn)黨威脅
2024-11-27 16:13:53臺(tái)退將感慨我們中國(guó)有多強(qiáng)遭民進(jìn)黨威脅