臺退將：DeepSeek只是開始競對聯(lián)手圍剿引發(fā)爭議

小大

用微信掃描二維碼
分享至好友和朋友圈

關鍵詞：

2025-01-31 10:52:04 量子位

一夜之間，OpenAI和Claude母公司Anthropic對DeepSeek發(fā)起了指責。據(jù)《金融時報》報道，OpenAI聲稱發(fā)現(xiàn)證據(jù)，證明DeepSeek利用其模型進行訓練，涉嫌侵犯知識產(chǎn)權。具體而言，他們發(fā)現(xiàn)了DeepSeek“蒸餾”O(jiān)penAI模型的跡象，即使用更大模型的輸出來提高較小模型的性能，以較低成本在特定任務上取得類似結果。微軟也開始調查DeepSeek是否使用了OpenAI的API。

消息一出，引來了一波嘲諷。紐約大學教授馬庫斯表示，OpenAI需要免費使用所有藝術家和作家的作品訓練模型，然后用省下的錢去起訴DeepSeek。知名技術媒體404 Media創(chuàng)始人及主編Jason也諷刺OpenAI只許州官放火。

另一方面，Anthropic創(chuàng)始人Dario Amodei發(fā)表長文稱，說DeepSeek構成威脅太夸張了，只是達到了他們7-10個月前的水平，Claude 3.5 Sonnet在許多評估中依然領先。不過，為了保持領先，他建議設置更多限制。

相比之下，微軟的做法顯得耐人尋味。就在指控DeepSeek涉嫌侵權后不久，微軟的AI平臺上接入了DeepSeek模型。網(wǎng)友調侃道，否認是接受的第一步。

目前，微軟和OpenAI對DeepSeek的質疑仍處于調查階段。根據(jù)微軟工作人員的說法，DeepSeek可能在去年秋天調用了OpenAI的API，導致數(shù)據(jù)泄露。按照OpenAI的服務條款，任何人都可以注冊使用其API，但不能使用輸出數(shù)據(jù)訓練對其造成競爭威脅的模型。OpenAI拒絕進一步置評，也不愿提供證據(jù)細節(jié)。

模型蒸餾是一種壓縮技術，通過將復雜的大模型的知識轉移到更小、更高效的模型中。這種技術在學術界和工業(yè)界非常普遍且被認可。例如，Together AI曾將Llama 3蒸餾到Mamba，實現(xiàn)推理速度提升。IBM的文章也提到，知識蒸餾已成為生成式AI普惠化的重要工具。

然而，違反OpenAI的服務條款是個問題。盡管一些開源模型允許蒸餾，但OpenAI首席科學家Mark Chen表示，DeepSeek獨立發(fā)現(xiàn)了OpenAI在實現(xiàn)過程中采用的一些核心理念，并認可了其在成本控制上的工作。同時，他也提到OpenAI也在積極探索模型壓縮和優(yōu)化技術。

實際上，OpenAI自身在合規(guī)性上也存在問題。它在訓練模型時使用了大量的互聯(lián)網(wǎng)數(shù)據(jù)，包括有版權的內容。2023年12月，《紐約時報》以侵犯知識產(chǎn)權為由將微軟和OpenAI告上法庭。OpenAI辯解稱，使用公開可獲得的互聯(lián)網(wǎng)資料訓練AI模型是合理的，且版權著作被非商業(yè)性使用是受到合理保護的。此外，大語言模型的關鍵在于Scaling，任何單獨被盜的內容都不足以支撐訓練一個大模型。

這引發(fā)了關于人工智能領域發(fā)展的基本邏輯的討論。Anthropic創(chuàng)始人Dario Amodei認為，DeepSeek的新模型雖然成本更低，但水平與他們7-10個月前相當。他認為正確的說法是“DeepSeek生成了一種模型，用較低的成本實現(xiàn)了接近7至10個月以前的Claude的表現(xiàn)”。

分析師郭明錤認為，DeepSeek R1加速了兩個趨勢：一是通過優(yōu)化訓練方式持續(xù)增長AI算力，二是API/Token價格顯著下滑，有利于加速AI應用的多元化。這些趨勢有助于增加AI算力需求，并降低投資者對AI投資能否獲利的疑慮。

(責任編輯：張蕾)

關閉

臺退將：DeepSeek只是開始 競對聯(lián)手圍剿引發(fā)爭議

相關新聞

今日熱點

頻道熱點

臺退將：DeepSeek只是開始競對聯(lián)手圍剿引發(fā)爭議