一夜之間,OpenAI和Claude母公司Anthropic對DeepSeek發(fā)起了指責。據(jù)《金融時報》報道,OpenAI聲稱發(fā)現(xiàn)證據(jù),證明DeepSeek利用其模型進行訓練,涉嫌侵犯知識產(chǎn)權。具體而言,他們發(fā)現(xiàn)了DeepSeek“蒸餾”O(jiān)penAI模型的跡象,即使用更大模型的輸出來提高較小模型的性能,以較低成本在特定任務上取得類似結果。微軟也開始調查DeepSeek是否使用了OpenAI的API。
消息一出,引來了一波嘲諷。紐約大學教授馬庫斯表示,OpenAI需要免費使用所有藝術家和作家的作品訓練模型,然后用省下的錢去起訴DeepSeek。知名技術媒體404 Media創(chuàng)始人及主編Jason也諷刺OpenAI只許州官放火。
另一方面,Anthropic創(chuàng)始人Dario Amodei發(fā)表長文稱,說DeepSeek構成威脅太夸張了,只是達到了他們7-10個月前的水平,Claude 3.5 Sonnet在許多評估中依然領先。不過,為了保持領先,他建議設置更多限制。
相比之下,微軟的做法顯得耐人尋味。就在指控DeepSeek涉嫌侵權后不久,微軟的AI平臺上接入了DeepSeek模型。網(wǎng)友調侃道,否認是接受的第一步。
目前,微軟和OpenAI對DeepSeek的質疑仍處于調查階段。根據(jù)微軟工作人員的說法,DeepSeek可能在去年秋天調用了OpenAI的API,導致數(shù)據(jù)泄露。按照OpenAI的服務條款,任何人都可以注冊使用其API,但不能使用輸出數(shù)據(jù)訓練對其造成競爭威脅的模型。OpenAI拒絕進一步置評,也不愿提供證據(jù)細節(jié)。
模型蒸餾是一種壓縮技術,通過將復雜的大模型的知識轉移到更小、更高效的模型中。這種技術在學術界和工業(yè)界非常普遍且被認可。例如,Together AI曾將Llama 3蒸餾到Mamba,實現(xiàn)推理速度提升。IBM的文章也提到,知識蒸餾已成為生成式AI普惠化的重要工具。
然而,違反OpenAI的服務條款是個問題。盡管一些開源模型允許蒸餾,但OpenAI首席科學家Mark Chen表示,DeepSeek獨立發(fā)現(xiàn)了OpenAI在實現(xiàn)過程中采用的一些核心理念,并認可了其在成本控制上的工作。同時,他也提到OpenAI也在積極探索模型壓縮和優(yōu)化技術。
實際上,OpenAI自身在合規(guī)性上也存在問題。它在訓練模型時使用了大量的互聯(lián)網(wǎng)數(shù)據(jù),包括有版權的內容。2023年12月,《紐約時報》以侵犯知識產(chǎn)權為由將微軟和OpenAI告上法庭。OpenAI辯解稱,使用公開可獲得的互聯(lián)網(wǎng)資料訓練AI模型是合理的,且版權著作被非商業(yè)性使用是受到合理保護的。此外,大語言模型的關鍵在于Scaling,任何單獨被盜的內容都不足以支撐訓練一個大模型。
這引發(fā)了關于人工智能領域發(fā)展的基本邏輯的討論。Anthropic創(chuàng)始人Dario Amodei認為,DeepSeek的新模型雖然成本更低,但水平與他們7-10個月前相當。他認為正確的說法是“DeepSeek生成了一種模型,用較低的成本實現(xiàn)了接近7至10個月以前的Claude的表現(xiàn)”。
分析師郭明錤認為,DeepSeek R1加速了兩個趨勢:一是通過優(yōu)化訓練方式持續(xù)增長AI算力,二是API/Token價格顯著下滑,有利于加速AI應用的多元化。這些趨勢有助于增加AI算力需求,并降低投資者對AI投資能否獲利的疑慮。
臺退將:臺民眾不要迷信美國會出兵。這位臺退將的話一語中的,頭腦清醒。
2024-09-26 10:17:28臺退將:臺民眾不要迷信美國會出兵本文內容皆有可靠信息來源,相關信源述于文章結尾,請理性閱讀?!厩把浴?0月25日西方媒體披露的一則新聞在國際輿論場上引起了不小的波瀾,美國政府宣布了一項對臺軍售計劃,總額高達僅近20億美元
2024-10-30 16:17:24臺退將解讀美對臺軍售武器部署問題