DeepSeek獨立發(fā)現(xiàn)o1的一些核心思路低成本高性能引熱議

小大

用微信掃描二維碼
分享至好友和朋友圈

關鍵詞：

2025-02-01 09:07:48 機器之心Pro

春節(jié)期間，國內外AI圈都被DeepSeek刷屏。英偉達的股市震蕩更是讓全世界矚目。DeepSeek最近發(fā)布的兩個模型——DeepSeek-V3和DeepSeek-R1以較低成本獲得了與OpenAI同類模型相當?shù)男阅?，這引發(fā)了市場對AI硬件需求的擔憂，投資者擔心未來對英偉達高端芯片的需求可能會減少。

關于DeepSeek技術創(chuàng)新的討論也非常多。很多人認為，DeepSeek在硬件受限的情況下走出了一條不同于OpenAI等狂堆算力的道路，通過一系列技術創(chuàng)新來減少模型對算力的需求，同時提升性能。這些成就得到了包括Sam Altman在內的AI領軍人物的認可。

隨后，OpenAI首席研究官Mark Chen發(fā)帖表示，DeepSeek確實獨立發(fā)現(xiàn)了一些OpenAI也在用的核心理念，但這不代表OpenAI在算力上的高投入不合理。他認為外界對成本方面的反應有些過度夸大，并指出擁有預訓練和推理兩個范式意味著可以在兩個維度上優(yōu)化能力。隨著蒸餾研究的成熟，降低成本和提升能力愈發(fā)解耦。OpenAI將繼續(xù)提升低成本提供模型服務的能力，但也會繼續(xù)專注于其研究路線圖，計劃在今年帶來更多更好的模型。

OpenAI研究科學家Noam Brown也試圖弱化外界對OpenAI和DeepSeek的對比，但效果并不明顯。Mark Chen提到的“外界對成本方面的反應有些過度夸大”這一點也被廣泛討論。實際上，DeepSeek-V3的成本僅包括正式訓練，不包括前期研究、消融實驗等費用。

圖靈獎得主、Meta AI首席科學家Yann LeCun認為市場對于DeepSeek的成本反應并不合理。他指出，巨額投資主要用于維持AI服務穩(wěn)定運行，而不是僅僅用于訓練模型。隨著AI能力增強，維持服務運行的成本會更高，關鍵在于用戶是否愿意為這些增強的功能付費。

不少網(wǎng)友贊同LeCun的觀點，認為訓練和推理成本更低的AI技術能更快普及，從而創(chuàng)造更大的市場。從這個角度來看，DeepSeek在降低推理成本方面的努力似乎比降低訓練成本更為重要。

面對可能即將到來的推理需求激增，OpenAI、Meta等公司都在做相應準備，如OpenAI的“星際之門”項目和Meta的新一年600億美元的AI投資。2025年，AI市場的競爭依然激烈，DeepSeek在新一年的發(fā)展值得關注。

(責任編輯：張蕾)

關閉

DeepSeek獨立發(fā)現(xiàn)o1的一些核心思路 低成本高性能引熱議

相關新聞

今日熱點

頻道熱點

DeepSeek獨立發(fā)現(xiàn)o1的一些核心思路低成本高性能引熱議