春節(jié)期間,國內外AI圈都被DeepSeek刷屏。英偉達的股市震蕩更是讓全世界矚目。DeepSeek最近發(fā)布的兩個模型——DeepSeek-V3和DeepSeek-R1以較低成本獲得了與OpenAI同類模型相當?shù)男阅?,這引發(fā)了市場對AI硬件需求的擔憂,投資者擔心未來對英偉達高端芯片的需求可能會減少。
關于DeepSeek技術創(chuàng)新的討論也非常多。很多人認為,DeepSeek在硬件受限的情況下走出了一條不同于OpenAI等狂堆算力的道路,通過一系列技術創(chuàng)新來減少模型對算力的需求,同時提升性能。這些成就得到了包括Sam Altman在內的AI領軍人物的認可。
隨后,OpenAI首席研究官Mark Chen發(fā)帖表示,DeepSeek確實獨立發(fā)現(xiàn)了一些OpenAI也在用的核心理念,但這不代表OpenAI在算力上的高投入不合理。他認為外界對成本方面的反應有些過度夸大,并指出擁有預訓練和推理兩個范式意味著可以在兩個維度上優(yōu)化能力。隨著蒸餾研究的成熟,降低成本和提升能力愈發(fā)解耦。OpenAI將繼續(xù)提升低成本提供模型服務的能力,但也會繼續(xù)專注于其研究路線圖,計劃在今年帶來更多更好的模型。
OpenAI研究科學家Noam Brown也試圖弱化外界對OpenAI和DeepSeek的對比,但效果并不明顯。Mark Chen提到的“外界對成本方面的反應有些過度夸大”這一點也被廣泛討論。實際上,DeepSeek-V3的成本僅包括正式訓練,不包括前期研究、消融實驗等費用。
圖靈獎得主、Meta AI首席科學家Yann LeCun認為市場對于DeepSeek的成本反應并不合理。他指出,巨額投資主要用于維持AI服務穩(wěn)定運行,而不是僅僅用于訓練模型。隨著AI能力增強,維持服務運行的成本會更高,關鍵在于用戶是否愿意為這些增強的功能付費。
不少網(wǎng)友贊同LeCun的觀點,認為訓練和推理成本更低的AI技術能更快普及,從而創(chuàng)造更大的市場。從這個角度來看,DeepSeek在降低推理成本方面的努力似乎比降低訓練成本更為重要。
面對可能即將到來的推理需求激增,OpenAI、Meta等公司都在做相應準備,如OpenAI的“星際之門”項目和Meta的新一年600億美元的AI投資。2025年,AI市場的競爭依然激烈,DeepSeek在新一年的發(fā)展值得關注。
國產(chǎn)AI公司深度求索(DeepSeek)的出現(xiàn)不僅吸引了科技界的關注,也引起了資本市場的興趣,并且持續(xù)擴展其影響力
2025-02-10 09:15:30券商晨會精華北京時間周五凌晨,OpenAI舉辦了“12天12場直播”活動的首場直播,推出了推理大模型o1的完整版本和進階模式,以及每月收費200美元(約合人民幣1450元)的ChatGPT Pro訂閱服務
2024-12-06 09:28:30OpenAI上線滿血版o1大模型9月12日,OpenAI在其官網(wǎng)上發(fā)布了一則公告,宣布向所有訂閱用戶推出OpenAI o1預覽模型。這一模型被公眾廣泛關注,昵稱為“草莓”大模型
2024-09-13 08:15:59OpenAI發(fā)布具有推理能力的AI模型o1