行業(yè)普遍認為,兩大“AI巨頭”都被DeepSeek卷入了競爭,開源的勝利正在改變AI世界。自走紅以來,DeepSeek因成本優(yōu)勢不斷震驚業(yè)界,為其開源生態(tài)的發(fā)展奠定了良好基礎(chǔ)。
過去,大模型多走閉源路線,這與高昂的成本密切相關(guān)。許多大模型在預訓練階段幾乎不計成本地投入,而DeepSeek則選擇了一條不同的道路,將重點放在強化學習上。通過反復高強度訓練,不斷調(diào)整和優(yōu)化,直到結(jié)果令人滿意。例如,OpenAI的GPT-5項目一次為期半年的訓練計算成本高達約5億美元,但仍未取得預期成果。相比之下,DeepSeek找到了一條低算力、高效率的路徑,其訓練成本僅為OpenAI相關(guān)模型的十幾分之一甚至幾十分之一。
DeepSeek不僅開源了所有模型和論文,還公開了訓練方法,允許全球技術(shù)人員進行研發(fā)和開發(fā)。這意味著新的技術(shù)和應(yīng)用將在這一新生態(tài)中不斷涌現(xiàn)。2025年1月20日,DeepSeek發(fā)布R1模型后,僅7天新增用戶達1億,成為史上最快破億的AI應(yīng)用。至2月1日,其日活躍用戶突破3000萬,超越豆包,逼近ChatGPT的5323萬。
從云服務(wù)商、電信運營商到手機和汽車廠商,越來越多的企業(yè)開始擁抱DeepSeek。這條鯰魚也攪動了全球AI市場,促使兩大“AI巨頭”先后決定開放部分功能。1月31日,OpenAI上線了新的推理模型o3-mini,并進一步下放免費權(quán)限。OpenAI CEO Sam Altman承認在開源上的失誤,并表示可能找到新的開源策略。百度也在2月13日宣布,從4月1日起文心一言將全面免費,并即日起上線深度搜索功能,該功能也將于4月1日起免費開放使用。
DeepSeek之所以能夠高效運行,一個重要原因是實現(xiàn)了芯片最底層的優(yōu)化。通過PTX編程,DeepSeek優(yōu)化了GPU的數(shù)據(jù)傳輸速度和其他運算,使同樣的GPU發(fā)揮出10倍效能。此外,DeepSeek在訓練方法上也進行了創(chuàng)新,跳過監(jiān)督微調(diào)階段,專注于規(guī)則驅(qū)動的強化學習。研究團隊采用了一種名為GRPO的方法,這種方法使得整個團隊共同進步,變得更加準確和一致。