梁文鋒很早就注意到AI模型,2018年榮獲中國私募行業(yè)的最高獎項——金牛獎,并在頒獎典禮上首次系統(tǒng)闡述AI在量化投資中的廣闊前景。他在演講中提到:“量化投資的未來,是用技術讓市場更有效率。”
2019年,幻方量化前瞻性地大規(guī)模布局AI算力,自主研發(fā)“螢火一號”訓練平臺,投資近2億元,配備1100塊GPU。2021年,投資加碼到10億元的“螢火二號”投入使用,搭載約1萬張英偉達A100顯卡。憑借這些前期準備,恰逢2023年AI大模型迎來爆發(fā)之年,梁文鋒宣布正式進軍通用人工智能領域,創(chuàng)辦杭州深度求索人工智能基礎技術研究有限公司,即DeepSeek。
DeepSeek采用差異化的技術路線,開發(fā)了新型MLA(多頭潛在注意力機制)和MoE架構,大幅降低顯存占用和推理成本。2024年12月26日,DeepSeek發(fā)布V3模型,使用2048顆H800 GPU,訓練成本僅557.6萬美元,性能卻超越多個開源模型,被硅谷稱為“來自東方的神秘力量”。
2025年1月20日,DeepSeek發(fā)布R1模型,部分性能可以追趕上當時最先進的大模型之一OpenAI o1模型,而且完全開源。7天內用戶增長至1億,登頂中國和美國蘋果應用商店免費APP榜,超越ChatGPT。R1的成功進一步鞏固了DeepSeek的全球影響力,引發(fā)美國科技股拋售,如英偉達市值損失了6000億美元。
DeepSeek R1的發(fā)布被業(yè)內譽為“AI的斯普特尼克時刻”,美國總統(tǒng)特朗普也給予正面評價。NVIDIA CEO黃仁勛稱其為“送給全球AI行業(yè)的禮物”,Meta首席科學家楊立昆肯定其在開源和技術優(yōu)化上的重大突破。微軟、OpenAI、亞馬遜等企業(yè)亦表達出對其技術實力的認可。
我們需要更多的DeepSeek。過去幾年里,中國大模型從業(yè)者們經常被問及中國距離追上ChatGPT還有多遠。2025年初,這個問題有了新的答案
2025-02-21 17:49:36DeepSeek爆火蛇年除夕夜,硅基流動創(chuàng)始人袁進輝沒有留在飯桌上,而是抓緊時間與技術團隊開會,解決DeepSeek模型在國產芯片上的適配問題
2025-02-16 09:01:22DeepSeek風暴席卷AI產業(yè)鏈中國AI初創(chuàng)公司深度求索(DeepSeek)在短短一個月內發(fā)布了兩款大模型:DeepSeek-V3和DeepSeek-R1
2025-01-27 19:35:39DeepSeek為何引發(fā)全球轟動