從DeepSeek看創(chuàng)新規(guī)律好奇心驅(qū)動的力量

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2025-03-06 18:38:28 財經(jīng)雜志

DeepSeek發(fā)布了全球第二個推理大模型，僅比OpenAI晚四個月。盡管雙方大模型性能相當(dāng)，但性價比相差二三十倍，這歸功于DeepSeek的工程創(chuàng)新。然而，這種漸進式創(chuàng)新并不等同于從零到一的顛覆性創(chuàng)新，有讀者對此表示失望。其實不必失望，因為從零到一和從一到一百同樣重要。例如，托馬斯·薩弗里發(fā)明了蒸汽機，但詹姆斯·瓦特的重大改進才使其普及并引發(fā)工業(yè)革命。兩者的重要性不可忽視。

這篇文章繼續(xù)探討創(chuàng)新規(guī)律。好奇心加上自由探索是DeepSeek創(chuàng)新的核心。接下來將討論DeepSeek的創(chuàng)新力來源及六種代表性創(chuàng)新思想。

DeepSeek非常低調(diào)，外界對其知之甚少，主要信息來自行業(yè)媒體《暗涌》對梁文峰的兩次專訪。梁文峰1985年出生，2010年畢業(yè)于浙江大學(xué)信息與通信工程專業(yè)碩士。2016年，他創(chuàng)立了一家利用人工智能炒股的基金公司——幻方量化，賺取了豐厚利潤。2022年11月，OpenAI發(fā)布ChatGPT，引發(fā)了全球性的大模型浪潮。2023年4月，梁文峰宣布成立DeepSeek公司專注大模型開發(fā)，同年5月首次接受《暗涌》專訪。2024年5月，DeepSeek發(fā)布V2，震動業(yè)界，7月第二次接受《暗涌》專訪。

在采訪中，梁文峰強調(diào)創(chuàng)新首先是一種信念問題。他認(rèn)為中國公司在過去30多年IT浪潮中基本沒有參與真正的技術(shù)創(chuàng)新，習(xí)慣追隨而非創(chuàng)新。中國AI與美國的真正差距在于原創(chuàng)與模仿。DeepSeek的使命是推動技術(shù)前沿的發(fā)展，促進整個生態(tài)的成長。創(chuàng)新不僅是商業(yè)驅(qū)動，還需要好奇心和創(chuàng)造的野心。

DeepSeek團隊成員充滿熱情和好奇心，背景各異且富有個性。他們對研究的渴望遠(yuǎn)超對金錢的關(guān)注。招聘標(biāo)準(zhǔn)基于熱情和好奇心，團隊成員多為頂尖高校的應(yīng)屆生、博士生甚至實習(xí)生以及一些有幾年經(jīng)驗的年輕人。

DeepSeek采用自下而上的管理模式，鼓勵自由發(fā)揮和試錯。團隊成員使用計算資源時不受限制，可以隨時調(diào)用訓(xùn)練集群。公司扁平化管理，沒有嚴(yán)格的層級架構(gòu)或部門壁壘，團隊成員可以自由協(xié)作。通過確保價值觀一致和企業(yè)文化來保持步調(diào)一致，管理者以身作則。

12 全文共 2 頁下一頁

關(guān)閉

從DeepSeek看創(chuàng)新規(guī)律 好奇心驅(qū)動的力量

相關(guān)新聞

今日熱點

頻道熱點

從DeepSeek看創(chuàng)新規(guī)律好奇心驅(qū)動的力量