DeepSeek發(fā)布了全球第二個推理大模型,僅比OpenAI晚四個月。盡管雙方大模型性能相當(dāng),但性價比相差二三十倍,這歸功于DeepSeek的工程創(chuàng)新。然而,這種漸進式創(chuàng)新并不等同于從零到一的顛覆性創(chuàng)新,有讀者對此表示失望。其實不必失望,因為從零到一和從一到一百同樣重要。例如,托馬斯·薩弗里發(fā)明了蒸汽機,但詹姆斯·瓦特的重大改進才使其普及并引發(fā)工業(yè)革命。兩者的重要性不可忽視。
這篇文章繼續(xù)探討創(chuàng)新規(guī)律。好奇心加上自由探索是DeepSeek創(chuàng)新的核心。接下來將討論DeepSeek的創(chuàng)新力來源及六種代表性創(chuàng)新思想。
DeepSeek非常低調(diào),外界對其知之甚少,主要信息來自行業(yè)媒體《暗涌》對梁文峰的兩次專訪。梁文峰1985年出生,2010年畢業(yè)于浙江大學(xué)信息與通信工程專業(yè)碩士。2016年,他創(chuàng)立了一家利用人工智能炒股的基金公司——幻方量化,賺取了豐厚利潤。2022年11月,OpenAI發(fā)布ChatGPT,引發(fā)了全球性的大模型浪潮。2023年4月,梁文峰宣布成立DeepSeek公司專注大模型開發(fā),同年5月首次接受《暗涌》專訪。2024年5月,DeepSeek發(fā)布V2,震動業(yè)界,7月第二次接受《暗涌》專訪。
在采訪中,梁文峰強調(diào)創(chuàng)新首先是一種信念問題。他認(rèn)為中國公司在過去30多年IT浪潮中基本沒有參與真正的技術(shù)創(chuàng)新,習(xí)慣追隨而非創(chuàng)新。中國AI與美國的真正差距在于原創(chuàng)與模仿。DeepSeek的使命是推動技術(shù)前沿的發(fā)展,促進整個生態(tài)的成長。創(chuàng)新不僅是商業(yè)驅(qū)動,還需要好奇心和創(chuàng)造的野心。
DeepSeek團隊成員充滿熱情和好奇心,背景各異且富有個性。他們對研究的渴望遠(yuǎn)超對金錢的關(guān)注。招聘標(biāo)準(zhǔn)基于熱情和好奇心,團隊成員多為頂尖高校的應(yīng)屆生、博士生甚至實習(xí)生以及一些有幾年經(jīng)驗的年輕人。
DeepSeek采用自下而上的管理模式,鼓勵自由發(fā)揮和試錯。團隊成員使用計算資源時不受限制,可以隨時調(diào)用訓(xùn)練集群。公司扁平化管理,沒有嚴(yán)格的層級架構(gòu)或部門壁壘,團隊成員可以自由協(xié)作。通過確保價值觀一致和企業(yè)文化來保持步調(diào)一致,管理者以身作則。
美國IT研究與顧問咨詢公司Gartner高級研究總監(jiān)方琦近日表示,DeepSeek成功的關(guān)鍵在于其偏重研究的導(dǎo)向,而非追求短期盈利
2025-03-15 06:48:47DeepSeek成功的關(guān)鍵是什么本周,中國互聯(lián)網(wǎng)上洋溢著喜悅的氣氛。2017年,谷歌旗下“深層思維”公司戰(zhàn)勝中國頂尖圍棋選手,展示了西方在人工智能領(lǐng)域的輝煌
2025-02-02 12:54:10一文看懂DeepSeek的中國式創(chuàng)新