DeepSeek V4有多強架構(gòu)創(chuàng)新引領(lǐng)未來(7)

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2026-04-28 17:08:27 正和島

V4發(fā)布稿結(jié)尾，DeepSeek引了一句荀子：“不誘于譽，不恐于誹，率道而行，端然正己?！边@句話放在DeepSeek一路走來的故事語境里，意味深長。過去一年多，DeepSeek在外界的敘事里經(jīng)歷了過山車般的起伏。2025年初V3和R1爆火后，媒體將其捧上神壇，“中國AI奇跡”的敘事鋪天蓋地。隨后一年多，當(dāng)Anthropic、OpenAI密集發(fā)布新模型，而DeepSeek只推出幾個跑分變化不大的中間版本時，關(guān)于“后繼乏力”的質(zhì)疑又此起彼伏。在這個崇尚競爭和結(jié)果說話的行業(yè)里，掌聲和噓聲都來得極快。

而梁文鋒似乎始終活在自己的節(jié)奏里。在DeepSeek內(nèi)部，梁文鋒更多扮演著一個導(dǎo)師的角色：組織研發(fā)、協(xié)調(diào)資源，也做具體研究，在共同成果上署名為通訊作者。他幾乎把所有時間投入選定的少數(shù)事情上，不做融資、不參加團建、很少和成員聚餐。DeepSeek至今保持著一些在全球AI圈都極其罕見的習(xí)慣：不打卡、沒有明確的績效考核，平日里多數(shù)員工會在下午六七點離開公司。在梁文鋒看來，一個人每天能高質(zhì)量工作的時間很難超過6到8小時，加班疲勞下的昏庸判斷反而會浪費寶貴的算力資源。

接近過梁文鋒的人曾評價：“他是一個特別抗噪音的人?！边@種抗噪音的能力，解釋了DeepSeek為何沒有在R1爆火后乘勝追擊放大招，而是沿著自己選定的方向繼續(xù)深耕效率優(yōu)化、架構(gòu)改進和一些“非主流”探索。梁文鋒認同的AGI目標(biāo)有兩層含義：一是基于國產(chǎn)生態(tài)來做大模型，他曾提出過“能不能用現(xiàn)存的一部分算力，就實現(xiàn)現(xiàn)在所有的智能”的假設(shè)；二是做“原創(chuàng)式創(chuàng)新”，做一些大廠或其它創(chuàng)業(yè)公司不會去試、不愿去試的方向。

這或許也能解釋V4為何選擇在這個時間點發(fā)布。不急不躁，按自己的節(jié)奏出牌，在技術(shù)成熟度、生態(tài)適配和成本重構(gòu)都到位的節(jié)點，一擊中的。也就在V4發(fā)布后，一個容易被忽略的細節(jié)值得被重新提起：截至2026年4月，斯坦福大學(xué)HAI實驗室發(fā)布的年度《AI指數(shù)報告》顯示，中美大模型性能差距已收窄至2.7%，基本實現(xiàn)技術(shù)追平。

首頁上一頁...4 5 678 全文共 8 頁下一頁

關(guān)閉

DeepSeek V4有多強 架構(gòu)創(chuàng)新引領(lǐng)未來(7)

相關(guān)新聞

今日熱點

頻道熱點

DeepSeek V4有多強架構(gòu)創(chuàng)新引領(lǐng)未來(7)