V4發(fā)布稿結(jié)尾,DeepSeek引了一句荀子:“不誘于譽,不恐于誹,率道而行,端然正己?!边@句話放在DeepSeek一路走來的故事語境里,意味深長。過去一年多,DeepSeek在外界的敘事里經(jīng)歷了過山車般的起伏。2025年初V3和R1爆火后,媒體將其捧上神壇,“中國AI奇跡”的敘事鋪天蓋地。隨后一年多,當(dāng)Anthropic、OpenAI密集發(fā)布新模型,而DeepSeek只推出幾個跑分變化不大的中間版本時,關(guān)于“后繼乏力”的質(zhì)疑又此起彼伏。在這個崇尚競爭和結(jié)果說話的行業(yè)里,掌聲和噓聲都來得極快。
而梁文鋒似乎始終活在自己的節(jié)奏里。在DeepSeek內(nèi)部,梁文鋒更多扮演著一個導(dǎo)師的角色:組織研發(fā)、協(xié)調(diào)資源,也做具體研究,在共同成果上署名為通訊作者。他幾乎把所有時間投入選定的少數(shù)事情上,不做融資、不參加團建、很少和成員聚餐。DeepSeek至今保持著一些在全球AI圈都極其罕見的習(xí)慣:不打卡、沒有明確的績效考核,平日里多數(shù)員工會在下午六七點離開公司。在梁文鋒看來,一個人每天能高質(zhì)量工作的時間很難超過6到8小時,加班疲勞下的昏庸判斷反而會浪費寶貴的算力資源。
接近過梁文鋒的人曾評價:“他是一個特別抗噪音的人?!边@種抗噪音的能力,解釋了DeepSeek為何沒有在R1爆火后乘勝追擊放大招,而是沿著自己選定的方向繼續(xù)深耕效率優(yōu)化、架構(gòu)改進和一些“非主流”探索。梁文鋒認同的AGI目標(biāo)有兩層含義:一是基于國產(chǎn)生態(tài)來做大模型,他曾提出過“能不能用現(xiàn)存的一部分算力,就實現(xiàn)現(xiàn)在所有的智能”的假設(shè);二是做“原創(chuàng)式創(chuàng)新”,做一些大廠或其它創(chuàng)業(yè)公司不會去試、不愿去試的方向。
這或許也能解釋V4為何選擇在這個時間點發(fā)布。不急不躁,按自己的節(jié)奏出牌,在技術(shù)成熟度、生態(tài)適配和成本重構(gòu)都到位的節(jié)點,一擊中的。也就在V4發(fā)布后,一個容易被忽略的細節(jié)值得被重新提起:截至2026年4月,斯坦福大學(xué)HAI實驗室發(fā)布的年度《AI指數(shù)報告》顯示,中美大模型性能差距已收窄至2.7%,基本實現(xiàn)技術(shù)追平。