中國工程院院士與DeepSeek過了一招 AI發(fā)展路徑新思考

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2025-03-03 09:44:52 上觀

近日，DeepSeek的出現(xiàn)引發(fā)了全球科技領(lǐng)域的廣泛關(guān)注和深入討論。中國科協(xié)會刊《科技導(dǎo)報》2025年第3期刊發(fā)了中國計算機(jī)學(xué)會原理事長李國杰院士的文章《DeepSeek引發(fā)的AI發(fā)展路徑思考》，探討了DeepSeek背后所蘊(yùn)含的AI發(fā)展路徑問題。

李國杰是中國工程院院士、發(fā)展中國家科學(xué)院（TWAS）院士，研究方向涵蓋計算機(jī)體系結(jié)構(gòu)、并行算法、人工智能等多個領(lǐng)域。

DeepSeek的橫空出世是人工智能發(fā)展史上的標(biāo)志性事件。短短7天內(nèi)，用戶增長超過1億，打破了用戶增長速度的世界紀(jì)錄。與此同時，英偉達(dá)股價單日暴跌17%，市值縮水5890億美元，創(chuàng)下美國上市公司單日最大損失紀(jì)錄。這表明，高算力和高投入不再是發(fā)展人工智能的唯一途徑，集成電路制程優(yōu)勢也不再等于人工智能技術(shù)霸權(quán)。DeepSeek引領(lǐng)行業(yè)進(jìn)入以算法和模型架構(gòu)優(yōu)化為主的新時期，同時高度重視數(shù)據(jù)質(zhì)量和規(guī)模，并理性提高算力。此外，DeepSeek標(biāo)志著中國科技公司從“追趕者”變?yōu)椤耙?guī)則改寫者”，在全球人工智能領(lǐng)域展現(xiàn)出顛覆性創(chuàng)新。

全球人工智能龍頭企業(yè)紛紛擁抱DeepSeek，微軟最早宣布將其R1模型添加到Azure AI Foundry，亞馬遜云科技（AWS）、英偉達(dá)、超威半導(dǎo)體（AMD）等也相繼部署DeepSeek V3和R1模型。上億用戶和眾多大公司根據(jù)性價比和親身體驗主動融入DeepSeek生態(tài)。DeepSeek推出的高效率、低成本推理模型和開源商業(yè)模式，引領(lǐng)了人工智能行業(yè)新潮流。

V3和R1模型受歡迎的原因在于其在模型算法和系統(tǒng)軟件層次的重大創(chuàng)新。V3模型參數(shù)量高達(dá)6710億，但采用混合專家模型（MoE）架構(gòu)后，每次調(diào)用僅激活約370億個參數(shù)，顯著降低了訓(xùn)練計算成本。改進(jìn)的多頭潛在注意力機(jī)制（MLA）減少了鍵值緩存開銷，將顯存占用降至其他大模型的5%~13%，提升了運(yùn)行效率。R1模型摒棄傳統(tǒng)監(jiān)督微調(diào)（SFT），提出群組相對策略優(yōu)化（GRPO），通過強(qiáng)化學(xué)習(xí)激發(fā)推理能力，簡化了訓(xùn)練流程。這些發(fā)明雖非首次提出，但DeepSeek通過努力將技術(shù)做到極致，在前人成果基礎(chǔ)上登上新的技術(shù)高峰。

第3波人工智能興起后，美國政府、AI龍頭企業(yè)和投資界認(rèn)為高算力是發(fā)展人工智能的關(guān)鍵。特朗普簽署法案啟動星際之門計劃，投資5000億美元打造基礎(chǔ)設(shè)施。然而，DeepSeek的成功揭示了真相，即推理模型開發(fā)比想象中簡單，各行各業(yè)都能參與。初生牛犢不怕虎的中國科技工作者戳破了紙老虎，展示了其實(shí)力。

2020年，OpenAI發(fā)表論文提出規(guī)模法則，認(rèn)為增加模型規(guī)模、數(shù)據(jù)量和計算資源可以顯著提升性能。但規(guī)模法則并非科學(xué)定律，而是經(jīng)驗歸納。近幾年大模型訓(xùn)練效果表明，要獲得線性增長需高指數(shù)性增加投入，這種模式難以持久。理查德·薩頓指出，雖然規(guī)模法則有效，但它不是解決所有問題的萬能鑰匙，AI系統(tǒng)還需具備持續(xù)學(xué)習(xí)、適應(yīng)環(huán)境等能力。

DeepSeek的出現(xiàn)迫使AI界重新思考技術(shù)路線：是繼續(xù)追求高算力還是在算法優(yōu)化上下功夫？DeepSeek標(biāo)志著從外延式發(fā)展階段轉(zhuǎn)向集約化系統(tǒng)優(yōu)化階段。盡管成功并未否定算力的重要性，但綠色發(fā)展和降低能耗成為重要目標(biāo)。

通用人工智能是一個模糊概念，OpenAI追求的是多個領(lǐng)域處理復(fù)雜問題的能力。莫拉維克悖論指出，復(fù)雜問題易解而簡單問題難解。因此，學(xué)術(shù)界更關(guān)注智能系統(tǒng)的持續(xù)學(xué)習(xí)和自我改進(jìn)能力。實(shí)現(xiàn)通用智能是漸進(jìn)過程，不會因某項技術(shù)突然到來。

DeepSeek和OpenAI都以通用人工智能為目標(biāo)，但路徑不同。OpenAI通過擴(kuò)大模型規(guī)模希望先做出通用基礎(chǔ)模型再蒸餾出垂直模型。DeepSeek則走“由專到通”的道路，通過模型算法和工程優(yōu)化探索受限資源下的通用智能。未來可能是通專融合，形成智能時代產(chǎn)業(yè)新生態(tài)。

科技界公認(rèn)圖靈是人工智能奠基人，他提出了計算模擬人類智能的假說。迄今為止，人工智能成果離不開計算，但高算力是否本質(zhì)需求值得深思。人腦高效低功耗是因為分布式模擬計算。深度學(xué)習(xí)奠基人辛頓提出“凡人計算”，采用與人腦相同的存算一體模擬計算方式，追求高算效和高能效，這是正確方向。

斯坦福大學(xué)華裔科學(xué)家團(tuán)隊基于阿里通義千問模型，結(jié)合谷歌AI推理模型Gemini 2.0 Flash Thinking Experimental，使用16個英偉達(dá)H100 GPU進(jìn)行了26分鐘訓(xùn)練，以不到50美元費(fèi)用成功訓(xùn)練出s1模型，性能超越高端模型。低成本模型顯示出巨大潛力。

過去幾年，開源大模型性能始終落后于閉源大模型，但DeepSeek改變了這一局面，增強(qiáng)了開源社區(qū)信心。楊立昆認(rèn)為開源模型正在超越閉源模型，改變發(fā)展模式比單項技術(shù)突破更重要。DeepSeek徹底開源模式破解了企業(yè)數(shù)據(jù)安全難題，真正實(shí)現(xiàn)了技術(shù)民主化。

長期以來，美國AI龍頭公司夸大開源AI的安全風(fēng)險，抑制開源AI發(fā)展。事實(shí)上，開源模型對全球AI供應(yīng)鏈至關(guān)重要，尤其是發(fā)展中國家。若美國繼續(xù)設(shè)置障礙，中國有望在開源AI全球供應(yīng)鏈中占據(jù)核心地位。真正的AI競爭不僅是技術(shù)和模型的競爭，更是生態(tài)系統(tǒng)、商業(yè)模式和價值觀的競爭。開源戰(zhàn)略將證明誰擁抱開源，誰就能贏得未來。

有人認(rèn)為ChatGPT是0到1的突破，而DeepSeek只是1到N的擴(kuò)展，但這不符合人工智能發(fā)展歷史。中國企業(yè)在應(yīng)用創(chuàng)新和商業(yè)模式創(chuàng)新方面表現(xiàn)出色，但原創(chuàng)能力逐漸增強(qiáng)。DeepSeek可能標(biāo)志著中國AI產(chǎn)業(yè)從“技術(shù)跟跑”向“技術(shù)并跑和領(lǐng)跑”邁進(jìn)。

盡管中國在人工智能基礎(chǔ)研究和核心技術(shù)上仍與美國有差距，但在論文發(fā)表總數(shù)和專利授權(quán)數(shù)量上超過美國。近年來中國進(jìn)步迅速，根據(jù)統(tǒng)計，中國作者在過去四年增長了8倍。人工智能產(chǎn)業(yè)具有不對稱性，一個小企業(yè)可以挑戰(zhàn)市值上萬億的龍頭企業(yè)。中國已有52家人工智能獨(dú)角獸企業(yè)，占全球18%。這表明中國已有一批創(chuàng)新型小企業(yè)進(jìn)入世界前列。

DeepSeek的成功說明算法優(yōu)化和系統(tǒng)級工程優(yōu)化不可或缺，優(yōu)秀工程師發(fā)揮著重要作用。良好的工程教育體系和龐大的工程師隊伍是中國的優(yōu)勢。年輕一代正成為科研主力，有信心在人工智能研究和應(yīng)用上走在前面。

實(shí)現(xiàn)人工智能自立自強(qiáng)不僅靠國家規(guī)劃和資金支持，更要做好人才使用培養(yǎng)和產(chǎn)業(yè)生態(tài)構(gòu)建。DeepSeek創(chuàng)始人梁文鋒強(qiáng)調(diào)自信，選擇初出茅廬的年輕人，拒絕經(jīng)驗豐富的人才。這種用人理念為公司帶來創(chuàng)新動力，對傳統(tǒng)教育和聘用模式提出警示。

構(gòu)建自主可控的產(chǎn)業(yè)生態(tài)是最困難的任務(wù)。英偉達(dá)的CUDA軟件生態(tài)是其護(hù)城河，DeepSeek沖擊了這一生態(tài)但未完全繞過。長遠(yuǎn)來看，需要開發(fā)一套自主可控的AI軟件工具系統(tǒng)，重構(gòu)AI軟件生態(tài)。這需要周密規(guī)劃和長期努力，相關(guān)部門應(yīng)組織全國力量完成這一任務(wù)。

資金投入雖非決定因素，但中國投資市場規(guī)模急劇萎縮值得關(guān)注。2023年美國AI投資達(dá)到672億美元，是中國的8.7倍。風(fēng)險投資和私募基金對科創(chuàng)產(chǎn)業(yè)極為重要，中美科創(chuàng)市場曾并駕齊驅(qū)，但2023年中國投資額僅相當(dāng)于美國的8%。政府和資本界需合力構(gòu)建健康的科創(chuàng)金融生態(tài)，為創(chuàng)新提供動力。

產(chǎn)業(yè)生態(tài)形成需市場牽引，國家應(yīng)通過政策引導(dǎo)推廣AI應(yīng)用，增強(qiáng)國產(chǎn)硬件和軟件市場占有率。重視芯片設(shè)計和大模型開源戰(zhàn)略，爭取中國在全球人工智能開源系統(tǒng)中的主導(dǎo)作用。通過算法和軟件協(xié)同創(chuàng)新，充分發(fā)揮硬件性能，力爭中國人工智能科研和應(yīng)用走在世界前列。

(責(zé)任編輯：于浩淙 zx0176)

關(guān)閉

中國工程院院士與DeepSeek過了一招 AI發(fā)展路徑新思考

相關(guān)新聞

今日熱點(diǎn)

頻道熱點(diǎn)