近日,DeepSeek的出現(xiàn)引發(fā)了全球科技領(lǐng)域的廣泛關(guān)注和深入討論。中國科協(xié)會刊《科技導(dǎo)報》2025年第3期刊發(fā)了中國計算機(jī)學(xué)會原理事長李國杰院士的文章《DeepSeek引發(fā)的AI發(fā)展路徑思考》,探討了DeepSeek背后所蘊(yùn)含的AI發(fā)展路徑問題。
李國杰是中國工程院院士、發(fā)展中國家科學(xué)院(TWAS)院士,研究方向涵蓋計算機(jī)體系結(jié)構(gòu)、并行算法、人工智能等多個領(lǐng)域。
DeepSeek的橫空出世是人工智能發(fā)展史上的標(biāo)志性事件。短短7天內(nèi),用戶增長超過1億,打破了用戶增長速度的世界紀(jì)錄。與此同時,英偉達(dá)股價單日暴跌17%,市值縮水5890億美元,創(chuàng)下美國上市公司單日最大損失紀(jì)錄。這表明,高算力和高投入不再是發(fā)展人工智能的唯一途徑,集成電路制程優(yōu)勢也不再等于人工智能技術(shù)霸權(quán)。DeepSeek引領(lǐng)行業(yè)進(jìn)入以算法和模型架構(gòu)優(yōu)化為主的新時期,同時高度重視數(shù)據(jù)質(zhì)量和規(guī)模,并理性提高算力。此外,DeepSeek標(biāo)志著中國科技公司從“追趕者”變?yōu)椤耙?guī)則改寫者”,在全球人工智能領(lǐng)域展現(xiàn)出顛覆性創(chuàng)新。
全球人工智能龍頭企業(yè)紛紛擁抱DeepSeek,微軟最早宣布將其R1模型添加到Azure AI Foundry,亞馬遜云科技(AWS)、英偉達(dá)、超威半導(dǎo)體(AMD)等也相繼部署DeepSeek V3和R1模型。上億用戶和眾多大公司根據(jù)性價比和親身體驗主動融入DeepSeek生態(tài)。DeepSeek推出的高效率、低成本推理模型和開源商業(yè)模式,引領(lǐng)了人工智能行業(yè)新潮流。
V3和R1模型受歡迎的原因在于其在模型算法和系統(tǒng)軟件層次的重大創(chuàng)新。V3模型參數(shù)量高達(dá)6710億,但采用混合專家模型(MoE)架構(gòu)后,每次調(diào)用僅激活約370億個參數(shù),顯著降低了訓(xùn)練計算成本。改進(jìn)的多頭潛在注意力機(jī)制(MLA)減少了鍵值緩存開銷,將顯存占用降至其他大模型的5%~13%,提升了運(yùn)行效率。R1模型摒棄傳統(tǒng)監(jiān)督微調(diào)(SFT),提出群組相對策略優(yōu)化(GRPO),通過強(qiáng)化學(xué)習(xí)激發(fā)推理能力,簡化了訓(xùn)練流程。這些發(fā)明雖非首次提出,但DeepSeek通過努力將技術(shù)做到極致,在前人成果基礎(chǔ)上登上新的技術(shù)高峰。
第3波人工智能興起后,美國政府、AI龍頭企業(yè)和投資界認(rèn)為高算力是發(fā)展人工智能的關(guān)鍵。特朗普簽署法案啟動星際之門計劃,投資5000億美元打造基礎(chǔ)設(shè)施。然而,DeepSeek的成功揭示了真相,即推理模型開發(fā)比想象中簡單,各行各業(yè)都能參與。初生牛犢不怕虎的中國科技工作者戳破了紙老虎,展示了其實(shí)力。
2020年,OpenAI發(fā)表論文提出規(guī)模法則,認(rèn)為增加模型規(guī)模、數(shù)據(jù)量和計算資源可以顯著提升性能。但規(guī)模法則并非科學(xué)定律,而是經(jīng)驗歸納。近幾年大模型訓(xùn)練效果表明,要獲得線性增長需高指數(shù)性增加投入,這種模式難以持久。理查德·薩頓指出,雖然規(guī)模法則有效,但它不是解決所有問題的萬能鑰匙,AI系統(tǒng)還需具備持續(xù)學(xué)習(xí)、適應(yīng)環(huán)境等能力。
DeepSeek的出現(xiàn)迫使AI界重新思考技術(shù)路線:是繼續(xù)追求高算力還是在算法優(yōu)化上下功夫?DeepSeek標(biāo)志著從外延式發(fā)展階段轉(zhuǎn)向集約化系統(tǒng)優(yōu)化階段。盡管成功并未否定算力的重要性,但綠色發(fā)展和降低能耗成為重要目標(biāo)。
通用人工智能是一個模糊概念,OpenAI追求的是多個領(lǐng)域處理復(fù)雜問題的能力。莫拉維克悖論指出,復(fù)雜問題易解而簡單問題難解。因此,學(xué)術(shù)界更關(guān)注智能系統(tǒng)的持續(xù)學(xué)習(xí)和自我改進(jìn)能力。實(shí)現(xiàn)通用智能是漸進(jìn)過程,不會因某項技術(shù)突然到來。
DeepSeek和OpenAI都以通用人工智能為目標(biāo),但路徑不同。OpenAI通過擴(kuò)大模型規(guī)模希望先做出通用基礎(chǔ)模型再蒸餾出垂直模型。DeepSeek則走“由專到通”的道路,通過模型算法和工程優(yōu)化探索受限資源下的通用智能。未來可能是通專融合,形成智能時代產(chǎn)業(yè)新生態(tài)。
科技界公認(rèn)圖靈是人工智能奠基人,他提出了計算模擬人類智能的假說。迄今為止,人工智能成果離不開計算,但高算力是否本質(zhì)需求值得深思。人腦高效低功耗是因為分布式模擬計算。深度學(xué)習(xí)奠基人辛頓提出“凡人計算”,采用與人腦相同的存算一體模擬計算方式,追求高算效和高能效,這是正確方向。
斯坦福大學(xué)華裔科學(xué)家團(tuán)隊基于阿里通義千問模型,結(jié)合谷歌AI推理模型Gemini 2.0 Flash Thinking Experimental,使用16個英偉達(dá)H100 GPU進(jìn)行了26分鐘訓(xùn)練,以不到50美元費(fèi)用成功訓(xùn)練出s1模型,性能超越高端模型。低成本模型顯示出巨大潛力。
過去幾年,開源大模型性能始終落后于閉源大模型,但DeepSeek改變了這一局面,增強(qiáng)了開源社區(qū)信心。楊立昆認(rèn)為開源模型正在超越閉源模型,改變發(fā)展模式比單項技術(shù)突破更重要。DeepSeek徹底開源模式破解了企業(yè)數(shù)據(jù)安全難題,真正實(shí)現(xiàn)了技術(shù)民主化。
長期以來,美國AI龍頭公司夸大開源AI的安全風(fēng)險,抑制開源AI發(fā)展。事實(shí)上,開源模型對全球AI供應(yīng)鏈至關(guān)重要,尤其是發(fā)展中國家。若美國繼續(xù)設(shè)置障礙,中國有望在開源AI全球供應(yīng)鏈中占據(jù)核心地位。真正的AI競爭不僅是技術(shù)和模型的競爭,更是生態(tài)系統(tǒng)、商業(yè)模式和價值觀的競爭。開源戰(zhàn)略將證明誰擁抱開源,誰就能贏得未來。
有人認(rèn)為ChatGPT是0到1的突破,而DeepSeek只是1到N的擴(kuò)展,但這不符合人工智能發(fā)展歷史。中國企業(yè)在應(yīng)用創(chuàng)新和商業(yè)模式創(chuàng)新方面表現(xiàn)出色,但原創(chuàng)能力逐漸增強(qiáng)。DeepSeek可能標(biāo)志著中國AI產(chǎn)業(yè)從“技術(shù)跟跑”向“技術(shù)并跑和領(lǐng)跑”邁進(jìn)。
盡管中國在人工智能基礎(chǔ)研究和核心技術(shù)上仍與美國有差距,但在論文發(fā)表總數(shù)和專利授權(quán)數(shù)量上超過美國。近年來中國進(jìn)步迅速,根據(jù)統(tǒng)計,中國作者在過去四年增長了8倍。人工智能產(chǎn)業(yè)具有不對稱性,一個小企業(yè)可以挑戰(zhàn)市值上萬億的龍頭企業(yè)。中國已有52家人工智能獨(dú)角獸企業(yè),占全球18%。這表明中國已有一批創(chuàng)新型小企業(yè)進(jìn)入世界前列。
DeepSeek的成功說明算法優(yōu)化和系統(tǒng)級工程優(yōu)化不可或缺,優(yōu)秀工程師發(fā)揮著重要作用。良好的工程教育體系和龐大的工程師隊伍是中國的優(yōu)勢。年輕一代正成為科研主力,有信心在人工智能研究和應(yīng)用上走在前面。
實(shí)現(xiàn)人工智能自立自強(qiáng)不僅靠國家規(guī)劃和資金支持,更要做好人才使用培養(yǎng)和產(chǎn)業(yè)生態(tài)構(gòu)建。DeepSeek創(chuàng)始人梁文鋒強(qiáng)調(diào)自信,選擇初出茅廬的年輕人,拒絕經(jīng)驗豐富的人才。這種用人理念為公司帶來創(chuàng)新動力,對傳統(tǒng)教育和聘用模式提出警示。
構(gòu)建自主可控的產(chǎn)業(yè)生態(tài)是最困難的任務(wù)。英偉達(dá)的CUDA軟件生態(tài)是其護(hù)城河,DeepSeek沖擊了這一生態(tài)但未完全繞過。長遠(yuǎn)來看,需要開發(fā)一套自主可控的AI軟件工具系統(tǒng),重構(gòu)AI軟件生態(tài)。這需要周密規(guī)劃和長期努力,相關(guān)部門應(yīng)組織全國力量完成這一任務(wù)。
資金投入雖非決定因素,但中國投資市場規(guī)模急劇萎縮值得關(guān)注。2023年美國AI投資達(dá)到672億美元,是中國的8.7倍。風(fēng)險投資和私募基金對科創(chuàng)產(chǎn)業(yè)極為重要,中美科創(chuàng)市場曾并駕齊驅(qū),但2023年中國投資額僅相當(dāng)于美國的8%。政府和資本界需合力構(gòu)建健康的科創(chuàng)金融生態(tài),為創(chuàng)新提供動力。
產(chǎn)業(yè)生態(tài)形成需市場牽引,國家應(yīng)通過政策引導(dǎo)推廣AI應(yīng)用,增強(qiáng)國產(chǎn)硬件和軟件市場占有率。重視芯片設(shè)計和大模型開源戰(zhàn)略,爭取中國在全球人工智能開源系統(tǒng)中的主導(dǎo)作用。通過算法和軟件協(xié)同創(chuàng)新,充分發(fā)揮硬件性能,力爭中國人工智能科研和應(yīng)用走在世界前列。
人工智能(AI)大模型DeepSeek點(diǎn)燃的AI熱潮,正在引發(fā)全球資本流向中國。
2025-02-17 10:11:09DeepSeek推動中國股票價值增1.3萬億美元