DeepSeek的算法優(yōu)化降低了算力門(mén)檻,把模型價(jià)格打了下來(lái);美團(tuán)的工程實(shí)踐證明了國(guó)產(chǎn)芯片的可行性。這些探索為國(guó)產(chǎn)芯片生態(tài)沉淀出工程能力和經(jīng)驗(yàn)。梁文鋒曾說(shuō):“我們不是有意成為一條鯰魚(yú),只是不小心成了一條鯰魚(yú)”,如今“鯰魚(yú)效應(yīng)”已經(jīng)顯現(xiàn),DeepSeek并不獨(dú)行。
騰訊云的湯道生曾比喻稱(chēng):“大模型是發(fā)動(dòng)機(jī),使用者是駕駛員”。中國(guó)算力的發(fā)展依賴(lài)整條產(chǎn)業(yè)鏈協(xié)同進(jìn)步。制造端數(shù)據(jù)顯示,中國(guó)芯片產(chǎn)量不斷攀升。中芯國(guó)際、華虹半導(dǎo)體等企業(yè)正推進(jìn)多重曝光等工藝攻關(guān)。算力端方面,華為昇騰910C等產(chǎn)品表明,通過(guò)極致的集群線性加速比也能跑通體量巨大的模型訓(xùn)練?!暗蒙鷳B(tài)者得天下”。行業(yè)從業(yè)者意識(shí)到這一點(diǎn),寒武紀(jì)推出兼容主流框架的基礎(chǔ)軟件平臺(tái),降低開(kāi)發(fā)者遷移門(mén)檻;智源人工智能研究院牽頭開(kāi)源系統(tǒng)構(gòu)建統(tǒng)一底層接口,讓上層模型可以運(yùn)行在多種不同的國(guó)產(chǎn)芯片上。國(guó)內(nèi)互聯(lián)網(wǎng)大廠也有很多動(dòng)作,百度雙軌戰(zhàn)略、字節(jié)跳動(dòng)千億投入都在為算力底座尋找更優(yōu)解。據(jù)公開(kāi)數(shù)據(jù)梳理,過(guò)去幾年美團(tuán)至少布局了21家覆蓋半導(dǎo)體/智能硬件和通用大模型領(lǐng)域的相關(guān)公司,包括芯片算力層的摩爾線程、沐曦股份以及視覺(jué)芯片領(lǐng)域的愛(ài)芯元智等。
在技術(shù)長(zhǎng)期跟進(jìn)的同時(shí),產(chǎn)業(yè)資本也在做算力的投資人和共建者,逐漸形成正向循環(huán)。北京智源人工智能研究院院長(zhǎng)王仲遠(yuǎn)指出,當(dāng)下人工智能正處于第三次浪潮重要拐點(diǎn),大模型推動(dòng)其從弱人工智能邁向通用人工智能,更重要的是推動(dòng)機(jī)器人從1.0專(zhuān)用機(jī)器人時(shí)代進(jìn)入2.0通用具身智能時(shí)代。一方面,眾多國(guó)產(chǎn)廠商致力于讓大模型在云端提升智慧和邏輯推理嚴(yán)密性;另一方面,也要讓大模型“行萬(wàn)里路”,例如文心大模型被植入到自動(dòng)駕駛決策系統(tǒng)中,混元大模型的工業(yè)質(zhì)檢方案已出現(xiàn)在多個(gè)流水線場(chǎng)景。美團(tuán)的外賣(mài)、到店、酒旅業(yè)務(wù)構(gòu)成了日常生活中最復(fù)雜的任務(wù)執(zhí)行網(wǎng)絡(luò),這里有海量的真實(shí)場(chǎng)景。王興明確提出要將美團(tuán)App率先升級(jí)成“AI-powered App”,這意味著LongCat的訓(xùn)練目標(biāo)不僅是回答問(wèn)題,更要解決實(shí)際任務(wù)。這解釋了美團(tuán)為何強(qiáng)調(diào)打造物理世界的AI底座。從參數(shù)提升到算力跑通,國(guó)產(chǎn)大模型正在完成從“能用”到“好用”的進(jìn)階。這條路沒(méi)有捷徑,未來(lái)當(dāng)算法、算力、資金與場(chǎng)景持續(xù)產(chǎn)生化學(xué)反應(yīng),中國(guó)AI的故事也將從“單點(diǎn)突破”翻到“系統(tǒng)進(jìn)化”這一頁(yè)。