在推理拐點(diǎn)敘事持續(xù)強(qiáng)化的背景下,圍繞推理效率的算力架構(gòu)出現(xiàn)分化,一批嘗試重構(gòu)算力架構(gòu)的初創(chuàng)公司開始浮出水面。近日,LPU初創(chuàng)企業(yè)元川微宣布完成數(shù)億元天使輪系列融資,參與投資方包括元禾原點(diǎn)、峰瑞資本、中芯聚源、深創(chuàng)投、東方嘉富、浙江省科創(chuàng)母基金以及上市公司星宸科技、智微智能等多元投資平臺。本輪融資資金將主要用于第一代LPU+架構(gòu)AI推理芯片的研發(fā)與量產(chǎn)。
LPU架構(gòu)進(jìn)入主流視野,很大程度上源于Groq的快速崛起。作為專注推理算力的代表性公司,Groq在低時延、高吞吐及能效上的表現(xiàn),引發(fā)市場對通用算力路徑之外技術(shù)路線的重新審視。2025年下半年,英偉達(dá)豪擲200億美元,實質(zhì)性整合了Groq的推理技術(shù)資產(chǎn)。今年3月,黃仁勛在GTC大會上展示了這項交易的最新成果:Groq的LPU架構(gòu)已被深度集成到英偉達(dá)的Vera Rubin平臺中,提供面向Agent的實時推理算力。
在產(chǎn)業(yè)龍頭的領(lǐng)銜押注下,圍繞推理場景的算力架構(gòu)重構(gòu),正在從邊緣探索走向產(chǎn)業(yè)前臺。元川微成立于2025年9月,創(chuàng)始人楊濱此前任職于華為,曾在2008年赴美組建華為處理器團(tuán)隊,2012年回國后主導(dǎo)華為無線基帶算法與芯片部門。楊濱在一檔播客中曾表示,他早前已看好LPU這一架構(gòu)路徑,但直到2025年初DeepSeek-R1技術(shù)報告發(fā)布,才真正堅定了下場創(chuàng)業(yè)的決心?!罢撐慕o我觸動極大,大模型終于不是泡沫了,可用了。模型能力很強(qiáng),成本降到了大家可以使用的階段。那天晚上我把論文看完,覺得終于可以下場了?!?/p>
LPU通常指面向大模型推理場景設(shè)計的專用架構(gòu),其核心在于通過優(yōu)化數(shù)據(jù)流、存儲與調(diào)度方式,讓數(shù)據(jù)在芯片內(nèi)部“少繞路”,同時減少運(yùn)行過程中的動態(tài)調(diào)度,從而提升響應(yīng)速度并降低能耗。落地到產(chǎn)品側(cè),元川微目前的規(guī)劃是,擬面向不同推理場景進(jìn)行分層布局,包括面向數(shù)據(jù)中心和高端邊緣節(jié)點(diǎn)的推理芯片,強(qiáng)調(diào)高性能、復(fù)雜場景;以及面向大端側(cè)和邊緣側(cè)的推理方案,更側(cè)重連接能力以及面向行業(yè)場景的功能適配。短期內(nèi)推理需求仍將主要集中在數(shù)據(jù)中心及部分邊緣節(jié)點(diǎn),但隨著Agent、具身智能等應(yīng)用逐步落地,推理負(fù)載將持續(xù)向終端側(cè)延伸,邊端有望成為下一階段的重要增長點(diǎn)。
據(jù)公司方面介紹,元川微目前仍處于研發(fā)階段,已完成系統(tǒng)仿真、原型驗證及FPGA驗證,下一步將推進(jìn)產(chǎn)品定義、客戶對接以及軟件生態(tài)與工具鏈建設(shè),并計劃于明年上半年完成投片。值得一提的是,在仍處于研發(fā)階段的情況下,元川微即獲得了多方資本加持。其近期官宣的天使輪系列融資,就集結(jié)了頭部財務(wù)投資機(jī)構(gòu)、政府投資平臺以及上市公司等的參與。對于產(chǎn)業(yè)方在公司早期階段的押注,楊濱表示,兩家上市公司股東一定程度上分別代表了不同的市場切入方向,一個深耕算力中心,一個布局大端側(cè)與邊緣側(cè),與元川微的產(chǎn)品分層邏輯契合,因此它們兼具了股東和客戶的身份,“產(chǎn)業(yè)方目前在產(chǎn)品定義、供應(yīng)鏈和早期市場上都給了元川微實際的支持?!睏顬I進(jìn)一步表示,產(chǎn)業(yè)方更看重的是系統(tǒng)方案落地后,能否真正改善每瓦特性能與每token成本,“賬能算回來,他們才會投?!?/p>
在楊濱看來,LPU架構(gòu)的興起,更本質(zhì)的原因在于算力需求結(jié)構(gòu)的變化。他認(rèn)為,當(dāng)前算力消費(fèi)的主體已經(jīng)發(fā)生變化,“簡單的碳基消費(fèi)者,變成了碳基和硅基混合的消費(fèi)模式?!币簿褪钦f,算力的調(diào)用方已經(jīng)不只是人,還有Agent。這一變化帶來的不只是量的壓力。人與AI對話每秒不過幾十個token,但Agent之間協(xié)同時交互量可能是這個數(shù)字的十倍乃至百倍,因此,現(xiàn)在階段的推理基礎(chǔ)設(shè)施,在每用戶每秒的token提供能力、每token的成本、每token的能耗上,都和滿足實際需求存在巨大差距。楊濱據(jù)此判斷,推理算力的基礎(chǔ)設(shè)施正處于一個重構(gòu)的轉(zhuǎn)折點(diǎn)。
黃仁勛也在近期的公開表態(tài)中,持續(xù)強(qiáng)調(diào)推理拐點(diǎn)來臨后,算力評價體系的重構(gòu),推理算力逐漸從附屬環(huán)節(jié)走向核心環(huán)節(jié)。標(biāo)志性的體現(xiàn)就是,成立了9年的Groq,因為英偉達(dá)一筆高達(dá)200億美元的整合性收購,驟然站在了AI行業(yè)的聚光燈下。不過,僅從國內(nèi)來看,真正意義上以LPU為核心路線的企業(yè)仍屬少數(shù)。目前,多數(shù)AI芯片公司仍沿GPU或通用算力路徑推進(jìn),通過兼顧訓(xùn)練與推理提升性能;包括元川微、邁特芯、深明奧思等少數(shù)幾家企業(yè),正在嘗試以推理為中心重新設(shè)計架構(gòu),屬于尚未形成共識的探索方向。
這一格局的形成,與技術(shù)路徑選擇及產(chǎn)業(yè)階段密切相關(guān)。一方面,相較在既有架構(gòu)上進(jìn)行優(yōu)化,從推理場景出發(fā)重新設(shè)計芯片架構(gòu),對系統(tǒng)設(shè)計能力與工程積累提出更高要求;另一方面,推理需求雖在快速增長,但其具體應(yīng)用形態(tài)仍在演進(jìn)之中,產(chǎn)業(yè)側(cè)對新架構(gòu)的接受度仍有待進(jìn)一步驗證。楊濱亦坦言,工藝制程與先進(jìn)IP的制約是繞不開的門檻,而在產(chǎn)業(yè)共識尚未形成的早期,愿意理解這條路線的人本就不多。不過他也表示,推理場景相較訓(xùn)練,對現(xiàn)有軟件生態(tài)的依賴要低得多,這種相對寬松的生態(tài)約束,對國內(nèi)推理芯片的創(chuàng)業(yè)者而言事實上是一個窗口機(jī)遇。
從更廣泛的行業(yè)視角來看,推理算力的興起,已經(jīng)為更多產(chǎn)業(yè)鏈環(huán)節(jié)帶來了結(jié)構(gòu)性機(jī)會。隨著token消耗提升,對算力密度、帶寬及能效的要求同步上升,除了芯片架構(gòu)層面,這一趨勢的影響也在向上游硬件體系傳導(dǎo),帶動包括服務(wù)器互聯(lián)、PCB及高速材料等環(huán)節(jié)的需求提升??梢钥吹?,相關(guān)上市公司在過去一段時間股價已經(jīng)經(jīng)歷了一輪陡峭上升,資金對這一方向的關(guān)注度持續(xù)提升。
思格新能今日敲鐘上市,截至發(fā)稿,股價漲76%,市值超1400億港元
2026-04-16 18:19:29華為老兵許映童做儲能年入90億周末,所有平臺都被一只“龍蝦”刷屏了。3月6日,近千名開發(fā)者和AI愛好者將深圳騰訊大廈的門口圍得水泄不通,求著騰訊云工程師免費(fèi)幫忙安裝OpenClaw
2026-03-10 20:16:28普通人要不要養(yǎng)龍蝦