在推理拐點敘事持續(xù)強化的背景下,圍繞推理效率的算力架構出現(xiàn)分化,一批嘗試重構算力架構的初創(chuàng)公司開始浮出水面。近日,LPU初創(chuàng)企業(yè)元川微宣布完成數(shù)億元天使輪系列融資,參與投資方包括元禾原點、峰瑞資本、中芯聚源、深創(chuàng)投、東方嘉富、浙江省科創(chuàng)母基金以及上市公司星宸科技、智微智能等多元投資平臺。本輪融資資金將主要用于第一代LPU+架構AI推理芯片的研發(fā)與量產(chǎn)。
LPU架構進入主流視野,很大程度上源于Groq的快速崛起。作為專注推理算力的代表性公司,Groq在低時延、高吞吐及能效上的表現(xiàn),引發(fā)市場對通用算力路徑之外技術路線的重新審視。2025年下半年,英偉達豪擲200億美元,實質性整合了Groq的推理技術資產(chǎn)。今年3月,黃仁勛在GTC大會上展示了這項交易的最新成果:Groq的LPU架構已被深度集成到英偉達的Vera Rubin平臺中,提供面向Agent的實時推理算力。
在產(chǎn)業(yè)龍頭的領銜押注下,圍繞推理場景的算力架構重構,正在從邊緣探索走向產(chǎn)業(yè)前臺。元川微成立于2025年9月,創(chuàng)始人楊濱此前任職于華為,曾在2008年赴美組建華為處理器團隊,2012年回國后主導華為無線基帶算法與芯片部門。楊濱在一檔播客中曾表示,他早前已看好LPU這一架構路徑,但直到2025年初DeepSeek-R1技術報告發(fā)布,才真正堅定了下場創(chuàng)業(yè)的決心?!罢撐慕o我觸動極大,大模型終于不是泡沫了,可用了。模型能力很強,成本降到了大家可以使用的階段。那天晚上我把論文看完,覺得終于可以下場了。”
LPU通常指面向大模型推理場景設計的專用架構,其核心在于通過優(yōu)化數(shù)據(jù)流、存儲與調度方式,讓數(shù)據(jù)在芯片內部“少繞路”,同時減少運行過程中的動態(tài)調度,從而提升響應速度并降低能耗。落地到產(chǎn)品側,元川微目前的規(guī)劃是,擬面向不同推理場景進行分層布局,包括面向數(shù)據(jù)中心和高端邊緣節(jié)點的推理芯片,強調高性能、復雜場景;以及面向大端側和邊緣側的推理方案,更側重連接能力以及面向行業(yè)場景的功能適配。短期內推理需求仍將主要集中在數(shù)據(jù)中心及部分邊緣節(jié)點,但隨著Agent、具身智能等應用逐步落地,推理負載將持續(xù)向終端側延伸,邊端有望成為下一階段的重要增長點。
思格新能今日敲鐘上市,截至發(fā)稿,股價漲76%,市值超1400億港元
2026-04-16 18:19:29華為老兵許映童做儲能年入90億周末,所有平臺都被一只“龍蝦”刷屏了。3月6日,近千名開發(fā)者和AI愛好者將深圳騰訊大廈的門口圍得水泄不通,求著騰訊云工程師免費幫忙安裝OpenClaw
2026-03-10 20:16:28普通人要不要養(yǎng)龍蝦