這個問題在商業(yè)層面已經產生了真實沖突。2026年4月初,Anthropic停止了訂閱用戶通過OpenClaw等第三方工具接入ClaudeAPI的許可。Anthropic官方解釋稱,部分重度用戶每月僅支付200美元訂閱費,卻消耗了價值5000美元的算力資源,給公司帶來巨大成本壓力。一個OpenClaw代理運行一天,消耗的算力成本在1000美元到5000美元之間,受影響用戶需切換至按用量付費的API模式。
火山引擎總裁譚待在接受媒體采訪時指出,目前探索中的Token有一大半都是無謂的探索。很多用戶反饋智能體產品Token消耗快,核心問題不是單Token貴,而是它完成任務時的大量無效嘗試——為了找到最終解法,超過一半的Token都消耗在探索中。如果單Token成本低但模型能力不足,需要消耗10倍甚至20倍的Token還無法完成任務,最終只會造成更大的浪費。
智能體的普及正在以遠超預期的速度消耗算力資源,現有的計費體系和效率管理機制仍有完善空間。小米集團MiMo負責人羅福莉在社交平臺發(fā)文指出,從宏觀角度看,全球計算資源增長的腳步已跟不上Agent帶來的Token需求增長。真正的出路不是提供更便宜的Token,而是讓“更高效的Agent框架”與“更強大且更高效的模型”協同演進。
當前,推理正在取代訓練成為算力消耗的主戰(zhàn)場。德勤在2026年1月發(fā)布的《2026科技、傳媒和電信行業(yè)預測》報告中指出,2026年AI推理將占算力三分之二,主要在近5000億美元新數據中心及企業(yè)服務器進行。推理算力需求占比近七成之后,競爭規(guī)則正在改寫。單Token成本、部署密度、能效比取代單純峰值算力,成為客戶選型的關鍵考量因素。
與此同時,算力供給的結構性缺口正在放大。根據半導體研究機構SemiAnalysis發(fā)布的數據,H100一年期租賃合同價格從2025年10月的低點1.70美元/小時/GPU飆升至2026年3月的2.35美元/小時/GPU,漲幅近40%。盡管價格上漲,相關GPU租賃容量已全部售罄,2026年初尋找新GPU算力資源的難度被比喻為“預訂最后一班航班的機票”,不僅價格高昂且?guī)缀鯚o余量可選。
傅里葉變換是頻率的翻譯器,可將聲音、圖像等復雜信號轉換為頻率語言,在科學和工程領域應用廣泛
2026-01-10 17:36:19中國科學家創(chuàng)出新計算架構提升算力