國內(nèi)云計算進(jìn)入“算力通脹”時代。4月15日,阿里云宣布自7月15日起,DDoS高防(中國內(nèi)地)彈性95費用上調(diào)50%,從每兆瓦月100元漲至150元。這是阿里云一個月內(nèi)第三次調(diào)價。騰訊云、百度智能云也同步跟進(jìn)。騰訊云4月9日宣布AI算力、容器、EMR全線上調(diào)5%;百度智能云AI算力與存儲上調(diào)5%~30%。這一輪全球漲價潮由海外率先引爆——亞馬遜AWS年初率先上調(diào)AI算力價格,谷歌云隨后跟進(jìn),最高漲幅達(dá)100%。
漲價背后最根本的驅(qū)動力是Token消耗的爆發(fā)式增長。國家數(shù)據(jù)局局長劉烈宏在3月24日的國新辦新聞發(fā)布會上披露,到今年3月,我國日均Token的調(diào)用量已超過140萬億,相比2024年初的1000億增長了1000多倍,相比2024年底的100萬億,三個月時間又增長了40%多。對于“Token”,國家數(shù)據(jù)局已正式將其定名為“詞元”。它正從AI技術(shù)的計量單位,加速轉(zhuǎn)變?yōu)橹悄軙r代的產(chǎn)業(yè)“貨幣”,其消耗規(guī)模的激增直接推高了算力需求,進(jìn)而帶動云計算服務(wù)價格上漲。
OpenClaw是這輪Token需求爆發(fā)的核心因素之一。據(jù)OpenRouter平臺數(shù)據(jù),2026年3月16日至22日當(dāng)周,平臺接近四分之一的Token消耗由OpenClaw貢獻(xiàn)。另據(jù)國金證券計算機(jī)行業(yè)周報,截至2026年3月9日至15日的周度數(shù)據(jù),OpenRouter平臺內(nèi)20%的Token消耗由OpenClaw貢獻(xiàn),OpenClaw單周Token消耗量已相當(dāng)于2025年第四季度全平臺周均Token消耗量的60%。
Token消耗量的快速攀升暴露了一個深層矛盾:消耗量增長并不等同于智能水平同步提升。智能體與傳統(tǒng)Chatbot的業(yè)務(wù)邏輯存在本質(zhì)差異。傳統(tǒng)Chatbot遵循用戶提問到模型回答的單輪交互模式,Token消耗與對話輪次呈線性關(guān)系。而智能體具備感知、決策、執(zhí)行的閉環(huán)能力,需要自主拆解復(fù)雜任務(wù)、調(diào)用外部工具、多輪迭代驗證,直至任務(wù)完成。這種業(yè)務(wù)邏輯的差異直接導(dǎo)致了Token消耗量的數(shù)量級放大。
這個問題在商業(yè)層面已經(jīng)產(chǎn)生了真實沖突。2026年4月初,Anthropic停止了訂閱用戶通過OpenClaw等第三方工具接入ClaudeAPI的許可。Anthropic官方解釋稱,部分重度用戶每月僅支付200美元訂閱費,卻消耗了價值5000美元的算力資源,給公司帶來巨大成本壓力。一個OpenClaw代理運行一天,消耗的算力成本在1000美元到5000美元之間,受影響用戶需切換至按用量付費的API模式。
火山引擎總裁譚待在接受媒體采訪時指出,目前探索中的Token有一大半都是無謂的探索。很多用戶反饋智能體產(chǎn)品Token消耗快,核心問題不是單Token貴,而是它完成任務(wù)時的大量無效嘗試——為了找到最終解法,超過一半的Token都消耗在探索中。如果單Token成本低但模型能力不足,需要消耗10倍甚至20倍的Token還無法完成任務(wù),最終只會造成更大的浪費。
智能體的普及正在以遠(yuǎn)超預(yù)期的速度消耗算力資源,現(xiàn)有的計費體系和效率管理機(jī)制仍有完善空間。小米集團(tuán)MiMo負(fù)責(zé)人羅福莉在社交平臺發(fā)文指出,從宏觀角度看,全球計算資源增長的腳步已跟不上Agent帶來的Token需求增長。真正的出路不是提供更便宜的Token,而是讓“更高效的Agent框架”與“更強(qiáng)大且更高效的模型”協(xié)同演進(jìn)。
當(dāng)前,推理正在取代訓(xùn)練成為算力消耗的主戰(zhàn)場。德勤在2026年1月發(fā)布的《2026科技、傳媒和電信行業(yè)預(yù)測》報告中指出,2026年AI推理將占算力三分之二,主要在近5000億美元新數(shù)據(jù)中心及企業(yè)服務(wù)器進(jìn)行。推理算力需求占比近七成之后,競爭規(guī)則正在改寫。單Token成本、部署密度、能效比取代單純峰值算力,成為客戶選型的關(guān)鍵考量因素。
與此同時,算力供給的結(jié)構(gòu)性缺口正在放大。根據(jù)半導(dǎo)體研究機(jī)構(gòu)SemiAnalysis發(fā)布的數(shù)據(jù),H100一年期租賃合同價格從2025年10月的低點1.70美元/小時/GPU飆升至2026年3月的2.35美元/小時/GPU,漲幅近40%。盡管價格上漲,相關(guān)GPU租賃容量已全部售罄,2026年初尋找新GPU算力資源的難度被比喻為“預(yù)訂最后一班航班的機(jī)票”,不僅價格高昂且?guī)缀鯚o余量可選。
緊張的并不只有GPU。據(jù)報道,2026年3月下旬,英特爾與AMD相繼通知客戶上調(diào)處理器價格。過去幾個月,CPU作為AI服務(wù)器調(diào)度與推理核心被云廠商大量采購,兩大巨頭2026年服務(wù)器CPU產(chǎn)能目前已基本售罄。頭部互聯(lián)網(wǎng)公司正在大幅加碼資本支出。財報數(shù)據(jù)顯示,騰訊資本支出在2024年迅速增加到768億元,同比增長221%,2025年進(jìn)一步增至792億元;阿里巴巴資本支出從2023年244億元增長至2025年的1039億元,突破千億。據(jù)媒體公開報道,字節(jié)跳動2026年資本支出計劃約1600億元,約一半投向AI芯片和數(shù)據(jù)中心。
算力緊張的另一個側(cè)面是中國AI芯片市場格局正在發(fā)生深刻變化。據(jù)IDC數(shù)據(jù),2025年中國市場AI加速卡總出貨量約為400萬張。英偉達(dá)出貨約220萬張,市場份額55%;AMD出貨約16萬張,市場份額4%。中國本土廠商合計出貨約165萬張,市場份額約41%。在中國廠商陣營中,華為處于領(lǐng)先地位。據(jù)IDC數(shù)據(jù),2025年華為出貨約81.2萬顆AI芯片,約占整體市場20%,接近國內(nèi)供應(yīng)商總出貨的一半。阿里巴巴旗下平頭哥以約26.5萬顆居次,市場份額約7%。百度昆侖芯與寒武紀(jì)各約11.6萬顆,并列第三。
中信證券指出,Agent和多模態(tài)等應(yīng)用爆發(fā)驅(qū)動Token調(diào)用量井噴,進(jìn)而導(dǎo)致國內(nèi)算力荒,國產(chǎn)大模型在推理端積極適配為國產(chǎn)算力廠商帶來加速放量機(jī)遇,預(yù)計2026年國產(chǎn)算力芯片出貨量至少實現(xiàn)翻倍以上增長,將為算力設(shè)計公司、先進(jìn)制程、先進(jìn)封裝、先進(jìn)存儲以及配套產(chǎn)業(yè)鏈帶來強(qiáng)勁增長動能。本土廠商的崛起,正在逐步改變中國AI芯片市場的供給格局,為緩解算力缺口提供了新的可能。
Token經(jīng)濟(jì)的最后一塊拼圖是商業(yè)模式。當(dāng)Token消耗量從萬億級邁向百萬億級,如何定價、如何收費,直接關(guān)系到產(chǎn)業(yè)的商業(yè)閉環(huán)能否跑通。回顧行業(yè)發(fā)展,2024年下半年至2025年初,中國大模型市場深陷價格戰(zhàn),字節(jié)豆包報價低至0.0008元/千Tokens,智譜自己也曾將GLM-4-Plus大幅降價。但這一格局在2026年正在發(fā)生根本性變化。智譜成為國產(chǎn)頭部模型廠商中首個在推出新模型的同時,執(zhí)行實質(zhì)性提價的公司。2月發(fā)布GLM-5時,CodingPlan套餐價格上調(diào)30%起,3月發(fā)布GLM-5-Turbo時再漲20%,相對GLM-4.7累計漲幅達(dá)83%。
漲價并未抑制需求。據(jù)智譜公開披露,2026年一季度API調(diào)用定價提升了83%,調(diào)用量反而增長400%。智譜MaaSAPI平臺ARR約17億元,在過去12個月提升60倍。截至2026年3月,平臺注冊用戶已突破400萬,覆蓋全球218個國家和地區(qū)。智譜CEO張鵬表示,當(dāng)模型足夠強(qiáng),API本身就是最好的商業(yè)模式,定價權(quán)是由技術(shù)實力以及長期趨勢所帶來的領(lǐng)先地位決定的。
當(dāng)前,Token計費正成為行業(yè)標(biāo)準(zhǔn)。今年3月,劉烈宏在中國發(fā)展高層論壇年會上指出,一套以詞元(Token)計費為基礎(chǔ)的新型商業(yè)邏輯正在加速演進(jìn),圍繞詞元的調(diào)用、分發(fā)與結(jié)算,一套新的價值體系正在加速形成。但Token定價面臨的真正難題不在于收費標(biāo)準(zhǔn),而在于智能體場景下的Token消耗目前高度不可預(yù)測。與電力或鋼鐵等傳統(tǒng)生產(chǎn)要素不同,Token具備獨特的可編程性。英偉達(dá)創(chuàng)始人兼CEO黃仁勛在2026年3月的一篇署名文章中,將Token定義為現(xiàn)代AI的基本單位,并指出它同時具有兩種屬性:作為語言,它是計算過程的原子;作為貨幣,它是價值流通的媒介。
譚待在受訪時指出,判斷行業(yè)階段可以用終局倒推——看所有Tokens未來能產(chǎn)生的收入規(guī)模,再對比當(dāng)前全球行業(yè)的實際收入,可以看出所處位置。目前OpenAI、Anthropic等企業(yè)的收入已知,全球行業(yè)收入大概是這些企業(yè)收入的三倍。整體來看,AI算力與Token經(jīng)濟(jì)仍處于極早期階段,定價機(jī)制、效率管理、供給能力等方面,仍有巨大的完善和提升空間。
傅里葉變換是頻率的翻譯器,可將聲音、圖像等復(fù)雜信號轉(zhuǎn)換為頻率語言,在科學(xué)和工程領(lǐng)域應(yīng)用廣泛
2026-01-10 17:36:19中國科學(xué)家創(chuàng)出新計算架構(gòu)提升算力