OpenClaw為何讓Token消耗失控 指數(shù)級(jí)增長(zhǎng)引發(fā)關(guān)注。最近,全球AI圈都在被一個(gè)詞震撼——OpenClaw(龍蝦)。在國(guó)內(nèi),上門安裝“龍蝦”成了暴利生意,幾天就能賺26萬(wàn);在海外,紐約、曼谷等城市甚至出現(xiàn)了“龍蝦教”,成百上千的“龍蝦教徒”搶爆線下活動(dòng)門票,把場(chǎng)地圍得水泄不通。

用戶真正用上OpenClaw后發(fā)現(xiàn),它還沒開始掙錢,就先耗空了錢包。有程序員養(yǎng)“龍蝦”,日消耗數(shù)千萬(wàn)到上億Token;更有重度使用者一天就消耗10億Token,花費(fèi)數(shù)千美元。因此,中國(guó)的Token出海正成為一項(xiàng)新產(chǎn)業(yè)。在全球最大的AI API聚合平臺(tái)OpenRouter上,剛過去的2月,MiniMax的M2.5、月之暗面的Kimi K2.5、DeepSeek的V3.2三款國(guó)產(chǎn)模型的Token消耗量躋身全球前五;平臺(tái)前十模型的總Token消耗約38.2萬(wàn)億,其中中國(guó)模型獨(dú)占17.3萬(wàn)億,占比45%。

盡管OpenRouter主要聚集了全球的個(gè)人開發(fā)者,在全球AI支出市場(chǎng)份額中只占很小比重,但這份Token消耗榜仍是中國(guó)AI大模型走向全球的最好注腳?!癟oken出?!边@一概念并非空洞敘事,而是中國(guó)大模型通過API形式向全球輸出推理服務(wù)的跨境商業(yè)模式。過去,人們?cè)u(píng)價(jià)一個(gè)模型,往往從參數(shù)、運(yùn)算以及各種榜單排名上去看,但這些維度仍停留在實(shí)驗(yàn)室視角;如今,當(dāng)AI智能體成為人們的助手、進(jìn)入應(yīng)用落地期,Token消耗成為衡量應(yīng)用規(guī)?;暮诵闹笜?biāo)。

或許正如一位行業(yè)分析師所言,2026年將成為AI算力敘事的分水嶺,從今年開始,市場(chǎng)對(duì)AI大模型只認(rèn)兩個(gè)指標(biāo)——你的Token生成速度是多少?你的百萬(wàn)Token成本是多少?

一個(gè)月前,AI圈的焦慮還是誰(shuí)能先用上OpenClaw。那時(shí),但凡一場(chǎng)OpenClaw相關(guān)的活動(dòng),就有上萬(wàn)乃至數(shù)萬(wàn)人圍觀;但凡一個(gè)技術(shù)社群,人們討論最多的就是誰(shuí)跑通了OpenClaw,誰(shuí)養(yǎng)起了“龍蝦”。好像誰(shuí)晚了一步,誰(shuí)就要被時(shí)代拋棄,被財(cái)富拋棄。然而當(dāng)?shù)谝慌浴褒埼r”的人開始真的用上它后,就被失控般的token消耗震驚:有程序員用OpenClaw做爬蟲測(cè)試,不到一天就花了近5000萬(wàn)Token;還有OpenClaw重度使用者(自動(dòng)寫論文、批量處理文件、持續(xù)監(jiān)控任務(wù)),一天消耗了1億token(約¥50-100);許多公司也開始將使用OpenClaw納入員工日常工作并考核,甚至給出¥100-1000不等的Token消耗補(bǔ)貼;近日獵豹移動(dòng)CEO傅盛也在直播中透露,他在OpenClaw上每天要花費(fèi)100多美元。

這些都是實(shí)實(shí)在在的真金白銀,而且一旦跑起來(lái)還不能停下,Token帶來(lái)的焦慮感似乎肉眼可見。就在3月6日,ChatGPT也發(fā)布最新的5.4版本,不僅擁有更強(qiáng)的工具調(diào)用和智能體工作流,據(jù)稱其電腦操作能力比肩人類,還將上下文長(zhǎng)度提升至1M。更長(zhǎng)的上下文,讓用戶的直接感受就是“貴”——有開發(fā)者拿它寫了半套OpenClaw,賬單就讓人心疼了,甚至隨便聊兩句下來(lái)一天就要十幾美元。
那為什么過去人們用AI對(duì)話時(shí)從來(lái)不提Token,而現(xiàn)在OpenClaw卻讓Token消耗失控了?要理解這種失控,需先看清智能體和傳統(tǒng)對(duì)話式AI的差別。傳統(tǒng)對(duì)話模型就像兩人的簡(jiǎn)單對(duì)話,用戶提問-模型回答,過程中的Token消耗是離散的、短暫的,一次頂多幾千、上萬(wàn);但OpenClaw這類自主智能體,則像一位全天候在崗的數(shù)字員工,它在你的指令下即要拆解目標(biāo)、規(guī)劃步驟,還要調(diào)用工具、檢查結(jié)果,并且根據(jù)結(jié)果反饋再回退重試、自動(dòng)循環(huán)……每一步都在消耗Token,每一輪對(duì)話都在放大成本——就像是個(gè)沒有開關(guān)的水龍頭,一次流淌百萬(wàn)、千萬(wàn)個(gè)Token都不在話下。因此,這種Token的消耗增長(zhǎng)已不是線性的,而是指數(shù)級(jí)的。
IDC的數(shù)據(jù)更讓人震驚:到2030年,全球活躍AI智能體將達(dá)22.16億,年度Token消耗量將從2025年的0.0005 PetaTokens飆升至152,667 PetaTokens——增長(zhǎng)超3億倍。這些消耗的Token,就是實(shí)實(shí)在在的金錢。“過去用AI大模型,可能我的日均消耗量就幾十塊錢,還不用在乎;但現(xiàn)在的日均消耗變成幾百塊錢,而且在某些情況下我其實(shí)不需要非得用頭部模型,我可以根據(jù)不同任務(wù)適配不同的模型?!睙o(wú)問芯穹首席解決方案架構(gòu)師劉川林稱。
這種情況下,中國(guó)模型在Token成本上的優(yōu)勢(shì)顯而易見。以Anthropic為例,其最新旗艦?zāi)P虲laude Sonnet 4.6的每百萬(wàn)Token輸出15美元;而MiniMax最新的M2.5模型海外定價(jià)Lightning版本百萬(wàn)Token輸出為2.4美元,不足前者的1/6。3月2日晚間,MiniMax披露了上市后的首份財(cái)報(bào)。根據(jù)財(cái)務(wù)數(shù)據(jù),其M2系列文本模型在2026年2月的單日Token消耗量已增長(zhǎng)至2025年12月的超6倍;其中來(lái)自編程套餐(Coding Plan)的Token消耗量增長(zhǎng)超過10倍。而今年春節(jié)前后,Kimi也憑著旗下K2.5大模型的優(yōu)秀性能和低成本,獲得大量全球付費(fèi)用戶及API調(diào)用,20天收入就超過2025年全年總收入。
過去,中國(guó)AI大模型在海外開源社區(qū)靠刷榜贏得贊譽(yù);如今,我們靠著實(shí)打?qū)嵉腡oken成本優(yōu)勢(shì),讓海外AI開發(fā)者用腳投票。盡管近幾周的OpenRouter周榜上,中國(guó)模型幾乎霸占前五,但OpenRouter的主要用戶還是全球個(gè)人開發(fā)者、獨(dú)立黑客和初創(chuàng)公司,它們?cè)谌駻I支出中的市場(chǎng)份額也僅占2%左右,真正的流量大頭還是那些財(cái)富 500 強(qiáng)企業(yè)、大型 SaaS廠商(如 Salesforce、Microsoft),它們消耗了全球90%以上的Token,但不會(huì)通過OpenRouter調(diào)用模型,而是直接對(duì)接像OpenAI、Anthropic這樣的官方API或通過Azure/AWS來(lái)托管。
此外,像ChatGPT、Gemini以及Claude這種AI巨頭,它們絕大部分的流量是在自家閉源生態(tài)內(nèi)運(yùn)行,也不經(jīng)過 OpenRouter。盡管這些都是閉源模型,但從一些披露的信息中也可見端倪。根據(jù)微軟Azure的披露,2025年6月,僅Azure OpenAI的日均調(diào)用量就達(dá)4.4萬(wàn)億Tokens,按月算其調(diào)用量更是超過130萬(wàn)億Tokens;而2025年7月谷歌披露的月度Token使用量更是高達(dá)960萬(wàn)億,是Azure OpenAI的7倍以上。因此,即使OpenRouter顯示的Token消耗高峰周(接近18萬(wàn)億),也只是Azure OpenAI 4天的Token消耗量。
因此,OpenRouter的榜單數(shù)據(jù)更多說明,中國(guó)大模型的Token主要滿足了那些追求低成本開發(fā)者的需求,而沒有進(jìn)入最廣闊的全球企業(yè)級(jí)AI市場(chǎng)。今天,DeepSeek、Qwen等中國(guó)模型已經(jīng)在海外開源模型拿下過半市場(chǎng)份額,為何進(jìn)不了更大海外企業(yè)級(jí)市場(chǎng)?這是因?yàn)?,一方面歐美科技巨頭在海外市場(chǎng)布局比中國(guó)企業(yè)更早、更深,微軟的Azure、谷歌的Google Cloud、亞馬遜的AWS都已在全球市場(chǎng)扎根數(shù)十年,形成了牢固的企業(yè)生態(tài),而今天AI與云計(jì)算已經(jīng)深度綁定,自然它們更容易拿下已打下基礎(chǔ)的企業(yè)級(jí)市場(chǎng)。另一方面,隨著科技發(fā)展、地緣緊張,數(shù)據(jù)主權(quán)成為國(guó)家安全的重要部分,歐美企業(yè)(尤其是金融、醫(yī)療、政府)對(duì)數(shù)據(jù)的合規(guī)和安全極其敏感,因此他們也更傾向與本國(guó)的云、AI廠商合作。
不過,這一歐美企業(yè)筑起的圍墻,正開始出現(xiàn)裂痕。2025年10月,Airbnb CEO布萊恩表示,公司正“大量依賴阿里巴巴的通義千問模型”,“我們也會(huì)使用OpenAI的最新模型,但通常不會(huì)在生產(chǎn)環(huán)境中大量使用,因?yàn)橛懈?、更便宜的模型可供選擇?!碑?dāng)年9月,德國(guó)的梅賽德斯-奔馳與字節(jié)跳動(dòng)合作,涉及豆包大模型、AI 云原生算法、智駕云等,豆包也就順勢(shì)“坐”上了奔馳。再往前,寶馬、SAP也均與通義千問大模型合作。
隨著AI對(duì)傳統(tǒng)企業(yè)的“逼迫”加劇,許多歐美企業(yè)在向AI轉(zhuǎn)型時(shí)已表現(xiàn)出“誰(shuí)便宜用誰(shuí)”的傾向。而中國(guó)AI大模型則憑借性價(jià)比優(yōu)勢(shì)打開局面——這可能是中國(guó)AI模型未來(lái)通過“被集成”方式(作為幕后廉價(jià)算力提供商)滲透進(jìn)全球SaaS生態(tài)的最好機(jī)會(huì)。
接著又來(lái)了新問題——為什么中國(guó)大模型能走性價(jià)比路線?浪潮信息首席AI戰(zhàn)略官劉軍曾表示:Token成本不是財(cái)務(wù)問題,是戰(zhàn)略問題。誰(shuí)能把成本壓下來(lái),誰(shuí)就拿到了智能體規(guī)?;娜雸?chǎng)券。Token成本≈模型一次 “思考” 的電費(fèi)+芯片折舊費(fèi)。其中,芯片折舊費(fèi)是單次購(gòu)買,然后隨著每一次計(jì)算再不斷折舊;而電力是數(shù)據(jù)中心持續(xù)運(yùn)轉(zhuǎn)的燃料。我們?cè)辔粩?shù)據(jù)中心從業(yè)者交流,通常一個(gè)數(shù)據(jù)中心運(yùn)營(yíng)成本中,電費(fèi)要占50%以上,一個(gè)大型AI數(shù)據(jù)中心的年電力賬單可達(dá)數(shù)億美元。
從Token成本的構(gòu)成看——芯片折舊拼的是產(chǎn)業(yè)創(chuàng)新,而電費(fèi)拼的是國(guó)運(yùn)級(jí)基礎(chǔ)設(shè)施。而說到電力,全球范圍內(nèi)幾乎只有中國(guó)的電力供應(yīng)和電力設(shè)施是最完善的。美國(guó)則因越來(lái)越大的數(shù)據(jù)中心電力消耗,正在引發(fā)電荒。今年2月初,美國(guó)紐約州議員提出法案,要暫停發(fā)放數(shù)據(jù)中心新建及運(yùn)營(yíng)相關(guān)許可證,暫停令為期三年。原因是紐約州數(shù)據(jù)中心總數(shù)已超過130座,由于數(shù)據(jù)中心耗電巨大,有高達(dá)10吉瓦的用電需求正在排隊(duì)接入電網(wǎng),短短一年內(nèi)這一數(shù)字增長(zhǎng)了3倍。因此,紐約州州長(zhǎng)開始要求數(shù)據(jù)中心“承擔(dān)其應(yīng)承擔(dān)的成本”。
除了紐約外,美國(guó)其他多個(gè)州也開始對(duì)數(shù)據(jù)中心單獨(dú)收取更高的電費(fèi),甚至還要求數(shù)據(jù)中心提供長(zhǎng)期承諾和財(cái)務(wù)抵押擔(dān)保。這背后并不是因?yàn)槊绹?guó)真的缺電(美國(guó)總發(fā)電容量是超過總用電量的),而是因?yàn)楹芏嗝绹?guó)電力設(shè)施已經(jīng)老舊,無(wú)法承受AI訓(xùn)練全年無(wú)休、滿負(fù)荷運(yùn)行的高負(fù)荷強(qiáng)度。由于美國(guó)電力分配不均,而且數(shù)據(jù)中心的接入速度遠(yuǎn)大于發(fā)電建設(shè)速度,因此老舊的電力設(shè)施卡住了數(shù)據(jù)中心的脖子。這種結(jié)構(gòu)性問題,短時(shí)間內(nèi)難以解決,因此倒逼著一些大型數(shù)據(jù)中心自建電站,并承擔(dān)電網(wǎng)升級(jí)的費(fèi)用,也因此抬高了AI企業(yè)的算力成本。
反觀中國(guó),過去幾年中國(guó)已悄悄從頂層設(shè)計(jì)上布下一張大棋。2020年國(guó)家推出新基建,將AI算力、特高壓等作為新型基礎(chǔ)設(shè)施提前布局,建成了一張全球規(guī)模最大、穩(wěn)定性最強(qiáng)、新能源消納能力最強(qiáng)的交直流混聯(lián)大電網(wǎng),也是全球唯一實(shí)現(xiàn)特高壓大規(guī)模商業(yè)化運(yùn)營(yíng)的電網(wǎng)。這種穩(wěn)定性,幾乎可以避免大規(guī)模停電的情況,讓大模型的訓(xùn)練/推理不會(huì)因斷電而廢掉進(jìn)度;而且容量超大,想擴(kuò)卡就能擴(kuò),不會(huì)被電網(wǎng)容量卡脖子。
2022年,國(guó)家再落下一子——推出東數(shù)西算工程,將東部算力需求引導(dǎo)到綠色電力資源豐富的西部。換句話說,這就是讓最耗電的AI數(shù)據(jù)中心離擁有最便宜電力的地方最近。這使得AI數(shù)據(jù)中心的運(yùn)營(yíng)成本直接降低了30%-50%。2025年,國(guó)家又在雅魯藏布江下游投入1.2萬(wàn)億元布局雅江水電站,這將是全球最大的水電項(xiàng)目,建成后其年發(fā)電量約3000億千瓦時(shí),可滿足全國(guó)約3%的電力需求。這將把西部的電力成本再往下拉一大截。
至此,Token成本的“西升東降”格局已然清晰——在未來(lái)海量智能體同時(shí)在線的世界,中國(guó)可以用最低成本的Token把AI服務(wù)輸送到全世界。當(dāng)算力不再被電力束縛,中國(guó)AI出海的想象空間,才真正開始打開。
在AI熱潮中,Token這一概念的地位逐漸凸顯。它不僅是大模型調(diào)用量的評(píng)估標(biāo)準(zhǔn),也是大模型廠商銷售套餐的計(jì)費(fèi)單位
2026-03-25 11:28:49Token翻譯為詞元"