
一個月前,AI圈的焦慮還是誰能先用上OpenClaw。那時,但凡一場OpenClaw相關的活動,就有上萬乃至數萬人圍觀;但凡一個技術社群,人們討論最多的就是誰跑通了OpenClaw,誰養(yǎng)起了“龍蝦”。好像誰晚了一步,誰就要被時代拋棄,被財富拋棄。然而當第一批吃“龍蝦”的人開始真的用上它后,就被失控般的token消耗震驚:有程序員用OpenClaw做爬蟲測試,不到一天就花了近5000萬Token;還有OpenClaw重度使用者(自動寫論文、批量處理文件、持續(xù)監(jiān)控任務),一天消耗了1億token(約¥50-100);許多公司也開始將使用OpenClaw納入員工日常工作并考核,甚至給出¥100-1000不等的Token消耗補貼;近日獵豹移動CEO傅盛也在直播中透露,他在OpenClaw上每天要花費100多美元。

這些都是實實在在的真金白銀,而且一旦跑起來還不能停下,Token帶來的焦慮感似乎肉眼可見。就在3月6日,ChatGPT也發(fā)布最新的5.4版本,不僅擁有更強的工具調用和智能體工作流,據稱其電腦操作能力比肩人類,還將上下文長度提升至1M。更長的上下文,讓用戶的直接感受就是“貴”——有開發(fā)者拿它寫了半套OpenClaw,賬單就讓人心疼了,甚至隨便聊兩句下來一天就要十幾美元。
那為什么過去人們用AI對話時從來不提Token,而現在OpenClaw卻讓Token消耗失控了?要理解這種失控,需先看清智能體和傳統(tǒng)對話式AI的差別。傳統(tǒng)對話模型就像兩人的簡單對話,用戶提問-模型回答,過程中的Token消耗是離散的、短暫的,一次頂多幾千、上萬;但OpenClaw這類自主智能體,則像一位全天候在崗的數字員工,它在你的指令下即要拆解目標、規(guī)劃步驟,還要調用工具、檢查結果,并且根據結果反饋再回退重試、自動循環(huán)……每一步都在消耗Token,每一輪對話都在放大成本——就像是個沒有開關的水龍頭,一次流淌百萬、千萬個Token都不在話下。因此,這種Token的消耗增長已不是線性的,而是指數級的。
IDC的數據更讓人震驚:到2030年,全球活躍AI智能體將達22.16億,年度Token消耗量將從2025年的0.0005 PetaTokens飆升至152,667 PetaTokens——增長超3億倍。這些消耗的Token,就是實實在在的金錢?!斑^去用AI大模型,可能我的日均消耗量就幾十塊錢,還不用在乎;但現在的日均消耗變成幾百塊錢,而且在某些情況下我其實不需要非得用頭部模型,我可以根據不同任務適配不同的模型?!睙o問芯穹首席解決方案架構師劉川林稱。
這種情況下,中國模型在Token成本上的優(yōu)勢顯而易見。以Anthropic為例,其最新旗艦模型Claude Sonnet 4.6的每百萬Token輸出15美元;而MiniMax最新的M2.5模型海外定價Lightning版本百萬Token輸出為2.4美元,不足前者的1/6。3月2日晚間,MiniMax披露了上市后的首份財報。根據財務數據,其M2系列文本模型在2026年2月的單日Token消耗量已增長至2025年12月的超6倍;其中來自編程套餐(Coding Plan)的Token消耗量增長超過10倍。而今年春節(jié)前后,Kimi也憑著旗下K2.5大模型的優(yōu)秀性能和低成本,獲得大量全球付費用戶及API調用,20天收入就超過2025年全年總收入。
過去,中國AI大模型在海外開源社區(qū)靠刷榜贏得贊譽;如今,我們靠著實打實的Token成本優(yōu)勢,讓海外AI開發(fā)者用腳投票。盡管近幾周的OpenRouter周榜上,中國模型幾乎霸占前五,但OpenRouter的主要用戶還是全球個人開發(fā)者、獨立黑客和初創(chuàng)公司,它們在全球AI支出中的市場份額也僅占2%左右,真正的流量大頭還是那些財富 500 強企業(yè)、大型 SaaS廠商(如 Salesforce、Microsoft),它們消耗了全球90%以上的Token,但不會通過OpenRouter調用模型,而是直接對接像OpenAI、Anthropic這樣的官方API或通過Azure/AWS來托管。
此外,像ChatGPT、Gemini以及Claude這種AI巨頭,它們絕大部分的流量是在自家閉源生態(tài)內運行,也不經過 OpenRouter。盡管這些都是閉源模型,但從一些披露的信息中也可見端倪。根據微軟Azure的披露,2025年6月,僅Azure OpenAI的日均調用量就達4.4萬億Tokens,按月算其調用量更是超過130萬億Tokens;而2025年7月谷歌披露的月度Token使用量更是高達960萬億,是Azure OpenAI的7倍以上。因此,即使OpenRouter顯示的Token消耗高峰周(接近18萬億),也只是Azure OpenAI 4天的Token消耗量。
因此,OpenRouter的榜單數據更多說明,中國大模型的Token主要滿足了那些追求低成本開發(fā)者的需求,而沒有進入最廣闊的全球企業(yè)級AI市場。今天,DeepSeek、Qwen等中國模型已經在海外開源模型拿下過半市場份額,為何進不了更大海外企業(yè)級市場?這是因為,一方面歐美科技巨頭在海外市場布局比中國企業(yè)更早、更深,微軟的Azure、谷歌的Google Cloud、亞馬遜的AWS都已在全球市場扎根數十年,形成了牢固的企業(yè)生態(tài),而今天AI與云計算已經深度綁定,自然它們更容易拿下已打下基礎的企業(yè)級市場。另一方面,隨著科技發(fā)展、地緣緊張,數據主權成為國家安全的重要部分,歐美企業(yè)(尤其是金融、醫(yī)療、政府)對數據的合規(guī)和安全極其敏感,因此他們也更傾向與本國的云、AI廠商合作。
不過,這一歐美企業(yè)筑起的圍墻,正開始出現裂痕。2025年10月,Airbnb CEO布萊恩表示,公司正“大量依賴阿里巴巴的通義千問模型”,“我們也會使用OpenAI的最新模型,但通常不會在生產環(huán)境中大量使用,因為有更快、更便宜的模型可供選擇?!碑斈?月,德國的梅賽德斯-奔馳與字節(jié)跳動合作,涉及豆包大模型、AI 云原生算法、智駕云等,豆包也就順勢“坐”上了奔馳。再往前,寶馬、SAP也均與通義千問大模型合作。
隨著AI對傳統(tǒng)企業(yè)的“逼迫”加劇,許多歐美企業(yè)在向AI轉型時已表現出“誰便宜用誰”的傾向。而中國AI大模型則憑借性價比優(yōu)勢打開局面——這可能是中國AI模型未來通過“被集成”方式(作為幕后廉價算力提供商)滲透進全球SaaS生態(tài)的最好機會。
接著又來了新問題——為什么中國大模型能走性價比路線?浪潮信息首席AI戰(zhàn)略官劉軍曾表示:Token成本不是財務問題,是戰(zhàn)略問題。誰能把成本壓下來,誰就拿到了智能體規(guī)?;娜雸鋈?。Token成本≈模型一次 “思考” 的電費+芯片折舊費。其中,芯片折舊費是單次購買,然后隨著每一次計算再不斷折舊;而電力是數據中心持續(xù)運轉的燃料。我們曾跟多位數據中心從業(yè)者交流,通常一個數據中心運營成本中,電費要占50%以上,一個大型AI數據中心的年電力賬單可達數億美元。
從Token成本的構成看——芯片折舊拼的是產業(yè)創(chuàng)新,而電費拼的是國運級基礎設施。而說到電力,全球范圍內幾乎只有中國的電力供應和電力設施是最完善的。美國則因越來越大的數據中心電力消耗,正在引發(fā)電荒。今年2月初,美國紐約州議員提出法案,要暫停發(fā)放數據中心新建及運營相關許可證,暫停令為期三年。原因是紐約州數據中心總數已超過130座,由于數據中心耗電巨大,有高達10吉瓦的用電需求正在排隊接入電網,短短一年內這一數字增長了3倍。因此,紐約州州長開始要求數據中心“承擔其應承擔的成本”。
除了紐約外,美國其他多個州也開始對數據中心單獨收取更高的電費,甚至還要求數據中心提供長期承諾和財務抵押擔保。這背后并不是因為美國真的缺電(美國總發(fā)電容量是超過總用電量的),而是因為很多美國電力設施已經老舊,無法承受AI訓練全年無休、滿負荷運行的高負荷強度。由于美國電力分配不均,而且數據中心的接入速度遠大于發(fā)電建設速度,因此老舊的電力設施卡住了數據中心的脖子。這種結構性問題,短時間內難以解決,因此倒逼著一些大型數據中心自建電站,并承擔電網升級的費用,也因此抬高了AI企業(yè)的算力成本。
反觀中國,過去幾年中國已悄悄從頂層設計上布下一張大棋。2020年國家推出新基建,將AI算力、特高壓等作為新型基礎設施提前布局,建成了一張全球規(guī)模最大、穩(wěn)定性最強、新能源消納能力最強的交直流混聯(lián)大電網,也是全球唯一實現特高壓大規(guī)模商業(yè)化運營的電網。這種穩(wěn)定性,幾乎可以避免大規(guī)模停電的情況,讓大模型的訓練/推理不會因斷電而廢掉進度;而且容量超大,想擴卡就能擴,不會被電網容量卡脖子。
2022年,國家再落下一子——推出東數西算工程,將東部算力需求引導到綠色電力資源豐富的西部。換句話說,這就是讓最耗電的AI數據中心離擁有最便宜電力的地方最近。這使得AI數據中心的運營成本直接降低了30%-50%。2025年,國家又在雅魯藏布江下游投入1.2萬億元布局雅江水電站,這將是全球最大的水電項目,建成后其年發(fā)電量約3000億千瓦時,可滿足全國約3%的電力需求。這將把西部的電力成本再往下拉一大截。
至此,Token成本的“西升東降”格局已然清晰——在未來海量智能體同時在線的世界,中國可以用最低成本的Token把AI服務輸送到全世界。當算力不再被電力束縛,中國AI出海的想象空間,才真正開始打開。
3月27日,小米宣布其自研大模型Xiaomi MiMo-V2-Pro在OpenRouter平臺最新周榜中位列第一,成為該平臺首個周Token消耗量超過3萬億的模型,市占率超過30%
2026-03-27 10:50:59小米MiMo成首個周token消耗超3萬億模型在AI熱潮中,Token這一概念的地位逐漸凸顯。它不僅是大模型調用量的評估標準,也是大模型廠商銷售套餐的計費單位
2026-03-25 11:28:49Token翻譯為詞元"昨晚,蔣興權、鞏曉彬、胡衛(wèi)東等中國籃球名宿齊聚北京五棵松體育館,現場見證中國男籃開啟2027年男籃世界杯預選賽征程。然而韓國隊的“三分雨”卻讓主場球迷的熱情迅速冷卻
2025-11-30 11:49:18中國男籃為何判若兩隊