4月8日,智譜公布了今年以來的第三次提價(jià)計(jì)劃,發(fā)布新一代旗艦?zāi)P虶LM-5.1的同時(shí)提價(jià)10%,而其距離上次調(diào)價(jià)30%起僅一個(gè)月。
但除智譜外,騰訊、阿里等也接連停止免費(fèi)公測(cè),提高API調(diào)用價(jià)格,其中,騰訊混元大模型最高漲價(jià)463%。與2025年降價(jià)、免費(fèi)試用相對(duì),目前明顯的信號(hào)是,國(guó)產(chǎn)AI大模型正在進(jìn)入集體漲價(jià)的時(shí)代。
Token變得更加緊俏。對(duì)于普通用戶而言,能直觀感受到的是免費(fèi)額度正在收緊。大模型Chat產(chǎn)品開始限制提問次數(shù)以及附件識(shí)別字符,“7.9元”、“一杯奶茶錢”等嘗鮮宣傳的首月優(yōu)惠套餐也逐步悄然下架。
對(duì)于開發(fā)人員而言,各家大模型API調(diào)用價(jià)格都在上漲,Coding Plan是更具性價(jià)比的選擇,但其具體額度消耗標(biāo)準(zhǔn)也在出現(xiàn)變化,從以prompt次數(shù)為基準(zhǔn)轉(zhuǎn)向以模型調(diào)用次數(shù)或Token為計(jì)費(fèi)基準(zhǔn)。
Prompt意味著一次提示指令,即給AI傳達(dá)的一次任務(wù),而一次指令通常會(huì)觸發(fā)多次模型調(diào)用。以阿里云百煉提供的信息作為參考,簡(jiǎn)單任務(wù)約消耗5~10次,復(fù)雜任務(wù)約10~30+次,實(shí)際消耗受任務(wù)難度、上下文及工具使用影響。
特別是在Agent場(chǎng)景中。智譜CEO張鵬此前在中關(guān)村論壇上表示,完成一個(gè)Agent任務(wù)所需要的Token量,可能是回答一個(gè)簡(jiǎn)單問題時(shí)的十倍甚至百倍。
大模型商們把賬算得更細(xì)了,要求用戶需要對(duì)更高水平的“數(shù)字員工”支付匹配的價(jià)格。1月30日,Kimi公布稱Coding plan將從基于prompt請(qǐng)求切換至基于Token計(jì)費(fèi)方式;3月20日,阿里云百煉暫停Lite套餐訂購(gòu);3月23日,Minimax也將Prompt基準(zhǔn)改為模型調(diào)用次數(shù)。
Coding plan甚至一度出現(xiàn)“限購(gòu)”現(xiàn)象,智譜從1月下旬便公告稱將試行限量發(fā)售GLM Coding Plan,限售后每日可銷售量降為當(dāng)前的20%,引發(fā)用戶蹲點(diǎn)搶購(gòu)。但這也許并不是大模型商們的饑餓營(yíng)銷,而是算力突發(fā)告急。
漲價(jià)潮正在向上游AI算力層蔓延。4月9日,騰訊云公告將于2026年5月9日起進(jìn)行調(diào)價(jià),AI算力相關(guān)產(chǎn)品服務(wù)費(fèi)用上調(diào)5%;容器服務(wù)TKE-原生節(jié)點(diǎn)相關(guān)產(chǎn)品服務(wù)費(fèi)用上調(diào)5%;彈性MapReduce(EMR)相關(guān)產(chǎn)品服務(wù)費(fèi)用上調(diào)5%。