你可能沒聽說過“詞元”這個詞,但你幾乎一定用過它,或許對它的英文名更熟悉——Token。
今天上午,國務院新聞辦公室舉行新聞發(fā)布會,介紹第九屆數(shù)字中國建設峰會有關情況。國家數(shù)據(jù)局局長劉烈宏透露,截至今年3月,我國日均Token調用量已超過140萬億。他特意補充了一句——“也就是詞元的調用量”。
不少業(yè)內人士認為這是一個標志性時刻:Token這個AI領域最核心的技術術語終于有了官方認可的中文名字。
140萬億是什么概念?Token又是什么?為什么它的調用量會被官方當作一個關鍵指標來發(fā)布?這些問題正悄悄揭開一個屬于普通人的新世界。
什么是詞元(Token)?國家數(shù)據(jù)局表示,詞元是大模型處理信息的“最小信息單元”,具備可計量、可定價、可交易的核心特征。
對于不常接觸AI領域的人來說,這段話還是有些抽象??梢赃@樣理解:如果把大模型比作一個超級大廚,把要處理的信息比作食材,那么詞元就是大廚眼中“一口能吃掉的最小單位”。詞元是AI理解和生成信息的最小計量單位。你問AI一個問題,它“吃”進去多少個詞元,又“吐”出來多少個詞元,就是它的工作量。
也可以把Token想象成AI世界里的“字”或“詞”,是對文字、符號甚至圖片的一小段信息的切分結果。比如你跟AI說一句話:“今天天氣不錯?!痹贏I內部,這句話會被拆成幾個詞元:“今”“天”“天氣”“不”“錯”“?!边@些詞元就是AI用來理解和生成內容的“最小磚塊”。AI不會直接讀整句話,而是按詞元為單位去計算、匹配、生成。
此外,你可以把詞元理解成AI的“積木”:不管是文字、語音、圖片、視頻,AI都會先把內容拆成一個個“詞元積木”,再用這些積木拼接、推理、生成結果。詞元就是人工智能理解和生成人類語言的“樂高積木”或“原子”。當我們人類讀書看報時,看到的是一個個字、一個個詞。但AI的“大腦”是計算機,它看不懂人類的文字,只能處理數(shù)字。因此,需要把人類的一句話切碎成一小塊一小塊的“基本單元”,然后再喂給AI。這個“基本單元”就是詞元“Token”。
你可能沒聽說過“詞元”這個詞,但你幾乎一定用過它。你或許對它的英文名更熟悉——Token。今天上午,國務院新聞辦公室舉行新聞發(fā)布會,介紹第九屆數(shù)字中國建設峰會有關情況
2026-03-26 15:34:26Token有官方中文名了在AI熱潮中,Token這一概念逐漸受到關注。它不僅是大模型調用量的評估標準,也是大模型廠商銷售套餐的計費單位
2026-03-24 22:24:39Token中文名定了在AI熱潮中,Token這一概念的地位逐漸凸顯。它不僅是大模型調用量的評估標準,也是大模型廠商銷售套餐的計費單位
2026-03-25 11:28:49Token翻譯為詞元"據(jù)央視報道,截至3月15日,中國AI大模型的周調用量達到4.69萬億Token,連續(xù)第二周超越美國,全球調用量排名前三的位置被中國模型包攬
2026-03-24 20:17:15AI大模型的Token到底是什么