
過(guò)去幾年,企業(yè)在采購(gòu)AI基礎(chǔ)設(shè)施時(shí)主要關(guān)注GPU型號(hào)、FLOPS和顯存規(guī)模。然而,隨著AI Coding、數(shù)字員工、企業(yè)知識(shí)庫(kù)和智能體應(yīng)用逐漸進(jìn)入業(yè)務(wù)流程,企業(yè)真正消耗的是源源不斷的Token。這意味著,企業(yè)買GPU只是起點(diǎn)。后續(xù)的GPU利用率、推理時(shí)延、并發(fā)調(diào)用能力和長(zhǎng)期運(yùn)維成本都會(huì)直接影響AI投入回報(bào)。

TokenBox?通過(guò)CXL、PCIe Fabric等創(chuàng)新硬件加速技術(shù)和自研KV緩存卸載、智能稀疏等推理加速引擎技術(shù),實(shí)現(xiàn)軟硬協(xié)同優(yōu)化,顯著提升推理性能。在企業(yè)本地部署場(chǎng)景中,這種優(yōu)化直接提升了Token產(chǎn)出效率。很多企業(yè)雖然購(gòu)買了100%的GPU算力,但在實(shí)際業(yè)務(wù)中的Token產(chǎn)出效率可能不足40%。未來(lái),企業(yè)之間的AI差距可能不僅在于GPU數(shù)量,還在于誰(shuí)能更穩(wěn)定、更高效地將Token轉(zhuǎn)化為真實(shí)業(yè)務(wù)能力。

為了滿足辦公場(chǎng)景下的高算力需求,TokenBox?在硬件架構(gòu)上進(jìn)行了多項(xiàng)關(guān)鍵突破。它具備T級(jí)顯存和10P以上的AI算力,支持DeepSeek V4滿血版1.6T參數(shù)模型的高效運(yùn)行。采用DC級(jí)冷熱部署設(shè)計(jì)與先進(jìn)的液冷整機(jī)散熱體系,在主流業(yè)務(wù)負(fù)載下噪音低至35dB。此外,TokenBox?采用Pack模塊化架構(gòu),企業(yè)可根據(jù)業(yè)務(wù)需求靈活擴(kuò)展GPU、CPU、內(nèi)存和存儲(chǔ)資源。超聚變與博通聯(lián)合打造了全球首款PCIe Fabric Gen6產(chǎn)品TokenFabric?,支持從4卡到128卡的全互聯(lián)擴(kuò)展,徹底繞開(kāi)傳統(tǒng)CPU中轉(zhuǎn)帶來(lái)的延遲損耗。