超聚變推出企業(yè)級(jí)Token生產(chǎn)平臺(tái) 解鎖高效本地AI部署(2)

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2026-06-03 20:21:40 智東西

超聚變推出企業(yè)級(jí)Token生產(chǎn)平臺(tái) 解鎖高效本地AI部署

過(guò)去幾年，企業(yè)在采購(gòu)AI基礎(chǔ)設(shè)施時(shí)主要關(guān)注GPU型號(hào)、FLOPS和顯存規(guī)模。然而，隨著AI Coding、數(shù)字員工、企業(yè)知識(shí)庫(kù)和智能體應(yīng)用逐漸進(jìn)入業(yè)務(wù)流程，企業(yè)真正消耗的是源源不斷的Token。這意味著，企業(yè)買GPU只是起點(diǎn)。后續(xù)的GPU利用率、推理時(shí)延、并發(fā)調(diào)用能力和長(zhǎng)期運(yùn)維成本都會(huì)直接影響AI投入回報(bào)。

超聚變推出企業(yè)級(jí)Token生產(chǎn)平臺(tái) 解鎖高效本地AI部署

TokenBox?通過(guò)CXL、PCIe Fabric等創(chuàng)新硬件加速技術(shù)和自研KV緩存卸載、智能稀疏等推理加速引擎技術(shù)，實(shí)現(xiàn)軟硬協(xié)同優(yōu)化，顯著提升推理性能。在企業(yè)本地部署場(chǎng)景中，這種優(yōu)化直接提升了Token產(chǎn)出效率。很多企業(yè)雖然購(gòu)買了100%的GPU算力，但在實(shí)際業(yè)務(wù)中的Token產(chǎn)出效率可能不足40%。未來(lái)，企業(yè)之間的AI差距可能不僅在于GPU數(shù)量，還在于誰(shuí)能更穩(wěn)定、更高效地將Token轉(zhuǎn)化為真實(shí)業(yè)務(wù)能力。

超聚變推出企業(yè)級(jí)Token生產(chǎn)平臺(tái) 解鎖高效本地AI部署

為了滿足辦公場(chǎng)景下的高算力需求，TokenBox?在硬件架構(gòu)上進(jìn)行了多項(xiàng)關(guān)鍵突破。它具備T級(jí)顯存和10P以上的AI算力，支持DeepSeek V4滿血版1.6T參數(shù)模型的高效運(yùn)行。采用DC級(jí)冷熱部署設(shè)計(jì)與先進(jìn)的液冷整機(jī)散熱體系，在主流業(yè)務(wù)負(fù)載下噪音低至35dB。此外，TokenBox?采用Pack模塊化架構(gòu)，企業(yè)可根據(jù)業(yè)務(wù)需求靈活擴(kuò)展GPU、CPU、內(nèi)存和存儲(chǔ)資源。超聚變與博通聯(lián)合打造了全球首款PCIe Fabric Gen6產(chǎn)品TokenFabric?，支持從4卡到128卡的全互聯(lián)擴(kuò)展，徹底繞開(kāi)傳統(tǒng)CPU中轉(zhuǎn)帶來(lái)的延遲損耗。

首頁(yè)上一頁(yè)123 全文共 3 頁(yè)下一頁(yè)

關(guān)閉

超聚變推出企業(yè)級(jí)Token生產(chǎn)平臺(tái) 解鎖高效本地AI部署(2)

相關(guān)新聞

今日熱點(diǎn)

頻道熱點(diǎn)