因此,可以認(rèn)為ACCEL的時(shí)鐘頻率是500M,也就是一個(gè)時(shí)鐘周期2納秒。等于是說(shuō),幾個(gè)時(shí)鐘周期,ACCEL就把計(jì)算任務(wù)辦完了。而在傳統(tǒng)計(jì)算機(jī)里,無(wú)論是CPU還是GPU,這類計(jì)算任務(wù)都要很多個(gè)時(shí)鐘周期的,做個(gè)乘法就要好多步。并行是說(shuō),海量數(shù)據(jù)可以組成向量加速,但對(duì)某個(gè)數(shù)據(jù)處理的時(shí)鐘周期是省不了的。
所以清華論文報(bào)告說(shuō),在進(jìn)行ImageNet三類物體分類時(shí),ACCEL的計(jì)算速度約相當(dāng)于4550個(gè)TOPS。TOPS是Tera Operations Per Second,代表每秒1萬(wàn)億次操作。這個(gè)計(jì)算速度確實(shí)能有商用GPU的3000多倍,因?yàn)镚PU每秒能有1萬(wàn)億次操作已經(jīng)很好了。所謂“算力是商用GPU的3000多倍”,就是這么來(lái)的。但這個(gè)說(shuō)法,究竟是哪里不對(duì)呢?
真正的問題,在于持續(xù)計(jì)算。ACCEL確實(shí)能在幾納秒之內(nèi)處理一幅圖像的光信號(hào),但它能不能持續(xù)運(yùn)算,真的用一秒時(shí)間,完成4550TOPS的運(yùn)算量?這就不行了,因?yàn)闇?zhǔn)備任務(wù)是需要時(shí)間的。例如以它的計(jì)算速度,一秒能處理1億個(gè)圖片,但把這么多圖片的光信號(hào)在一秒內(nèi)發(fā)送給它,是不可能的。實(shí)際準(zhǔn)備一個(gè)圖片需要的時(shí)間就不短,真正的瓶頸是在這兒。
ACCEL芯片測(cè)試準(zhǔn)備
ACCEL芯片是一個(gè)光電芯片,它的輸入是光信號(hào),要把它運(yùn)行起來(lái),需要準(zhǔn)備好光信號(hào)輸入,而這是個(gè)相當(dāng)復(fù)雜的任務(wù)。按論文描述,清華團(tuán)隊(duì)要搭起光學(xué)鏡片組,才能將識(shí)別目標(biāo)的光信號(hào)輸入給ACCEL進(jìn)行處理,換下一個(gè)識(shí)別目標(biāo)要不少操作。而GPU、CPU在計(jì)算機(jī)系統(tǒng)中應(yīng)用多年了,處理輸入已經(jīng)很成熟了,所以能將海量數(shù)據(jù)組織起來(lái),象流水線一樣送到運(yùn)算核心不停處理。高性能GPU的核心技術(shù)之一,就是海量數(shù)據(jù)輸入管理,要用到上百G的高速存儲(chǔ)器,多級(jí)緩存。
所以,論總的算力ACCEL并不大,它只是對(duì)整個(gè)流程中的一步處理得極快,而這一步快的代價(jià)是另一些步驟慢。一個(gè)比喻是,一個(gè)士兵面前正好有一個(gè)敵人,他開槍只用1秒鐘就消滅了一個(gè)敵人。但這不代表他可以一小時(shí)消滅3600個(gè)敵人,更不是說(shuō)他可以一個(gè)人頂3000多個(gè)人。如果有人說(shuō)他的“戰(zhàn)力”有3000多個(gè)士兵這么多,這就錯(cuò)得離譜。再一個(gè)比喻是,一張弓,可以在1秒內(nèi)讓箭飛出100米,速度很快。但是,不能說(shuō)它的“運(yùn)送能力”是1小時(shí)360公里,因?yàn)闆]法持續(xù)飛。如果射一箭,人走過去再射一箭,這樣接力,一小時(shí)跑不了多遠(yuǎn)。
英偉達(dá)不僅自身實(shí)現(xiàn)了蛻變,也深刻影響了眾多科技企業(yè)的命運(yùn)
2024-09-23 05:49:54又一芯片公司2024中國(guó)算力大會(huì)將于9月27日至29日在河南鄭州舉行,華為將參與此次大會(huì),主題定為“共贏算力新時(shí)代”
2024-09-25 09:12:00華為將參加2024中國(guó)算力大會(huì)