中國(guó)研究人員開發(fā)了一種高性能算法,能夠大幅提升NVIDIA消費(fèi)級(jí)GPU的科學(xué)計(jì)算性能,最高可達(dá)800倍。這一創(chuàng)新成果來(lái)自深圳北理莫斯科大學(xué)的研究團(tuán)隊(duì),該校由北京理工大學(xué)和莫斯科國(guó)立羅蒙諾索夫大學(xué)聯(lián)合創(chuàng)立。
新算法主要增強(qiáng)了近場(chǎng)動(dòng)力學(xué)的計(jì)算效率。近場(chǎng)動(dòng)力學(xué)是一種先進(jìn)的非局部理論,用于解決材料斷裂、損壞等復(fù)雜物理問(wèn)題,在航空、工程和軍事等領(lǐng)域有廣泛應(yīng)用。然而,傳統(tǒng)方法在處理這類問(wèn)題時(shí)效率較低。
研究團(tuán)隊(duì)基于NVIDIA CUDA編程技術(shù),創(chuàng)建了PD-General框架,優(yōu)化了算法設(shè)計(jì)和內(nèi)存管理,充分利用了GPU的大規(guī)模并行計(jì)算能力。實(shí)驗(yàn)結(jié)果顯示,在一塊普通的RTX 4070顯卡上,新算法比傳統(tǒng)串行算法快800倍,相比新的OpenMP并行算法也提升了100倍。
在涉及上百萬(wàn)粒子的大規(guī)模模擬中,新算法只需不到5分鐘即可完成4000步迭代。而在大規(guī)模2D單軸拉伸問(wèn)題中,新算法僅用不到2分鐘就完成了695萬(wàn)次單精度迭代。
該算法的應(yīng)用前景廣泛,包括改進(jìn)航空器結(jié)構(gòu)材料應(yīng)力與失效模型、提升建筑與工業(yè)材料測(cè)試效率以及加快防御性材料的抗沖擊研究。最重要的是,這一算法不需要高性能GPU芯片,普通消費(fèi)級(jí)家用GPU就能勝任。如果能支持國(guó)產(chǎn)GPU硬件,將更加理想。