中國(guó)AI企業(yè)應(yīng)如何看待英偉達(dá)新顯卡!1月7日上午,英偉達(dá)總裁黃仁勛在全球最大的消費(fèi)電子展上發(fā)表了演講。此前有海外科技博主預(yù)測(cè),英偉達(dá)即將發(fā)布的新版顯卡GPU性能會(huì)有顯著提升。在演講中,黃仁勛發(fā)布了英偉達(dá)RTX 50系列顯卡,并表示RTX 5090的整體性能是上一代RTX 4090的兩倍。
這一消息引發(fā)了擔(dān)憂,特別是在美國(guó)對(duì)華斷供高端芯片的背景下,中國(guó)人工智能行業(yè)可能無(wú)法獲得最高性能的GPU用于訓(xùn)練,與美國(guó)的差距可能會(huì)進(jìn)一步拉大。在人工智能領(lǐng)域,“算力焦慮”一直是一個(gè)熱門(mén)話題。作為全球主導(dǎo)的GPU企業(yè),英偉達(dá)的H100 GPU數(shù)量一度成為衡量大模型公司算力的標(biāo)準(zhǔn),黃仁勛曾稱(chēng):“英偉達(dá)是AI世界的引擎”,認(rèn)為其硬件是發(fā)展人工智能大模型的關(guān)鍵。
然而,現(xiàn)場(chǎng)的朋友表示,算力和人工智能大模型不再是多數(shù)企業(yè)最關(guān)心的問(wèn)題。2024年的重點(diǎn)是如何將人工智能落地應(yīng)用,這并不一定需要最高性能的GPU芯片。相比之下,黃仁勛在演講中強(qiáng)調(diào)英偉達(dá)“Blackwell架構(gòu)芯片是人類(lèi)歷史上最大的單芯片”,但同時(shí)也宣布了消費(fèi)級(jí)產(chǎn)品的降價(jià)策略,性能不變但價(jià)格降至三分之一,這與之前的漲價(jià)預(yù)期形成了反差。顯然,在面臨越來(lái)越多挑戰(zhàn)的情況下,英偉達(dá)也在尋求多元化的發(fā)展路徑。
實(shí)際上,全球幾家全力投入人工智能大模型研發(fā)的頭部企業(yè)正在掀起一股“去英偉達(dá)”的趨勢(shì)。例如,Open AI和蘋(píng)果公司等開(kāi)始自研芯片和生態(tài)系統(tǒng),以支持自身的大模型訓(xùn)練。這種趨勢(shì)打破了英偉達(dá)宣傳的“算力為王”的觀念。除了自研AI芯片,這些公司還在更多地關(guān)注大模型本身的設(shè)計(jì)優(yōu)化。
Mistral AI公司公開(kāi)引入混合專(zhuān)家模型進(jìn)行大模型訓(xùn)練,用多個(gè)特定領(lǐng)域的“小專(zhuān)家”配合幾個(gè)“通用專(zhuān)家”,先決定問(wèn)題類(lèi)型再處理不同類(lèi)型的問(wèn)題。此外,DPO、LoRA等高效微調(diào)方法也簡(jiǎn)化了模型對(duì)齊過(guò)程,降低了復(fù)雜度。在這種趨勢(shì)下,國(guó)產(chǎn)大模型逐漸明確了發(fā)展方向。2024年,國(guó)產(chǎn)大模型取得了顯著進(jìn)展,有些通過(guò)底層優(yōu)化,僅用2048塊GPU就達(dá)到了頭部公司數(shù)萬(wàn)塊GPU訓(xùn)練才具備的大模型性能。
在中國(guó)工業(yè)互聯(lián)網(wǎng)研究院的數(shù)據(jù)中,DeepSeek-V3通過(guò)采用混合精度方法,有效平衡了訓(xùn)練精度和效率,結(jié)合混合專(zhuān)家模型架構(gòu),將大模型訓(xùn)練成本降低至500萬(wàn)美元,僅為同性能模型的5%~10%,而性能卻與GPT-4o和Claude 3.5 Sonnet相當(dāng)。目前,國(guó)內(nèi)類(lèi)似的大模型成本和訓(xùn)練時(shí)長(zhǎng)都大幅下降。這種新的訓(xùn)練方法不僅降低了大模型行業(yè)的門(mén)檻,還推動(dòng)了全球大模型的降價(jià)潮,對(duì)人工智能技術(shù)的應(yīng)用和轉(zhuǎn)化具有革命性意義。
業(yè)內(nèi)人士指出,在當(dāng)前全球人工智能大模型的競(jìng)爭(zhēng)中,算力雖然重要,但不是決定性因素。只有與軟件和應(yīng)用場(chǎng)景結(jié)合起來(lái),才能真正賦能行業(yè)轉(zhuǎn)型,提高經(jīng)濟(jì)效率。部分人工智能項(xiàng)目存在“假智能”的問(wèn)題,即靠大量數(shù)據(jù)疊加出答案,缺乏真正的創(chuàng)造力和想象力。盡管一些前沿大模型探索了“思維鏈”,試圖模擬人類(lèi)思維推導(dǎo),但在實(shí)現(xiàn)“通用人工智能”方面仍有較大障礙。
更大的問(wèn)題是,僅靠算力的方式遲早會(huì)遇到瓶頸?,F(xiàn)有大模型已經(jīng)讀完了幾乎所有的英文書(shū)籍,接下來(lái)的發(fā)展方向必須回到技術(shù)本質(zhì),解決更關(guān)鍵的方向性問(wèn)題。中國(guó)企業(yè)正通過(guò)高效靈活的路徑,找到更加“聰明”的人工智能發(fā)展方向。人工智能是一場(chǎng)向著未知的探險(xiǎn),中國(guó)企業(yè)選定的方向不會(huì)輕易被各種“焦慮”裹挾。中國(guó)AI企業(yè)應(yīng)如何看待英偉達(dá)新顯卡!
NVIDIA首席執(zhí)行官黃仁勛在CES 2025上發(fā)布了GeForce RTX50系列圖形顯卡,包括RTX5090、RTX5080以及RTX5070家族等多款產(chǎn)品
2025-01-09 14:50:13應(yīng)如何看待英偉達(dá)RTX50系顯卡從2024年下半年開(kāi)始,關(guān)于英偉達(dá)RTX 50系列顯卡的爆料越來(lái)越多,尤其是旗艦型號(hào)GeForce RTX 5090備受關(guān)注
2025-01-09 08:00:03實(shí)拍英偉達(dá)5090顯卡