近期,中國人工智能公司深度求索(DeepSeek)開發(fā)的AI模型引起了西方業(yè)界的高度關注。各大西方媒體、AI團隊及投資者紛紛探討,在缺乏頂尖芯片的情況下,中國如何以更低的成本創(chuàng)造出能與美國頂尖AI模型相媲美的產(chǎn)品。
美國消費者新聞與商業(yè)頻道(CNBC)報道指出,深度求索發(fā)布的AI模型不僅性能超越美國同類模型,而且構(gòu)建成本更低,所用芯片算力也較弱。這一消息在硅谷引發(fā)恐慌,讓美國人開始質(zhì)疑美國在全球人工智能領域的領先地位是否正在縮小,以及科技巨頭在構(gòu)建人工智能模型和數(shù)據(jù)中心上的巨額投入是否值得。
去年12月底,深度求索推出了一款免費開源的大語言模型DeepSeek-V3。該模型僅用了兩個月時間,花費不到600萬美元,使用英偉達H800芯片構(gòu)建而成。相比之下,谷歌和OpenAI則花費了數(shù)年時間和數(shù)億美元才取得類似成果。DeepSeek的開源模型已成為許多美國開發(fā)者的基礎。
在一系列第三方基準測試中,深度求索的模型在解決復雜問題、數(shù)學和編程等方面表現(xiàn)優(yōu)于Meta的Llama 3.1、OpenAI的GPT-4和Anthropic的Claude Sonnet 3.5。其最新發(fā)布的推理模型DeepSeek-R1同樣超越了OpenAI的最新模型o1。
微軟首席執(zhí)行官薩蒂亞·納德拉在達沃斯世界經(jīng)濟論壇上表示,深度求索的新模型令人印象深刻,他們高效地開發(fā)出一款開源模型,在推理計算方面表現(xiàn)出色,計算效率極高。這些進展需要被嚴肅對待。
值得注意的是,這些成就是在美國政府對中國實施嚴格半導體限制的情況下取得的。這些限制使中國無法獲取最強大的芯片,如英偉達H100。這表明要么深度求索找到了繞過相關規(guī)則的方法,要么美國的出口管制并未達到預期效果。
標桿資本普通合伙人切坦·普塔貢塔認為,深度求索采用預訓練大型模型,并利用蒸餾技術提升小型模型的能力,這是一種非常具有成本效益的方法。
其他中國AI模型也在有限資源下取得了顯著成績。例如,李開復的初創(chuàng)公司零一萬物成立八個月就成為獨角獸企業(yè),2024年創(chuàng)造近1400萬美元收入,其模型訓練成本僅為300萬美元。阿里巴巴的千問也大幅降低了大型語言模型的成本。
美國AI初創(chuàng)企業(yè)Perplexity首席執(zhí)行官阿拉文德·斯里尼瓦斯表示,需求是發(fā)明之母,由于必須想出變通辦法,最終構(gòu)建出了效率更高的系統(tǒng)。
《紐約時報》報道指出,深度求索開發(fā)的AI系統(tǒng)可與OpenAI和谷歌等公司的尖端聊天機器人相媲美。DeepSeek-V3大模型的訓練只用了領先人工智能公司用的高度專業(yè)化計算機芯片的一小部分。自ChatGPT發(fā)布以來,許多專家和投資者普遍認為,不投入數(shù)億美元購買人工智能專用芯片的話,沒有公司能與行業(yè)領軍者競爭。然而,DeepSeek僅用了約2000個英偉達生產(chǎn)的專用芯片。
喬治華盛頓大學助理教授杰弗里·丁表示,中國進口芯片受到限制,迫使DeepSeek工程師更有效地訓練大模型,使其仍有競爭力。多倫多的技術顧問魯文·科恩表示,DeepSeek-V3與OpenAI、谷歌和Anthropic的最新系統(tǒng)能力相當,而且使用起來便宜得多。
美國喬治梅森大學經(jīng)濟系教授泰勒·考恩認為,美國限制對華出口芯片,間接導致了中國重要創(chuàng)新的出現(xiàn)。南加州大學古爾德法學院法學教授張湖月提到,中國在效率方面的成就并非偶然,這是對美國及其盟友不斷升級的出口限制的直接回應。嚴格的出口管制反而促使中國科技公司變得更加自力更生,推動了原本可能不會發(fā)生的突破。
近期,中國在一個月內(nèi)進行了四次軍事力量的展示,這些舉動不僅體現(xiàn)了遠程軍事投射和遠洋作戰(zhàn)的實力,也對美國的挑釁行為作出了回應
2024-08-12 09:23:25美媒緊盯中國與美國不相上下