斯坦福大學華裔科學家團隊基于阿里通義千問模型,結合谷歌AI推理模型Gemini 2.0 Flash Thinking Experimental,使用16個英偉達H100 GPU進行了26分鐘訓練,以不到50美元費用成功訓練出s1模型,性能超越高端模型。低成本模型顯示出巨大潛力。
過去幾年,開源大模型性能始終落后于閉源大模型,但DeepSeek改變了這一局面,增強了開源社區(qū)信心。楊立昆認為開源模型正在超越閉源模型,改變發(fā)展模式比單項技術突破更重要。DeepSeek徹底開源模式破解了企業(yè)數(shù)據(jù)安全難題,真正實現(xiàn)了技術民主化。
長期以來,美國AI龍頭公司夸大開源AI的安全風險,抑制開源AI發(fā)展。事實上,開源模型對全球AI供應鏈至關重要,尤其是發(fā)展中國家。若美國繼續(xù)設置障礙,中國有望在開源AI全球供應鏈中占據(jù)核心地位。真正的AI競爭不僅是技術和模型的競爭,更是生態(tài)系統(tǒng)、商業(yè)模式和價值觀的競爭。開源戰(zhàn)略將證明誰擁抱開源,誰就能贏得未來。
有人認為ChatGPT是0到1的突破,而DeepSeek只是1到N的擴展,但這不符合人工智能發(fā)展歷史。中國企業(yè)在應用創(chuàng)新和商業(yè)模式創(chuàng)新方面表現(xiàn)出色,但原創(chuàng)能力逐漸增強。DeepSeek可能標志著中國AI產業(yè)從“技術跟跑”向“技術并跑和領跑”邁進。
盡管中國在人工智能基礎研究和核心技術上仍與美國有差距,但在論文發(fā)表總數(shù)和專利授權數(shù)量上超過美國。近年來中國進步迅速,根據(jù)統(tǒng)計,中國作者在過去四年增長了8倍。人工智能產業(yè)具有不對稱性,一個小企業(yè)可以挑戰(zhàn)市值上萬億的龍頭企業(yè)。中國已有52家人工智能獨角獸企業(yè),占全球18%。這表明中國已有一批創(chuàng)新型小企業(yè)進入世界前列。
DeepSeek的成功說明算法優(yōu)化和系統(tǒng)級工程優(yōu)化不可或缺,優(yōu)秀工程師發(fā)揮著重要作用。良好的工程教育體系和龐大的工程師隊伍是中國的優(yōu)勢。年輕一代正成為科研主力,有信心在人工智能研究和應用上走在前面。
人工智能(AI)大模型DeepSeek點燃的AI熱潮,正在引發(fā)全球資本流向中國。
2025-02-17 10:11:09DeepSeek推動中國股票價值增1.3萬億美元