中國一家人工智能實驗室最近發(fā)布了一款尖端模型的技術細節(jié),此舉不僅震驚了世界,也讓其低調的負責人梁文鋒成為民族英雄。1月20日,由對沖基金經理梁文鋒創(chuàng)立的公司深度求索正式發(fā)布了R1模型,并在一篇論文中詳細解釋了如何利用有限的自籌預算構建一個大語言模型,該模型可在沒有人工監(jiān)督的情況下自動學習和自我改善。
包括OpenAI和谷歌DeepMind在內的美國企業(yè)率先開發(fā)出推理模型,這是一個相對較新的人工智能研究領域,旨在使模型具有與人類相匹配的認知能力。上個月,OpenAI發(fā)布了o1模型的完整版本,但對其創(chuàng)建方法保密。深度求索R1模型的發(fā)布在硅谷引發(fā)了一場激烈辯論,討論資源更雄厚的美國人工智能企業(yè)能否守住技術優(yōu)勢。與此同時,梁文鋒也成為提升中國國內民族自豪感的焦點人物。本周,在中國總理召開的一次座談會中,梁文鋒是唯一的人工智能企業(yè)負責人。
2023年,梁文鋒創(chuàng)建了深度求索公司。另一家大語言模型公司的創(chuàng)始人表示,他建立了一個出色的基礎設施團隊,真正了解芯片的工作原理。在美國禁止英偉達向中國出口功能最強大的芯片后,中國本土人工智能企業(yè)被迫尋找創(chuàng)新方法,以最大限度地利用現有芯片的計算能力。深度求索的工程師已經知道如何解決這一問題,能夠釋放這些圖形處理器(GPU)的潛力,即使它們不是最先進的。
業(yè)內人士認為,深度求索對研究的專注使其成為一個可畏的競爭對手,因為該公司愿意分享取得的突破,而非為獲取商業(yè)利益保護它們。深度求索沒有從外部基金籌集資金,也沒有采取重大舉措將其模型貨幣化。北京的一名人工智能行業(yè)投資者表示,深度求索的運作方式就像早期的DeepMind,專注于研究和工程。
深度求索僅用2048顆英偉達H800 GPU和560萬美元就訓練出了6710億參數的開源大模型,這只是OpenAI和谷歌訓練同等類型模型花費的一小部分。加州大學伯克利分校的人工智能政策研究員里特維克·古普塔表示,深度求索最近發(fā)布的模型表明,沒有阻礙人們獲取人工智能能力的障礙。他說,訓練模型的第一人必須花費大量資源才能實現目的,但跟進者可以用更少的費用且更快的速度實現目標。他還指出,中國擁有比美國更多的系統(tǒng)工程師人才庫,他們知道如何最好地利用計算資源,以更便宜的方式訓練和運行模型。
盡管如此,美國的競爭對手也沒有停滯不前。它們正在構建由英偉達新一代Blackwell芯片組成的超大型“集群”,從而創(chuàng)造出強大的計算能力,有可能再次拉開與中國競爭對手的性能差距。
就在硅谷審視與中國企業(yè)深度求索有關的新聞之際,Meta的首席執(zhí)行官扎克伯格宣布計劃在2025年大幅增加對人工智能的投資。他表示,今年將對該領域增加600億至650億美元的投資,同時大幅擴大人工智能研發(fā)團隊。人工智能和中國的發(fā)展態(tài)勢成為本周在瑞士達沃斯舉行的世界經濟論壇2025年年會的主要話題。微軟高管也表示,應非常認真地對待來自中國的發(fā)展態(tài)勢。
湖人在客場加時賽中以132-134不敵老鷹,遭遇三連敗。勒布朗-詹姆斯出場43分鐘22秒,貢獻了39分、10個籃板、11次助攻、2次搶斷和3次封蓋。他在場時湖人凈勝3分
2024-12-10 13:31:57外媒討論詹姆斯上場時間問題多家媒體稱敘利亞總統(tǒng)已離開敘首都大馬士革。據俄羅斯塔斯社、路透社、半島電視臺等多家媒體8日報道,敘利亞總統(tǒng)巴沙爾·阿薩德已經離開敘利亞首都大馬士革,去向不清楚。
2024-12-08 13:46:58外媒:敘利亞總統(tǒng)已離開大馬士革