當(dāng)硅谷仍在為GPU萬卡集群投入巨額資金時,來自杭州的一群年輕人用557.6萬美元證明,AI大模型的競爭并不只依賴規(guī)模,更看重使用效率。一款上架不到半個月的應(yīng)用程序DeepSeek在1月27日登頂蘋果應(yīng)用商店排行榜,擊敗了ChatGPT。
最近幾天,AI領(lǐng)域最火的大語言模型不是ChatGPT或文心一言,而是杭州AI公司深度求索推出的DeepSeek。從去年12月26日發(fā)布的DeepSeek-V3到1月20日的DeepSeek-R1,這家公司以O(shè)penAI三十分之一的價格實(shí)現(xiàn)了與o1模型相當(dāng)甚至超越的成績,給美國AI行業(yè)帶來了不小的沖擊。
經(jīng)過同題問答測試,DeepSeek-R1通過步步推理生成了具有邏輯性的回答,用戶可以看到其思考過程。IT從業(yè)者劉鴻博表示,這種體驗(yàn)與第一次使用ChatGPT 3.5相似,甚至更加震撼。他認(rèn)為DeepSeek對高語境內(nèi)容和中文網(wǎng)絡(luò)梗的理解能力更強(qiáng),達(dá)到了脫口秀文本的水平。
DeepSeek-R1發(fā)布后,不少美國AI從業(yè)者在社交平臺上表達(dá)了內(nèi)心的震撼。面對成本僅為“零頭”但性能優(yōu)秀的大模型,許多人發(fā)現(xiàn)傳統(tǒng)的高投入模式已無法阻止用戶的選擇。北京時間1月27日,DeepSeek在美國、中國和英國的App Store免費(fèi)應(yīng)用下載榜上名列前茅。
根據(jù)官方公布的性能測試,DeepSeek在數(shù)學(xué)測試、編程等多個領(lǐng)域與o1模型表現(xiàn)旗鼓相當(dāng),在某些測試中還超過了o1模型。此外,DeepSeek的訓(xùn)練成本更低,使用的算力也受到限制。相比之下,Meta旗下Llama3.1 405B模型的訓(xùn)練成本超過6000萬美元,而OpenAI的GPT-4o模型的訓(xùn)練成本為1億美元。
DeepSeek的價格優(yōu)勢早在去年年中就已顯現(xiàn),但由于當(dāng)時知名度不高,降價聲勢很快被其他大廠蓋過?,F(xiàn)在,除了價格優(yōu)勢外,DeepSeek還有比肩o1模型的性能。一些業(yè)內(nèi)人士認(rèn)為,DeepSeek可能顛覆硅谷巨頭的高投入路徑,對那些依賴銷售大量GPU的公司形成挑戰(zhàn)。
在實(shí)際應(yīng)用方面,DeepSeek的表現(xiàn)同樣令人印象深刻。通過聯(lián)網(wǎng)搜索功能,DeepSeek能夠整理出詳細(xì)的事件表,并展示清晰的思考過程。日常使用中,用戶發(fā)現(xiàn)該模型對中國古代文化如生辰八字、奇門遁甲等非常熟悉,且展示了專業(yè)的思考過程。
DeepSeek之所以能以較低的成本訓(xùn)練出高性能模型,是因?yàn)樗饤壛藗鹘y(tǒng)的監(jiān)督微調(diào),采用單純的強(qiáng)化學(xué)習(xí)訓(xùn)練。這一方法不僅減少了計算資源的需求,還觀察到了模型的“頓悟時刻”。在處理復(fù)雜問題時,模型會重新評估初步方法并分配更多思考時間,顯示出高級的問題解決策略。
DeepSeek團(tuán)隊(duì)由清華大學(xué)和北京大學(xué)的應(yīng)屆生和實(shí)習(xí)生主導(dǎo),平均年齡不足26歲。這種自下而上的創(chuàng)新文化與OpenAI早期類似。面壁智能首席科學(xué)家劉知遠(yuǎn)認(rèn)為,DeepSeek的成功證明了通過有限資源的高效利用可以實(shí)現(xiàn)以少勝多,縮小了中美在AI領(lǐng)域的差距。未來發(fā)展路徑尚不明確,仍需百倍努力探出新路。
Microsoft AI 公司首席執(zhí)行官穆斯塔法?蘇萊曼宣布,所有 Microsoft Copilot 用戶現(xiàn)在可以免費(fèi)使用 OpenAI 的 o1 推理模型
2025-01-31 18:42:10Copilot開放深度思考模式極氪汽車于8月13日推出了2025款極氪001與007,這兩款新車主要在智能駕駛、智能座艙及動力電池領(lǐng)域進(jìn)行了顯著升級,彌補(bǔ)了先前的不足
2024-08-14 12:16:342025款極氪007城區(qū)NZP通勤模式實(shí)測