短短一個月內(nèi),中國AI初創(chuàng)公司深度求索(DeepSeek)發(fā)布了兩款大模型:DeepSeek-V3和DeepSeek-R1。這兩款模型成本低廉,性能與OpenAI相當(dāng),讓硅谷震驚,并引發(fā)了Meta內(nèi)部的恐慌,工程師們開始連夜嘗試復(fù)制DeepSeek的成果。
Scale AI創(chuàng)始人Alexander Wang在采訪中表示,DeepSeek在他們的測試?yán)锉憩F(xiàn)最好,與美國最好的模型相當(dāng)。他還提到,DeepSeek-V3是中國科技界帶給美國的一個教訓(xùn),中國以更低的成本、更快的速度和更強(qiáng)的實(shí)力追趕上來。
中國AI的新進(jìn)展引起了國外媒體的廣泛關(guān)注,被視為對硅谷的一次警鐘。尤其是在5000億美元的“星際之門”計(jì)劃公布之際,DeepSeek以極低的價(jià)格建立了一個突破性的AI模型,而且沒有使用尖端芯片,這引發(fā)了人們對于巨額資本投入是否有效的質(zhì)疑。
一名匿名Meta員工透露,公司內(nèi)部因DeepSeek的模型進(jìn)入了恐慌模式。DeepSeek-V3在基準(zhǔn)測試中已經(jīng)超越了Llama 4,而其訓(xùn)練預(yù)算僅為550萬美元。工程師們正在爭分奪秒地分析DeepSeek,試圖復(fù)制其中的技術(shù)。管理層則為GenAI研發(fā)部門的巨額投入感到焦慮,高管薪資甚至超過了訓(xùn)練整個DeepSeek V3的成本。
去年12月27日,DeepSeek推出了開源模型DeepSeek-V3,在聊天機(jī)器人競技場中排名第七,在開源模型中排名第一,且是全球前十中性價(jià)比最高的模型。今年1月20日,DeepSeek正式開源R1推理模型,允許所有人在遵循MIT License的情況下蒸餾R1訓(xùn)練其他模型。1月24日,DeepSeek-R1在聊天機(jī)器人競技場綜合榜單上排名第三,與頂尖推理模型o1并列。在高難度提示詞、代碼和數(shù)學(xué)等技術(shù)性領(lǐng)域,DeepSeek-R1表現(xiàn)出色,位列第一。在風(fēng)格控制方面,DeepSeek-R1也與o1并列第一。
DeepSeek發(fā)布了新一代開源大模型DeepSeek-R1。該模型在數(shù)學(xué)、代碼、自然語言推理等任務(wù)上的性能與美國OpenAI公司的最新o1大模型相當(dāng)
2025-01-21 22:05:22DeepSeek又有重大突破數(shù)據(jù)是寶貴的資源,能夠幫助投資者減少煩惱。中國AI大模型市場正快速發(fā)展。近日,量化巨頭幻方量化旗下公司DeepSeek發(fā)布了推理大模型DeepSeek-R1
2025-01-27 09:33:36DeepSeek出圈概念股曝光中國國產(chǎn)大模型Deepseek在硅谷引起了轟動。從斯坦福到麻省理工,Deepseek R1幾乎一夜之間成為美國頂尖大學(xué)研究人員的首選模型
2025-01-27 15:33:19媒體揭秘國產(chǎn)大模型DeepSeek