1月26日晚,游戲科學(xué)創(chuàng)始人、CEO馮驥發(fā)文談到了DeepSeek,稱其可能是一個國運(yùn)級別的科技成果。他認(rèn)為,如果有一個AI大模型能做到以下任何一條,都是了不起的突破,而DeepSeek全部實(shí)現(xiàn)了。
DeepSeek具備強(qiáng)大的推理能力,暫時沒有其他模型能與之匹敵。它參數(shù)少,訓(xùn)練開銷和使用費(fèi)用低了一個數(shù)量級。此外,DeepSeek是開源的,任何人都可以下載和部署,還提供了詳細(xì)的論文說明訓(xùn)練步驟和竅門,甚至有可在手機(jī)上運(yùn)行的mini模型。官方提供的服務(wù)完全免費(fèi),用戶可以隨時隨地使用。DeepSeek還支持聯(lián)網(wǎng)搜索,這是目前唯一支持該功能的推理模型。更重要的是,這款模型由一家規(guī)模較小的年輕中國公司開發(fā)完成,團(tuán)隊(duì)成員沒有海外經(jīng)歷或資深從業(yè)經(jīng)驗(yàn)。
馮驥推薦大家使用DeepSeek,并希望它能讓人們更深入地理解當(dāng)前最先進(jìn)的AI技術(shù),使AI逐漸融入日常生活。他感到非常幸運(yùn)和開心,因?yàn)檫@樣震撼的突破來自一個純粹的中國公司,知識與信息平權(quán)又邁出了堅(jiān)實(shí)的一步。
資料顯示,Deepseek來自國產(chǎn)大模型公司深度求索,該公司隸屬于量化巨頭幻方量化。1月20日,深度求索正式發(fā)布了推理大模型DeepSeek-R1。這款模型一經(jīng)推出便在海外開發(fā)者社區(qū)中引起了轟動,因其“物美價(jià)廉”的特性而受到歡迎。作為一款開源模型,R1在數(shù)學(xué)、代碼、自然語言推理等任務(wù)上的性能能夠比肩OpenAI o1模型正式版,并采用MIT許可協(xié)議,支持免費(fèi)商用、任意修改和衍生開發(fā)。
目前,在國外大模型排名榜Chatbot Arena上,DeepSeek-R1的基準(zhǔn)測試排名已升至全類別大模型第三,與OpenAI的ChatGPT-4o最新版并列,并在風(fēng)格控制類模型分類中與OpenAI的O1模型并列第一。1月27日,蘋果App Store中國區(qū)免費(fèi)榜顯示,DeepSeek成為中國區(qū)第一;1月26日,DeepSeek在美國區(qū)蘋果App Store免費(fèi)榜升至第六位,超越了Google Gemini、Microsoft Copilot等美國科技公司的生成式AI產(chǎn)品。