火遍全球的DeepSeek科學(xué)家是怎么用它的。過年期間爆火的DeepSeek是一家專注于開發(fā)先進大語言模型和相關(guān)技術(shù)的創(chuàng)新型科技公司,全稱杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司,成立于2023年7月17日。在硅谷,DeepSeek被稱作“來自東方的神秘力量”。2024年底,DeepSeek發(fā)布了新一代大語言模型V3,隨后在2025年1月20日推出了開源模型R1,再次引發(fā)全球關(guān)注。R1模型通過純深度學(xué)習(xí)的方法讓AI自發(fā)涌現(xiàn)出推理能力,發(fā)布后在全球范圍內(nèi)掀起熱潮,在中國區(qū)和美國區(qū)蘋果AppStore免費榜均位列首位,超越了包括ChatGPT在內(nèi)的多個知名AI產(chǎn)品。
火遍全球的DeepSeek:科學(xué)家是怎么用它的?創(chuàng)新技術(shù)引領(lǐng)未來方向
阿里云、百度智能云、華為云、騰訊云等國內(nèi)四大云巨頭以及海外的亞馬遜AWS、微軟Azure等云巨頭都已正式支持DeepSeek。春節(jié)期間,多家國產(chǎn)芯片廠商也積極響應(yīng),如天數(shù)智芯、摩爾線程等宣布支持DeepSeek模型。GiteeAI聯(lián)合沐曦還首發(fā)了全套DeepSeek-R1千問蒸餾模型,實現(xiàn)了從芯片到平臺,從算力到模型的全國產(chǎn)研發(fā)、中國制造。
DeepSeek不僅在技術(shù)上表現(xiàn)出色,在市場上也取得了巨大成功。這款由中國的深度求索公司研發(fā)的大型語言模型擁有強大的自然語言處理能力,能夠理解并回答問題,還能輔助寫代碼、整理資料和解決復(fù)雜的數(shù)學(xué)問題。與OpenAI開發(fā)的Chat-GPT相比,DeepSeek以更低的成本達到了相似甚至更好的效果,引發(fā)了廣泛討論。DeepSeek代表了AI的未來方向——更懂人話,更會思考,并且擅長個性化發(fā)揮,被稱為“全能型AI助手”。
隨著DeepSeek掀起新一輪AI熱潮,業(yè)內(nèi)人士認為它將推動AI實現(xiàn)“平民化”。正如蘋果iPhone改變了人們的生活方式,DeepSeek將通過開源系統(tǒng)讓更多開發(fā)者開發(fā)出有用的AI應(yīng)用場景,使AI走入普通人的生活。AI開源初創(chuàng)公司HuggingFace聯(lián)合創(chuàng)始人Thomas Wolf表示,下一步將是建立在這些模型之上的應(yīng)用,讓模型在應(yīng)用層面變得有用,從而完成現(xiàn)實中的任務(wù),讓人們在生活中受益。
然而,DeepSeek的成功也引起了某些勢力的注意。1月30日凌晨,針對DeepSeek線上服務(wù)的攻擊烈度突然升級,至少有2個僵尸網(wǎng)絡(luò)參與了攻擊。中國常駐聯(lián)合國代表傅聰對此表示:“永遠不要低估中國科研人員的聰明才智。DeepSeek引發(fā)全球轟動和一些人的焦慮恐慌,說明技術(shù)遏制和技術(shù)限制無法奏效?!?/p>
DeepSeek之所以讓美國感到緊張,主要因為它具有高性價比、模式創(chuàng)新和顯著的進步。DeepSeek的出現(xiàn)打破了美國大模型的壟斷地位,降低了行業(yè)門檻,并通過創(chuàng)新的數(shù)據(jù)處理方法優(yōu)化了算力,提升了模型性能。這不僅沖擊了美國的技術(shù)優(yōu)勢,也引發(fā)了美國高新技術(shù)人員的擔憂。根據(jù)報告,2024年國內(nèi)大模型的能力進步顯著,國內(nèi)外差距大幅縮小。這表明DeepSeek的成功是中國國內(nèi)大模型整體發(fā)展的階段性成果。