1月27日,中國(guó)深度求索公司開發(fā)的DeepSeek在蘋果美國(guó)地區(qū)應(yīng)用商店免費(fèi)APP下載排行榜上超越了ChatGPT。最近發(fā)布的開源模型DeepSeek-R1引起了全球范圍內(nèi)的廣泛關(guān)注。
輿論認(rèn)為,這一低成本、開源的人工智能模型震動(dòng)了硅谷,讓競(jìng)爭(zhēng)對(duì)手感到擔(dān)憂,也讓科學(xué)家們興奮不已。多方評(píng)論指出,中國(guó)AI技術(shù)的快速發(fā)展,讓美國(guó)的打壓政策顯得尷尬。1月20日,深度求索發(fā)布了最新開源模型DeepSeek-R1,此后熱度不斷上升,在國(guó)內(nèi)外引發(fā)了廣泛討論。頂級(jí)風(fēng)投A16Z創(chuàng)始人馬克·安德森評(píng)價(jià)稱,DeepSeek-R1是他見過(guò)的最驚人、最令人印象深刻的突破之一,并稱贊其為給世界的一份意義深遠(yuǎn)的禮物。
在硅谷,幾乎每個(gè)人都在談?wù)揇eepSeek。有報(bào)道稱,硅谷工程師正在瘋狂地分析DeepSeek,甚至有人將其稱為中國(guó)的“ChatGPT時(shí)刻”。DeepSeek的特點(diǎn)是低成本、高性能和開源。該模型的推理計(jì)算效率極高,可以與一些頂尖的AI模型相媲美,與硅谷前沿發(fā)展保持同步。
DeepSeek-R1在技術(shù)上實(shí)現(xiàn)了重要突破,用純深度學(xué)習(xí)的方法讓AI自發(fā)涌現(xiàn)出推理能力,在數(shù)學(xué)、代碼、自然語(yǔ)言推理等任務(wù)上的性能比肩OpenAI的o1模型正式版。據(jù)DeepSeek介紹,R1的預(yù)訓(xùn)練費(fèi)用只有557.6萬(wàn)美元,遠(yuǎn)低于OpenAI GPT-4o模型的訓(xùn)練成本。
加利福尼亞大學(xué)伯克利分校教授亞歷克斯·迪馬基表示,DeepSeek的技術(shù)路線揭示了一個(gè)事實(shí):達(dá)到頂尖性能未必需要巨額投入,這對(duì)硅谷的燒錢競(jìng)賽無(wú)異于釜底抽薪。開源也是DeepSeek備受關(guān)注的原因之一,這意味著其他企業(yè)和研究人員可以共享基礎(chǔ)代碼,構(gòu)建和發(fā)布自己的產(chǎn)品。
英偉達(dá)資深科學(xué)家吉姆·范稱贊DeepSeek是“非美國(guó)公司踐行OpenAI初心”的典范,通過(guò)開放技術(shù)細(xì)節(jié)和訓(xùn)練方法,為全球研究者賦能。德國(guó)馬克斯·普朗克光科學(xué)研究所的馬里奧·克倫也認(rèn)為,DeepSeek-R1的開源性非常出色,相比之下,o1和其他模型都是閉源模型“黑匣子”。
短短一個(gè)月內(nèi),中國(guó)AI初創(chuàng)公司深度求索(DeepSeek)發(fā)布了兩款大模型:DeepSeek-V3和DeepSeek-R1
2025-01-26 15:51:02DeepSeek新模型火到海外