中國(guó)人工智能領(lǐng)域,尤其是大型語(yǔ)言模型技術(shù)近期取得了顯著進(jìn)展。這些成就讓美國(guó)試圖打壓中國(guó)科技發(fā)展的政策顯得尷尬。
世界經(jīng)濟(jì)論壇2025年年會(huì)開幕當(dāng)天,中國(guó)深度求索公司發(fā)布了最新的開源模型DeepSeek-R1。該模型在技術(shù)上實(shí)現(xiàn)了重要突破,使用純深度學(xué)習(xí)方法使AI自發(fā)涌現(xiàn)出推理能力。DeepSeek-R1延續(xù)了高性價(jià)比的優(yōu)勢(shì),在后訓(xùn)練階段大規(guī)模使用強(qiáng)化學(xué)習(xí)技術(shù),即使只有極少標(biāo)注數(shù)據(jù)也能大幅提升模型的推理能力。在數(shù)學(xué)、代碼和自然語(yǔ)言推理等任務(wù)上,其性能與美國(guó)OpenAI的o1模型正式版相當(dāng)。
中國(guó)AI技術(shù)在世界經(jīng)濟(jì)論壇2025年年會(huì)上成為熱議話題。麻省理工學(xué)院知名AI專家馬克斯·特格馬克教授在接受采訪時(shí)表示,過(guò)去一年里,中國(guó)在AI領(lǐng)域取得了巨大進(jìn)步。他高度贊揚(yáng)了中國(guó)深度求索公司最新發(fā)布的大型語(yǔ)言模型,并指出中國(guó)已基本趕上美國(guó)在前沿大型語(yǔ)言模型上的發(fā)展,這凸顯了因地緣政治破壞科技合作的愚蠢和錯(cuò)誤。
去年9月,OpenAI發(fā)布了推理模型o1。幾個(gè)月后,阿里巴巴的通義千問(wèn)團(tuán)隊(duì)推出了實(shí)驗(yàn)性研究模型QwQ-32B-Preview,該模型在多個(gè)測(cè)試中展現(xiàn)出與o1模型相當(dāng)甚至超越的推理能力。隨后,中國(guó)深度求索公司在2024年12月下旬發(fā)布了混合專家模型DeepSeek-V3。測(cè)試結(jié)果顯示,DeepSeek-V3在多項(xiàng)評(píng)測(cè)中超越了Llama-3.1-405B等開源模型,并且在性能上與世界頂尖的閉源模型GPT-4o和Claude-3.5-Sonnet不相上下,同時(shí)具有成本優(yōu)勢(shì)。
此外,OpenAI在2024年初發(fā)布視頻生成模型“天空”后,中國(guó)短視頻平臺(tái)快手公司在同年6月推出了視頻生成大模型“可靈”。隨后幾個(gè)月內(nèi),智譜AI、字節(jié)跳動(dòng)和騰訊等多家中國(guó)公司也相繼推出類似工具。
英國(guó)《經(jīng)濟(jì)學(xué)人》雜志撰文指出,中國(guó)最近的進(jìn)展正在顛覆整個(gè)AI行業(yè),令美國(guó)政策制定者感到尷尬。中國(guó)模式的成功可能會(huì)重塑AI行業(yè)的經(jīng)濟(jì)模式。美國(guó)《紐約時(shí)報(bào)》的一篇文章提到,中國(guó)公司打造了一款更便宜、更有競(jìng)爭(zhēng)力的模型,與谷歌和OpenAI等美國(guó)巨頭的產(chǎn)品相比毫不遜色。
喬治·華盛頓大學(xué)助理教授杰弗里·丁表示,美國(guó)對(duì)中國(guó)芯片的限制迫使中國(guó)工程師更有效地訓(xùn)練模型,使其仍然具有競(jìng)爭(zhēng)力。
除了大型語(yǔ)言模型,物理AI也將為中國(guó)帶來(lái)良好機(jī)會(huì)。中國(guó)禾賽科技聯(lián)合創(chuàng)始人李一帆在達(dá)沃斯論壇期間指出,當(dāng)數(shù)字世界的AI與物理產(chǎn)品結(jié)合時(shí),中國(guó)企業(yè)在供應(yīng)鏈、制造能力、成本控制等方面具有明顯優(yōu)勢(shì)。
短短一個(gè)月內(nèi),中國(guó)AI初創(chuàng)公司深度求索(DeepSeek)發(fā)布了兩款大模型:DeepSeek-V3和DeepSeek-R1
2025-01-27 08:52:31DeepSeek刷屏硅谷背后