DeepSeek上周發(fā)布了開源模型DeepSeek-R1,并聲稱其性能可以與OpenAI的o1正式版相媲美,這一消息在海外AI業(yè)界引發(fā)了廣泛討論。焦點在于,當(dāng)開源模型的能力達到甚至超越最新的閉源模型時,可能會改變整個大模型的競爭格局。
根據(jù)DeepSeek的介紹,DeepSeek-R1在Codeforces、GPQA Diamond、MATH-500、MMLU、SWE-bench Verified等測試中的得分接近或超過o1正式版。該模型在后訓(xùn)練階段大規(guī)模應(yīng)用了強化學(xué)習(xí)技術(shù),在僅有少量標(biāo)注數(shù)據(jù)的情況下顯著提升了推理能力。
Meta首席AI科學(xué)家Yann Lecun認(rèn)為,DeepSeek-R1的發(fā)布意味著開源大模型正在超越閉源模型,而不是單純地表明中國公司在AI領(lǐng)域超越美國公司。他表示,DeepSeek將從開放研究和開源中受益,類似于Meta的PyTorch和Llama。通過提出新想法并在他人工作的基礎(chǔ)上進行實現(xiàn),由于這些工作是公開和開源的,每個人都能從中獲益,這就是開放研究和開源的力量。
短短一個月內(nèi),中國AI初創(chuàng)公司深度求索(DeepSeek)發(fā)布了兩款大模型:DeepSeek-V3和DeepSeek-R1
2025-01-26 15:51:02DeepSeek新模型火到海外