工程院院士與DeepSeek過了一招。美國當(dāng)?shù)貢r(shí)間2月17日晚間,馬斯克旗下的人工智能公司xAI發(fā)布了最新人工智能模型Grok 3。在這場直播發(fā)布中,DeepSeek成為屢次被提及的比較對象,以此展示Grok 3的性能。前幾年,中國企業(yè)每每推出模型時(shí),都要和GPT-3.5、GPT-4進(jìn)行對比。如今,Grok 3的主要比較對象變成了DeepSeek,這再次證明了DeepSeek在全球人工智能行業(yè)中的影響力。
過去,人工智能領(lǐng)域信奉“大力出奇跡”,即通過增加模型規(guī)模、數(shù)據(jù)量和計(jì)算資源來顯著提升模型性能。而DeepSeek則開辟了一條新路,以低成本、高效率的方式改寫了行業(yè)競爭法則,給全球人工智能界帶來新的啟示。早在DeepSeek“出圈”之前,青島的人工智能企業(yè)就開始關(guān)注這個(gè)“不走尋常路”的新物種,并在DeepSeek推理模型推出的第一時(shí)間積極擁抱,用以提升自家行業(yè)模型能力。
對青島的人工智能企業(yè)來說,DeepSeek的到來將加速大模型在各行各業(yè)的應(yīng)用,為垂直領(lǐng)域的行業(yè)大模型帶來新的機(jī)遇。但當(dāng)前再強(qiáng)大的通用大模型對行業(yè)專業(yè)知識的理解仍有不足,大模型要在各個(gè)行業(yè)中真正發(fā)揮作用仍需學(xué)習(xí)更多專業(yè)知識,垂域大模型還有許多工作要做。
沒有人會(huì)否認(rèn),DeepSeek是繼ChatGPT之后全球人工智能領(lǐng)域最引人注目的產(chǎn)品。某種意義上,DeepSeek對于推動(dòng)全球人工智能發(fā)展的意義要遠(yuǎn)甚于ChatGPT。如果說ChatGPT展示了大模型的強(qiáng)大,那DeepSeek則表明最強(qiáng)的大模型并非遙不可及。
更低的算力成本和開源路線,是DeepSeek與ChatGPT最顯著的區(qū)別。正是基于這兩點(diǎn),DeepSeek改變了現(xiàn)有全球AI的競爭規(guī)則。算法、算力、數(shù)據(jù)被稱為人工智能三要素。自ChatGPT引發(fā)全球大模型浪潮以來,算力的重要性不斷上升。然而,DeepSeek重構(gòu)了這種以算力為中心的競爭規(guī)則。通過多元專家混合的模型架構(gòu),DeepSeek V3版本的訓(xùn)練成本僅為600萬美元,顯著低于此前海外主流大模型的成本。中國工程院院士李國杰認(rèn)為,DeepSeek的創(chuàng)新不僅是技術(shù)上的突破,也是發(fā)展模式上的顛覆性創(chuàng)新。
近日,DeepSeek的出現(xiàn)引發(fā)了全球科技領(lǐng)域的廣泛關(guān)注和深入討論
2025-03-03 09:44:52中國工程院院士與DeepSeek過了一招