工程院院士與DeepSeek過了一招 AI行業(yè)迎來“安卓時(shí)刻”

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2025-03-03 08:49:55 信網(wǎng)

工程院院士與DeepSeek過了一招。美國當(dāng)?shù)貢r(shí)間2月17日晚間，馬斯克旗下的人工智能公司xAI發(fā)布了最新人工智能模型Grok 3。在這場直播發(fā)布中，DeepSeek成為屢次被提及的比較對象，以此展示Grok 3的性能。前幾年，中國企業(yè)每每推出模型時(shí)，都要和GPT-3.5、GPT-4進(jìn)行對比。如今，Grok 3的主要比較對象變成了DeepSeek，這再次證明了DeepSeek在全球人工智能行業(yè)中的影響力。

過去，人工智能領(lǐng)域信奉“大力出奇跡”，即通過增加模型規(guī)模、數(shù)據(jù)量和計(jì)算資源來顯著提升模型性能。而DeepSeek則開辟了一條新路，以低成本、高效率的方式改寫了行業(yè)競爭法則，給全球人工智能界帶來新的啟示。早在DeepSeek“出圈”之前，青島的人工智能企業(yè)就開始關(guān)注這個(gè)“不走尋常路”的新物種，并在DeepSeek推理模型推出的第一時(shí)間積極擁抱，用以提升自家行業(yè)模型能力。

對青島的人工智能企業(yè)來說，DeepSeek的到來將加速大模型在各行各業(yè)的應(yīng)用，為垂直領(lǐng)域的行業(yè)大模型帶來新的機(jī)遇。但當(dāng)前再強(qiáng)大的通用大模型對行業(yè)專業(yè)知識的理解仍有不足，大模型要在各個(gè)行業(yè)中真正發(fā)揮作用仍需學(xué)習(xí)更多專業(yè)知識，垂域大模型還有許多工作要做。

沒有人會(huì)否認(rèn)，DeepSeek是繼ChatGPT之后全球人工智能領(lǐng)域最引人注目的產(chǎn)品。某種意義上，DeepSeek對于推動(dòng)全球人工智能發(fā)展的意義要遠(yuǎn)甚于ChatGPT。如果說ChatGPT展示了大模型的強(qiáng)大，那DeepSeek則表明最強(qiáng)的大模型并非遙不可及。

更低的算力成本和開源路線，是DeepSeek與ChatGPT最顯著的區(qū)別。正是基于這兩點(diǎn)，DeepSeek改變了現(xiàn)有全球AI的競爭規(guī)則。算法、算力、數(shù)據(jù)被稱為人工智能三要素。自ChatGPT引發(fā)全球大模型浪潮以來，算力的重要性不斷上升。然而，DeepSeek重構(gòu)了這種以算力為中心的競爭規(guī)則。通過多元專家混合的模型架構(gòu)，DeepSeek V3版本的訓(xùn)練成本僅為600萬美元，顯著低于此前海外主流大模型的成本。中國工程院院士李國杰認(rèn)為，DeepSeek的創(chuàng)新不僅是技術(shù)上的突破，也是發(fā)展模式上的顛覆性創(chuàng)新。

12 3 全文共 3 頁下一頁

關(guān)閉

工程院院士與DeepSeek過了一招 AI行業(yè)迎來“安卓時(shí)刻”

相關(guān)新聞

今日熱點(diǎn)

頻道熱點(diǎn)