工程院院士與DeepSeek過(guò)了一招 AI行業(yè)迎來(lái)“安卓時(shí)刻”

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2025-03-03 08:49:55 信網(wǎng)

工程院院士與DeepSeek過(guò)了一招。美國(guó)當(dāng)?shù)貢r(shí)間2月17日晚間，馬斯克旗下的人工智能公司xAI發(fā)布了最新人工智能模型Grok 3。在這場(chǎng)直播發(fā)布中，DeepSeek成為屢次被提及的比較對(duì)象，以此展示Grok 3的性能。前幾年，中國(guó)企業(yè)每每推出模型時(shí)，都要和GPT-3.5、GPT-4進(jìn)行對(duì)比。如今，Grok 3的主要比較對(duì)象變成了DeepSeek，這再次證明了DeepSeek在全球人工智能行業(yè)中的影響力。

過(guò)去，人工智能領(lǐng)域信奉“大力出奇跡”，即通過(guò)增加模型規(guī)模、數(shù)據(jù)量和計(jì)算資源來(lái)顯著提升模型性能。而DeepSeek則開辟了一條新路，以低成本、高效率的方式改寫了行業(yè)競(jìng)爭(zhēng)法則，給全球人工智能界帶來(lái)新的啟示。早在DeepSeek“出圈”之前，青島的人工智能企業(yè)就開始關(guān)注這個(gè)“不走尋常路”的新物種，并在DeepSeek推理模型推出的第一時(shí)間積極擁抱，用以提升自家行業(yè)模型能力。

對(duì)青島的人工智能企業(yè)來(lái)說(shuō)，DeepSeek的到來(lái)將加速大模型在各行各業(yè)的應(yīng)用，為垂直領(lǐng)域的行業(yè)大模型帶來(lái)新的機(jī)遇。但當(dāng)前再?gòu)?qiáng)大的通用大模型對(duì)行業(yè)專業(yè)知識(shí)的理解仍有不足，大模型要在各個(gè)行業(yè)中真正發(fā)揮作用仍需學(xué)習(xí)更多專業(yè)知識(shí)，垂域大模型還有許多工作要做。

沒(méi)有人會(huì)否認(rèn)，DeepSeek是繼ChatGPT之后全球人工智能領(lǐng)域最引人注目的產(chǎn)品。某種意義上，DeepSeek對(duì)于推動(dòng)全球人工智能發(fā)展的意義要遠(yuǎn)甚于ChatGPT。如果說(shuō)ChatGPT展示了大模型的強(qiáng)大，那DeepSeek則表明最強(qiáng)的大模型并非遙不可及。

更低的算力成本和開源路線，是DeepSeek與ChatGPT最顯著的區(qū)別。正是基于這兩點(diǎn)，DeepSeek改變了現(xiàn)有全球AI的競(jìng)爭(zhēng)規(guī)則。算法、算力、數(shù)據(jù)被稱為人工智能三要素。自ChatGPT引發(fā)全球大模型浪潮以來(lái)，算力的重要性不斷上升。然而，DeepSeek重構(gòu)了這種以算力為中心的競(jìng)爭(zhēng)規(guī)則。通過(guò)多元專家混合的模型架構(gòu)，DeepSeek V3版本的訓(xùn)練成本僅為600萬(wàn)美元，顯著低于此前海外主流大模型的成本。中國(guó)工程院院士李國(guó)杰認(rèn)為，DeepSeek的創(chuàng)新不僅是技術(shù)上的突破，也是發(fā)展模式上的顛覆性創(chuàng)新。

更低的成本意味著降低了擁抱大模型的門檻。海爾相關(guān)負(fù)責(zé)人表示，依托算法突破大幅降低模型的算力需求，將極大提速大模型的產(chǎn)業(yè)化應(yīng)用進(jìn)程，成為中國(guó)和中國(guó)企業(yè)贏得AI時(shí)代競(jìng)爭(zhēng)的關(guān)鍵優(yōu)勢(shì)。例如，在家電行業(yè)，低成本人工智能技術(shù)有望突破制造業(yè)與生成式人工智能結(jié)合的局限性，催生基于垂域大模型賦能的新型智能制造產(chǎn)業(yè)，促進(jìn)智能家居及家用服務(wù)機(jī)器人同步發(fā)展。

選擇開源路線，則進(jìn)一步降低了技術(shù)普及應(yīng)用的門檻，對(duì)全球加快構(gòu)建大模型AI產(chǎn)業(yè)生態(tài)具有重要意義。專注“AI+教育”領(lǐng)域的青島羅博數(shù)碼科技有限公司董事長(zhǎng)殷述軍表示，如果拿AI行業(yè)與移動(dòng)互聯(lián)網(wǎng)做類比，可以說(shuō)這是AI行業(yè)的“安卓時(shí)刻”，接下來(lái)行業(yè)一定會(huì)像2012年移動(dòng)互聯(lián)網(wǎng)一樣，產(chǎn)生生態(tài)的大爆發(fā)。百度也宣布將于6月30日起正式開源下一代文心大模型，似乎也從側(cè)面印證了DeepSeek的影響。

種種跡象表明，DeepSeek是全球AI發(fā)展的又一個(gè)標(biāo)志性時(shí)刻，大模型商業(yè)化落地有望提速。極視角聯(lián)合創(chuàng)始人陳碩表示，2025年將是大模型在產(chǎn)業(yè)側(cè)應(yīng)用的爆發(fā)年。

DeepSeek火爆之后，青島的人工智能相關(guān)企業(yè)紛紛第一時(shí)間接入DeepSeek。根據(jù)DeepSeek提供的解釋，接入DeepSeek是指通過(guò)API、SDK或預(yù)訓(xùn)練模型接口直接調(diào)用DeepSeek提供的現(xiàn)有服務(wù)或模型能力。從全球來(lái)看，微軟最早宣布將DeepSeek-R1模型添加到云平臺(tái)Azure AI Foundry，開發(fā)者可用于構(gòu)建基于云的應(yīng)用程序和服務(wù)。接著，AWS、英偉達(dá)、AMD等公司相繼宣布在其AI服務(wù)平臺(tái)上部署DeepSeek-R1模型。

青島的人工智能企業(yè)緊跟行業(yè)步伐。誕生于海爾生態(tài)的三翼鳥HomeGPT智慧家庭領(lǐng)域大模型、卡奧斯天智工業(yè)大模型平臺(tái)、海納云安全大模型、國(guó)創(chuàng)大模型等，均已引入了DeepSeek的能力，為智慧家庭、生產(chǎn)數(shù)字化、城市應(yīng)急安全等場(chǎng)景賦能。海信自研的星海大模型接入DeepSeek，在智慧生活和智慧城市領(lǐng)域?yàn)橛脩魩?lái)全新的智能交互體驗(yàn)。青島聯(lián)通也進(jìn)行了模型的本地化部署，開發(fā)并上線了多個(gè)大模型智能體應(yīng)用，有效賦能內(nèi)部營(yíng)銷、客服、財(cái)務(wù)、管理等多個(gè)環(huán)節(jié)。

盡管DeepSeek十分強(qiáng)大，但對(duì)專注于垂直細(xì)分領(lǐng)域的人工智能企業(yè)來(lái)說(shuō)，要真正將DeepSeek帶來(lái)的行業(yè)利好轉(zhuǎn)化為商業(yè)落地前景，“專業(yè)”能力仍是要持續(xù)精進(jìn)的核心競(jìng)爭(zhēng)力。海納云安全大模型相關(guān)負(fù)責(zé)人介紹，盡管DeepSeek在多個(gè)領(lǐng)域展示了其卓越的性能，但在與應(yīng)急管理結(jié)合時(shí)仍然面臨一些難點(diǎn)，如算法場(chǎng)景適配，應(yīng)急場(chǎng)景復(fù)雜多樣等。這就要求模型兼具靈活性和準(zhǔn)確性，此外，應(yīng)急行業(yè)很多政策標(biāo)準(zhǔn)文件更新頻率快，需要模型具備快速迭代和學(xué)習(xí)的能力。

今年，羅博科技將基于DeepSeek等開源模型蒸餾訓(xùn)練特定領(lǐng)域的專家模型，在端側(cè)實(shí)現(xiàn)更好的效果和更低的成本。如果將DeepSeek等通用大模型比喻為知識(shí)面廣博的“通才”，那垂直領(lǐng)域行業(yè)大模型則為精通某一具體行業(yè)的“專才”。從“通才”到“專才”，很多時(shí)候并非通過(guò)簡(jiǎn)單地調(diào)整幾個(gè)參數(shù)或增加行業(yè)數(shù)據(jù)來(lái)實(shí)現(xiàn)的。將“通才”的能力為我所用，開發(fā)更優(yōu)秀的“專才”是未來(lái)垂域模型的重要發(fā)力方向，也是垂域模型的重要核心競(jìng)爭(zhēng)力所在。

(責(zé)任編輯：盧其龍 CN070)

關(guān)閉

工程院院士與DeepSeek過(guò)了一招 AI行業(yè)迎來(lái)“安卓時(shí)刻”

相關(guān)新聞

今日熱點(diǎn)

頻道熱點(diǎn)