周鴻祎稱大模型不是萬能不要覺得有了GPT就能裁員了(2)

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2023-06-29 09:38:31 界面新聞

但是，當(dāng)我們帶著通用大模型真正走進(jìn)政府、城市、行業(yè)、企業(yè)時(shí)就會發(fā)現(xiàn)，公有大模型無法直接使用。因?yàn)楣写竽Ｐ痛嬖谝韵滤狞c(diǎn)不足：

第一，公有大模型雖然是通才，但它缺乏行業(yè)深度。我們之前認(rèn)為GPT什么都會，但如果你是一個行業(yè)專家，你會發(fā)現(xiàn)GPT在安全、金融這些垂直領(lǐng)域，知識深度是不夠的。很多公司自己訓(xùn)大模型都發(fā)現(xiàn)了這個特點(diǎn)，想讓它能力很均衡，就會犧牲深度。所以未來垂直大模型是重要的發(fā)展方向，通用模型和各領(lǐng)域?qū)Ｓ械闹R數(shù)據(jù)結(jié)合，讓大模型從“萬事通”變成政府通、行業(yè)通和企業(yè)通，這才是真正的價(jià)值。最新資料表明，GPT4也是由8個垂直模型組成的，從側(cè)面印證了這個觀點(diǎn)。

第二，公有大模型容易造成企業(yè)內(nèi)部數(shù)據(jù)泄露。一方面，公有大模型不是本地部署，它與外部進(jìn)行信息交流時(shí)必然存在數(shù)據(jù)泄露的風(fēng)險(xiǎn)；另一方面，公有大模型也無法實(shí)現(xiàn)組織內(nèi)部權(quán)限的分級管理。因此，政府、企業(yè)使用公有大模型必然存在安全風(fēng)險(xiǎn)。

第三，對企業(yè)來講，公有大模型無法保障內(nèi)容真正可信。這主要包含兩個問題：一個是企業(yè)在日常生產(chǎn)經(jīng)營過程中，知識庫是實(shí)時(shí)產(chǎn)生的，并且不斷變化。它不像公有大模型的通用知識，是一成不變的“百科全書”。因此，企業(yè)使用公有大模型無法滿足時(shí)效性的需求。另一個是大模型自身的“幻覺”問題，也就是我們常說的一本正經(jīng)地“胡說八道”。公有大模型經(jīng)常出現(xiàn)張冠李戴的問題，需要通過企業(yè)的內(nèi)部搜索、內(nèi)部知識庫進(jìn)行矯正。這些都需要專有大模型才能實(shí)現(xiàn)。

第四，也是很多企業(yè)級用戶關(guān)注的，公有大模型無法實(shí)現(xiàn)成本可控。舉個例子，很多企業(yè)其實(shí)只需要大模型寫代碼的能力，這時(shí)候公有大模型寫詩、寫論文的能力就是多余的。也就是說，很多企業(yè)只需要百億級垂直大模型就滿足需求，如果使用千億級大模型就是成本的浪費(fèi)。這個成本不只是大模型的采購成本，還包括訓(xùn)練成本、部署成本、微調(diào)成本。在控制成本方面，垂直大模型將會有很大優(yōu)勢。因此，在一個用公開數(shù)據(jù)訓(xùn)練的“通識”大模型基礎(chǔ)上，訓(xùn)練專有大模型，就能做到“事半功倍”，為企業(yè)降本增效。

關(guān)閉

周鴻祎稱大模型不是萬能 不要覺得有了GPT就能裁員了(2)

相關(guān)新聞

今日熱點(diǎn)

頻道熱點(diǎn)

周鴻祎稱大模型不是萬能不要覺得有了GPT就能裁員了(2)