但是,當(dāng)我們帶著通用大模型真正走進(jìn)政府、城市、行業(yè)、企業(yè)時(shí)就會發(fā)現(xiàn),公有大模型無法直接使用。因?yàn)楣写竽P痛嬖谝韵滤狞c(diǎn)不足:
第一,公有大模型雖然是通才,但它缺乏行業(yè)深度。我們之前認(rèn)為GPT什么都會,但如果你是一個行業(yè)專家,你會發(fā)現(xiàn)GPT在安全、金融這些垂直領(lǐng)域,知識深度是不夠的。很多公司自己訓(xùn)大模型都發(fā)現(xiàn)了這個特點(diǎn),想讓它能力很均衡,就會犧牲深度。所以未來垂直大模型是重要的發(fā)展方向,通用模型和各領(lǐng)域?qū)S械闹R數(shù)據(jù)結(jié)合,讓大模型從“萬事通”變成政府通、行業(yè)通和企業(yè)通,這才是真正的價(jià)值。最新資料表明,GPT4也是由8個垂直模型組成的,從側(cè)面印證了這個觀點(diǎn)。
第二,公有大模型容易造成企業(yè)內(nèi)部數(shù)據(jù)泄露。一方面,公有大模型不是本地部署,它與外部進(jìn)行信息交流時(shí)必然存在數(shù)據(jù)泄露的風(fēng)險(xiǎn);另一方面,公有大模型也無法實(shí)現(xiàn)組織內(nèi)部權(quán)限的分級管理。因此,政府、企業(yè)使用公有大模型必然存在安全風(fēng)險(xiǎn)。
第三,對企業(yè)來講,公有大模型無法保障內(nèi)容真正可信。這主要包含兩個問題:一個是企業(yè)在日常生產(chǎn)經(jīng)營過程中,知識庫是實(shí)時(shí)產(chǎn)生的,并且不斷變化。它不像公有大模型的通用知識,是一成不變的“百科全書”。因此,企業(yè)使用公有大模型無法滿足時(shí)效性的需求。另一個是大模型自身的“幻覺”問題,也就是我們常說的一本正經(jīng)地“胡說八道”。公有大模型經(jīng)常出現(xiàn)張冠李戴的問題,需要通過企業(yè)的內(nèi)部搜索、內(nèi)部知識庫進(jìn)行矯正。這些都需要專有大模型才能實(shí)現(xiàn)。
第四,也是很多企業(yè)級用戶關(guān)注的,公有大模型無法實(shí)現(xiàn)成本可控。舉個例子,很多企業(yè)其實(shí)只需要大模型寫代碼的能力,這時(shí)候公有大模型寫詩、寫論文的能力就是多余的。也就是說,很多企業(yè)只需要百億級垂直大模型就滿足需求,如果使用千億級大模型就是成本的浪費(fèi)。這個成本不只是大模型的采購成本,還包括訓(xùn)練成本、部署成本、微調(diào)成本。在控制成本方面,垂直大模型將會有很大優(yōu)勢。因此,在一個用公開數(shù)據(jù)訓(xùn)練的“通識”大模型基礎(chǔ)上,訓(xùn)練專有大模型,就能做到“事半功倍”,為企業(yè)降本增效。
中國經(jīng)濟(jì)網(wǎng)曲阜6月26日訊(記者李方)6月26日,世界互聯(lián)網(wǎng)大會數(shù)字文明尼山對話在山東濟(jì)寧曲阜開幕。
2023-06-26 17:50:45尼山對話聚焦人工智能11月28日,新東方創(chuàng)始人俞敏洪在個人公眾號,更新了與360公司創(chuàng)始人、董事長兼CEO周鴻祎的采訪對話。
2023-11-29 14:42:13周鴻祎回應(yīng)360廣告多