9月19日,中國(guó)科學(xué)院地理科學(xué)與資源研究所攜手中國(guó)科學(xué)院青藏高原研究所、中國(guó)科學(xué)院自動(dòng)化研究所等機(jī)構(gòu),共同發(fā)布了名為“坤元”(Sigma Geography)的多模態(tài)地理科學(xué)大模型。這一專為地理科學(xué)領(lǐng)域設(shè)計(jì)的語(yǔ)言大模型,具有解決地理科學(xué)問(wèn)題的專業(yè)技能,其開(kāi)發(fā)涵蓋了地理學(xué)全面語(yǔ)料庫(kù)的構(gòu)建、專業(yè)語(yǔ)言大模型的建立,以及地理科學(xué)研究智慧輔助平臺(tái)的開(kāi)發(fā)。這讓“坤元”不僅能夠理解地理知識(shí),還能精準(zhǔn)匹配圖像、理解用戶需求并自動(dòng)生成圖表,服務(wù)范圍從解答地理專業(yè)問(wèn)題到地理文獻(xiàn)智能分析,再到地理數(shù)據(jù)查詢與分析,乃至專題地圖繪制等。
研發(fā)團(tuán)隊(duì)構(gòu)建了一個(gè)包含四大類別、十六小類的全方位地理學(xué)科語(yǔ)料庫(kù),為大模型提供了320億詞元進(jìn)行自我學(xué)習(xí),并精心調(diào)整了超過(guò)4萬(wàn)條高質(zhì)地理學(xué)指令。與通用語(yǔ)言模型相比,“坤元”在地理學(xué)特定語(yǔ)言模式、術(shù)語(yǔ)及專業(yè)知識(shí)的理解上更為精準(zhǔn),其在地理學(xué)專業(yè)測(cè)試中的準(zhǔn)確度提高了31.3%。
“坤元”的目標(biāo)是拓寬公眾的地理認(rèn)知邊界,提升地理專業(yè)人士的工作效率,促進(jìn)地理智能化的發(fā)展,為地理科學(xué)研究提供新動(dòng)力,加速重要地理科學(xué)發(fā)現(xiàn)的進(jìn)程。展望未來(lái),研發(fā)團(tuán)隊(duì)正致力于地圖大模型及地理推理機(jī)的研究,以實(shí)現(xiàn)模型直接解析地圖的能力;同時(shí),他們還計(jì)劃開(kāi)發(fā)一個(gè)地理科研合作大平臺(tái),使每位科學(xué)家和研究團(tuán)隊(duì)都能擁有定制化的地理大模型,通過(guò)共享資源與智慧,與全球數(shù)百萬(wàn)科研人員協(xié)同創(chuàng)新。