天眼查財(cái)產(chǎn)線索信息顯示,廣州小鵬汽車科技有限公司于6月3日申請(qǐng)了一項(xiàng)名為“聲學(xué)語義大模型、服務(wù)器、語音交互方法和存儲(chǔ)介質(zhì)”的專利。
該專利公開了一種聲學(xué)語義大模型,包括聲學(xué)編碼模塊、字符轉(zhuǎn)寫模塊、知識(shí)檢索模塊和大語言模型模塊。聲學(xué)編碼模塊根據(jù)輸入的語音請(qǐng)求生成聲學(xué)特征向量。字符轉(zhuǎn)寫模塊將語音請(qǐng)求轉(zhuǎn)寫為對(duì)應(yīng)的字符序列。知識(shí)檢索模塊從外部知識(shí)庫(kù)中獲取補(bǔ)充信息。大語言模型模塊則根據(jù)聲學(xué)特征向量和補(bǔ)充信息確定自然語言處理結(jié)果。通過這種端到端的聲學(xué)語義大模型,減少了多個(gè)模塊的串行處理,降低了處理語音請(qǐng)求的時(shí)延,提升了模型響應(yīng)速度,從而增強(qiáng)了用戶體驗(yàn)。