电竞下注-中国电竞赛事及体育赛事平台

當前位置:新聞 > 經(jīng)濟新聞 > 正文

海云數(shù)據(jù)創(chuàng)造“讀唇術(shù)”:看嘴型識別發(fā)音

2017-03-31 17:33:11    中國網(wǎng)  參與評論()人

聲音是人類感知世界的重要渠道,然而在特定的無聲場景中,聲音的傳播屬性被強制剝離,形成信息真空。將失去的聲音還原成信息流,并用文字可讀的方式再造場景成為迫切需要,唇語識別技術(shù)由此而生。

2017年3月29日,海云數(shù)據(jù)創(chuàng)始人兼CEO馮一村在亞洲大數(shù)據(jù)可視分析峰會上,發(fā)布了重慶市公安科研所與海云數(shù)據(jù)共同研發(fā)的唇語識別技術(shù)成果。

1

【海云數(shù)據(jù)創(chuàng)始人、CEO馮一村發(fā)言】

馮一村介紹:自2016年12月以來,海云研究院經(jīng)過多項技術(shù)攻關(guān),結(jié)合海云數(shù)據(jù)業(yè)務(wù)形態(tài)、唇語識別的核心技術(shù)及應用進行了深度探索,打破了原先只能識別英文的技術(shù)局限,開創(chuàng)了中文唇語識別模型的研究先河,并取得了一定的成果。經(jīng)過實踐評估,中文識別模型準確率已達到70%。

神奇卻不神秘的唇語識別

唇語識別并不神秘,早在幾年前,國外就已提出相關(guān)概念,但更多是存于構(gòu)想階段。實質(zhì)上,唇語識別是一項集機器視覺與自然語言處理于一體的技術(shù)。唇語識別系統(tǒng)使用機器視覺技術(shù),從圖像中連續(xù)識別出人臉,并提取此人連續(xù)的口型變化特征,隨即將連續(xù)變化的特征輸入到唇語識別模型中,識別出講話人口型對應的發(fā)音,從而計算出可能性最大的表達語句。

關(guān)閉