电竞下注-中国电竞赛事及体育赛事平台

當(dāng)前位置:新聞 > 經(jīng)濟(jì)新聞 > 正文

海云數(shù)據(jù)創(chuàng)造“讀唇術(shù)”:看嘴型識別發(fā)音

2017-03-31 17:33:11    中國網(wǎng)  參與評論()人

聲音是人類感知世界的重要渠道,然而在特定的無聲場景中,聲音的傳播屬性被強(qiáng)制剝離,形成信息真空。將失去的聲音還原成信息流,并用文字可讀的方式再造場景成為迫切需要,唇語識別技術(shù)由此而生。

2017年3月29日,海云數(shù)據(jù)創(chuàng)始人兼CEO馮一村在亞洲大數(shù)據(jù)可視分析峰會上,發(fā)布了重慶市公安科研所與海云數(shù)據(jù)共同研發(fā)的唇語識別技術(shù)成果。

1

【海云數(shù)據(jù)創(chuàng)始人、CEO馮一村發(fā)言】

馮一村介紹:自2016年12月以來,海云研究院經(jīng)過多項技術(shù)攻關(guān),結(jié)合海云數(shù)據(jù)業(yè)務(wù)形態(tài)、唇語識別的核心技術(shù)及應(yīng)用進(jìn)行了深度探索,打破了原先只能識別英文的技術(shù)局限,開創(chuàng)了中文唇語識別模型的研究先河,并取得了一定的成果。經(jīng)過實踐評估,中文識別模型準(zhǔn)確率已達(dá)到70%。

神奇卻不神秘的唇語識別

唇語識別并不神秘,早在幾年前,國外就已提出相關(guān)概念,但更多是存于構(gòu)想階段。實質(zhì)上,唇語識別是一項集機(jī)器視覺與自然語言處理于一體的技術(shù)。唇語識別系統(tǒng)使用機(jī)器視覺技術(shù),從圖像中連續(xù)識別出人臉,并提取此人連續(xù)的口型變化特征,隨即將連續(xù)變化的特征輸入到唇語識別模型中,識別出講話人口型對應(yīng)的發(fā)音,從而計算出可能性最大的表達(dá)語句。

但是,成熟的唇語識別系統(tǒng)需要建立在大量人臉特征樣本的基礎(chǔ)之上,通過帶記憶的深度神經(jīng)網(wǎng)絡(luò)才能保證結(jié)果的最大準(zhǔn)確性。鑒于人種的生物特征以及語言特征區(qū)別,國外的系統(tǒng)并不能照搬照抄,因此海云數(shù)據(jù)攜手重慶公安研究所開始了中文唇語識別系統(tǒng)的研發(fā)。

唇語識別提升大數(shù)據(jù)應(yīng)用價值

在研發(fā)過程中,海云數(shù)據(jù)一直在深挖唇語識別的實際應(yīng)用價值。結(jié)合多年公安大數(shù)據(jù)落地實踐經(jīng)驗來看,唇語識別技術(shù)能豐富海云數(shù)據(jù)現(xiàn)有的公共安全領(lǐng)域的大數(shù)據(jù)一站式解決方案,更好的提高公安破案效率。

此前,海云數(shù)據(jù)開發(fā)的大數(shù)據(jù)可視指揮決策平臺——智警,能夠?qū)⒖谝曨l、警力分布、警車GPS等相關(guān)數(shù)據(jù)放到空間、地理維度進(jìn)行分析,并能夠有效的協(xié)助決策層認(rèn)知到警力是否充足、警力調(diào)配是否合理,從而有效的預(yù)防”兩搶一盜“等犯罪現(xiàn)象??梢灶A(yù)想,加入唇語識別技術(shù)后,公安人員可通過平臺鎖定視頻中犯罪嫌疑人的語言記錄,極大助力犯罪緝查工作的開展。

這其實只是唇語識別技術(shù)的應(yīng)用場景之一。在日常生活、社會公益、體育賽事裁定等方面唇語識別有著更廣闊的空間。譬如助力聾啞人、老年人交流;唇語解鎖;體育賽事的語言暴力等。一項新技術(shù)的誕生,往往能夠給人類帶來無限的想象空間。而率先掌握新技術(shù)的人則必將擁有打開。

關(guān)閉