
胡郁現(xiàn)場演講圖

段建軍現(xiàn)場演講圖
中國網(wǎng)娛樂9月22日訊 對于不少“開車族”而言,手機內(nèi)的語音導(dǎo)航可謂是必不可少的行車神器,為了響應(yīng)市場需求、增添語音導(dǎo)航的新鮮感,部分導(dǎo)航類app更是邀請到林志玲、郭德綱、羅永浩等圈內(nèi)明星為該款應(yīng)用站臺“獻(xiàn)聲”。有了這樣一款系統(tǒng),用戶不但能解決行車途中可能遇到的路況煩惱,還可以享受到“私人訂制”的語音導(dǎo)航服務(wù)。那么問題來了,語音導(dǎo)航如何做到識別每一條街道、每一個地名?錄制這樣一款復(fù)雜的語音系統(tǒng)需要耗費多長時間?在即將播出的新一期《未來架構(gòu)師》中,科大訊飛執(zhí)行總裁胡郁與“汽車行業(yè)領(lǐng)跑者”段建軍,以“世界無邊界”為主題,帶領(lǐng)觀眾走進(jìn)近未來的人機交互世界!
智能語音竟可“私人訂制” !“人機大戰(zhàn)”是否能捍衛(wèi)人類最后尊嚴(yán)?
在本周日晚播出的第十期《未來架構(gòu)師》中,科大訊飛執(zhí)行總裁胡郁就將在節(jié)目中與觀眾分享研發(fā)語音識別技術(shù)的艱辛成長史。
中國有九大方言語系,其中細(xì)分的方言有幾十甚至上百種,且由于地域的差異,人們說話的方式更是南腔北調(diào)。最初,科大訊飛為了讓機器人聽懂不同口音的人說話,便設(shè)計出了一套名為訊飛語音的輸入法,人們只需將此輸入法裝在智能手機上,就可以通過語音識別技術(shù),直接將其轉(zhuǎn)換成文字;可在當(dāng)時,輸入法的正確率僅僅只有百分之五十五,面對這一問題,科大訊飛并沒有選擇放棄,而是不斷的致力于提升語音識別技術(shù),通過不斷的努力,如今其系統(tǒng)已經(jīng)收集了成千上萬上億小時的數(shù)據(jù),正確率可以達(dá)到百分之九十八。
“我們所接觸到的所有漢語音節(jié)都是由特定的聲母、韻母和不同的調(diào)性組合組裝在一起的,即使我們的語言千變?nèi)f化,但常用的音節(jié)卻不超過三千個。”在本周日晚播出的第十期《未來架構(gòu)師》中,科大訊飛執(zhí)行總裁胡郁就關(guān)于“明星和藝人如何進(jìn)行復(fù)雜的語音錄制”這一問題給出了相應(yīng)的解釋;“我們的團(tuán)隊根據(jù)此種情況,專門設(shè)計了一個標(biāo)準(zhǔn)的‘庫’,它能盡可能地覆蓋每個人在不同情況下的音,配音者只需要用一小時左右的時間,把一篇文字按要求朗讀一遍;我們的程序會通過機器去學(xué)習(xí)他們的嗓音,這樣就能夠得到一個可以講任意文字信息的語音系統(tǒng)了?!焙粽f。