????
來源:www.ccttx.cn????作者:酷蜂科技????時間:2017-12-25 09:06
[摘要]在今年的烏鎮(zhèn)互聯(lián)網世界大會上面,有一項黑科技進入了人們的眼球,它就是唇語識別技術。唇語識別APP開發(fā)不受噪音干擾,在多人的對話里面也能有效進行區(qū)分,有望解決語音識別的缺陷。
在今年的烏鎮(zhèn)互聯(lián)網世界大會上面,有一項黑科技進入了人們的眼球,它就是唇語識別技術。
唇語識別APP開發(fā)不受噪音干擾,在多人的對話里面也能進行有效區(qū)分,這樣有望解決語音識別的缺陷。事實上,把唇語識別和語音結合起來能夠大大提高系統(tǒng)的正確率和抗干擾能力,所以就有了更多的發(fā)揮空間。
唇語識別APP開發(fā)還有哪些問題需要解決?
1、攝像頭錄入存在很大的限制:在目前的唇語識別系統(tǒng)中,獲得的嘴唇視覺特征信息都是正向的,這樣就意味著與它交互的時候,必須時刻正對著它,這在真實的場景下很難達到。因此唇語識別技術想要應用到更多的場景,這就要求在人臉識別、唇的檢測和定位方面研究出更強的定位、跟蹤算法,提高算法的普適性。
2、識別的準確性問題也需要解決:單純利用視覺特征難以區(qū)分,會造成信息識別錯誤,想要處理這個問題,傳統(tǒng)的技術方法是文法型語言模型。目前很多識別系統(tǒng)都是人工限定的框架,在某一場景中對可能出現(xiàn)的語句進行很多設置。
唇語識別APP開發(fā)其實是迎接一個新時代,隨著大數(shù)據(jù)和人工智能發(fā)展,識別準確率會不斷提高。