如何判斷汽車(chē)語(yǔ)音識(shí)別系統(tǒng)的性能優(yōu)劣?
要判斷汽車(chē)語(yǔ)音識(shí)別系統(tǒng)的性能優(yōu)劣,可以從以下幾個(gè)方面入手。
首先是誤喚醒率,主喚醒詞誤喚醒率應(yīng)小于 0.2 次/小時(shí),除主喚醒詞外其他免喚醒詞綜合誤喚醒率小于 1.5 次/小時(shí)。測(cè)試時(shí)可搭建實(shí)際場(chǎng)景,人工嘴播放測(cè)試音頻,至少播放 10 小時(shí)。
其次是喚醒率,不同場(chǎng)景下車(chē)速、音樂(lè)、車(chē)窗、空調(diào)、人聲等因素會(huì)影響喚醒率。比如在停車(chē)場(chǎng),車(chē)速為 0 時(shí)喚醒率較高。
然后是識(shí)別率,通常以字識(shí)別率和句識(shí)別率為驗(yàn)收標(biāo)準(zhǔn),可用詞錯(cuò)誤率來(lái)評(píng)測(cè),通過(guò)編輯距離算法計(jì)算替換、刪除和插入錯(cuò)誤。
還有響應(yīng)時(shí)間,包括喚醒響應(yīng)時(shí)間和識(shí)別響應(yīng)時(shí)間,喚醒響應(yīng)時(shí)間平均應(yīng)小于 0.6 秒,識(shí)別響應(yīng)時(shí)間平均應(yīng)小于 1.3 秒。
此外,麥克風(fēng)硬件規(guī)格也很重要,比如電容麥克風(fēng)通常比動(dòng)圈麥克風(fēng)靈敏度高。硬件實(shí)際狀態(tài)如噪音、麥克風(fēng)數(shù)量和位置等會(huì)影響識(shí)別效果。回聲消除算法能優(yōu)化語(yǔ)音交互,產(chǎn)品還可設(shè)計(jì) VAD 截?cái)鄷r(shí)長(zhǎng)來(lái)適應(yīng)不同場(chǎng)景。
最后,可參考車(chē)載智能語(yǔ)音系統(tǒng)的測(cè)試與評(píng)價(jià)方法,從語(yǔ)音喚醒成功率、誤喚醒率、識(shí)別成功率、音源定位準(zhǔn)確率、聲紋鑒別率、回聲消除能力、響應(yīng)識(shí)別時(shí)間、語(yǔ)音資源占用、系統(tǒng)穩(wěn)定性等方面綜合評(píng)估。
車(chē)系推薦
最新問(wèn)答

