智能語音技術(shù)目前已經(jīng)從科幻電影走進人們現(xiàn)實是生活,但最大的一點是如何提升語音識別的準(zhǔn)確率。
為此,科技巨頭們一直在不懈努力。
2016年9月,微軟宣布自家語音識別技術(shù)的最低錯誤率為6.3%,打破此前IBM保持的6.9%紀(jì)錄。而就在此后的幾個月,微軟再次宣布將最低錯誤率降低到了5.9%,這已經(jīng)與普通人類齊平。
現(xiàn)在,IBM實現(xiàn)了反超。
IBM最新宣布,已經(jīng)成功將語音識別中的單詞錯誤率降低到5.5%,并正在向5.1%努力。
IBM介紹稱,5.5%低錯誤率是通過長短期記憶、WaveNet語言模型和三個強聲學(xué)模型實現(xiàn)的。而這一結(jié)果則是使用SWITCHBOARD和CallHome語料庫測試得出,具有相當(dāng)?shù)臋?quán)威性和業(yè)內(nèi)認(rèn)同。