電氣通信大學(xué)研究院情報理工學(xué)研究科綜合情報學(xué)專業(yè)的柳井啟司教授等人宣稱,開發(fā)出了把用于圖像識別的數(shù)據(jù)壓縮為16分之1大小的技術(shù)。如此一來,同樣容量大小的存儲空間,能對16倍多的對象物進行識別。對于像可穿戴設(shè)備和智能手機這樣存儲空間有限的移動終端,他們提出將把該技術(shù)運用到相關(guān)圖像識別app上。
圖像數(shù)據(jù)分類的流程(電通大提供)
這次采用了“標量量化”壓縮技術(shù)和機械學(xué)習(xí)相結(jié)合的方法,將圖像分類標本大幅壓縮。能識別256種圖像的app數(shù)據(jù)量從54MB減少到3.4MB,能識別1000種圖像的則從72MB減少到4.5MB。識別精度和速度則基本不變。因為是在移動終端內(nèi)部完成一系列識別過程,因此能實時進行圖像識別。
對于應(yīng)用場景,研發(fā)人員進行的設(shè)想是,比如,當(dāng)攝像頭對著一個物體時,能實時判斷出該物體是什么,并顯示出與之相關(guān)的文章或文字介紹。具體說來,像健康管理app中對食物進行卡路里計算、觀光app中對風(fēng)景名勝進行講解等。計劃將推動智能手機、智能眼鏡等廠商使用該技術(shù)。