人工智慧 語音助理項鍊能夠與你無聲交流!這是怎麼做到的?

人工智慧語音助理項鍊能夠與你無聲交流!這是怎麼做到的?

圖書館內喊「嗨 SIRI」 太尷尬?讓無聲人工智慧語音助理幫助你

直接開口詢問、指示人工智慧 SIRI,進而解決己身需求,已是 3C 智慧產品廣泛使用的日常風景。然而,若是在安靜的環境中呢?想像一下,如果你在靜謐的圖書館或是針落有聲的會議室裡,開口詢問:「嘿 Siri,明天天氣如何?」似乎有點尷尬。

當你亟需向你的人工智慧助理下指令,卻遇到上述需要保持安靜、無法說話的情況怎麼辦?

拯救你的無聲尷尬!透過下巴動作就能辨識的語音助理項鍊 SpeeChin

不用擔心!為了拯救你的無聲尷尬,康乃爾大學資訊科學助理教授 Cheng Zhang 和博士生  Ruidong Zhang,發明了一款項鍊型的人工智慧語音助理「SpeeChin」。這款項鍊配備了紅外線鏡頭、微處理器、電池和藍牙模組,項鍊外盒配有可提高穩定性的機翼造型平衡器,亦於項鍊盒底部配置了一枚硬幣以平衡配重。

SpeeChin 特性如同一般項鍊,使用銀鍊掛在脖子上,其紅外線鏡頭裝置於 3D 列印的項鍊盒上方,使鏡頭穩定指向佩戴者的下巴。SpeeChin 能夠基於下巴運動軌跡,捕捉「頸部和臉部皮膚變形圖像」,進而辨識無聲語言。目前的實驗結果顯示,SpeeChin 已能辨識簡單的英文和中文單詞。

已可辨識中英文!移動偵測問題仍待解決

在最初的實驗裡,研究人員測量了 10 名英文使用者及 10 名中文使用者,共 20 位參與者的下巴基線,接著使用差分圖像訓練 SpeeChin 辨識簡單指令,應用機器學習演算法將辨識結果傳到配對的智慧型手機,就像用另一種方式溝通的 Siri。隱私問題也不必擔憂,SpeeChin 只會對準佩戴者的下巴,不會拍到使用者的臉。

實驗方式為:10 位英文使用者無聲說出 54 條指令,包括數字、互動、呼叫語音助理、標點和導航,10 位中文參與者的 44 條指令也一樣。最後實驗結果顯示,SpeeChin 的英文/中文命令辨識能力平均準確率分別為 90.5% 和 91.6%。

此外,研究人員還要求其中 6 名參與者在行走時默念 10 個中文和英文片語,然而因為參與者頭部以不可預測的方式移動,所以最後成功率較低。顯示移動偵測的準確度是尚待解決的問題。

為什麼無聲語音辨識要做成項鍊的形式呢?研究人員認為:項鍊是人們習慣的裝飾品,至於耳掛式設備則可能會有不太舒服的佩戴體驗。雖然人們可能會想「我的手機就是語音辨識設備了啊」,但難免還是會遇到無法出聲的人或場合,此時人工智慧無聲語音辨識的研究就能派上用場

 

相關文章:

元宇宙也有翻譯蒟蒻了!Meta推全球語言都可翻譯的人工智慧

Google提出Android隱私沙盒,標榜保護用戶資料安全

白帽SEO、黑帽SEO,到底差在哪?

RWD 和 AWD 的差異與優缺點

人工智慧有望解決能源危機,就靠控制核融合!

Meta和Google等科技巨頭究竟會如何面對網軍及假新聞?

網頁RWD和AWD想做SEO哪個有利?

    Ezra.Yii5778 發表在 痞客邦 留言(0) 人氣()