新冠肺炎期間,WFH 已經是常態,全世界有數百萬人使用視訊來開會、學習、娛樂,甚至就診。IT 大廠紛紛發展視訊會議能應用的人工智慧技術。微軟甚至聯合美妝大廠資生堂,共同推出能「立即上妝」的視訊會議 AI 技術呢!
而顯示卡大廠 NVIDIA 去年末推出的雲端視訊串流 AI 人工智慧平台「Maxine」,能使用人工智慧視訊壓縮技術—只要從人臉上「抓到」幾個關鍵點後,就能在另一端依據這些臉部特徵關鍵點 (facial points),重建人臉動畫。如此一來,就不需串流整個影像的畫素,大幅度降低視訊傳輸所需的頻寬。
以下影片為 NVIDIA Maxine 的各種功能介紹:
無需強大硬體,即可享有高解析.無噪音的視訊會議體驗
NVIDIA Maxine 是雲端原生的視訊串流 AI平台,其嶄新的 AI 功能可被導入到各式各樣的網路視訊會議中。視訊會議的服務供應商可透過 NVIDIA 的雲端 GPU(沒錯!此款 GPU 真的就在雲端上,因此你無需添購任何專業的設備~)上運行該平台,為用戶提供全新的 AI 功能,包括視線校正(Gaze Correction)、超高解析度、噪音消除和臉部打光等功能。
由於資料是在雲端而不是在本地設備上處理,因此使用者無需任何強大的硬體設備,即可享受高解析度、無背景噪音、自動修正的角度、甚至虛擬背景、替身、即時翻譯等進階功能!
AI 捕捉臉部關鍵點,所需頻寬減至原本一成
以下為 NVIDIA Research AI 視訊壓縮展示影片:
NVIDIA 使用的人工智慧技術可以分析每個會議參與者的臉部關鍵點(眼、鼻、口等周圍的要點 key points),並在接收器端運用所抓到的臉部要點來重建臉部動畫。如此一來就不需要傳輸完整的畫面,傳輸的資料減少了,所需的頻寬也因而大大減少。
透過上述人工智慧抓住臉部關鍵點的影像壓縮技術,視訊頻寬消耗減少至原本 H.264 串流視訊壓縮標準要求的十分之一,讓服務供應商的成本也跟著減少、終端用戶也可獲得順暢的視訊會議體驗。
本文為該系列的上篇,下篇(關於眼神接觸、臉部對齊……人工智慧提升視訊會議的體驗)請點此連結
相關文章:
隱私是基本人權!蘋果新功能「App 追蹤透明度」讓 Facebook 急跳腳?
留言列表