自新冠肺炎疫情爆發以來,“戴口罩發聲”一直是一個問題。
新冠肺炎疫情發生後,戴口罩講話已成為常態。
在會議、課堂、醫療現場,甚至在YouTube上拍攝和直播時(這也意味著隱藏你的臉)──
想必大家都經歷過口罩摘不下來、聲音低沉、噪音進來的問題。
與此同時,東京大學和京都索尼計算機科學實驗室(CSL)開發的一種新設備,面膜夾” 引起了人們的注意。
只需將這個小夾子固定在您的面罩上即可。面具本身就變成了麥克風是的。
傳統的“面罩收音”方法及其局限性
| 手法 | 結構 | 優點 | 缺點 |
|---|---|---|---|
| 針式麥克風(領夾式麥克風) | 貼在領子上或口罩外面 | 簡單且高品質的聲音 | 口罩布摩擦聲音低沉 |
| 喉式麥克風 | 拾取喉嚨振動 | 即使在噪音中也清晰可見 | 需要戴在脖子上/感覺有壓力 |
| AI降噪麥克風 | AI消除背景聲音 | 抗噪音能力強 | 設備龐大且昂貴 |
| 揚聲器面罩/擴音器 | 面具內的揚聲器 | 方便醫療和教育環境 | 重量、電池壽命和音質問題 |
雖然每種方法都有一定的效果,“面具堵聲音”的根本問題我還沒能解決它。
“MaskClip”由東京大學信息研究研究生院Rekimoto實驗室和索尼CSL京都共同開發。使用壓電元件(壓電傳感器)的小型夾式麥克風裝置是。
“Piezo”是一個希臘詞,意思是“推動或施加壓力”。壓電元件(piezoelectric element)是將力或振動等物理壓力轉換為電信號具有屬性的材料。還用於揚聲器、打火機點火裝置、電子樂器、振動傳感器等。
這次的“MaskClip”使用該壓電元件來檢測面罩表面的輕微振動(聲音引起的空氣振動)。將電信號轉換為音頻數據我正在做。
換句話說,將口罩變成“拾取聲音的傳感器”的心臟就是這個壓電元件。
直接檢測口罩表面的微小振動,而不是空氣中的聲音。通過面具的移動拾取聲音這是它的工作原理。
所以,
- 即使在嘈雜的環境中也能準確捕捉說話者的聲音
- 顯著降低外部噪音和混響的影響
- 適用於一般無紡布口罩一鍵式安裝,衛生
確切地面罩本身就變成了高性能麥克風這是思想的轉變。
實驗結果:比針式麥克風清晰約 3 倍
根據研究團隊的實驗,與傳統針式麥克風相比,MaskClip 降低了字符錯誤率 (CER)。大約三分之一減少到。
即使在背景噪音很大的環境中,這也能發揮作用。只能高精度提取您自己的聲音就是這個意思。
它在醫療、研究、教育和攝影等需要佩戴口罩的環境中顯示出語音輸入、通話和錄音的巨大潛力。
創作者的好消息:“你可以隱藏麥克風”
對於戴著口罩進行拍攝和直播的 YouTube 用戶和視頻博主來說是個好消息。
MaskClip 適合面罩內部,因此麥克風完全隱藏的自然鏡頭你可以拍照。
無需像過去那樣看到電纜或將針式麥克風隱藏在衣領下。
能夠以穩定的音質進行錄製,同時保持乾淨的外觀,這是相當大的優勢。
未來的可能性
儘管仍處於研究階段,MaskClip有望應用於以下領域。
- 🏥醫療領域:無需摘下面罩即可錄音/語音指令
- 🧑🏫教育/會議:講師和演講者戴著口罩授課。
- 🎥內容創作:拍攝時隱藏麥克風替代方案
- 🌐翻譯/語音識別:配合實時轉錄和自動字幕
口罩已經從阻擋聲音的東西,變成了拾取聲音的新設備。
這項研究讓我們對未來有所了解。
参考論文
該技術的詳細信息發表在以下論文中。
