數碼錄音筆工作原理
數碼錄音筆通過對聲音的模擬信號的采樣、編碼,將模擬信號通過數模轉換器轉換為數字信號,并進行壓縮后進行存儲。
智能錄音筆工作原理
語音交互,只需要短短幾秒鐘便可翻譯出文字。所謂語音轉換成文字用到了語音交互中一項ASR技術。
建立聲學模型:由于每個人發音、語調、語速等各不相同,需要將同一個單詞或漢字讓不同用戶錄取,以便機器識別更多的人。聲學模型建立過程需要錄入大量的原始用戶聲音,以從中提取特征建立聲學模型數據庫。
建立語言模型:同聲學模型,也需要大量文字信息的儲存。語言模型可以對聲學模型進行匹配與調整,讓正確率盡可能提高,語句更加通順。
語音識別:有前兩步作為基礎的情況下,最終形成的數據庫存儲在設備本地或云端,再進行實時語音識別。將用戶的語音輸入進行編碼和特征提取,將提取到的特征拿到聲學模型庫中去查詢,得到單個的單詞或漢字;然后再拿到語言模型庫中去查詢,得到最匹配的單詞或漢字。