資源簡介 (共19張PPT)語音識別技術(shù)浙教版八年級下冊第5課 語音識別技術(shù)學(xué)習(xí)目標(biāo)通過對語音識別應(yīng)用的體驗(yàn),理解語音識別的基本過程和原理,了解聲學(xué)模型和語音模型,感受語音識別帶來的便利。探究1.為什公智能青箱能聽懂人們的問題?2.你認(rèn)為如何讓人工智能聽懂家鄉(xiāng)的方言 建構(gòu)語音識別是以語音為研究對象,通過語音信號處理和模式識別讓機(jī)器自動(dòng)識別和理解人類口述的語言。其最大優(yōu)勢在于使得人機(jī)用戶界面更加自然和容易使用。一、語音識別的過程語音識別一般會(huì)經(jīng)歷以下基本過程:通過數(shù)模轉(zhuǎn)化得到一個(gè)數(shù)字聲音信號,再對該聲音信號進(jìn)行預(yù)處理和特征提取,將該特征在聲學(xué)模型中進(jìn)行模式識別得到音素序列,最后將該音素序列在語言模型中查找概率最高的文本,并輸出識別結(jié)果。一、語音識別的過程一、語音識別的過程1.聲音數(shù)字化聲音數(shù)字化是指將連續(xù)變化的聲音物理信號,每隔一段時(shí)間,測得模擬信號的電壓值,給出該電壓值相應(yīng)的量化值,并在計(jì)算機(jī)中用0和1表示,將模擬信號轉(zhuǎn)換為數(shù)字信號。2.信號預(yù)處理對輸入的語音信號進(jìn)行預(yù)處理,如降噪、消除錄制聲音時(shí)的雜音、回聲等等,得到一個(gè)比較干凈的語音信號。一、語音識別的過程3.特征提取特征提取就是每隔一定時(shí)間,把聲音的音高、音長、音強(qiáng)和音色等特征提取出來的過程。4.模式匹配模式匹配就是將提取出來的特征在聲學(xué)模型中進(jìn)行比對,得到一組音素序列。音素是根據(jù)語音的自然規(guī)律劃分出的最小的語音單位。知識鏈接模式識別 人工智能中的模式識別是根據(jù)某個(gè)類別數(shù)據(jù)的共有模式,即模型(特征),對數(shù)據(jù)進(jìn)行檢測識別或分類。模型的建立可以是直接給予某一事物的各種特征描述,或給予某一事物的海量數(shù)據(jù)樣本,讓機(jī)器通過樣本來自己發(fā)現(xiàn)特征。一、語音識別的過程5.語言處理語言處理需要借助語言模型。聲學(xué)模型識別出的單個(gè)音素,經(jīng)過語言模型可以找出該音素出現(xiàn)概率最高的一個(gè)詞語。不同單詞之間的搭配,在語句中出現(xiàn)的概率是不一樣的。二、語音識別的實(shí)踐人工智能開放平臺(tái)集成了大量聲學(xué)和語言模型,通過這些平臺(tái)提供的軟件開發(fā)工具包,可以把錄制的聲音傳送到平臺(tái)并進(jìn)行識別,再返回識別結(jié)果。如利用人工智能開放平臺(tái)的開發(fā)工具包,識別錄制的myaudio.wav文件中的語音信息。二、語音識別的實(shí)踐親身體驗(yàn)嘗試在人工智能開放平臺(tái)、APP或相關(guān)軟件中,將錄制的myaudio.wav文件分別轉(zhuǎn)換成文本。日積月累語音識別的準(zhǔn)確率與聲學(xué)模型及語言模型都密切相關(guān)。如果聲學(xué)模型是用普通話訓(xùn)練的,那么識別方言語音,正確率就相對較低。通過及時(shí)更新地名、網(wǎng)絡(luò)流行語等詞匯,在語言模型中改變單詞之間的搭配概率,可以有效地提高新單詞的識別率。語音識別的準(zhǔn)確率還與錄音時(shí)周邊環(huán)境的噪音、錄音設(shè)備的質(zhì)量等因素有關(guān)。隨堂練習(xí)1.錄制一段語音,在人工智能開放平臺(tái)、APP或軟件中,將錄制的語音分別轉(zhuǎn)換成文本,并統(tǒng)計(jì)轉(zhuǎn)換后文本的準(zhǔn)確率。2.選擇不同的“發(fā)音人”或者方言對同一段文本信息進(jìn)行錄制,然后在同一個(gè)平臺(tái)、APP或軟件中進(jìn)行測試,并統(tǒng)計(jì)識別正確率。謝謝聆聽!INTERNET OF THINGS謝謝21世紀(jì)教育網(wǎng)(www.21cnjy.com)中小學(xué)教育資源網(wǎng)站兼職招聘:https://www.21cnjy.com/recruitment/home/admin 展開更多...... 收起↑ 資源預(yù)覽 縮略圖、資源來源于二一教育資源庫