資源簡介 (共13張PPT)第5課 語音識別技術曾經我們有過這樣一個夢有一扇門,一喊就能開,是什么門……有一根棍子,一喊就能改變大小……故事里的語音識別一、語音識別語音識別是以語音為研究對象,通過語音信號處理和模式識別讓機器自動識別和理解人類口述的語言。其最大優勢在于使得人機用戶界面更加自然和容易使用。“聲 控”語音識別(ASR)語音————————“指令”或者“文本”模擬探究:語音識別是怎么實現的二、語音識別過程先要了解:人是如何聽到聲音轉化為文字的?人類實驗一:謝謝 「ありがとうございますarigatō gozaimasu」早上好 おはよう,ou h ayo那我開吃了 いただきます (i ta da ki ma su)(隨機挑選一句測試,回想下你經歷了哪些過程)聽到聲音——仔細辨別、消除雜音——比對、識別音素——依靠經驗和前后語義——確定內容① ② ③ ④ ⑤實驗二:抱負?包袱?報復?二、語音識別過程聽到聲音第一步計算機用什么“聽到”聲音?“聽到”聲音就是從模擬信號轉變為數字信號的過程觀看以下視頻的部分內容《https://www./video/BV1Sb4y1H7eW/ spm_id_from=333.337.search-card.all.click&vd_source=a3b085c6762de3a15bd46347b13fb3d4》二、語音識別過程聲音數字化采樣、量化、編碼。聲音從模擬信號轉變為數字信號。聲音數字化之后,常常在電腦上以波形文件的形式呈現,如下圖,我們用了大家最熟悉的scratch,錄制了“喵”這個聲音,得到以下波形實驗3:“貓”和“高”的波形文件相同嗎?同一個人的說不同字波形文件相同嗎?不同的人說同一個字波形文件是否相同?二、語音識別過程仔細聽、辨別噪音第二步2.消除雜音人即使在嘈雜的環境中也能努力甄別有效聲音,或者通過調整距離來聽清,那在語音識別環節我們怎么做?1.精準拾音近場識別技術:可拾音距離<1m,正常拾音距離范圍≤10cm遠場識別技術:主要解決回聲干擾、室內混響、多信號源干擾,從而實現較遠距離的拾音等手機和天貓精靈分別會采用什么技術?二、語音識別過程特征提取、模式匹配第三 比對、識別聲音おはよう,ou h ayo我和誰最像??聲學模型實際過程中,我們會切成更小的聲音片段——音素,然后進行比對音素是最小的語音單位。查閱p27頁國家的音素。大數據在這個過程中發揮什么作用?二、語音識別過程依靠經驗 確定內容第四步抱負?包袱?報復?你的理想baofu是什么……聲學模型識別出單個音素,而語言模型可以讓我們找出該音素出現頻率最高的一個詞語,同時,使得單詞和單詞之間的搭配符合語言習慣。你好的波形n i h ao尼好尼號你好你號去噪音二、語音識別的過程問:如果要讓人工智能聽懂家鄉的方言,你覺得哪個環節要改一下?總結:影響聲音識別的因素有哪些?實踐:語音識別有哪些語音識別應用?1.siri 智能家居 喚醒萬物2.會場翻譯、翻譯筆、微信等 語音轉文字3.提取視頻臺詞4.記錄實踐:語音識別小飛預設的指令:向左轉 向右轉 笑一個 點頭用機器人“小飛”體驗語音識別謝謝聆聽!INTERNET OF THINGS 展開更多...... 收起↑ 資源預覽 縮略圖、資源來源于二一教育資源庫