資源簡介 (共54張PPT)第3單元 第1課初識語音識別——語音識別技術應用(清華大學版)六年級上1核心素養目標3新知講解5拓展延伸7板書設計2新知導入4課堂練習6課堂總結課后作業801核心素養目標信息意識計算思維數字化學習與創新信息社會責任理解并尊重同學的隱私,學會安全地收集和處理敏感數據(如語音),避免不當分享。利用語音識別了解學習語音識別的過程,學會語音識別技術項目應用設計。學習用語音與機器進行交流,讓機器明白你說什么,并按照你說的話執行某些指令,并規范使用語音識別技術。能夠了解認識語音識別技術的原理和應用,認識機器的“聽覺系統”語音識別。02新知導入要讓機器模擬人類的智能,就要先模擬人類的感官智能,使機器不僅能跟人類一樣慧眼識物、察顏觀色,還能模擬人類的聽覺能力,理解人類語言的內涵,這樣才能讓機器更好地跟人們進行交流。本節課,我們就來認識機器的“聽覺系統”——語音識別吧!02新知導入02新知導入思考同學們,請思考一下,你們認為什么是語音識別,生活中你們有沒有見到過語音識別的例子,和同學們討論交流一下。02新知導入語音識別是指計算機或其他設備能夠識別和理解人類語音的技術。它通過將聲音信號轉化為文本或指令,使得人們可以通過說話來與設備進行交互。02新知導入在生活中,我們可以看到許多語音識別的例子,比如:1. 智能助手:像Siri、Google Assistant和Alexa等智能助手,可以通過語音指令執行任務,比如設置鬧鐘、查詢天氣、播放音樂等。2. 語音輸入:在手機或電腦上,我們可以使用語音輸入功能,將說的話直接轉換為文字,方便快捷。02新知導入3. 導航系統:許多車載導航系統支持語音指令,駕駛者可以通過語音來輸入目的地或調整路線。4. 客服系統:一些公司使用語音識別技術來處理客戶的電話咨詢,自動識別客戶的需求并提供相應的服務。02新知導入03新知講解一、認識語音識別技術用語音與機器進行交流,讓機器明白你說什么,并按照你說的話執行某些指令,這就是人們在最初研究機器智能時夢寐以求的事情,而今天這種技術已經飛入尋常百姓家。03新知講解語音識別技術的含義語音識別技術也被稱為自動語音識別,目標是將人類語音中的詞匯或語義內容轉換為計算機可讀的輸入指令,如圖3.1.1所示。可以把機器的語音識別簡單理解為“機器的聽覺系統”,目的是讓機器聽懂人說的話,并按人類下達的指令執行任務。03新知講解語音識別技術的含義圖 3.1.1 將語音轉換為文字或指令03新知講解語音識別的發展針對語音識別技術的研究從 20世紀50年代開始到現在已經歷了半個多世紀,經過艱難的探索獲得了巨大的進展。1952 年貝爾實驗室研究成功了世界上第一個能識別10個英文數字發音的實驗系統;20世紀70年代,科學家在小詞匯量、孤立詞的識別方面取得了實質性的進展;到20世紀80年代語音識別技術逐漸由孤立詞識別轉向連接詞識別。語音識別的發展過程如圖 3.1.2 所示。03新知講解語音識別的發展圖 3.1.2 語音識別由開始的識別詞升級為識別句子03新知講解語音識別的發展1987 年,科學家開發出了世界上第一個“非特定人連續語音識別系統”用統計的方法提高了語音識別準確率,如圖 3.1.3 所示。圖3.1.3 語音識別不斷優化,準確率提升03新知講解語音識別的發展20 世紀 90年代,大詞匯量連續語音識別得到了優化;1997 年首個語音聽寫產品問世,只要對著話筒說出要輸入的字符,它就會自動判斷并幫你輸入文字。2011年年初,某企業的深度神經網絡(DNN)模型在語音搜索任務上獲得成功,之后多家國內企業將 DNN 模型應用到中文語音識別領域。03新知講解語音識別的發展如今,語音識別技術逐漸實現產品化,并嵌入移動設備,如手機、計算機等,以及穿戴式設備如電話手表等進行使用。手機使用語音識別技術的示例如圖 3.1.4 所示。人機交互的方式翻開了新的篇章。圖3.1.4 手機使用了語音識別技術03新知講解課堂活動同學們,你能總結一下語音識別技術發展的過程嗎 和同學們一起分享交流吧!03課堂練習語音識別技術的發展過程可以分為以下幾個主要階段 :1、1950年代至1960年代 :語音識別技術的早期起源。這一時期的語音識別技術主要是基于手工編寫的規則和模板的方法,用于識別單詞和短語 。 2、1970年代至1980年代 :基于Hidden Markov Model(HMM)的語音識別技術出現。這一階段研究者們開始使用HMM模型來描述語音信號,并開發了一系列的語音識別算法 。 03課堂練習3、1990年代至2000年代 :深入研究語音識別算法的階段。研究者們開始探索各種不同的語音識別算法,包括神經網絡、支持向量機、決策樹等,尤其是循環神經網絡(RNN)和長短期記憶網絡(LSTM)的應用,顯著提升了語音識別的性能 。4、2010年代至今 :深度學習驅動的語音識別技術飛速發展。隨著深度學習技術的出現和發展,特別是卷積神經網絡(CNN)和RNN的廣泛應用,語音識別技術得到了巨大的提升。2015年后,端到端方法的興起進一步推動了語音識別性能的提升,使得語音識別的準確性首次超越了人類。 03新知講解二、語音識別技術的應用語音識別技術已經融入了人們的日常生活中,關于語音識別技術的應用主要體現在兩個方面:語音輸入和語音控制。03新知講解語音輸入,即將說話人的語音實時地轉化為文字。相對于鍵盤輸入法,語音輸入更符合人們的日常習慣,也更自然、高效。語音輸入系統可以用于會議的實時記錄、語音搜索等方面。如圖 3.1.5 所示,手機中有連續的語音輸入時還可以自動更新、糾正文字,并進行合理的斷句。語音輸入03新知講解語音輸入圖 3.1.5 語音識別實時將輸入的語音轉化為文字03新知講解語音控制,即將說話人的語音轉化為指令來控制設備的運行。這種方式相對于手動控制來說更加快捷、方便,可以用在諸如工業控制、語音撥號系統、智能家電、聲控智能玩具等許多領域。語音控制家居設備的應用場景如圖 3.1.6 所示。語音控制03新知講解語音控制圖3.1.6 語音控制家居設備03新知講解課堂活動同學們,你們還能想到語音識別技術應用在哪些領域嗎 和同學們一起分享交流一下。03課堂練習語音識別技術在多個領域都有廣泛應用:在智能家居中,語音識別技術使得用戶可以通過聲音指令控制各種家居設備,如智能音箱、智能電視、智能燈具、空調等。用戶只需通過簡單的語音指令就可以實現對設備的開啟、關閉、調節等操作,極大地提高了使用的便捷性 12。此外,語音識別技術還可以設置情景模式,如“回家”模式,自動開啟燈光、調節溫度、播放音樂等,使家居環境更加智能化和個性化 。03課堂練習在汽車領域,語音識別技術可以幫助駕駛員進行各種操作,如撥打電話、導航、調節空調等,而無需分散注意力去操作物理按鈕或觸摸屏。這不僅提高了駕駛的安全性,也提升了駕駛體驗 。語音識別技術的智能化也讓玩具行業進行了變革,越來越多的智能玩具被研發出來,如智能語音娃娃、智能語音兒童機器人。用戶可以通過語音與這些玩具進行簡單交流,完成一些簡單的任務 。03課堂練習在工業及醫療領域,語音識別技術能夠解放雙手,只需對機器發出命令,即可讓其操作完成需要的任務,大大提升了工作效率 。在醫療領域,語音識別技術可以協助醫生快速記錄病歷和治療方案,提高工作效率 。在智能教育方面,AI語音技術可以作為課堂質量輔助和線上虛擬助手,提供個性化的學習體驗 。03新知講解三、語音識別體驗活動活動主題:語音輸入圖 3.1.7 項目準備工具活動準備(見圖 3.1.7)03新知講解三、語音識別體驗活動活動操作說明將程序文件導入編程軟件中,再將計算機和 AIoT板相連接,從智能云平臺中獲得語音識別的 API,粘貼在編程平臺的語音識別程序指令中,將程序刷入 AIoT板;接著按下 AIoT 板的A鍵開始錄音,錄音時長可為 2~5 秒;最后在 AIoT 板OLED 顯示屏上可以看到識別結果。整個過程需要連接 Wi-Fi。03新知講解三、語音識別體驗活動示例程序 (見圖 3.1.8)圖3.1.8 AIoT 板語音識別轉文字程序示例03課堂練習找到語音識別 API:搜索“智能云”進入網址→注冊、登錄→控制臺→產品服務一人工智能語音能力引擎一創建語音識別應用→概覽一領取語音識別免費資源→應用列表→獲得 API Key 和 Secret Key。溫馨小貼士04課堂練習根據體驗活動,請同學們思考一下,機器實現語音識別的必要條件有哪些。請同學們討論交流,并將結果寫在下面的空白處。實踐03課堂練習實現語音識別的必要條件主要包括以下幾個方面:1. 高質量的音頻輸入:- 清晰的音頻信號,盡量減少背景噪音。- 適當的麥克風設備,能夠準確捕捉語音。2. 語言模型:- 需要一個強大的語言模型,以理解和預測語音中的單詞和句子結構。- 語言模型應涵蓋目標語言的詞匯、語法和常用表達。03課堂練習3. 聲學模型:- 聲學模型用于將音頻信號轉換為音素或詞。- 需要大量的語音數據進行訓練,以提高識別準確率。4. 數據處理能力:- 強大的計算能力,以實時處理和分析音頻數據。- 需要高效的算法來進行特征提取和模式識別。03課堂練習5. 訓練數據:- 大量多樣化的語音數據集,用于訓練和驗證模型。- 數據集應包括不同口音、語速和語調的樣本。6. 用戶適應性:- 系統應能夠適應不同用戶的語音特征,包括口音、語速和發音習慣。- 可能需要個性化的訓練或調整。03課堂練習7. 上下文理解:- 理解語境和上下文,以提高識別的準確性。- 需要結合語境信息來處理同音詞或多義詞。8. 反饋機制:- 用戶反饋機制,以不斷改進和優化識別系統。- 通過用戶的使用數據來調整模型,提高準確性。05拓展延伸非特定人語音識別它們有什么區別嗎 語音識別技術可以分為特定人語音識別和非特定人語音識別。05拓展延伸非特定人語音識別哪一種更簡單,哪一種更實用呢 特定人語音識別技術是針對一個特定的人的識別技術,簡單說就是只能識別特定某個人的聲音,不適用于更廣泛的群體;而非特定人語音識別技術恰恰相反,不針對特定個體,也不分年齡、性別與特征,只要音源相同就可以識別。它可以滿足一類人群的語音識別要求,適合更廣泛的群體應用。05拓展延伸非特定人語音識別非特定人語音識別系統適合公共產品或公共服務領域應用,特定語音識別結合聲紋識別等技術更適合家庭與小規模特定場景。兩種技術各有優劣,應根據具體應用合理選擇。05拓展延伸語音識別技術常用的方法有如下四種:1. 基于語言學和 聲學的方法,2. 隨機模型法,3. 利用人工神經網絡的方法,4. 概率語法分析。其中最主流的方法是隨機模型法。05拓展延伸基于語言學和聲學的方法基于語言學和聲學的方法是最早應用于語音識別的方法,但是這種方法涉及的知識太過于困難,導致現在并沒有得到大規模普及。05拓展延伸隨機模型法隨機模型法目前應用較為成熟,該方法主要采用提取特征、訓練模板、對模板進行分類及對模板進行判斷的步驟來對語音進行識別。該方法涉及到的技術一般有3種:動態時間規整(DTW),隱馬爾科夫模型(HMM)理論和矢量量化(VQ )技術。其中,HMM 算法相較于其他兩者的優點是簡便優質, 在語音識別性能方面更為優異。也正因為如此,如今大部分語音識別系統都在使用HMM算法。05拓展延伸神經網絡的方法(ANN)神經網絡方法是在語音識別發展的后期才有的一種新的識別方法。它其實是一種模擬人類神經活動的方法,同時具有人的一些特性,如自動適應和自主學習。其較強的歸類能力和映射能力在語音識別技術中具有很高的利用價值。業界將 ANN 與傳統的方法進行結合,各取所長,使得語音識別的效率得到了顯著的提升。05拓展延伸概率語法分析法概率語法分析法是一種能夠識別大長度語段的技術,主要是為了完成“區別語言的特征”,對于不同層次的知識利用相應層次的知識來解決。這種方法最大的不足就是,建立一個有效、適宜的適用知識系統存在著一定的困難。06單元總結活動日志 班級:XX 姓名:XX任務名稱 初識語音識別——語音識別技術應用任務環節 1口 2口 3口 4口(在對應環節畫V)任務完成內容 體驗語音識別技術任務完成度 口口口口口口口口口(100%)任務小結 問題與反思:項目做得不完善改進的方法:多練習或者詢問老師和同學訣竅07課堂總結1引入新知內容初識語音識別——語音識別技術應用2學習語音識別技術的含義和發展3學習語音識別技術的應用4完成課題練習5進行相關知識拓展1234508板書設計初識語音識別——語音識別技術應用1.進行新知引入2.學習語音識別技術的含義和發展3.學習語音識別技術的應用4.完成課堂練習5.進行知識拓展09課后作業01在本節課完成后,想一想,你覺得語音識別技術有什么好處?有沒有可能的壞處?09課后作業02請同學們在小組內討論一下,你認為語音識別技術會改變我們日常生活中的哪些方面?https://www.21cnjy.com/recruitment/home/fine 展開更多...... 收起↑ 資源列表 【清華大學出版社】《信息科技》六年級上冊第三單元第1課《初識語音識別——語音識別技術應用》.pptx 新知導入.mp4 縮略圖、資源來源于二一教育資源庫