資源簡介
(共39張PPT)
第1單元 第4課
跨學科活動:身高推斷
(清華大學版)八年級
下
1
核心素養(yǎng)目標
3
新知講解
5
拓展延伸
7
板書設計
2
新知導入
4
課堂練習
6
課堂總結
課后作業(yè)
8
01
核心素養(yǎng)目標
信息意識
計算思維
數字化學習與創(chuàng)新
信息社會責任
認識到使用算法和數據分析技術需要承擔社會責任,包括對數據的合理使用、對結果的科學解讀以及對他人隱私的尊重。
熟練完成身高數據采集分析、機器學習等現代技術,激發(fā)他們的創(chuàng)新思維,鼓勵他們探索新的解決方案和應用場景。
利用搜集的身高數據,具體問題具體分析,選擇出最合適的算法,訓練一個能推斷身高的模型并不斷優(yōu)化完善。
能意識到數據的來源、數據的質量以及數據隱私的重要性。理解如何合理使用數據,確保數據的合法性和倫理性。
02
新知導入
本課中你將體驗:
如何收集各種與身高有關的數據,形成數據集
如何選擇合適的算法訓練一個能推斷身高的模型
如何搭建一個身高推斷系統
02
新知導入
在一些電視劇和電影中常常能看到這樣的場景:神探僅通過現場的腳印,就能初步推斷出犯罪嫌疑人的身高。神探之所以能推斷出犯罪嫌疑人的身高,是因為人的身高與腳的長度、寬度和步伐長度有一定的關系。請你組建一個小組,應用機器學習知識探究身高和腳長等因素的關系,并訓練一個能推斷身高的人工智能模型,進一步思考可以用這些知識解決哪些問題。
02
新知導入
03
新知講解
一、需求分析
身高推斷系統項目的設計,必須先完成問題分析,查找相關資料并思考哪些因素與身高有關聯,確認數據收集計劃,同時要基于收集的數據進行數據整理并生成一個數據集,訓練一個能準確推斷身高的模型,最終將模型應用到一個 Web 頁面。請你結合前面的學習,根據項目需求將表 1.4.1填寫完整。
03
新知講解
03
新知講解
二、分工合作
為了更好地完成身高推斷系統這個項目,你的小組需要進行分工合作,小組成員的分工角色與合作職責,可以參照表 1.4.2所示范例設計,也可以另行設計。
姓名 角色 分工
A 組長 負責項目統籌、監(jiān)督與管理
B 成員 負責進行數據集制作與文檔撰寫
C 成員 負責模型訓練與評估
D 成員 負責模型部署與程序測試
E 成員 負責總結內容
03
新知講解
三、規(guī)劃實施
身高推斷系統項目的實施過程,可分為方案設計、數據準備、訓練模型、搭建系統、測試優(yōu)化等環(huán)節(jié)。
03
新知講解
1.方案設計
身高推斷系統項目方案的設計,一般包括:收集哪些數據,如何收集數據,數據集怎么制作;如何訓練模型,選擇哪種算法,希望模型達到什么樣的效果;設計并開發(fā)一個什么樣的身高推斷系統,有哪些功能。
請搜索并學習更多相關知識,結合需求分析中的表格內容來設計項目方案。
03
新知講解
2.數據準備
數據準備需要你完成數據收集、清洗和整理及數據集劃分等工作。數據收集的方法很多,針對身高推斷系統項目,建議選擇在線調查的收集方式。請規(guī)劃好要收集的信息,設計調查問卷,完成數據收集工作。
注意:收集好數據后,還需做數據整理,再將數據集劃分為訓練集和驗證集。
請在收集數據的過程中完成表 1.4.3。
03
新知講解
表1.4.3 數據準備記錄表
序號 內容 描述
1 涉及的變量 主變量:身高(cm)
協變量:年齡(歲)、性別(男/女)、父母身高總和(cm)、體重(kg)、運動時長(周·小時)、睡眠質量評分(1-5分)、
2 劃分比例 訓練集:驗證集=7:3(采用 Stratified Sampling分層抽樣保證樣本代表性)
3 數據量 總樣本量 ≥200訓練集
≥140例驗證集
≥60例(滿足最小樣本量要求)
03
新知講解
3.訓練模型
準備好劃分為訓練集和驗證集的身高數據集之后,訓練模型環(huán)節(jié)要經歷模型搭建并訓練、模型測試與評估等流程。請同學們嘗試訓練一個最佳的身高推斷模型并保存。可以嘗試不同的回歸算法,比較所訓練的模型在對驗證集進行模型推理時計算出的 R值,分析并確認一個最好的模型,將效果比較及分析記錄到表 1.4.4 中。
03
新知講解
序號 算法名稱 R2值
1 線性回歸 0.75
2 決策樹回歸 0.82
3 隨機森林回歸 0.88
總結分析
在測試的三種回歸算法中,隨機森林回歸表現出最佳擬合效果(R2=0.88)。 相比線性回歸(R2=0.75),非線性算法(決策樹/隨機森林)更能捕捉身高數據中的非線性關系。 驗證結果表明該模型具有較好的泛化能力(假設3.驗證集 R2與訓練集接近)。 建議最終采用隨機森林回歸作為最優(yōu)模型,若存在過擬合現象可調整樹的數量或深度參數。
03
新知講解
4.搭建系統
請參照學習過的模型應用知識,利用 XEduHub 和 PyWebl0 搭建一個人體身高推斷系統,要實現載人訓練好的模型并能完成推斷結果的輸出,同時實現方案設計的功能,包括個性化輸入、輸出交互設計等。
03
新知講解
5.測試優(yōu)化
搭建好身高推斷系統后,還要經歷測試優(yōu)化環(huán)節(jié),方可用于問題解決。測試時,可直接尋找不同的新用戶使用你的系統,輸入數據,看看推斷結果是否正確或基本符合要求,同時也評估一下系統的其他功能。優(yōu)化應包括模型優(yōu)化和系統功能優(yōu)化,模型優(yōu)化可從數據集和算法入手,系統功能優(yōu)化則是朝功能更強大的方向修改模型應用的程序。
03
新知講解
請對你所在小組開發(fā)的身高推斷系統進行測試優(yōu)化,并根據測試中發(fā)現的問題或不足思考相應的解決方法,記錄在表1.4.5 中。
03
新知講解
表1.4.5 測試情況與解決思路
序號 發(fā)現的問題或不足 解決思路
1 預測結果偏差較大(身高+15cm誤差) 1.增加訓練樣本量至 500例
2.引入XGBoost算法替代隨機森林
2 模型對新地區(qū)數據泛化能力弱 合并5所學校的體檢數據集、使用遷移學習微調預訓練模型
3 Web端響應延遲超過3秒 1.將Scikit-learn模型轉換為 TensorFlow Lite格式
2.采用緩存機制存儲預測結果
4 缺失值未處理導致預測失敗 使用lterative lmputer填補缺失值、在問卷中增加必填項校驗
5 SHAP值解釋可視化效果不佳 改用 RadViz圖形展示特征貢獻度、生成3D熱力圖輔助理解
03
新知講解
四、交流評價
項目成果交流,分成果整理與交流兩個環(huán)節(jié)。成果整理,其內容涉及項目需求分析、項目方案設計、素材收集、模型部署和應用等方面,并為之制作匯報交流用的 PPT。
項目成果評價,可基于表1.4.6的評價量規(guī),來對自己與他人的項目成果進行客觀的評價,并記錄評價結果。
03
新知講解
04
課堂練習
一、選擇題
1、在機器學習中,哪個算法通常用于預測連續(xù)的目標變量(如身高)?
A. 邏輯回歸 B. K-means聚類
C.線性回歸 D. 決策樹分類器
2、當我們對一個回歸模型進行優(yōu)化時,應該使用以下哪種評估指標來評估模型的預測效果?
A. 精確度(Accuracy) B. 均方誤差(MSE)
C. F1-score D. 召回率(Recall)
3、對于推斷身高的回歸模型,若想要提高模型的預測精度,以下哪種方法是最有效的?
A.增加數據量 B.降低模型復雜度
C.使用更少的特征 D.刪除噪聲數據
C
B
A
04
課堂練習
4、若推斷身高的模型輸出結果出現了過擬合現象,以下哪種方法最適合進行調整?
A.增加模型訓練的次數 B.使用正則化技術
C.增加訓練集的大小 D.改變模型的類型
二、判斷題
1、線性回歸模型可以用于推斷身高這一問題,因為身高與年齡之間的關系可以用線性模型來近似。
2、在進行身高預測時,如果數據集的特征之間存在很強的相關性,那么使用主成分分析(PCA)進行特征降維是一個好方法。
3、在使用神經網絡進行身高預測時,增加網絡層數總是能提高模型的準確性。
B
×
04
課堂練習
三、操作題
假設你有一組數據,其中包含了多個人的年齡和性別以及他們的身高(單位:cm)。通過這些數據,設計一個簡單的模型來推斷一個人的身高。
1. 創(chuàng)建一個包含至少5個人數據的訓練集,數據包括年齡(整數)、性別(男/女)、身高(cm)。
2. 使用線性回歸模型訓練該數據集,以預測身高。
3. 給定一個新人的年齡和性別,預測其身高。
05
拓展延伸
模型選擇與優(yōu)化
模型比較:除了線性回歸,還可以嘗試其他回歸模型,如決策樹回歸、隨機森林回歸、支持向量機回歸等。
超參數調優(yōu):通過網格搜索或隨機搜索來選擇最佳的超參數,進一步提高模型的性能。
05
拓展延伸
數據的標準化與歸一化
內容:不同特征可能存在尺度差異,通過標準化(Standardization)或歸一化(Normalization)將數據處理成統一尺度。
應用:在身高預測中,處理不同特征(如體重、年齡等)的尺度差異,有助于提升模型性能,特別是在神經網絡和KNN等算法中。
05
拓展延伸
特征工程
數據預處理:包括數據標準化、歸一化等技術,能夠改善模型的性能。
特征提取與選擇:如何根據數據的不同特性選擇合適的特征(如年齡、性別、體重等),并通過相關性分析、主成分分析(PCA)等方法進行特征提取。
示例:使用 BMI(體重/身高的平方)作為新的特征,或者結合歷史數據進行更準確的推斷。
05
拓展延伸
多模態(tài)學習
集成學習:結合多個模型的預測結果(例如,使用加權平均方法或投票機制)來提高身高預測的準確性。
多模態(tài)數據融合:除了傳統的數值型數據,還可以通過圖像、視頻等其他模態(tài)數據來增強身高預測模型的性能。
05
拓展延伸
多項式回歸
內容:通過增加高次項來擴展線性回歸模型,使其能夠捕捉更復雜的關系。
應用:在年齡與身高之間可能存在非線性關系,使用多項式回歸可以提升模型對復雜數據的擬合能力。
示例:引入年齡的平方、性別的交互項等。
06
小結與評價
單元回顧
本單元你學習了:
人工智能起源和機器學習的概念
機器學習的基本流程
利用 BaseML 工具完成模型訓練和評估
機器學習模型的應用
06
小結與評價
知識梳理
06
小結與評價
學習檢測
1、人工智能的起源可以追溯到達特茅斯會議,達特茅斯會議是( )年召開的。
A.1956 B.1966 C.1970 D.19752.
2、機器學習是一種使計算機能夠( ),而無須進行明確編程的科學。
A.休眠 B.學習 C.播放音樂 D.畫畫
A
B
06
小結與評價
學習檢測
3、小明在開始訓練模型前,對收集到的數據做了如下整理:將 80% 的數據用于模型的訓練,稱為 ;剩余20% 的數據用于驗證模型的識別效果,稱為 。
4、機器學習中,模型從已知數據中學習規(guī)律的過程稱為 。
5、假設你有一個數據集,其中包含了一系列的房屋信息,如面積、臥室數量、地理位置和價格。你的任務是創(chuàng)建一個模型,根據給定房屋信息來預測房屋的總價值。試描述整理數據、訓練模型以及評估模型性能的基本步驟。
訓練集
驗證集
訓練或學習
06
小結與評價
反思評價
在本單元的學習過程中,肯定少不了與他人進行互動交流、參與作品制作等活動。現在請就此進行總結與反思,以便更好地促進自身成長。
1.從同伴那里學到了什么
2.與同伴分享過哪些觀點
3.工具、方法的使用是否得當
4.是否有值得推廣的經驗
07
課堂總結
1
引入新知內容
跨學科活動:身高推斷
2
進行需求分析和分工合作
3
完成規(guī)劃實施和評價交流
4
完成課堂練習
5
進行知識拓展
1
2
3
4
5
08
板書設計
跨學科活動:身高推斷
1、進行新知引入
2、進行需求分析和分工合作
3、完成規(guī)劃實施和評價交流
4、完成課堂練習
5、進行知識拓展
課后作業(yè)。
1、身高預測模型進行調參優(yōu)化。
2、總結單元內容,完成思維導圖。
09
課后作業(yè)
1、使用網格搜索或隨機搜索對你的身高預測模型進行調參,并報告調優(yōu)前后的模型性能變化。
2、回顧本單元所學內容,完成一份思維導圖。
https://www.21cnjy.com/recruitment/home/fine
展開更多......
收起↑