資源簡介 (共19張PPT)第11課決策樹----以選西瓜為例構建決策樹決策樹算法是一種基于樹形結構的決策分析方法,其原理是通過一系列的判斷和決策過程,將數據集進行分類或回歸預測。具體來說,決策樹算法通過遞歸地將數據集劃分為更小的子集,并在每個子集上應用決策規則,從而構建出一個樹形結構。決策樹算法是一種基于樹形結構的決策分析方法,通過遞歸地將數據集劃分為更小的子集,并在每個子集上應用決策規則,從而構建出一個樹形結構。其原理在于選擇合適的特征進行劃分,并構建出準確可靠的決策樹結構。決策樹算法的原理決策樹算法用途分類問題:決策樹算法常用于分類問題,如垃圾郵件識別、疾病診斷等。通過構建決策樹模型,可以根據輸入的特征將數據劃分為不同的類別。回歸預測:除了分類問題,決策樹算法也可以用于回歸預測,如預測房價、股票價格等。通過構建決策樹模型,可以根據輸入的特征預測連續的輸出值。決策樹算法用途3.特征選擇:決策樹算法在特征選擇方面也有很好的應用。通過計算特征的信息增益、增益率或基尼系數等指標,可以選擇出對數據集分類或回歸最有影響的特征。4.數據挖掘:決策樹算法可以用于數據挖掘中的關聯規則挖掘,如購物籃分析等。通過構建決策樹模型,可以發現不同商品之間的關聯關系,為商業決策提供支持。人工選瓜根蒂紋理觸感新西瓜輸入規律結果推測輸入模型結果預測知識學習數據訓練人工選瓜與機器選瓜新西瓜收集數據1分析數據2訓練算法3使用算法4軟粘清晰硬挺硬滑模糊硬挺硬滑模糊蜷縮軟粘稍糊蜷縮軟粘模糊蜷縮硬滑清晰蜷縮軟粘清晰蜷縮軟粘清晰蜷縮硬滑稍糊蜷縮硬滑清晰蜷縮12345678910編號 1 2 3 4 5 6 7 8 9 10根蒂 蜷縮 蜷縮 蜷縮 蜷縮 蜷縮 硬挺 硬挺 蜷縮 蜷縮 蜷縮紋理 清晰 清晰 清晰 清晰 稍糊 清晰 模糊 模糊 稍糊 模糊觸感 硬滑 硬滑 軟粘 軟粘 硬滑 軟粘 硬滑 硬滑 軟粘 軟粘好瓜 是 是 是 是 是 否 否 否 否 否好瓜壞瓜編號 1 2 3 4 5 6 7 8 9 10根蒂 蜷縮 蜷縮 蜷縮 蜷縮 蜷縮 硬挺 硬挺 蜷縮 蜷縮 蜷縮紋理 清晰 清晰 清晰 清晰 稍糊 清晰 模糊 模糊 稍糊 模糊觸感 硬滑 硬滑 軟粘 軟粘 硬滑 軟粘 硬滑 硬滑 軟粘 軟粘好瓜 是 是 是 是 是 否 否 否 否 否屬性 值 好瓜 壞瓜根蒂 蜷縮 5 3硬挺 0 2紋理 清晰 4 1稍糊 1 1模糊 0 3觸感 硬滑 3 2軟粘 2 3純度分類結果的差異程度稍糊的純度<清晰的純度<模糊的純度屬性 值 好瓜 壞瓜 信息熵 信息增益根蒂 蜷縮 5 3 0.95 0.24硬挺 0 2 0紋理 清晰 4 1 0.72 0.44稍糊 1 1 1模糊 0 3 0觸感 硬滑 3 2 0.97 0.03軟粘 2 3 0.97利用程序計算各屬性的信息熵和信息增益編號 1 2 3 4 5 6 7 8 9 10根蒂 蜷縮 蜷縮 蜷縮 蜷縮 蜷縮 硬挺 硬挺 蜷縮 蜷縮 蜷縮紋理 清晰 清晰 清晰 清晰 稍糊 清晰 模糊 模糊 稍糊 模糊觸感 硬滑 硬滑 軟粘 軟粘 硬滑 軟粘 硬滑 硬滑 軟粘 軟粘好瓜 是 是 是 是 是 否 否 否 否 否編號 1 2 3 4 5 6 7 8 9 10根蒂 蜷縮 蜷縮 蜷縮 蜷縮 蜷縮 硬挺 硬挺 蜷縮 蜷縮 蜷縮紋理 清晰 清晰 清晰 清晰 稍糊 清晰 模糊 模糊 稍糊 模糊觸感 硬滑 硬滑 軟粘 軟粘 硬滑 軟粘 硬滑 硬滑 軟粘 軟粘好瓜 是 是 是 是 是 否 否 否 否 否紋理7,8,105,91,2,3,4,6模糊稍糊清晰1,2,3,4,6編號 1 2 3 4 6根蒂 蜷縮 蜷縮 蜷縮 蜷縮 硬挺紋理 清晰 清晰 清晰 清晰 清晰觸感 硬滑 硬滑 軟粘 軟粘 軟粘好瓜 是 是 是 是 否編號 1 2 3 4 5 6 7 8 9 10根蒂 蜷縮 蜷縮 蜷縮 蜷縮 蜷縮 硬挺 硬挺 蜷縮 蜷縮 蜷縮紋理 清晰 清晰 清晰 清晰 稍糊 清晰 模糊 模糊 稍糊 模糊觸感 硬滑 硬滑 軟粘 軟粘 硬滑 軟粘 硬滑 硬滑 軟粘 軟粘好瓜 是 是 是 是 是 否 否 否 否 否紋理7,8,105,91,2,3,4,6模糊稍糊清晰1,2,3,4,6編號 5 9根蒂 蜷縮 蜷縮紋理 稍糊 稍糊觸感 硬滑 軟粘好瓜 是 否任務一根據計算的信息增益,手工繪制決策樹紋理模糊稍糊清晰作業展示任務二依據決策樹,將判斷西瓜好壞的程序補充完整a=input("請輸入西瓜的紋理{清晰,稍糊,模糊}:")b=input("請輸入西瓜的根蒂{蜷縮,硬挺}:")c=input("請輸入西瓜的觸感{硬滑,軟粘}:")if a=="模糊":print("壞瓜")elif a=="____":if c=="_____":print(____)elif c=="_____":print(____)elif a=="____":if b=="_____":print(____)elif b=="_____":print(____)運行程序,判斷一個新買的西瓜是否是好瓜 1、對真實西瓜的判定,決策樹算法的判斷結果一定準確嗎?2、如何提高決策樹算法的結果準確性?思考與討論不一定,因為特征有限,樣本有限增加特征、樣本的數量編號 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17色澤 青綠 烏黑 烏黑 青綠 淺白 青綠 烏黑 烏黑 烏黑 青綠 淺白 淺白 青綠 淺白 烏黑 淺白 青綠根蒂 蜷縮 蜷縮 蜷縮 蜷縮 蜷縮 稍蜷 稍蜷 稍蜷 稍蜷 硬挺 硬挺 蜷縮 稍蜷 稍蜷 稍蜷 蜷縮 蜷縮敲聲 濁響 沉悶 濁響 沉悶 濁響 濁響 濁響 濁響 沉悶 清脆 清脆 濁響 濁響 沉悶 濁響 濁響 沉悶紋理 清晰 清晰 清晰 清晰 清晰 清晰 稍糊 清晰 稍糊 清晰 模糊 模糊 稍糊 稍糊 清晰 模糊 稍糊臍部 凹陷 凹陷 凹陷 凹陷 凹陷 稍凹 稍凹 稍凹 稍凹 平坦 平坦 平坦 凹陷 凹陷 稍凹 平坦 稍凹觸感 硬滑 硬滑 硬滑 硬滑 硬滑 軟粘 軟粘 硬滑 硬滑 軟粘 硬滑 軟粘 硬滑 硬滑 軟粘 硬滑 硬滑好瓜 是 是 是 是 是 是 是 是 否 否 否 否 否 否 否 否 否拓展與延伸特征屬性樣本數量3個6個10個17個請利用提供的程序使用1-15號西瓜為數據集生成決策樹,并用16號,17號西瓜驗證其準確性概念及特征構建決策樹的一般流程以選西瓜為例構建決策樹課堂小結決策樹使用決策樹實現智能選瓜收集數據分析數據訓練算法使用算法 展開更多...... 收起↑ 資源預覽 縮略圖、資源來源于二一教育資源庫