資源簡介 §4 用樣本估計總體的數字特征4.1 樣本的數字特征【學習目標】1.會求樣本的眾數、中位數、平均數、極差、方差和標準差.2.理解樣本的數字特征的意義和作用,會用樣本的數字特征估計總體的數字特征,作出合理解釋和決策.◆ 知識點 平均數、中位數、眾數及極差、方差、標準差數字特征 定義平均數 指這組數據的平均值.一般地,n個數據x1,x2,…,xn的平均數記為,其計算公式為= . 中位數 把一組數據按 的順序排列后, 的那個數據為這組數據的中位數,它使數據被分成的兩部分的數據量是一樣的 眾數 一組數據中出現次數 的數據 極差 一組數據中 的差稱為這組數據的極差 方差 方差刻畫的是數據偏離平均數的 程度.如果一組數據是x1,x2,…,xn,這組數據的平均數記為,方差記為s2,則s2= 標準差 方差的算術平方根為標準差. s== 【診斷分析】 判斷正誤.(請在括號中打“√”或“×”)(1)在兩組數據中,平均數較大的一組方差較大. ( )(2)平均數反映數據的集中趨勢,方差則反映數據偏離平均數的離散程度. ( )(3)一組數據的眾數、中位數、平均數均是唯一的. ( )◆ 探究點一 數字特征的計算例1 (1)(多選題)甲、乙兩名球員練習罰球,每人練習10組,每組罰球20個,命中個數如下所示:甲:20,19,17,18,18,16,17,15,20,20乙:18,19,13,18,19,20,20,20,17,16則下列結論正確的是 ( )A.甲數據的極差比乙數據的極差小B.甲數據的中位數與乙數據的中位數相等C.甲數據的平均數與乙數據的平均數相等D.甲數據的方差是2.8(2)(多選題)某學校有1000名學生,為更好地了解學生的身體健康情況,隨機抽取了100名學生進行測試,將測試成績分成[50,60),[60,70),…,[90,100]五組,測試成績(單位:分)的頻率分布直方圖如圖所示,則下列說法正確的有 ( )A.頻率分布直方圖中a的值為0.005B.估計這100名學生測試成績的中位數約為77C.估計這100名學生測試成績的眾數為80D.估計該校全部學生測試成績落在[60,70)內的人數為160(3)五個數1,2,3,4,a的平均數是3,則這五個數的標準差是 . [素養小結]樣本的眾數、中位數和平均數常用來表示樣本數據的“中心值”,其中眾數和中位數容易計算,且不受少數幾個極端值的影響,但只能表達樣本數據中的少量信息.平均數表達了數據更多的信息,但受樣本中每個數據的影響,越極端的數據對平均數的影響越大,當一組數據中個別數據較大時,可用中位數描述其集中趨勢.◆ 探究點二 數字特征的應用例2 個體戶張某經營一家餐飲店,下面是該餐飲店所有工作人員某月的工資表.工作人員 工資老板張某 30 000元大廚老張 4500元二廚小馬 3500元采購員小王 4000元雜工李阿姨 3200元服務生小明 3200元會計小何 4100元(1)計算所有工作人員該月的平均工資.(2)由(1)計算出的平均工資能否反映該餐飲店打工人員這個月收入的一般水平 為什么 (3)去掉老板張某的工資后,再計算平均工資,這能代表該餐飲店打工人員當月收入的一般水平嗎 (4)根據以上計算,結合統計的觀點,你對(3)的結果有什么看法 變式 甲、乙兩臺機床同時加工直徑為100 cm的零件,為了檢驗質量,各從中抽取6件測量其直徑(單位:cm),所得數據分別記錄如下:甲:99 100 98 100 100 103乙:99 100 102 99 100 100(1)分別計算兩組數據的平均數及標準差;(2)根據計算結果判斷哪臺機床加工的零件質量更穩定.[素養小結](1)平均數、中位數與眾數都是描述一組數據集中趨勢的量,平均數是最重要的量.但當一組數據中有不少數據多次重復出現時,其眾數往往更能反映這組數據的集中趨勢.(2)方差、標準差描述了數據相對平均數的離散程度.標準差越大,數據越分散,穩定性就越差;標準差越小,數據越集中,穩定性就越好.拓展 某科研課題組通過一款手機APP軟件,調查了某市2000名跑步愛好者平均每周的跑步量(簡稱“周跑量”),得到頻率分布直方圖如圖.(1)估計樣本的中位數(保留一位小數);(2)根據跑步愛好者的周跑量,將跑步愛好者分成三類,不同類別的跑步愛好者的周跑量及購買的裝備的價格如下表:周跑量 小于20 km 不小于20 km 且小于40 km 不小于40 km類別 休閑跑者 核心跑者 精英跑者裝備價格(單位:元) 2500 4000 4500根據以上數據,估計該市每名跑步愛好者購買裝備平均需要花費多少元 §4 用樣本估計總體的數字特征4.1 樣本的數字特征【課前預習】知識點(x1+x2+…+xn) 從小到大 “中間” 最多 最大值與最小值 離散 [(x1-)2+(x2-)2+…+(xn-)2] 診斷分析(1)× (2)√ (3)× [解析] (1)平均數與方差沒有必然關系.(2)根據平均數的定義與方差的定義可知正確.(3)眾數可以不止一個,其余是唯一的.【課中探究】探究點一例1 (1)ACD (2)AB (3) [解析] (1)甲數據的最大值為20,最小值為15,則極差為5,乙數據的最大值為20,最小值為13,則極差為7,所以A正確;甲數據的中位數為=18,乙數據的中位數為=18.5,所以B不正確;甲數據的平均數=×(20+19+17+18+18+16+17+15+20+20)=18,乙數據的平均數=×(18+19+13+18+19+20+20+20+17+16)=18,所以C正確;甲數據的方差為×[(20-18)2+(19-18)2+(17-18)2+(18-18)2+(18-18)2+(16-18)2+(17-18)2+(15-18)2+(20-18)2+(20-18)2]=×28=2.8,所以D正確.故選ACD.(2)對于A,由頻率分布直方圖可知10(2a+3a+7a+6a+2a)=1,解得a=0.005,所以A正確;對于B,由頻率分布直方圖可知,10×5×0.005=0.25<0.5,10×12×0.005=0.6>0.5,設這100名學生測試成績的中位數為x,則0.25+7×0.005(x-70)=0.5,解得x≈77,所以B正確;對于C,由頻率分布直方圖可知,測試成績在[70,80)內的人數最多,所以眾數的估計值為=75,所以C錯誤;對于D,由頻率分布直方圖可知,測試成績在[60,70)內的頻率為3×0.005×10=0.15,所以估計該校全部學生測試成績落在[60,70)內的人數為0.15×1000=150,所以D錯誤.故選AB.(3)由=3,得a=5.由方差s2=×[(1-3)2+(2-3)2+(3-3)2+(4-3)2+(5-3)2]=2,得標準差s=.探究點二例2 解:(1)所有工作人員該月的平均工資是×(30 000+4500+3500+4000+3200+3200+4100)=7500(元).(2)由(1)計算出的平均工資不能反映該餐飲店打工人員當月收入的一般水平,可以看出,除了老板張某外,其余人員的工資都低于平均工資,因為老板張某的工資特別高,所以他的工資對平均工資的影響較大,同時他也不是打工人員.(3)去掉老板張某工資后的平均工資為×(4500+3500+4000+3200+3200+4100)=3750(元),該平均工資能代表該餐飲店打工人員當月收入的一般水平.(4)從本題的計算可以看出,個別特殊值對平均數有很大的影響,因此在選擇樣本時,樣本中盡量不含特殊數據.變式 解:(1)=×(99+100+98+100+100+103)=100(cm),=×(99+100+102+99+100+100)=100(cm).=×[(99-100)2+(100-100)2+(98-100)2+(100-100)2+(100-100)2+(103-100)2]=,所以s甲= cm.=×[(99-100)2+(100-100)2+(102-100)2+(99-100)2+(100-100)2+(100-100)2]=1,所以s乙=1 cm.(2)由(1)知,兩臺機床加工的零件直徑的平均數相同,又s甲>s乙,所以乙機床加工的零件質量更穩定.拓展 解:(1)∵5×(0.02+0.024+0.024)=0.34<0.5,5×(0.02+0.024+0.024+0.036)=0.52>0.5,∴估計中位數位于區間[25,30)內.設樣本的中位數為x km,則0.34+(x-25)×0.036=0.5,解得x≈29.4,∴估計樣本的中位數約為29.4 km.(2)根據題意,樣本中休閑跑者共有5×(0.02+0.024)×2000=440(人),核心跑者共有5×(0.024+0.036+0.044+0.032)×2000=1360(人),精英跑者共有5×(0.012+0.004+0.004)×2000=200(人),故估計該市每名跑步愛好者購買裝備的平均花費為×(440×2500+1360×4000+200×4500)=3720(元). 展開更多...... 收起↑ 資源預覽 縮略圖、資源來源于二一教育資源庫