資源簡介 (共48張PPT)14.4 用樣本估計總體14.4.1 用樣本估計總體的集中趨勢參數探究點一 平均數的計算與應用探究點二 眾數與中位數的計算探究點三 平均數、中位數、眾數的應用探究點四 根據頻率分布直方圖估計總體的集中趨勢【學習目標】1.結合具體實例,經歷用樣本估計總體的集中趨勢參數(平均數、中位數、眾數)的過程,并理解集中趨勢參數的統計含義.2.結合具體實例,認識樣本與總體的關系,逐步建立用樣本估計總體的思想,嘗試運用統計語言描述總體的特征.知識點一 平均數1.平均數概念:一般地,我們把總體中所有數據的算術平均數稱為總體均值,它通常可以代表總體的水平.在進行統計分析時,我們經常用樣本平均數估計總體均值.2.平均數的計算(1)如果有個數據,, ,,那么稱為這 個數據,, ,的平均數,一般記為 ___________.(2)加權平均數:一般地,若取值為,, ,的頻數分別為 ,, , ,則這組數據的平均數為_______________.(3)一般地,若取值為,, ,的頻率分別為,, , ,則其平均數為 .(4)分層抽樣中的樣本平均數:如果將總體分為層,第層抽取的樣本為,, ,,第 層的樣本量為,樣本平均數為,,2, ,.記 ,則所有數據的樣本平均數 .【診斷分析】判斷正誤.(正確的打“√”,錯誤的打“×”)(1)總體平均數是總體的一項重要特征.( )√[解析] 總體平均數是總體的一項重要特征.(2)對于一組數據,樣本平均數與總體平均數 一定相等.( )×[解析] 由于樣本是總體中的部分數據,隨著選取樣本的不同,樣本平均數也不一定相同,但總體平均數是一個確定的數值,故兩者不一定相等.(3)對于同一個總體,選取不同的樣本,樣本平均數也不同.( )×[解析] 對于同一個總體而言,選取不同的樣本,其平均數不一定相同,也不一定不同.知識點二 眾數與中位數1.眾數:一般地,我們將一組數據中出現__________的那個數據叫作該組數據的眾數.次數最多2.中位數:一般地,將一組數據按照從小到大的順序排成一列,如果數據的個數為奇數,那么排在________的數據就是這組數據的中位數;如果數據的個數為偶數,那么,排在正中間的兩個數據的________即為這組數據的中位數.平均數、眾數和中位數都是刻畫數據集中趨勢的度量值.正中間平均數【診斷分析】判斷正誤.(正確的打“√”,錯誤的打“×”)(1)中位數是一組數據中間的數.( )×(2)眾數是一組數據中出現次數最多的數.( )√(3)平均數不一定是原數據中的數.( )√(4)中位數一定是原數據中的數.( )×探究點一 平均數的計算與應用例1(1)某學校為了調查高一年級學生的體育鍛煉情況,從甲、乙、丙3個班中,用簡單隨機抽樣的方法獲得了部分學生一周的鍛煉時間(單位: ),數據整理后如下表所示:甲 6 6.5 7 7.5 8 - - -乙 6 7 8 9 10 11 12 -丙 3 4.5 6 7.5 9 10.5 12 13.5則估計該校高一年級學生一周的平均鍛煉時間為____ .8.2[解析] 樣本中甲、乙、丙三個班級的平均鍛煉時間分別為,,,則樣本平均數為 ,故估計該校高一年級學生一周的平均鍛煉時間為 .(2)[2024·天津河東區期末] 某校組織“校園安全”知識測試,隨機調查600名學生,將他們的測試成績按照[50,60),[60,70),[70,80),[80,90),分成五組,得到如圖所示的頻率79.5分布直方圖,若每組數據以所在區間的中點值為代表,則估計這600名學生成績的平均數為_____.[解析] 由題圖知,解得 ,所以估計這600名學生成績的平均數為 .變式(1) [2024·宿遷期末]已知樣本數據,, ,的平均數為5,則,,, 的平均數為( )A.6 B.7 C.15 D.16[解析] 設樣本數據,,,的平均數為,則 ,,,的平均數為,解得 ,所以,,,的平均數為 .故選B.√(2)有4萬個不小于70的兩位數,從中隨機抽取了3000個數據,統計如下表:個數 800 1300 900平均數 78.1 85 91.9請根據表格中的信息,估計這4萬個數據的平均數為_______.[解析] 這3000個數據的平均數為 ,用樣本平均數估計總體平均數,可估計這4萬個數據的平均數為85.23.[素養小結](1)給定一組數據,要求其平均數可直接套用公式,若這組數據都在某一數據附近波動,可用平均數的簡化公式計算,若這組數據某些數多次出現,可用加權平均數公式計算.(2)在頻率分布表中,平均數可用各組區間的中點值與對應頻率之積的和進行估計.探究點二 眾數與中位數的計算例2 在一次中學生田徑運動會上,參加男子跳高比賽的17名學生的成績如下表所示:1.50 1.60 1.65 1.70 1.75 1.80 1.85 1.90人數 2 3 2 3 4 1 1 1則這17名學生成績的眾數、中位數與平均數分別為_________________ _(結果保留至小數點后兩位).,,[解析] 在這17個數據中,1.75出現了4次,出現的次數最多,即這組數據的眾數是1.75.表里的17個數據可看成是按從小到大的順序排列的,其中第9個數據1.70是最中間的一個數據,即這組數據的中位數是1.70.這組數據的平均數 .故這17名學生成績的眾數、中位數分別為, ,平均數約為1.69.變式(1) 已知一組數據:96,97,95,99,96,98,100,97,98,96,則下列說法不正確的是( )A.這組數據的中位數是97 B.這組數據的眾數是96C.這組數據的平均數是97 D.這組數據的極差是5√[解析] 由題意,這組數據從小到大排列為95,96,96,96,97,97,98,98,99,100,共10個數據,所以這組數據的中位數是,故A中說法正確;在這組數據中,96出現的次數最多,所以這組數據的眾數是96,故B中說法正確;這組數據的平均數是,故C中說法不正確;這組數據的極差是 ,故D中說法正確.故選C.(2)已知一組數據5,2,,5,8,9,且 .若該組數據的眾數是中位數的 ,則該組數據的平均數為( )A.6 B.6.5 C.7 D.7.5[解析] , 這組數據從小到大排列為2,5,5, ,8,9,則該組數據的眾數是5,又該組數據的眾數是中位數的, 該組數據的中位數是6,即,解得 ,則該組數據的平均數為 ,故選A.√[素養小結]求中位數時,要將這組數據按從小到大的順序排成一列,取中間的一個數或中間兩個數的平均數作為中位數.探究點三 平均數、中位數、眾數的應用例3 某公司銷售部有銷售人員15人,銷售部為了制定某種商品的月銷售定額,統計了這15人某月的銷售量如下:銷售量(件) 1800 510 250 210 150 120人數 1 1 3 5 3 2(1)求這15位銷售人員該月銷售量的平均數、中位數及眾數.解:這15位銷售人員該月銷售量的平均數是,表中的數據是按從大到小的順序排列的,處于中間位置的是210,所以中位數是210,而210出現了5次,次數最多,所以眾數是210.(2)假設銷售部負責人把每位銷售人員的月銷售定額制定為320件,你認為是否合理,為什么?如果不合理,請你制定一個較為合理的月銷售定額.解:不合理.因為15人中有13人的銷售量不到320件,320雖是所給一組數據的平均數,但它卻不能很好地反映銷售人員的一般水平.銷售定額制定為210件合適些,因為210既是中位數,又是眾數,且是大部分人能達到的定額.變式 下表是某校高一年級兩個班各11名同學1分鐘仰臥起坐的成績(單位:次):一班 20 34 26 29 28 34 35 36 34 34 31二班 26 28 30 28 30 31 30 36 30 31 30解:一班數據的平均數為 ,一班數據從小到大排列為20,26,28,29,31,34,34,34,34,35,36,所以一班數據的中位數為34,34出現的次數最多,所以一班數據的眾數為34.(1)這兩組數據的平均數,中位數和眾數各是多少?二班數據的平均數為 ,二班數據從小到大排列為26,28,28,30,30,30,30,30,31,31,36,所以二班數據的中位數為30,30出現的次數最多,所以二班數據的眾數為30.(2)你認為用哪個數表示兩個班的成績更合適?解:用平均數表示兩個班的成績更合適.[素養小結]平均數、中位數和眾數的優缺點名稱 優點 缺點眾數 ①體現了樣本數據的最 大集中點; ②容易計算 ①它只能表達樣本數據中很少的一部分信息;②有時無法客觀地反映總體特征中位 數 ①不受數據組中極端值 的影響; ②容易計算,便于利用 中間數據的信息 對極端值不敏感名稱 優點 缺點平均 數 能較好地反映樣本數據 全體的信息 ①任何一個數據的改變都會引起平均數的改變②數據越“離群”,對平均數的影響越大續表探究點四 根據頻率分布直方圖估計總體的集中趨勢例4 [2024·南京期末] 從全校學生的期末考試成績(均為整數)中隨機抽取一個樣本,將樣本分成5組,繪成頻率分布直方圖,如圖中從左到右各小組的小矩形(1)求樣本容量;解:根據題意,樣本容量為 .的高的比為 ,最左邊的一組頻數是6.(2)求 這一組的頻數及頻率;解:這一組的頻率為 ,所以頻數為.(3)估計這組樣本數據的眾數和中位數(每組數據以所在區間的中點值為代表).解:根據頻率分布直方圖,可估計這組樣本數據的眾數為 .成績在內的頻率為,成績在內的頻率為 ,成績在內的頻率為,設中位數為,則 ,所以,解得 ,故估計這組樣本數據的中位數為113.變式 (多選題)[2024 江蘇連云港高級中學月考] 從參加環保知識競賽的學生中抽出60名學生,將其成績(均為整數)整理后作出頻率分布直方圖,如圖所示,則下列說法正確的是(每組數據以所在區間的中點值為代表)( )A. 這一組的頻數是15B.估計這組數據的眾數是74.5C.估計這組數據的平均數是72.5D.估計這組數據的中位數約是72.8√√√[解析] 對于A,因為 這一組的頻率是 ,所以 這一組的頻數是,故A正確;對于B, 一組的頻率最大,人數最多,所以估計這組數據的眾數是 ,故B正確;對于C,估計這組數據的平均數是,故C錯誤;對于D,前3組的頻率之和為,前4組的頻率之和為 ,所以中位數在區間內,設中位數為 ,則,解得 ,所以估計這組數據的中位數約是,故D正確.故選 .[素養小結]用頻率分布表或頻率分布直方圖求數字特征:(1)眾數是最高的小長方形的底邊的中點對應的數據.(2)中位數左右兩側直方圖的面積相等.(3)平均數等于每個小長方形的面積乘小長方形底邊中點的橫坐標的和.(4)利用直方圖求得的眾數、中位數、平均數均為近似值,往往與實際數據得出的不一致,但它們能粗略估計其眾數、中位數和平均數.1.一組數據的平均數、中位數都是唯一的,眾數不一定唯一,可以有一個,也可以有多個,還可以沒有.如果有兩個數據出現的次數相同,并且比其他數據出現的次數都多,那么這兩個數據都是這組數據的眾數.眾數一定是原數據中的數,平均數和中位數都不一定是原數據中的數.2.中位數僅與數據排列位置有關,某些數據的變動對中位數沒有影響,中位數可能在所給數據中(數據個數為奇數或數據個數為偶數且中間兩數相等),也可能不在所給的數據中(數據個數為偶數且中間兩數不相等).當一組數據的個別數據變動較大時,可以用中位數描述其集中趨勢.3.眾數考查各數據出現的頻率,大小只與這組數據中的部分數據有關,當一組數據中有多個數據多次重復出現時,眾數往往更能反映問題.4.總體平均數是總體的一項重要特征.另外,某類個體在總體中所占的比例也是人們關心的一項總體特征,例如全部產品中合格品所占的比例、贊成某項政策的人在整個人群中所占的比例等.1.眾數、中位數、平均數的實際意義平均數是統計中最常用的數據代表值,比較可靠和穩定,因為它與每一個數據都有關,反映出來的信息也最充分.平均數既可以描述一組數據本身的整體平均情況,也可以用來作為不同組數據比較的一個標準,它在生活中應用最廣泛.中位數作為一組數據的代表,可靠性比較差,因為它只利用了部分數據.但當一組數據的個別數據偏大或偏小時,用中位數來描述該組數據的集中趨勢就比較合適.眾數作為一組數據的代表,可靠性也比較差,因為它也只利用了部分數據.在一組數據中,如果個別數據有很大的波動,且某個數據出現的次數最多,此時用眾數表示這組數據的集中趨勢就比較合適.在實際中,經常用平均數、中位數或者眾數進行一些判斷.例1(1)(多選題)如圖所示,下列頻率分布直方圖顯示了三種不同的分布形態.圖①形成對稱形態,圖②形成“右拖尾”形態,圖③形成“左拖尾”形態,根據所給圖作出以下判斷,正確的是( )①②③A.圖①的平均數中位數 眾數B.圖②的平均數 眾數 中位數C.圖②的眾數 中位數 平均數D.圖③的平均數 中位數 眾數√√√[解析] 圖①的頻率分布直方圖是對稱的,所以平均數中位數 眾數,故A正確;圖②眾數最小,“右拖尾”平均數大于中位數,故B錯誤,C正確;圖③“左拖尾”眾數最大,平均數小于中位數,故D正確.故選 .①②③(2)(多選題)某市舉辦了普法知識競賽,從參賽者中隨機抽取1000人,統計成績后,畫出頻率分布直方圖如圖所示,則( )A.B.估計樣本中普法知識競賽成績的平均數為85分C.估計樣本中普法知識競賽成績的眾數為95分D.估計樣本中普法知識競賽成績的中位數為88分√√[解析] 對于A,由頻率分布直方圖可知,,解得 ,所以A正確;對于B,估計樣本中普法知識競賽成績的平均數為, 所以B錯誤;對于C,估計樣本中普法知識競賽成績的眾數為95分,所以C正確;對于D,因為前3組的頻率和為 ,前4組的頻率和為 ,所以中位數在80到90之間,設中位數為 ,則,解得 ,所以D錯誤.故選 .2.分層抽樣的樣本平均數的計算例2(1) [2024·甘肅天水一中高一月考]在某學校的期中考試中,高一、高二、高三年級的參考人數分別為600,800,600.現用分層抽樣的方法從三個年級中抽取樣本,經計算得高一、高二、高三年級數學成績的樣本平均數分別為93,81,99,則全校學生數學成績的平均數為( )A.92 B.91 C.90 D.89[解析] 由題意,全校學生數學成績的平均數為.故選C.√(2)[2024·江蘇南通期中]采用分層抽樣的方法對某校共600名高三年級學生的身高(單位:厘米)進行調查,得到該年級男生、女生和全體學生的平均身高分別為,, ,則該年級的男生人數為( )A.315 B.320 C.325 D.330[解析] 設該年級的男生人數為,則女生人數為 ,則,即,即,所以 . 故選C.√14.4 用樣本估計總體14.4.1 用樣本估計總體的集中趨勢參數【課前預習】知識點一2.(1) (2)診斷分析(1)√ (2)× (3)× [解析] (1)總體平均數是總體的一項重要特征.(2)由于樣本是總體中的部分數據,隨著選取樣本的不同,樣本平均數也不一定相同,但總體平均數是一個確定的數值,故兩者不一定相等.(3)對于同一個總體而言,選取不同的樣本,其平均數不一定相同,也不一定不同.知識點二1.次數最多 2.正中間 平均數診斷分析(1)× (2)√ (3)√ (4)×【課中探究】探究點一例1 (1)8.2 (2)79.5 [解析] (1)樣本中甲、乙、丙三個班級的平均鍛煉時間分別為×(6+6.5+7+7.5+8)=7(h),×(6+7+8+9+10+11+12)=9(h),×(3+4.5+6+7.5+9+10.5+12+13.5)=8.25(h),則樣本平均數為=8.2,故估計該校高一年級學生一周的平均鍛煉時間為8.2 h.(2)由題圖知10×(x+0.015+0.020+0.030+0.025)=1,解得x=0.010,所以估計這600名學生成績的平均數為55×0.1+65×0.15+75×0.2+85×0.3+95×0.25=79.5.變式 (1)B (2)85.23 [解析] (1)設樣本數據x1,x2,…,xn的平均數為,則2x1+1,2x2+1,…,2xn+1的平均數為2+1=5,解得=2,所以3x1+1,3x2+1,…,3xn+1的平均數為3+1=3×2+1=7.故選B.(2)這3000個數據的平均數為=85.23,用樣本平均數估計總體平均數,可估計這4萬個數據的平均數為85.23.探究點二例2 1.75,1.70,1.69 [解析] 在這17個數據中,1.75出現了4次,出現的次數最多,即這組數據的眾數是1.75.表里的17個數據可看成是按從小到大的順序排列的,其中第9個數據1.70是最中間的一個數據,即這組數據的中位數是1.70.這組數據的平均數=×(1.50×2+1.60×3+1.65×2+1.70×3+1.75×4+1.80×1+1.85×1+1.90×1)=≈1.69.故這17名學生成績的眾數、中位數分別為1.75,1.70,平均數約為1.69.變式 (1)C (2)A [解析] (1)由題意,這組數據從小到大排列為95,96,96,96,97,97,98,98,99,100,共10個數據,所以這組數據的中位數是×(97+97)=97,故A中說法正確;在這組數據中,96出現的次數最多,所以這組數據的眾數是96,故B中說法正確;這組數據的平均數是×(95+96+96+96+97+97+98+98+99+100)=97.2,故C中說法不正確;這組數據的極差是100-95=5,故D中說法正確.故選C.(2)∵5探究點三例3 解:(1)這15位銷售人員該月銷售量的平均數是=320,表中的數據是按從大到小的順序排列的,處于中間位置的是210,所以中位數是210,而210出現了5次,次數最多,所以眾數是210.(2)不合理.因為15人中有13人的銷售量不到320件,320雖是所給一組數據的平均數,但它卻不能很好地反映銷售人員的一般水平.銷售定額制定為210件合適些,因為210既是中位數,又是眾數,且是大部分人能達到的定額.變式 解:(1)一班數據的平均數為(20+34+26+29+28+34+35+36+34+34+31)÷11=341÷11=31,一班數據從小到大排列為20,26,28,29,31,34,34,34,34,35,36,所以一班數據的中位數為34,34出現的次數最多,所以一班數據的眾數為34.二班數據的平均數為(26+28+30+28+30+31+30+36+30+31+30)÷11=330÷11=30,二班數據從小到大排列為26,28,28,30,30,30,30,30,31,31,36,所以二班數據的中位數為30,30出現的次數最多,所以二班數據的眾數為30.(2)用平均數表示兩個班的成績更合適.探究點四例4 解:(1)根據題意,樣本容量為6÷=48.(2)[105.5,120.5)這一組的頻率為=,所以頻數為48×=18.(3)根據頻率分布直方圖,可估計這組樣本數據的眾數為=113.成績在[75.5,90.5)內的頻率為,成績在[90.5,105.5)內的頻率為,成績在[105.5,120.5)內的頻率為,設中位數為x,則x∈[105.5,120.5),所以++(x-105.5)×=,解得x=113,故估計這組樣本數據的中位數為113.變式 ABD [解析] 對于A,因為[79.5,89.5)這一組的頻率是(89.5-79.5)×0.025=0.25,所以[79.5,89.5)這一組的頻數是60×0.25=15,故A正確;對于B,[69.5,79.5)一組的頻率最大,人數最多,所以估計這組數據的眾數是=74.5,故B正確;對于C,估計這組數據的平均數是44.5×0.1+54.5×0.15+64.5×0.15+74.5×0.3+84.5×0.25+94.5×0.05=70.5,故C錯誤;對于D,前3組的頻率之和為0.4,前4組的頻率之和為0.7,所以中位數在區間[69.5,79.5)內,設中位數為x,則(x-69.5)×0.03=0.1,解得x≈72.8,所以估計這組數據的中位數約是72.8,故D正確.故選ABD.14.4 用樣本估計總體14.4.1 用樣本估計總體的集中趨勢參數1.A [解析] 眾數是在一組數據中出現次數最多的數,所以一定會在原始數據中出現.故選A.2.B [解析] 由小到大排列為1,2,4,5,6,6,8,15,所以中位數為=5.5,眾數為6.故選B.3.D [解析] 由題意得=3,故x1+x2+x3+x4+x5=15,則===10.故選D.4.B [解析] 因為樣本數據a1,a2,…,a10的平均數為,所以=,即a1+a2+…+a10=10,同理可得,b1+b2+…+b10=10,所以樣本數據a1,b1,a2,b2,…,a10,b10的平均數為=(+),故選B.5.C [解析] 若這100個數都是8,則這100個數據的中位數是8,故A錯誤;因為100為偶數,所以第50個和第51個數據的平均數為中位數,故C正確,B,D不正確.故選C.6.D [解析] 由題意得,這組數據的平均數為=,除m外,將數據按從小到大的順序排列可得1,2,2,2,6,8,結合m的任意性可知中位數為2,則=2×2,解得m=7.故選D.7.D [解析] 由題意知,眾數m0=5;中位數是第15個數與第16個數的平均數,由表知將數據從小到大排列后的第15個數是5,第16個數是6,所以中位數me==5.5;平均數x=×(2×3+3×4+10×5+6×6+3×7+2×8+2×9+2×10)≈6.∴m08.BCD [解析] 對于A,中位數是3,則這5個數從小到大排列后,第3個數是3,第1,2個數是2才能使眾數為2,所以第1個數不是1,選項A錯誤;對于B,有可能出現點數1,例如1,2,5,6,6,選項B正確;對于C,有可能出現點數1,例如1,1,1,2,5,選項C正確;對于D,有可能出現點數1,例如1,4,5,5,5,選項D正確.故選BCD.9.AB [解析] 依題意得(0.015+0.025+0.035+0.005+2a)×10=1,解得a=0.010.對于A,估計該樣本的眾數為75,故A正確;對于B,估計該樣本的平均數為45×0.1+55×0.15+65×0.25+75×0.35+85×0.1+95×0.05=68.5,故B正確;對于C,∵10×(0.010+0.015+0.025)=0.5,∴估計該樣本的中位數為70,故C錯誤;對于D,估計該校學生中成績超過80分的占(0.010+0.005)×10×100%=15%,故D錯誤.故選AB.10.95 [解析] 設20名女生的平均成績為分,由題意得50×92=30×90+20×,∴=95,即20名女生的平均成績為95分.11.324 [解析] 依題意高一年級女生的近視人數為1250×60%-390=360,則高一年級近視學生的平均度數為×300+×350=324.12.91 [解析] 92+89+88+93+91+89+92+94=728=91×8,而91×7=637,728-637=91,因此去掉的兩個數的和是182,觀察這8個數中最大和最小的數,去掉的兩個數是88和94,不見的分是91.13.解:(1)若x為這組數據的一個眾數,則x的可能取值為164,165,168,170,即x的取值集合為{164,165,168,170}.(2)若x=174,則估計該校高一年級新生的平均身高為×(152+155+158+164+164+165+165+165+166+167+168+168+169+170+170+170+171+174+174+175)=166.5(cm).14.解:(1)由(0.2+0.8+0.6+a+0.1)×0.5=1,解得a=0.3.(2)估計該樣本數據的平均數=0.1×0.25+0.4×0.75+0.3×1.25+0.15×1.75+0.05×2.25=1.075.由0.5×(0.2+0.8)=0.5×(0.6+0.3+0.1)=0.5,估計該樣本數據的中位數為1.(3)不一定.理由:①不知道各批魚的汞含量分布是否都和這批魚相同;②樣本指標只能作為估計值.(理由說明一點就可以)15.7.8 [解析] 這組數據共五個數,中位數為8,則從小到大排列時,8的前面有兩個數,后面也有兩個數,又唯一的眾數為9,所以有兩個9,其余數字均只出現過一次,則最大數字為9,又極差為3,所以最小數字為6,所以這組數據為6,7,8,9,9,則平均數為=7.8.16.[3,5] [解析] 根據題意,實數1,5,x,y的平均數為4,則有1+5+x+y=4×4,即x+y=10.分6種情況討論:①若該四個數按從小到大的順序排列,1,5位于中間,則x,y位于兩側,此時中位數是3;②若該四個數按從小到大的順序排列,1,x位于中間,則5,y位于兩側,此時x≤5,y≤1,不符合題意;③若該四個數按從小到大的順序排列,1,y位于中間,則x,5位于兩側,此時y≤5,x≤1,不符合題意;④若該四個數按從小到大的順序排列,5,x位于中間,則1,y位于兩側,則有1≤x≤5,故∈[3,5];⑤若該四個數按從小到大的順序排列,5,y位于中間,則x,1位于兩側,此時1≤y≤5,故∈[3,5];⑥若該四個數按從小到大的順序排列,x,y位于中間,則1,5位于兩側,可知x=y=5,故=5,此時中位數是5.綜上這四個數的中位數的取值范圍是[3,5].14.4 用樣本估計總體14.4.1 用樣本估計總體的集中趨勢參數【學習目標】 1.結合具體實例,經歷用樣本估計總體的集中趨勢參數(平均數、中位數、眾數)的過程,并理解集中趨勢參數的統計含義. 2.結合具體實例,認識樣本與總體的關系,逐步建立用樣本估計總體的思想,嘗試運用統計語言描述總體的特征.◆ 知識點一 平均數1.平均數概念:一般地,我們把總體中所有數據的算術平均數稱為總體均值,它通常可以代表總體的水平.在進行統計分析時,我們經常用樣本平均數估計總體均值.2.平均數的計算(1)如果有n個數據a1,a2,…,an,那么稱為這n個數據a1,a2,…,an的平均數,一般記為= . (2)加權平均數:一般地,若取值為x1,x2,…,xn的頻數分別為f1,f2,…,fn,則這組數據的平均數為 . (3)一般地,若取值為x1,x2,…,xn的頻率分別為p1,p2,…,pn,則其平均數為x1p1+x2p2+…+xnpn.(4)分層抽樣中的樣本平均數:如果將總體分為k層,第j層抽取的樣本為xj1,xj2,…,,第j層的樣本量為nj,樣本平均數為,j=1,2,…,k.記【診斷分析】 判斷正誤.(正確的打“√”,錯誤的打“×”)(1)總體平均數是總體的一項重要特征. ( )(2)對于一組數據,樣本平均數與總體平均數一定相等. ( )(3)對于同一個總體,選取不同的樣本,樣本平均數也不同. ( )◆ 知識點二 眾數與中位數1.眾數:一般地,我們將一組數據中出現 的那個數據叫作該組數據的眾數. 2.中位數:一般地,將一組數據按照從小到大的順序排成一列,如果數據的個數為奇數,那么排在 的數據就是這組數據的中位數;如果數據的個數為偶數,那么,排在正中間的兩個數據的 即為這組數據的中位數. 平均數、眾數和中位數都是刻畫數據集中趨勢的度量值.【診斷分析】 判斷正誤.(正確的打“√”,錯誤的打“×”)(1)中位數是一組數據中間的數. ( )(2)眾數是一組數據中出現次數最多的數. ( )(3)平均數不一定是原數據中的數. ( )(4)中位數一定是原數據中的數. ( )◆ 探究點一 平均數的計算與應用例1 (1)某學校為了調查高一年級學生的體育鍛煉情況,從甲、乙、丙3個班中,用簡單隨機抽樣的方法獲得了部分學生一周的鍛煉時間(單位:h),數據整理后如下表所示:甲 6 6.5 7 7.5 8 - - -乙 6 7 8 9 10 11 12 -丙 3 4.5 6 7.5 9 10.5 12 13.5則估計該校高一年級學生一周的平均鍛煉時間為 h. (2)[2024·天津河東區期末] 某校組織“校園安全”知識測試,隨機調查600名學生,將他們的測試成績按照[50,60),[60,70),[70,80),[80,90),[90,100]分成五組,得到如圖所示的頻率分布直方圖,若每組數據以所在區間的中點值為代表,則估計這600名學生成績的平均數為 . 變式 (1)[2024·宿遷期末] 已知樣本數據2x1+1,2x2+1,…,2xn+1的平均數為5,則3x1+1,3x2+1,…,3xn+1的平均數為 ( ) A.6 B.7C.15 D.16(2)有4萬個不小于70的兩位數,從中隨機抽取了3000個數據,統計如下表:數據x 70≤x≤79 80≤x≤89 90≤x≤99個數 800 1300 900平均數 78.1 85 91.9請根據表格中的信息,估計這4萬個數據的平均數為 . [素養小結](1)給定一組數據,要求其平均數可直接套用公式,若這組數據都在某一數據附近波動,可用平均數的簡化公式計算,若這組數據某些數多次出現,可用加權平均數公式計算.(2)在頻率分布表中,平均數可用各組區間的中點值與對應頻率之積的和進行估計.◆ 探究點二 眾數與中位數的計算例2 在一次中學生田徑運動會上,參加男子跳高比賽的17名學生的成績如下表所示:成績(單位:m) 1.50 1.60 1.65 1.70 1.75 1.80 1.85 1.90人數 2 3 2 3 4 1 1 1則這17名學生成績的眾數、中位數與平均數分別為 (結果保留至小數點后兩位). 變式 (1)已知一組數據:96,97,95,99,96,98,100,97,98,96,則下列說法不正確的是 ( )A.這組數據的中位數是97B.這組數據的眾數是96C.這組數據的平均數是97D.這組數據的極差是5(2)已知一組數據5,2,x,5,8,9,且5A.6 B.6.5C.7 D.7.5[素養小結]求中位數時,要將這組數據按從小到大的順序排成一列,取中間的一個數或中間兩個數的平均數作為中位數.◆ 探究點三 平均數、中位數、眾數的應用例3 某公司銷售部有銷售人員15人,銷售部為了制定某種商品的月銷售定額,統計了這15人某月的銷售量如下:銷售量(件) 1800 510 250 210 150 120人數 1 1 3 5 3 2(1)求這15位銷售人員該月銷售量的平均數、中位數及眾數.(2)假設銷售部負責人把每位銷售人員的月銷售定額制定為320件,你認為是否合理,為什么 如果不合理,請你制定一個較為合理的月銷售定額.變式 下表是某校高一年級兩個班各11名同學1分鐘仰臥起坐的成績(單位:次):一班 20 34 26 29 28 34 35 36 34 34 31二班 26 28 30 28 30 31 30 36 30 31 30(1)這兩組數據的平均數,中位數和眾數各是多少 (2)你認為用哪個數表示兩個班的成績更合適 [素養小結]平均數、中位數和眾數的優缺點名稱 優點 缺點眾數 ①體現了樣本數據的最大集中點; ②容易計算 ①它只能表達樣本數據中很少的一部分信息; ②有時無法客觀地反映總體特征中位數 ①不受數據組中極端值的影響; ②容易計算,便于利用中間數據的信息 對極端值不敏感平均數 能較好地反映樣本數據全體的信息 ①任何一個數據的改變都會引起平均數的改變 ②數據越“離群”,對平均數的影響越大◆ 探究點四 根據頻率分布直方圖估計總體的集中趨勢例4 [2024·南京期末] 從全校學生的期末考試成績(均為整數)中隨機抽取一個樣本,將樣本分成5組,繪成頻率分布直方圖,如圖中從左到右各小組的小矩形的高的比為2∶3∶6∶4∶1,最左邊的一組頻數是6.(1)求樣本容量;(2)求[105.5,120.5)這一組的頻數及頻率;(3)估計這組樣本數據的眾數和中位數(每組數據以所在區間的中點值為代表).變式 (多選題)[2024·江蘇連云港高級中學月考] 從參加環保知識競賽的學生中抽出60名學生,將其成績(均為整數)整理后作出頻率分布直方圖,如圖所示,則下列說法正確的是(每組數據以所在區間的中點值為代表) ( )A.[79.5,89.5)這一組的頻數是15B.估計這組數據的眾數是74.5C.估計這組數據的平均數是72.5D.估計這組數據的中位數約是72.8[素養小結]用頻率分布表或頻率分布直方圖求數字特征:(1)眾數是最高的小長方形的底邊的中點對應的數據.(2)中位數左右兩側直方圖的面積相等.(3)平均數等于每個小長方形的面積乘小長方形底邊中點的橫坐標的和.(4)利用直方圖求得的眾數、中位數、平均數均為近似值,往往與實際數據得出的不一致,但它們能粗略估計其眾數、中位數和平均數.14.4 用樣本估計總體14.4.1 用樣本估計總體的集中趨勢參數一、選擇題1.下列數字特征一定會在原始數據中出現的是 ( ) A.眾數 B.中位數C.平均數 D.都不會2.樣本數據2,1,4,5,6,6,15,8的中位數和眾數分別是 ( )A.5,6 B.5.5,6C.6,6 D.5.5,53.樣本中共有5個個體,其值分別為x1,x2,x3,x4,x5.若該樣本的平均數為3,則3x1+1,3x2+1,3x3+1,3x4+1,3x5+1的平均數為 ( )A.1 B.3C.9 D.104.樣本數據a1,a2,…,a10的平均數為,樣本數據b1,b2,…,b10的平均數為,則樣本數據a1,b1,a2,b2,…,a10,b10的平均數為 ( )A.+ B.(+)C.2(+) D.(+)5.已知100個數據的中位數是8,則下列說法正確的是 ( )A.這100個數據中一定有且僅有50個數小于或等于8B.把這100個數據從小到大排列后,8是第50個數據C.把這100個數據從小到大排列后,8是第50個和第51個數據的平均數D.把這100個數據從小到大排列后,8是第50個和第49個數據的平均數6.[2024·揚州模擬] 某同學測得連續7天的最低氣溫分別為1,2,2,m,6,2,8(單位℃),若這組數據的平均數是中位數的2倍,則m= ( )A.2 B.3C.6 D.77.為了普及環保知識,增強環保意識,某中學隨機抽取30名學生參加環保知識競賽,得分(滿分為10分)的頻數分布表如表:得分 3 4 5 6 7 8 9 10頻數 2 3 10 6 3 2 2 2設得分的中位數為me,眾數為m0,平均數為x,則 ( )A.me=m0=x B.me=m0C.me8.(多選題)擲骰子5次,分別記錄每次骰子出現的點數,根據這5次的統計結果,下列選項中有可能出現點數1的是 ( )A.中位數是3,眾數是2B.平均數是4,中位數是5C.極差是4,平均數是2D.平均數是4,眾數是59.(多選題)[2024·常州期末] 一條青果巷,半部常州史!這個“江南名士第一巷”,不僅歷史文化底蘊深厚,而且紅色文化資源密集.基于此,某中學積極響應,舉行了一次“紅色青果”知識競賽.學校在競賽后,隨機抽查了100人的成績整理后得到如圖所示的頻率分布直方圖,則下列結論正確的有(同一組中的數據以該組區間的中點值為代表) ( )A.估計該樣本的眾數為75B.估計該樣本的平均數為68.5C.估計該樣本的中位數為75D.估計該校學生中成績超過80分的占20%二、填空題10.[2024·深圳中學高一期末] 某班有50名學生,該班一次數學測試的平均成績是92分,如果30名男生的平均成績為90分,那么20名女生的平均成績為 分. 11.[2024·邯鄲期末] 某校高一年級有1250人,全年級學生的近視率為60%,男生中有390人近視.學校醫務室計劃通過抽樣的方法估計高一年級所有近視學生的平均度數.現從近視的學生中通過分層抽樣的方法得到容量為100的樣本,樣本中男生的平均度數為300度,女生的平均度數為350度,則估計高一年級近視學生的平均度數為 度. 12.9名評委對某參賽選手打分,記分員在去掉一個最高分和一個最低分后算出平均分為91,復核員在復核時發現只有8個評委的給分:92,89,88,93,91,89,92,94,還有一個評委的給分不見了,假設記分員的計算準確,則另一個分數為 . 三、解答題13.從某校高一年級新生中隨機抽取一個容量為20的身高樣本,數據如下(單位:cm,數據間無大小順序要求):152,155,158,164,164,165,165,165,166,167,168,168,169,170,170,170,171,x,174,175.(1)若x為這組數據的一個眾數,求x的取值集合;(2)若x=174,試估計該校高一年級新生的平均身高.14.[2024·江蘇無錫期末] 有一種魚的身體吸收汞,一定量的身體中汞的含量超過其體重的1.0×10-6的魚被人食用后就會對人體產生危害.在100條魚的樣本中發現汞含量(乘百萬分之一)統計得到頻率分布直方圖,如圖所示.(1)求頻率分布直方圖中a的值.(2)請估計該樣本數據的平均數和中位數(同一組數據以該組區間的中點值為代表).(3)從實際情況看,許多魚汞含量超標的原因是這些魚在出售之前沒有被檢測過,你認為每批這種魚的平均汞含量都比1.0×10-6大嗎 請說明理由.15.某射擊運動員連續射擊5次,命中的環數(環數為整數)形成的一組數據中,中位數為8,唯一的眾數為9,極差為3,則該組數據的平均數為 . 16.[2024·上海青浦區期中] 已知實數1,5,x,y的平均數為4,則這四個數的中位數的取值范圍是 . 展開更多...... 收起↑ 資源列表 14.4.1 用樣本估計總體的集中趨勢參數.pptx 14.4.1 用樣本估計總體的集中趨勢參數 【正文】導學案.docx 14.4.1 用樣本估計總體的集中趨勢參數 【正文】練習冊.docx 14.4.1 用樣本估計總體的集中趨勢參數 【答案】導學案.docx 14.4.1 用樣本估計總體的集中趨勢參數 【答案】練習冊.docx 縮略圖、資源來源于二一教育資源庫