資源簡介 專題 9.2 用樣本估計總體【十大題型】【人教 A 版(2019)】【題型 1 頻率分布直方圖的繪制】 ........................................................................................................................2【題型 2 根據統計圖解決實際問題】 ....................................................................................................................4【題型 3 頻率分布直方圖的相關計算問題】 ........................................................................................................6【題型 4 統計圖的綜合應用問題】 ........................................................................................................................7【題型 5 百分位數的求解】 ..................................................................................................................................11【題型 6 眾數、中位數、平均數的計算與求參】 ..............................................................................................12【題型 7 眾數、中位數、平均數的實際應用】 ..................................................................................................12【題型 8 方差、標準差的求解及應用】 ..............................................................................................................14【題型 9 頻率分布直方圖中集中趨勢參數的計算】 ..........................................................................................15【題型 10 其他統計圖表中反映的集中趨勢與離散程度】 ................................................................................18【知識點 1 總體取值規律的估計】1.頻率分布直方圖(1)頻率分布表與頻率分布直方圖的意義為了探索一組數據的取值規律,一般先要用表格對數據進行整理,或者用圖將數據直觀表示出來.在初中,我們曾用頻數分布表和頻數分布圖來整理和表示這種數值型數據,由此能使我們清楚地知道數據分布在各個小組的個數.有時,我們更關心各個小組的數據在樣本容量中所占比例的大小,所以選擇頻率分布表和頻率分布直方圖來整理和表示數據.(2)頻率分布表與頻率分布直方圖的制作步驟與畫頻數分布直方圖類似,我們可以按以下步驟制作頻率分布表、畫頻率分布直方圖.第一步,求極差極差為一組數據中最大值與最小值的差.第二步,決定組距與組數第三步,將數據分組通常對組內數據取左閉右開區間,最后一組數據取閉區間.第四步,列頻率分布表計算各小組的頻率,作出頻率分布表.第五步,畫頻率分布直方圖畫圖時,以橫軸表示分組,縱軸(小長方形的高度)表示 .2.其他幾類常用統計圖——條形圖、折線圖、扇形圖條形圖 折線圖 扇形圖一般地,條形圖中,一條軸 用一個單位長度表示一定 用整個圓表示總體,扇形上顯示的是所關注的數據類 的數量,用折線的起伏表示 圖中,每一個扇形的圓心特型,另一條軸上對應的是數 數量的增減變化. 角以及弧長,都與這一部點量、個數或者比例,條形圖 分表示的數據大小成正中每一長方形都是等寬的. 比.作 能清楚地表示每個項目的具 能清楚地看出數量增減變 可以形象地表示出各部分用 體數量,便于相互比較大小. 化的情況及各部分數量的 數據在全部數據中所占的及 多少.常用來表示隨時間變 比例情況.選 化的數據,當然,也可以用用 在其他合適的情形中.情景圖例【題型 1 頻率分布直方圖的繪制】【例 1】(24-25 高二·上海·課堂例題)從高一學生中抽取 50 名參加調研考試,成績的分組及各組的頻數如下(單位:分):[40,50),2;[50,60),3;[60,70),10;[70,80),15;[80,90),12;[90,100],8.(1)列出樣本的頻率分布表;(2)畫出頻率分布直方圖;(3)估計成績在[70,80)分的學生所占總體的百分比.【變式 1-1】(24-25 高一下·全國·課后作業)為加強中學生實踐創新能力和團隊精神的培養,促進教育教學改革,某市教育局將舉辦全市中學生創新知識競賽.某校舉行選拔賽,共有 200 名學生參加,為了解成績情況,從中抽取 50 名學生的成績(得分均為整數,滿分為 100 分)進行統計,請你根據尚未完成的頻率分布表解答下列問題:分組 頻數 頻率[60.5,70.5) a 0.26[70.5,80.5) 15 c[80.5,90.5) 18 0.36[90.5,100.5] b d合計 50 e(1)求 a,b,c,d,e 的值;(2)作出頻率分布直方圖.【變式 1-2】(23-24 高二·上海·課堂例題)某醫學研究團隊為了研究一種降血脂新藥的有效性,給 50 名患者服用該藥,一周后測得低密度脂蛋白的含量(單位:mmol/L)如下:2.80 3.54 3.02 3.43 3.69 2.46 3.03 3.06 3.35 3.573.72 4.36 2.56 4.11 2.81 2.77 5.32 3.34 3.68 3.952.98 3.63 3.65 3.22 3.90 3.97 3.86 3.93 3.17 3.723.36 3.56 3.80 4.57 5.02 3.31 3.52 3.27 3.98 4.723.03 4.09 2.14 2.06 3.00 2.75 3.84 2.16 3.09 2.81(1)制作頻率分布表;(2)繪制頻率分布直方圖和頻率分布折線圖.【變式 1-3】(2024 高一下·全國·專題練習)如表所示給出了在某校 500 名 12 歲男孩中,用隨機抽樣得出的 120 人的身高(單位:cm).區間[122,126) [126,130) [130,134) [134,138) [138,142) [142,146) [146,150) [150,154) [154,158]界限人5 8 10 22 33 20 11 6 5數(1)列出樣本頻率分布表;(2)畫出頻率分布直方圖;(3)估計身高小于 134 cm 的人數占總人數的百分比.【題型 2 根據統計圖解決實際問題】【例 2】(2024·陜西西安·模擬預測)2017 年至 2022 年某省年生產總量及其增長速度如圖所示,則下列結論錯誤的是( )A.2017 年至 2022 年該省年生產總量逐年增加B.2017 年至 2022 年該省年生產總量的極差為 14842.3 億元C.2017 年至 2022 年該省年生產總量的增長速度逐年降低D.2017 年至 2022 年該省年生產總量的增長速度的中位數為 7.6%【變式 2-1】(2024 高二下·浙江紹興·學業考試)下圖為某同學兩次月考成績占總成績百分數的扇形統計圖,已知該同學第一次月考總分低于第二次月考總分,則( )A.該同學數學學科成績一定下降 B.該同學政治學科成績一定下降C.該同學化學學科成績可能下降 D.該同學語文學科成績一定提升【變式 2-2】(23-24 高一下·陜西·期末)如圖是 2020 年 2 月 15 日至 3 月 2 日武漢市新冠肺炎新增確診病例的折線統計圖.則下列說法不正確的是( )A.武漢市新冠肺炎疫情防控取得了階段性的成果,但防控要求不能降低B.2020 年 2 月 19 日武漢市新增新冠肺炎確診病例比前日降低了 1045 人C.2020 年 2 月 15 日到 3 月 2 日武漢市新冠肺炎新增確診病例最多的一天是最少的一天 16 倍多D.2020 年 2 月 19 日至 3 月 2 日武漢市新增新冠肺炎確診病例低于 500 人的有 10 天【變式 2-3】(23-24 高一下·湖南·階段練習)如圖為近一年我國商品零售總額和餐飲收入總額同比增速情況折線圖,根據該圖,下列結論正確的是( )(注:同比,指當前的數據與上一年同期進行比對;環比,指當前數據與上個月的數據進行比對.)A.2024 年1 2月份,商品零售總額同比增長9.2%B.2023 年3 12月份,餐飲收入總額同比都降低C.2023 年6 10月份,商品零售總額同比都增加D.2023 年 12 月,餐飲收入總額環比增速為 14.1%【題型 3 頻率分布直方圖的相關計算問題】【例 3】(23-24 高一下·湖南邵陽·期末)某校高一年級有 800 名學生選學物理,將某次聯考的物理成績繪制成的頻率分布直方圖如圖所示,則高一年級這次聯考的物理成績位于區間[60,80)的人數約為( )A.200 B.220 C.240 D.260【變式 3-1】(23-24 高一下·廣東廣州·階段練習)要調查某地區高中學生身體素質,從高中生中抽取 100 人進行跳遠測試,根據測試成績制作頻率分布直方圖如下圖,現再從這 100 人中用分層抽樣的方法抽取 20 人,應從[120,130)間抽取人數為 b,則 b 為( )A.4 B.5 C.6 D.7【變式 3-2】(23-24 高一下·北京朝陽·期末)李華統計了他爸爸 2024 年 5 月的手機通話明細清單,發現他爸爸該月共通話 60 次,他按每次通話時間長短進行分組(每組為左閉右開的區間),畫出了如圖所示的頻率分布直方圖.則每次通話時長不低于 5 分鐘且小于 15 分鐘的次數為( )A.18 B.21 C.24 D.27【變式 3-3】(2025 高三上·河南·專題練習)為了調查某工廠生產的一批口罩的質量情況,隨機抽取了一批口罩,所得數據如下圖所示,為了進一步了解情況,研究人員在被抽取的口罩中按照質量的指標值再次進行分層抽樣,共抽取 個,若質量的指標值在[110,120)中的抽取80個,則下列說法正確的是( )A.質量的指標值在[140,150)中的抽取5個B.質量的指標值在[130,140)中的抽取60個C.質量的指標值在[120,130)中的抽取40個D. = 200【題型 4 統計圖的綜合應用問題】【例 4】(23-24 高一下·四川內江·期末)某調查機構對全國互聯網行業進行調查統計,得到整個互聯網行業從業者年齡的分布餅狀圖 90 后從事互聯網行業者的崗位分布條形圖,則下列結論中不一定正確的是( )A.互聯網行業從事技術崗位的人數中,90 后比 80 后多B.90 后互聯網行業者中從事技術崗位的人數超過整個從事互聯網行業者總人數的20%C.互聯網行業中從事運營崗位的人數 90 后比 80 前多D.互聯網行業從業人員中 90 后占一半以上【變式 4-1】(2024·河南·二模)某銀行為客戶定制了 A,B,C,D,E 共 5 個理財產品,并對 5 個理財產品的持有客戶進行抽樣調查,得出如下的統計圖:用該樣本估計總體,以下四個說法錯誤的是( )A.44~56 周歲人群理財人數最多B.18~30 周歲人群理財總費用最少C.B 理財產品更受理財人青睞D.年齡越大的年齡段的人均理財費用越高【變式 4-2】(24-25 高一上·全國·課后作業)以下是某手機店根據某手機銷售的相關數據繪制的統計圖的一部分.請根據圖 1、圖 2 解答下列問題:(1)來自該店財務部的數據報告表明,該手機店 1~4 月的手機銷售總額一共是 290 萬元,請將圖 1 中的統計圖補充完整;(2)該店 1 月份音樂手機的銷售額為多少萬元 (3)小剛觀察圖 2 后,認為 4 月份音樂手機的銷售額比 3 月份減少了,你同意他的看法嗎 請說明理由.【變式 4-3】(2025 高一·全國·專題練習)某市為了增強學生體質,全面實施“學生飲用奶”營養工程.某品牌牛奶供應商提供了原味、草莓味、菠蘿味、香橙味、核桃味五種口味的牛奶供學生飲用.某中學為了了解學生對不同口味牛奶的喜好,對全校訂購牛奶的學生進行了隨機調查(每盒各種口味牛奶的體積相同),繪制了如下兩張不完整的統計圖:(1)本次被調查的學生有多少名?(2)補全上面的條形統計圖①,并計算出喜好菠蘿味牛奶的學生人數在扇形統計圖②中所占圓心角的度數;(3)該校共有 1200 名學生訂購了該品牌的牛奶,牛奶供應商每天只為每名訂購牛奶的學生配送一盒牛奶.要使學生每天都喝到自己喜好的口味的牛奶,牛奶供應商每天送往該校的牛奶中,草莓味要比原味的多多少盒?【知識點 2 總體百分位數、集中趨勢與離散程度的估計】1.總體百分位數的估計(1)概念一般地,一組數據的第 p 百分位數是這樣一個值,它使得這組數據中至少有 p%的數據小于或等于這個值,且至少有(100-p)%的數據大于或等于這個值.(2)求解步驟可以通過下面的步驟計算一組 n 個數據的第 p 百分位數:第 1 步,按從小到大排列原始數據.第 2 步,計算 i=n×p%.第 3 步,若 i 不是整數,而大于 i 的比鄰整數為 j,則第 p 百分位數為第 j 項數據;若 i 是整數,則第 p百分位數為第 i 項與第(i+1)項數據的平均數.2.總體集中趨勢的估計在初中的學習中我們已經了解到,平均數、中位數和眾數等都是刻畫“中心位置”的量,它們從不同角度刻畫了一組數據的集中趨勢.具體概念回顧如下:名稱 概念平如果有 n 個數 x1,x2,…,xn,那么 就是這組數據均數 的平均數,用 表示,即 .中 將一組數據按從小到大或從大到小的順序排列,處在最中間的一個數據位 (當數據個數是奇數時)或最中間兩個數據的平均數(當數據個數是偶數 數時)稱為這組數據的中位數.眾 一組數據中出現次數最多的數據(即頻數最大值所對應的樣本數據)稱數 為這組數據的眾數.3.總體離散程度的估計(1)方差和標準差假設一組數據是 , , , ,用 表示這組數據的平均數,則我們稱 為這組數據的方差.有時為了計算方差的方便,我們還把方差寫成 的形式.我們對方差開平方,取它的算數平方根 ,稱為這組數據的標準差.(2)總體(樣本)方差和總體標準差①一般式:如果總體中所有個體的變量值分別為 ,總體平均數為 ,則總體方差.②加權式:如果總體的 N 個變量值中,不同的值共有 k(k≤N)個,不妨記為 ,其中出現的頻數為 ,則總體方差為 .總體標準差:S= .(3)標準差與方差的統計意義①標準差刻畫了數據的離散程度或波動幅度,標準差越大,數據的離散程度越大;標準差越小,數據的離散程度越小.②在刻畫數據的分散程度上,方差與標準差是一樣的,但在解決實際問題時,一般多采用標準差.③標準差(方差)的取值范圍為[0,+∞).若樣本數據都相等,表明數據沒有波動幅度,數據沒有離散性,則標準差為 0.反之,標準差為 0 的樣本,其中的數據都相等.4.頻率分布直方圖中的統計參數(1)頻率分布直方圖中的“眾數”根據眾數的意義可知,在頻率分布直方圖中最高矩形中的某個(些)點的橫坐標為這組數據的眾數.一般用中點近似代替.(2)頻率分布直方圖中的“中位數”根據中位數的意義,在樣本中,有 50%的個體小于或等于中位數,也有 50%的個體大于或等于中位數.因此,在頻率分布直方圖中,中位數左邊和右邊的直方圖的面積應該相等,由此可估計中位數的值.(3)頻率分布直方圖中的“平均數”平均數是頻率分布直方圖的“重心”.因為平均數可以表示為數據與它的頻率的乘積之和,所以在頻率分布直方圖中,樣本平均數可以用每個小矩形底邊中點的橫坐標與小矩形的面積的乘積之和近似代替.【題型 5 百分位數的求解】【例 5】(23-24 高一下·貴州黔西·期末)興義市峰林布依景區在春節期間,迎來眾多游客,其中某天接受了一個小型的旅行團,他們的年齡(單位:歲)如下:6,6,7,8,10,37,39,45,46,52,53,61,則這組數據的第 75 百分位數是( )A.34.5 B.46 C.49 D.52【變式 5-1】(23-24 高一下·廣東廣州·期末)有一組數據按從小到大排序如下:70,71,73,75,76,則這組數據的 40%分位數,70%分位數分別是( )A.71,74 B.71,75 C.72,74 D.72,75【變式 5-2】(23-24 高一下·江蘇蘇州·期末)某科研單位對 ChatGPT 的使用情況進行滿意度調查,在一批用戶的有效問卷(用戶打分在 50 分到 100 分之間的問卷)中隨機抽取了 100 份,按分數進行分組(每組為左閉右開的區間),得到如圖所示的頻率分布直方圖,估計這批用戶問卷的得分的第75百分位數為( )A.78.5 B.82.5 C.85 D.87.5【變式 5-3】(23-24 高一下·天津南開·期末)一組數據:53,57,45,61,79,49,x,若這組數據的第 80百分位數與第 60 百分位數的差為 3,則 = ( )A.58 或 64 B.58 C.59 或 64 D.59【題型 6 眾數、中位數、平均數的計算與求參】【例 6】(2024·浙江紹興·三模)已知實數1 < 2 < < ,若 = 36,且這四個數的中位數是 3,則這四個數的平均數是( )A 5 7.2 B.3 C.2 D.4【變式 6-1】(24-25 高一上·四川南充·開學考試)“雜交水稻之父”袁隆平培育的超級雜交稻在全世界推廣種植.某種植戶為了考察所種植的雜交水稻苗的長勢,從稻田中隨機抽取 7 株水稻苗,測得苗高(單位:cm)分別是 23,24,23,25,26,23,25.則這組數據的眾數和中位數分別是( )A.24,25 B.23,23C.23,24 D.24,24【變式 6-2】(2024·江蘇南通·三模)某同學測得連續 7 天的最低氣溫分別為1,2,2, ,6,2,8(單位:℃),若這組數據的平均數是中位數的 2 倍,則 = ( )A.2 B.3 C.6 D.7【變式 6-3】(23-24 高一下·云南曲靖·期末)已知一組數據丟失了其中一個大于 3 的數據,剩下的六個數據分別是 3,3,5,3,6,11,若這組數據的平均數與眾數的和是中位數的 2 倍,則丟失的數據可能是( )A.5 B.12 C.18 D.20【題型 7 眾數、中位數、平均數的實際應用】【例 7】(23-24 高一下·河北邯鄲·期末)在一次數學智力測驗中,將 100 名參賽者的成績進行分組整理后得到如下頻率分布直方圖(每組為左閉右開的區間),根據此頻率分布直方圖,下列結論正確的是( )A.這 100 名學生中成績在[80,90)內的頻率為 0.012B.這 100 名學生中成績在[70,90)內的人數為 14C.這 100 名學生的平均成績為 68.2(同一組中的數據用該組區間的中點值代表)D.這 100 名學生成績的中位數為 75【變式 7-1】(2024·黑龍江哈爾濱·三模)如圖所示,下列頻率分布直方圖顯示了三種不同的形態.圖(1)形成對稱形態,圖(2)形成“右拖尾”形態,圖(3)形成“左拖尾”形態,根據所給圖作出以下判斷,正確的是( )A.圖(1)的平均數=中位數>眾數 B.圖(2)的眾數<中位數<平均數C.圖(2)的平均數<眾數<中位數 D.圖(3)的中位數<平均數<眾數【變式 7-2】(2024·陜西西安·二模)某教育機構為調查中小學生每日完成作業的時間,收集了某位學生 100天每天完成作業的時間,并繪制了如圖所示的頻率分布直方圖(每個區間均為左閉右開),根據此直方圖得出了下列結論,其中正確的是( )A.估計該學生每日完成作業的時間在 2 小時至 2.5 小時的有 50 天B.估計該學生每日完成作業時間超過 3 小時的概率為 0.3C.估計該學生每日完成作業時間的平均數為 2.75 小時D.估計該學生每日完成作業時間的中位數與平均數相等【變式 7-3】(2024·全國·模擬預測)如圖為 2014—2022 年中國游戲用戶規模(單位:百萬人)及同比增長率、2010—2022 年中國國產游戲獲批版號數量(單位:個)的統計圖,則下列結論正確的是( )A.2014—2022 年中國游戲用戶規模逐年增長B.2014—2022 年中國游戲用戶規模的同比增長率的中位數為3.1%C.2010—2022 年中國國產游戲獲批版號數量的極差為 223 個D.2010—2022 年中國國產游戲獲批版號數量的平均數超過 1600 個【題型 8 方差、標準差的求解及應用】【例 8】(23-24 高一下·寧夏·期末)已知某 4 個數據的平均數為 6,方差為 3,現又加入一個數據 6,此時這 5 個數據的方差為( )A 24 B 16 C 14 D 12. 5 . 5 . 5 . 5【變式 8-1】(24-25 高一·全國·單元測試)某班統計一次數學測驗成績的平均分與方差,計算完畢才發現有個同學的分數還未錄入,只好重算一次.已知原平均分和原方差分別為 , 2,新平均分和新方差分別為 1, 21,若此同學的得分恰好為 ,則( )A. = 1, 2 = 21 B. = 1, 2 < 21C. = 2 2 21, > 1 D. < 1, = 21【變式 8-2】(24-25 高二上·吉林·開學考試)有兩位射擊運動員在一次射擊測試中各射靶 10 次,每次命中的環數如下:甲:7 8 7 9 5 4 9 10 7 4乙:9 5 7 8 7 6 8 6 7 7設甲、乙兩名運動員射擊平均環數分別記為 和 ,方差分別記為 21和 22.(1)求 , , 21, 22;(2)如果你是教練,你如何對這次射擊情況作出評價?如果這是一次選拔性考核,你應當如何作出選擇?【變式 8-3】(23-24 高一下·江蘇蘇州·期末)2023 年 10 月 22 日,漢江生態城 2023 襄陽馬拉松在湖北省襄陽市成功舉行,志愿者的服務工作是馬拉松成功舉辦的重要保障,襄陽市新時代文明實踐中心承辦了志愿者選拔的面試工作.現隨機抽取了 100 名候選者的面試成績,并分成五組:第一組[45,55),第二組[55,65),第三組[65,75),第四組[75,85),第五組[85,95],繪制成如圖所示的頻率分布直方圖.已知第一、二組的頻率之和為 0.3,第一組和第五組的頻率相同.(1)估計這 100 名候選者面試成績的平均數和第 25 百分位數;(2)在這 100 名候選者用分層隨機抽樣的方法從第四組和第五組面試者內抽取 10 人,再從這 10 名面試者中隨機抽取兩名,求兩名面試者成績都在第五組的概率.(3)現從以上各組中用分層隨機抽樣的方法選取 20 人,擔任本市的宣傳者.若本市宣傳者中第二組面試者的面試成績的平均數和方差分別為 62 和 40,第四組面試者的面試成績的平均數和方差分別為 80 和 70,據此估計這次第二組和第四組所有面試者的面試成績的方差.【題型 9 頻率分布直方圖中集中趨勢參數的計算】【例 9】(23-24 高一下·遼寧朝陽·開學考試)對某校高三年級學生參加社區服務的次數進行統計,隨機抽取 M 名學生,得到這 M 名學生參加社區服務的次數,根據此數據作出如下頻率分布表和頻率分布直方圖.分組 頻數 頻率[10,15) 10 0.20[15,20) 24 n[20,25) m p[25,30] 2 0.04合計 M 1(1)求出表中 M,p 及圖中 a 的值;(2)若該校有高三學生 300 人,試估計該校高三學生參加社區服務的次數在區間[15,20)內的人數;(3)估計該校高三學生參加社區服務次數的眾數、中位數及平均數.(保留一位小數)【變式 9-1】(23-24 高一上·內蒙古呼和浩特·期末)2023 年秋末冬初,呼和浩特市發生了流感疾病. 為了徹底擊敗病毒,人們更加講究衛生講究環保. 某學校開展組織學生參加線上環保知識競賽活動,現從中抽取200 名學生,記錄他們的首輪競賽成績并作出如圖所示的頻率直方圖,根據圖形,請回答下列問題:(1)若從成績低于 60 分的同學中按分層抽樣方法抽取 5 人成績,求 5 人中成績低于 50 分的人數;(2)以樣本估計總體,利用組中值估計該校學生首輪競賽成績的平均數;(3)首輪競賽成績位列前10%的學生入圍第二輪的復賽,請根據圖中信息,估計入圍復賽的成績(記為 ).【變式 9-2】(23-24 高一下·湖南長沙·期末) (身體質量指數)是目前國際上常用的衡量人體胖瘦程度體重(單位:kg)以及是否健康的一個標準,其計算公式是: = 2 : m2 .中國成人的 數值參考標準為: < 18.5身高 單位為偏瘦;18.5 ≤ < 24為正常;24 ≤ < 28為偏胖; ≥ 28為肥胖.某公司為了解公司員工的身體肥胖情況,研究人員從公司員工體檢數據中,采用分層隨機抽樣的方法抽取了 60 名男員工,40 名女員工的身高體重數據,通過計算男女員工的 值,整理得到如下的頻率分布直方圖.(1)求頻率分布直方圖中 a 的值,并估計該公司員工為肥胖的百分比;(2)估計該公司員工的 值的眾數,中位數;(3)已知樣本中 60 名男員工 值的平均數為 1 = 22.4,根據頻率分布直方圖,估計樣本中 40 名女員工 值的平均數 2.【變式 9-3】(23-24 高一下·四川達州·階段練習)有一種魚的身體吸收汞,身體中汞的含量超過其體重的1.00ppm(百萬分之一)的魚被人食用后,就會對人體產生危害.某檢測中心從一批這種魚中隨機抽取了 50 條,檢測其汞含量(單位:ppm),并將所得數據分為 6 組:[0,0.4),[0.4,0.8),[0.8,1.2),[1.2,1.6),[1.6,2.0),[2.0,2.4],整理后得到如下頻率分布直方圖.(1)由頻率分布直方圖估計樣本的80%分位數(精確到 0.01);(2)由頻率分布直方圖估計這批魚汞含量的平均值(同一組中的數據用該組區間的中點值為代表);(3)從實際情況看,許多魚的汞含量超標的原因是這些魚在出售之前沒有被檢測過.你認為每批這種魚的平均汞含量都比1.00ppm大嗎 并說明理由.【題型 10 其他統計圖表中反映的集中趨勢與離散程度】【例 10】(23-24 高一下·湖北武漢·期末)近年來,“直播帶貨”受到越來越多人的喜愛,目前已經成為推動消費的一種流行的營銷形式.某直播平臺 1200 個直播商家,對其進行調查統計,發現所售商品多為小吃、衣帽、生鮮、玩具、飾品類等,各類直播商家所占比例如圖所示.(1)該直播平臺為了更好地服務買賣雙方,打算隨機抽取 60 個直播商家進行問詢交流.如果按照比例分層抽樣的方式抽取,則應抽取小吃類、生鮮類商家各多少家?(2)在問詢了解直播商家的利潤狀況時,工作人員對(1)中抽取的 60 個商家的平均日利潤進行了統計(單位:元),所得頻率分布直方圖如右圖所示,請根據頻率分布直方圖計算下面的問題:①估計該直播平臺商家平均日利潤的中位數與平均數(結果保留一位小數,求平均數時同一組中的數據用該組區間的中點值作代表);②若將平均日利潤超過 430 元的商家評為“優秀商家”,估計該直播平臺“優秀商家”的個數.【變式 10-1】(23-24 高二上·四川成都·期末)為了了解甲、乙兩個工廠生產的輪胎的寬度是否達標,分別從兩廠隨機選取了 10 個輪胎,將每個輪胎的寬度(單位:mm) 記錄下來并繪制出折線圖:(1)分別計算甲、 乙兩廠提供 10 個輪胎寬度的平均值;(2)輪胎的寬度在[193,195]內,則稱這個輪胎是標準輪胎,試比較甲、 乙兩廠分別提供的 10 個輪胎中所有標準輪胎寬度的方差的大小,根據兩廠的標準輪胎寬度的平均水平及其波動情況,判斷這兩個工廠哪個廠的輪胎相對更好.【變式 10-2】(23-24 高一下·寧夏·期末)某公司為了提高職工的健身意識,鼓勵大家加入健步運動,要求200 名職工每天晚上 9:30 上傳手機計步截圖,對于步數超過 10000 的予以獎勵.圖 1 為甲乙兩名職工在某一星期內的運動步數統計圖,圖 2 為根據這星期內某一天全體職工的運動步數做出的頻率分布直方圖.(1)請根據頻率分布直方圖,求 m 的值,并求出該天運動步數不少于 15000 步的人數;(2)估計全體職工在該天運動步數的眾數、平均數和中位數;(3)如果當天甲的排名為第 130 名,乙的排名為第 40 名,試判斷做出的是星期幾的頻率分布直方圖.【變式 10-3】(23-24 高一下·廣東東莞·期末)樹人中學男女學生比例約為2:3,某數學興趣社團為了解該校學生課外體育鍛煉情況(鍛煉時間長短(單位:小時),采用樣本量比例分配的分層抽樣,抽取男生 人,女生 人進行調查.記男生樣本為 1, 2, , ,樣本平均數、方差分別為 、 21;女生樣本為 1, 2, , ,樣本平均數、方差分別為 、 22;總樣本平均數、方差分別為 、 2. (1)證明: ( )2 = 2 21 + ( ) ; =1(2)該興趣社團通過分析給出以下兩個統計圖,假設兩個統計圖中每個組內的數據均勻分布,根據兩圖信息分別估計男生樣本、女生樣本的平均數;(3)已知男生樣本方差 21 = 5.5,女生樣本方差 22 = 5.7,請結合(2)問的結果計算總樣本方差 2的估計值.專題 9.2 用樣本估計總體【十大題型】【人教 A 版(2019)】【題型 1 頻率分布直方圖的繪制】 ........................................................................................................................2【題型 2 根據統計圖解決實際問題】 ....................................................................................................................7【題型 3 頻率分布直方圖的相關計算問題】 ......................................................................................................10【題型 4 統計圖的綜合應用問題】 ......................................................................................................................12【題型 5 百分位數的求解】 ..................................................................................................................................18【題型 6 眾數、中位數、平均數的計算與求參】 ..............................................................................................19【題型 7 眾數、中位數、平均數的實際應用】 ..................................................................................................20【題型 8 方差、標準差的求解及應用】 ..............................................................................................................23【題型 9 頻率分布直方圖中集中趨勢參數的計算】 ..........................................................................................26【題型 10 其他統計圖表中反映的集中趨勢與離散程度】 ................................................................................30【知識點 1 總體取值規律的估計】1.頻率分布直方圖(1)頻率分布表與頻率分布直方圖的意義為了探索一組數據的取值規律,一般先要用表格對數據進行整理,或者用圖將數據直觀表示出來.在初中,我們曾用頻數分布表和頻數分布圖來整理和表示這種數值型數據,由此能使我們清楚地知道數據分布在各個小組的個數.有時,我們更關心各個小組的數據在樣本容量中所占比例的大小,所以選擇頻率分布表和頻率分布直方圖來整理和表示數據.(2)頻率分布表與頻率分布直方圖的制作步驟與畫頻數分布直方圖類似,我們可以按以下步驟制作頻率分布表、畫頻率分布直方圖.第一步,求極差極差為一組數據中最大值與最小值的差.第二步,決定組距與組數第三步,將數據分組通常對組內數據取左閉右開區間,最后一組數據取閉區間.第四步,列頻率分布表計算各小組的頻率,作出頻率分布表.第五步,畫頻率分布直方圖畫圖時,以橫軸表示分組,縱軸(小長方形的高度)表示 .2.其他幾類常用統計圖——條形圖、折線圖、扇形圖條形圖 折線圖 扇形圖一般地,條形圖中,一條軸 用一個單位長度表示一定 用整個圓表示總體,扇形上顯示的是所關注的數據類 的數量,用折線的起伏表示 圖中,每一個扇形的圓心特型,另一條軸上對應的是數 數量的增減變化. 角以及弧長,都與這一部點量、個數或者比例,條形圖 分表示的數據大小成正中每一長方形都是等寬的. 比.作 能清楚地表示每個項目的具 能清楚地看出數量增減變 可以形象地表示出各部分用 體數量,便于相互比較大小. 化的情況及各部分數量的 數據在全部數據中所占的及 多少.常用來表示隨時間變 比例情況.選 化的數據,當然,也可以用用 在其他合適的情形中.情景圖例【題型 1 頻率分布直方圖的繪制】【例 1】(24-25 高二·上海·課堂例題)從高一學生中抽取 50 名參加調研考試,成績的分組及各組的頻數如下(單位:分):[40,50),2;[50,60),3;[60,70),10;[70,80),15;[80,90),12;[90,100],8.(1)列出樣本的頻率分布表;(2)畫出頻率分布直方圖;(3)估計成績在[70,80)分的學生所占總體的百分比.【解題思路】(1)根據題中所給數據 即可得出頻率分布表;(2)根據頻率分布表畫出頻率分布直方圖即可;(3)根據頻率分布直方圖即可得解.【解答過程】(1)頻率分布表如下:成績分組 頻數 頻率[40,50) 2 0.04[50,60) 3 0.06[60,70) 10 0.20[70,80) 15 0.30[80,90) 12 0.24[90,100] 8 0.16合計 50 1.00(2)由題意知組距為 10,取小矩形的高根據表格畫出如下的頻率分布直方圖:(3)由頻率分布直方圖,可估計成績在[70,80)分的學生所占總體的百分比是0.03 × 10 = 0.3 = 30%.【變式 1-1】(24-25 高一下·全國·課后作業)為加強中學生實踐創新能力和團隊精神的培養,促進教育教學改革,某市教育局將舉辦全市中學生創新知識競賽.某校舉行選拔賽,共有 200 名學生參加,為了解成績情況,從中抽取 50 名學生的成績(得分均為整數,滿分為 100 分)進行統計,請你根據尚未完成的頻率分布表解答下列問題:分組 頻數 頻率[60.5,70.5) a 0.26[70.5,80.5) 15 c[80.5,90.5) 18 0.36[90.5,100.5] b d合計 50 e(1)求 a,b,c,d,e 的值;(2)作出頻率分布直方圖.【解題思路】(1)根據頻率分布表中的數據,利用頻率公式結合頻數為 50,頻率和為 1 求解;(2)根據頻率分布表中的數據,以組距為 x 軸,以頻率比組距為 y 軸,畫出頻率分布直方圖;【解答過程】(1)根據題意,得分在[60.5,70.5)內的頻數 a=50×0.26=13,在[90.5,100.5]內的頻數 b=50-13-15-18=4,在[70.5,80.5) 15內的頻率 c=50 = 0.30,在[90.5 4,100.5]內的頻率 d=50 = 0.08,頻率和 e=1.(2)根據頻率分布表作出頻率分布直方圖,如圖所示.【變式 1-2】(23-24 高二·上海·課堂例題)某醫學研究團隊為了研究一種降血脂新藥的有效性,給 50 名患者服用該藥,一周后測得低密度脂蛋白的含量(單位:mmol/L)如下:2.80 3.54 3.02 3.43 3.69 2.46 3.03 3.06 3.35 3.573.72 4.36 2.56 4.11 2.81 2.77 5.32 3.34 3.68 3.952.98 3.63 3.65 3.22 3.90 3.97 3.86 3.93 3.17 3.723.36 3.56 3.80 4.57 5.02 3.31 3.52 3.27 3.98 4.723.03 4.09 2.14 2.06 3.00 2.75 3.84 2.16 3.09 2.81(1)制作頻率分布表;(2)繪制頻率分布直方圖和頻率分布折線圖.【解題思路】(1)根據所給數據求出極差,分組,求出各區間的頻數及頻率即可求出頻率分布表;(2)根據(1)作出頻率分布直方圖,再由頻率分布直方圖得出折線圖即可【解答過程】(1)由題目數據可知極差為5.32 2.06 = 3.26,組距為0.5,所以分 7 組較好,[2.06,2.56),[2.56,3.06),[3.06,3.56),[3.56,4.06),[4.06,4.56),[4.56,5.06),[5.06,5.56),頻率分布表如下:分組 頻數 頻率[2.06,2.56) 4 0.08[2.56,3.06) 11 0.22[3.06,3.56) 12 0.24[3.56,4.06) 16 0.32[4.06,4.56) 3 0.06[4.56,5.06) 3 0.06[5.06,5.56) 1 0.02合計 50 1.00(2)根據(1)的頻率分布表可以畫出頻率分布直方圖如圖所示:頻率折線圖如圖:【變式 1-3】(2024 高一下·全國·專題練習)如表所示給出了在某校 500 名 12 歲男孩中,用隨機抽樣得出的 120 人的身高(單位:cm).區間[122,126) [126,130) [130,134) [134,138) [138,142) [142,146) [146,150) [150,154) [154,158]界限人5 8 10 22 33 20 11 6 5數(1)列出樣本頻率分布表;(2)畫出頻率分布直方圖;(3)估計身高小于 134 cm 的人數占總人數的百分比.【解題思路】(1)借助所給表格計算即可得;(2)借助頻率分布直方圖的定義及所給表格即可得;(3)計算出相應頻率之和即可得.【解答過程】(1)樣本頻率分布表如下:分組 頻數 頻率[122,126) 5 0.04[126,130) 8 0.07[130,134) 10 0.08[134,138) 22 0.18[138,142) 33 0.28[142,146) 20 0.17[146,150) 11 0.09[150,154) 6 0.05[154,158] 5 0.04合計 120 1.00(2)其頻率分布直方圖如下:(3)0.04 + 0.07 + 0.08 = 0.19,故可估計身高小于 134 cm 的人數占總人數的19%.【題型 2 根據統計圖解決實際問題】【例 2】(2024·陜西西安·模擬預測)2017 年至 2022 年某省年生產總量及其增長速度如圖所示,則下列結論錯誤的是( )A.2017 年至 2022 年該省年生產總量逐年增加B.2017 年至 2022 年該省年生產總量的極差為 14842.3 億元C.2017 年至 2022 年該省年生產總量的增長速度逐年降低D.2017 年至 2022 年該省年生產總量的增長速度的中位數為 7.6%【解題思路】根據給定的條形圖和折線圖,逐項分析判斷即得.【解答過程】對于 A,觀察條形圖知,2017 年至 2022 年該省年生產總量逐年增加,A 正確;對于 B,2017 年至 2022 年該省年生產總量的極差為48670.4 33828.1 = 14842.3(億元),B 正確;對于 C,2017 年至 2020 年該省年生產總量的增長速度逐年降低,而 2021 年該省年生產總量的增長速度比 2020 年該省年生產總量的增長速度高,C 錯誤;對于 D,2017 年至 2020 年該省年生產總量的增長速度由小到大排列為:3.8%,4.5%,7.6%,7.6%,7.8%,8.0%,7.6%+7.6%因此增長速度的中位數為 2 = 7.6%,D 正確.故選:C.【變式 2-1】(2024 高二下·浙江紹興·學業考試)下圖為某同學兩次月考成績占總成績百分數的扇形統計圖,已知該同學第一次月考總分低于第二次月考總分,則( )A.該同學數學學科成績一定下降 B.該同學政治學科成績一定下降C.該同學化學學科成績可能下降 D.該同學語文學科成績一定提升【解題思路】根據扇形統計圖一一分析即可.【解答過程】對于 A:第一次月考數學成績占16%,第二次月考數學成績占17%,且第一次月考總分低于第二次月考總分,所以第二次月考數學成績比第一次數學成績要高,故 A 錯誤;對于 B:第一次月考政治成績占17%,第二次月考政治成績占16%,由于只知道第一次月考總分低于第二次月考總分,故無法判斷這兩次月考政治學科成績的變化,故 B 錯誤;對于 C:第一次月考化學成績占16%,第二次月考化學成績占17%,且第一次月考總分低于第二次月考總分,所以第二次月考化學成績比第一次化學成績要高,故 C 錯誤;對于 D:第一次月考語文成績占16%,第二次月考語文成績占18%,且第一次月考總分低于第二次月考總分,所以第二次月考語文成績比第一次語文成績要高,故 D 正確.故選:D.【變式 2-2】(23-24 高一下·陜西·期末)如圖是 2020 年 2 月 15 日至 3 月 2 日武漢市新冠肺炎新增確診病例的折線統計圖.則下列說法不正確的是( )A.武漢市新冠肺炎疫情防控取得了階段性的成果,但防控要求不能降低B.2020 年 2 月 19 日武漢市新增新冠肺炎確診病例比前日降低了 1045 人C.2020 年 2 月 15 日到 3 月 2 日武漢市新冠肺炎新增確診病例最多的一天是最少的一天 16 倍多D.2020 年 2 月 19 日至 3 月 2 日武漢市新增新冠肺炎確診病例低于 500 人的有 10 天【解題思路】直接利用折線圖以及統計的相關知識逐一分析即可【解答過程】對于 A, 19 日后新增確診病例人數與之前的各天新增確診病例人數相比較呈大幅下降趨勢,故防控取得了階段性的成果,但新增人數還較多,故防控要求不能降低,故 A 正確;對于 B,由圖可知 18 日新增確診病例人數 1660 人,19 日新增確診病例人數 615 人,故 2020 年 2 月 19 日武漢市新增新冠肺炎確診病例比前日降低了 1045 人,故 B 正確;對于 C,由圖新增確診病例最多一天的人數為 1690,新增確診病例最少一天的人數 111 人,故 2020 年 2 月 15 日到 3 月 2 日武漢市新冠肺炎新增確診病例最多的一天人數與最少的一天的人數的比值1690為 111 < 16,C 錯誤,對于 D,由圖得到,病例低于 500 人的有 2 月 20 日、21 日、23 日、24 日、25 日、26 日、27 日、28 日、3月 1 日、2 日,共 10 天,故 D 正確;故選:C.【變式 2-3】(23-24 高一下·湖南·階段練習)如圖為近一年我國商品零售總額和餐飲收入總額同比增速情況折線圖,根據該圖,下列結論正確的是( )(注:同比,指當前的數據與上一年同期進行比對;環比,指當前數據與上個月的數據進行比對.)A.2024 年1 2月份,商品零售總額同比增長9.2%B.2023 年3 12月份,餐飲收入總額同比都降低C.2023 年6 10月份,商品零售總額同比都增加D.2023 年 12 月,餐飲收入總額環比增速為 14.1%【解題思路】根據折線統計圖一一分析即可.【解答過程】對于 A,2024 年1 2月份,商品零售總額同比增長2.9%,故 A 錯誤;對于 B,2023 年 8 月份,餐飲收入總額同比增加,故 B 錯誤;對于 C,2023 年6 10月份,商品零售總額同比都增加,故 C 正確;對于 D,2023 年 12 月,餐飲收入總額環比增速并未告知,故 D 錯誤.故選:C.【題型 3 頻率分布直方圖的相關計算問題】【例 3】(23-24 高一下·湖南邵陽·期末)某校高一年級有 800 名學生選學物理,將某次聯考的物理成績繪制成的頻率分布直方圖如圖所示,則高一年級這次聯考的物理成績位于區間[60,80)的人數約為( )A.200 B.220 C.240 D.260【解題思路】根據頻率和為1可構造方程求得 的值,再由頻率分布直方圖可求得成績落在[60,80)的頻率,由樣本估計總體可計算得到結果.【解答過程】(0.01 + 0.02 + + 0.005) × 20 = 1 = 0.015,成績落在[60,80)的頻率為0.015 × 20 = 0.3,則成績位于區間[60,80)的人數約為800 × 0.3 = 240(人).故選:C.【變式 3-1】(23-24 高一下·廣東廣州·階段練習)要調查某地區高中學生身體素質,從高中生中抽取 100 人進行跳遠測試,根據測試成績制作頻率分布直方圖如下圖,現再從這 100 人中用分層抽樣的方法抽取 20 人,應從[120,130)間抽取人數為 b,則 b 為( )A.4 B.5 C.6 D.7【解題思路】先由頻率之和為1解得 值,計算可得[120,130)之間的學生人數,根據抽樣比可求得 .【解答過程】由題得10 × (0.005 + 0.035 + + 0.020 + 0.010) = 1,所以 = 0.030.在[120,130)之間的學生:100 × 10 × 0.030 = 30人,現再從這100人中用分層抽樣的方法抽取20人,應從[120,130) 20間抽取人數為100 × 30 = 6,故 = 6.故選:C.【變式 3-2】(23-24 高一下·北京朝陽·期末)李華統計了他爸爸 2024 年 5 月的手機通話明細清單,發現他爸爸該月共通話 60 次,他按每次通話時間長短進行分組(每組為左閉右開的區間),畫出了如圖所示的頻率分布直方圖.則每次通話時長不低于 5 分鐘且小于 15 分鐘的次數為( )A.18 B.21 C.24 D.27【解題思路】根據給定的頻率分布直方圖,求出每次通話時長不低于 5 分鐘且小于 15 分鐘的頻率即可得解.【解答過程】觀察頻率分布直方圖,得每次通話時長不低于 5 分鐘且小于 15 分鐘的頻率為:1 5(0.06 + 0.03 + 0.02 + 0.02) = 0.35,則60 × 0.35 = 21,所以每次通話時長不低于 5 分鐘且小于 15 分鐘的次數為 21.故選:B.【變式 3-3】(2025 高三上·河南·專題練習)為了調查某工廠生產的一批口罩的質量情況,隨機抽取了一批口罩,所得數據如下圖所示,為了進一步了解情況,研究人員在被抽取的口罩中按照質量的指標值再次進行分層抽樣,共抽取 個,若質量的指標值在[110,120)中的抽取80個,則下列說法正確的是( )A.質量的指標值在[140,150)中的抽取5個B.質量的指標值在[130,140)中的抽取60個C.質量的指標值在[120,130)中的抽取40個D. = 200【解題思路】計算出質量的指標值在[110,120)內的頻率,由頻率、頻數以及總容量三者之間的關系額可求得 的值,可判斷 D 選項;然后將 的值乘以對應組的頻率,可判斷 ABC 選項.【解答過程】質量的指標值在[110,120)內的頻率為0.04 × 10 = 0.4,所以, =800.4 = 200,所以,質量的指標值在[140,150)中的抽取的數量為200 × 0.005 × 10 = 10個,質量的指標值在[130,140)中的抽取的數量為200 × 0.02 × 10 = 40個,質量的指標值在[120,130)的抽取的數量為200 × 0.03 × 10 = 60個,ABC 錯,D 對.故選:D.【題型 4 統計圖的綜合應用問題】【例 4】(23-24 高一下·四川內江·期末)某調查機構對全國互聯網行業進行調查統計,得到整個互聯網行業從業者年齡的分布餅狀圖 90 后從事互聯網行業者的崗位分布條形圖,則下列結論中不一定正確的是( )A.互聯網行業從事技術崗位的人數中,90 后比 80 后多B.90 后互聯網行業者中從事技術崗位的人數超過整個從事互聯網行業者總人數的20%C.互聯網行業中從事運營崗位的人數 90 后比 80 前多D.互聯網行業從業人員中 90 后占一半以上【解題思路】利用整個互聯網行業從業者年齡分布餅狀圖、90 后從事互聯網行業崗位分布條形圖即可判斷各選項的真假.【解答過程】選項 A;設整個互聯網行業總人數為 a,互聯網行業中從事技術崗位的 90 后人數為56% × 39.6% = 22.176% ,小于 80 后的人數38% ,但 80 后中從事技術崗位的人數比例未知,故 A 錯誤.選項 B:設整個互聯網行業總人數為 a,90 后從事技術崗位人數為 56%×39.6%a,而 90 后總人數的 20%為56% × 39.6% ,故 B 正確;選項 C:設整個互聯網行業總人數為 a,互聯網行業中從事運營崗位的 90 后人數為56% × 17% = 9.52% ,超過 80 前的人數 6%a,且 80 前中從事運營崗位的人數比例未知,故 C 正確;選項 D: 由整個互聯網行業從業者年齡分布餅狀圖得到互聯網行業從業人員中 90 后占56%,故 D 正確.故選:A.【變式 4-1】(2024·河南·二模)某銀行為客戶定制了 A,B,C,D,E 共 5 個理財產品,并對 5 個理財產品的持有客戶進行抽樣調查,得出如下的統計圖:用該樣本估計總體,以下四個說法錯誤的是( )A.44~56 周歲人群理財人數最多B.18~30 周歲人群理財總費用最少C.B 理財產品更受理財人青睞D.年齡越大的年齡段的人均理財費用越高【解題思路】A.由扇形圖判斷;B.設總人數為 a,按照扇形圖得到各段人數,再由折線圖求解判斷;C.利用條形圖判斷;D.利用折線圖判斷.【解答過程】A.44~56 周歲人群理財人數所占比例是 37%,是最多的,故正確;B.設總人數為 a,則 18~30 周歲人群的人均理財費用約為0.28 × 3500 = 980 ,31~43 周歲人群的人均理財費用約為0.3 × 4500 = 1350 ,44~56 周歲人群的人均理財費用約為0.37 × 5500 = 2035 ,57 周歲人群的人均理財費用約為0.05 × 6200 = 310 ,所以 57 周歲及以上人群的人均理財費用最少,故錯誤;C.由條形圖可知:B 理財產品更受理財人青睞,故正確;D.由折線圖知:年齡越大的年齡段的人均理財費用越高,故正確,故選:B.【變式 4-2】(24-25 高一上·全國·課后作業)以下是某手機店根據某手機銷售的相關數據繪制的統計圖的一部分.請根據圖 1、圖 2 解答下列問題:(1)來自該店財務部的數據報告表明,該手機店 1~4 月的手機銷售總額一共是 290 萬元,請將圖 1 中的統計圖補充完整;(2)該店 1 月份音樂手機的銷售額為多少萬元 (3)小剛觀察圖 2 后,認為 4 月份音樂手機的銷售額比 3 月份減少了,你同意他的看法嗎 請說明理由.【解題思路】(1)用 290 減去 1 月,2 月和 4 月的銷售額可得 3 月份的銷售額,從而可將圖 1 中的統計圖補充完整,(2)用 1 月份的銷售額乘以 1 月份音樂手機所占的百分比可得結果,(3)根據兩個分別計算 3 月份和 4 月份音樂手機的銷售額,然后比較可得結論.【解答過程】(1)290 (85 + 80 + 65) = 60(萬元),補圖如下圖.(2)85 × 23% = 19.55(萬元),所以該店 1 月份音樂手機的銷售額為19.55萬元.(3)不同意.理由如下:3 月份音樂手機的銷售額是60 × 18% = 10.8(萬元),4 月份音樂手機的銷售額是65 × 17% = 11.05(萬元),而10.8 < 11.05,因此 4 月份音樂手機的銷售額比 3 月份的銷售額增多了.【變式 4-3】(2025 高一·全國·專題練習)某市為了增強學生體質,全面實施“學生飲用奶”營養工程.某品牌牛奶供應商提供了原味、草莓味、菠蘿味、香橙味、核桃味五種口味的牛奶供學生飲用.某中學為了了解學生對不同口味牛奶的喜好,對全校訂購牛奶的學生進行了隨機調查(每盒各種口味牛奶的體積相同),繪制了如下兩張不完整的統計圖:(1)本次被調查的學生有多少名?(2)補全上面的條形統計圖①,并計算出喜好菠蘿味牛奶的學生人數在扇形統計圖②中所占圓心角的度數;(3)該校共有 1200 名學生訂購了該品牌的牛奶,牛奶供應商每天只為每名訂購牛奶的學生配送一盒牛奶.要使學生每天都喝到自己喜好的口味的牛奶,牛奶供應商每天送往該校的牛奶中,草莓味要比原味的多多少盒?【解題思路】(1)根據題意,由核桃味的人數以及其占比,即可得到樣本容量;(2)根據題意,直接補全條形圖,再由喜好菠蘿味牛奶的學生人數占比,即可得到其所占圓心角的度數;(3)根據題意,代入公式計算即可得到結果.【解答過程】(1)根據喜好核桃味的學生數,得本次被調查的學生數(樣本容量)為10 ÷ 50 0 = 200.(2)喜好香橙味牛奶的學生數是200 38 62 50 10 = 40補全條形圖如圖所示,喜好菠蘿味牛奶的學生人數為 50,50在扇形統計圖中所占圓心角的度數為200 × 360° = 90°1200(3)草莓味要比原味多 200 × (62 38) = 144 (盒).【知識點 2 總體百分位數、集中趨勢與離散程度的估計】1.總體百分位數的估計(1)概念一般地,一組數據的第 p 百分位數是這樣一個值,它使得這組數據中至少有 p%的數據小于或等于這個值,且至少有(100-p)%的數據大于或等于這個值.(2)求解步驟可以通過下面的步驟計算一組 n 個數據的第 p 百分位數:第 1 步,按從小到大排列原始數據.第 2 步,計算 i=n×p%.第 3 步,若 i 不是整數,而大于 i 的比鄰整數為 j,則第 p 百分位數為第 j 項數據;若 i 是整數,則第 p百分位數為第 i 項與第(i+1)項數據的平均數.2.總體集中趨勢的估計在初中的學習中我們已經了解到,平均數、中位數和眾數等都是刻畫“中心位置”的量,它們從不同角度刻畫了一組數據的集中趨勢.具體概念回顧如下:名稱 概念平如果有 n 個數 x1,x2,…,xn,那么 就是這組數據均數 的平均數,用 表示,即 .中 將一組數據按從小到大或從大到小的順序排列,處在最中間的一個數據位 (當數據個數是奇數時)或最中間兩個數據的平均數(當數據個數是偶數 數時)稱為這組數據的中位數.眾 一組數據中出現次數最多的數據(即頻數最大值所對應的樣本數據)稱數 為這組數據的眾數.3.總體離散程度的估計(1)方差和標準差假設一組數據是 , , , ,用 表示這組數據的平均數,則我們稱 為這組數據的方差.有時為了計算方差的方便,我們還把方差寫成 的形式.我們對方差開平方,取它的算數平方根 ,稱為這組數據的標準差.(2)總體(樣本)方差和總體標準差①一般式:如果總體中所有個體的變量值分別為 ,總體平均數為 ,則總體方差.②加權式:如果總體的 N 個變量值中,不同的值共有 k(k≤N)個,不妨記為 ,其中出現的頻數為 ,則總體方差為 .總體標準差:S= .(3)標準差與方差的統計意義①標準差刻畫了數據的離散程度或波動幅度,標準差越大,數據的離散程度越大;標準差越小,數據的離散程度越小.②在刻畫數據的分散程度上,方差與標準差是一樣的,但在解決實際問題時,一般多采用標準差.③標準差(方差)的取值范圍為[0,+∞).若樣本數據都相等,表明數據沒有波動幅度,數據沒有離散性,則標準差為 0.反之,標準差為 0 的樣本,其中的數據都相等.4.頻率分布直方圖中的統計參數(1)頻率分布直方圖中的“眾數”根據眾數的意義可知,在頻率分布直方圖中最高矩形中的某個(些)點的橫坐標為這組數據的眾數.一般用中點近似代替.(2)頻率分布直方圖中的“中位數”根據中位數的意義,在樣本中,有 50%的個體小于或等于中位數,也有 50%的個體大于或等于中位數.因此,在頻率分布直方圖中,中位數左邊和右邊的直方圖的面積應該相等,由此可估計中位數的值.(3)頻率分布直方圖中的“平均數”平均數是頻率分布直方圖的“重心”.因為平均數可以表示為數據與它的頻率的乘積之和,所以在頻率分布直方圖中,樣本平均數可以用每個小矩形底邊中點的橫坐標與小矩形的面積的乘積之和近似代替.【題型 5 百分位數的求解】【例 5】(23-24 高一下·貴州黔西·期末)興義市峰林布依景區在春節期間,迎來眾多游客,其中某天接受了一個小型的旅行團,他們的年齡(單位:歲)如下:6,6,7,8,10,37,39,45,46,52,53,61,則這組數據的第 75 百分位數是( )A.34.5 B.46 C.49 D.52【解題思路】根據題意結合百分位數的定義運算求解.46+52【解答過程】因為12 × 75% = 9,所以這組數據的第 75 百分位數是第 9 位數和第 10 位數的中位數 2= 49.故選:C.【變式 5-1】(23-24 高一下·廣東廣州·期末)有一組數據按從小到大排序如下:70,71,73,75,76,則這組數據的 40%分位數,70%分位數分別是( )A.71,74 B.71,75 C.72,74 D.72,75【解題思路】按步驟求解百分位數即可.【解答過程】數據從小到大排序:70,71,73,75,76,∵ 5 × 40% = 2 ∴ 40% 71+73是整數, 這組數據的 分位數是 2 = 72;∵ 5 × 70% = 3.5不是整數, ∴ 這組數據的 70%分位數是75.故選:D.【變式 5-2】(23-24 高一下·江蘇蘇州·期末)某科研單位對 ChatGPT 的使用情況進行滿意度調查,在一批用戶的有效問卷(用戶打分在 50 分到 100 分之間的問卷)中隨機抽取了 100 份,按分數進行分組(每組為左閉右開的區間),得到如圖所示的頻率分布直方圖,估計這批用戶問卷的得分的第75百分位數為( )A.78.5 B.82.5 C.85 D.87.5【解題思路】根據百分位數計算規則計算可得.【解答過程】因為(0.01 + 0.025 + 0.035) × 10 = 0.7 < 0.75,(0.01 + 0.025 + 0.035 + 0.02) × 10 = 0.9 > 0.75,所以第75百分位數位于[80,90),設為 ,則(0.01 + 0.025 + 0.035) × 10 + 0.02( 80) = 0.75,解得 = 82.5.故選:B.【變式 5-3】(23-24 高一下·天津南開·期末)一組數據:53,57,45,61,79,49,x,若這組數據的第 80百分位數與第 60 百分位數的差為 3,則 = ( )A.58 或 64 B.58 C.59 或 64 D.59【解題思路】先對數據從小到大排序,分 ≤ 57, ≥ 79,57 < < 79三種情況,舍去不合要求的情況,列出方程,求出答案,【解答過程】將已知的 6 個數從小到大排序為 45,49,53,57,61,79.若 ≤ 57,則這組數據的第 80 百分位數與第 60 百分位數分別為 61 和 57,他們的差為 4,不符合條件;若 ≥ 79,則這組數據的第 80 百分位數與第 60 百分位數分別為 79 和 61,它們的差為 18,不符合條件;若57 < < 79,則這組數據的第 80 百分位數與第 60 百分位數分別為 x 和 61(或 61 和 x),則| 61| = 3,解得 = 58或 = 64故選:A.【題型 6 眾數、中位數、平均數的計算與求參】【例 6】(2024·浙江紹興·三模)已知實數1 < 2 < < ,若 = 36,且這四個數的中位數是 3,則這四個數的平均數是( )A 5.2 B.3 C7.2 D.4【解題思路】借助中位數與平均數定義結合題目所給條件計算即可得.2+ = 3 = 4【解答過程】由題意可得 2 ,即 , = 36 = 9 = 1+2+4+9則 4 = 4.故選:D.【變式 6-1】(24-25 高一上·四川南充·開學考試)“雜交水稻之父”袁隆平培育的超級雜交稻在全世界推廣種植.某種植戶為了考察所種植的雜交水稻苗的長勢,從稻田中隨機抽取 7 株水稻苗,測得苗高(單位:cm)分別是 23,24,23,25,26,23,25.則這組數據的眾數和中位數分別是( )A.24,25 B.23,23C.23,24 D.24,24【解題思路】把給定數據由小到大排列,再求出眾數、中位數即得.【解答過程】苗高由小到大排列為:23,23,23,24,25,25,26,所以這組數據的眾數和中位數分別是 23,24.故選:C.【變式 6-2】(2024·江蘇南通·三模)某同學測得連續 7 天的最低氣溫分別為1,2,2, ,6,2,8(單位:℃),若這組數據的平均數是中位數的 2 倍,則 = ( )A.2 B.3 C.6 D.721+ 【解題思路】根據題意分析可知:平均數為 7 ,中位數為 2,列式求解即可.1+2+2+ +6+2+8 21+ 【解答過程】由題意可知:這組數據的平均數為 7 = 7 ,除 外,將數據按升序排列可得1,2,2,2,6,8,結合 21+ 的任意性可知中位數為 2,則 7 = 2 × 2,解得 = 7.故選:D.【變式 6-3】(23-24 高一下·云南曲靖·期末)已知一組數據丟失了其中一個大于 3 的數據,剩下的六個數據分別是 3,3,5,3,6,11,若這組數據的平均數與眾數的和是中位數的 2 倍,則丟失的數據可能是( )A.5 B.12 C.18 D.20【解題思路】設丟失的數據為 ,即可求出平均數與眾數,再對 分3 < < 5和 ≥ 5兩種情況討論,得到中位數,即可得到方程,解得即可;31+ 【解答過程】設丟失的數據為 ,則這七個數據的平均數為 7 ,眾數是 3,若3 < < 5 31+ ,則中位數為 ,此時 7 +3 = 2 ,解得 = 4;31+ 若 ≥ 5,則中位數為 5,此時 7 +3 = 2 × 5,解得 = 18.綜上所述,丟失的數據可能是 4,18.故選:C.【題型 7 眾數、中位數、平均數的實際應用】【例 7】(23-24 高一下·河北邯鄲·期末)在一次數學智力測驗中,將 100 名參賽者的成績進行分組整理后得到如下頻率分布直方圖(每組為左閉右開的區間),根據此頻率分布直方圖,下列結論正確的是( )A.這 100 名學生中成績在[80,90)內的頻率為 0.012B.這 100 名學生中成績在[70,90)內的人數為 14C.這 100 名學生的平均成績為 68.2(同一組中的數據用該組區間的中點值代表)D.這 100 名學生成績的中位數為 75【解題思路】由概率之和為 1 可判斷 A;結合頻率與頻數的關系可判斷 B;結合平均數的公式可判斷 C;由中位數的公式可判斷 D.【解答過程】由頻率分布直方圖可得(0.008 + + 0.020 + 0.032 + 0.020 + 0.008) × 10 = 1,解得 = 0.012,所以成績在[80,90)內的頻率為0.012 × 10 = 0.12,故 A 不正確;這 100 名學生中成績在[70,90)內的頻率為(0.020 + 0.012) × 10 = 0.32,所以成績在[70,90)內的人數為 32,故 B 不正確;根據頻率分布直方圖平均數的計算公式可得 = 45 × 0.08 + 55 × 0.2 + 65 × 0.32 + 75 × 0.2 + 85 × 0.12 + 95 × 0.08 = 68.2,故 C 正確;根據頻率分布直方圖可得,中位數在[60,70)之間,故 D 不正確.故選:C.【變式 7-1】(2024·黑龍江哈爾濱·三模)如圖所示,下列頻率分布直方圖顯示了三種不同的形態.圖(1)形成對稱形態,圖(2)形成“右拖尾”形態,圖(3)形成“左拖尾”形態,根據所給圖作出以下判斷,正確的是( )A.圖(1)的平均數=中位數>眾數 B.圖(2)的眾數<中位數<平均數C.圖(2)的平均數<眾數<中位數 D.圖(3)的中位數<平均數<眾數【解題思路】根據平均數,中位數,眾數的概念結合圖形分析判斷.【解答過程】圖(1)的分布直方圖是對稱的,所以平均數=中位數=眾數,故 A 錯誤;圖(2)頻率直方圖可得,單峰不對稱且“右拖尾”,最高峰偏左,眾數最小,平均數易受極端值的影響,與中位數相比,平均數總是在“拖尾”那邊,平均數大于中位數,故 B 正確,C錯誤;同理圖(3)“左拖尾”,眾數最大,平均數小于中位數,故 D 錯誤.故選:B.【變式 7-2】(2024·陜西西安·二模)某教育機構為調查中小學生每日完成作業的時間,收集了某位學生 100天每天完成作業的時間,并繪制了如圖所示的頻率分布直方圖(每個區間均為左閉右開),根據此直方圖得出了下列結論,其中正確的是( )A.估計該學生每日完成作業的時間在 2 小時至 2.5 小時的有 50 天B.估計該學生每日完成作業時間超過 3 小時的概率為 0.3C.估計該學生每日完成作業時間的平均數為 2.75 小時D.估計該學生每日完成作業時間的中位數與平均數相等【解題思路】直接根據直方圖來計算判斷每一個選項.【解答過程】對于 A:估計該學生每日完成作業的時間在 2 小時至 2.5 小時的有100 × 0.5 × 0.5 = 25天,A錯誤;對于 B:估計該學生每日完成作業時間超過 3 小時的概率為(0.3 + 0.2 + 0.1 + 0.1) × 0.5 = 0.35,B 錯誤;對于 C:(1.25 × 0.1 + 1.75 × 0.3 + 2.25 × 0.5 + 2.75 × 0.4 + 3.25 × 0.3 + 3.75 × 0.2 + 4.25 × 0.1 + 4.75 × 0.1) × 0.5= 2.75,C 正確;對于 D:估計該學生每日完成作業時間的中位數為 ,則(0.1 + 0.3 + 0.5) × 0.5 + 0.4 × ( 2.5) = 0.5,解得 = 2.625,D 錯誤.故選:C.【變式 7-3】(2024·全國·模擬預測)如圖為 2014—2022 年中國游戲用戶規模(單位:百萬人)及同比增長率、2010—2022 年中國國產游戲獲批版號數量(單位:個)的統計圖,則下列結論正確的是( )A.2014—2022 年中國游戲用戶規模逐年增長B.2014—2022 年中國游戲用戶規模的同比增長率的中位數為3.1%C.2010—2022 年中國國產游戲獲批版號數量的極差為 223 個D.2010—2022 年中國國產游戲獲批版號數量的平均數超過 1600 個【解題思路】根據條形統計圖、折線統計圖逐項分析樣本的數字特征即可判斷.【解答過程】A 選項:2022 年中國游戲用戶規模比 2021 年少,A 錯誤;B 選項:2014—2022 年中國游戲用戶規模的同比增長率從小到大依次為 0.3%,0.2%,2.5%,3.1%,3.2%,3.7%,4.6%,5.9%,7.3%,中位數為3.2%,B 錯誤;C 選項:2010—2022 年中國國產游戲獲批版號數量的極差為9177 245 = 8932(個),C 錯誤;D 選項:200 + 2 × 400 + 2 × 500 + 3 × 600 + 2 × 1300 + 2000 + 4000 + 9100= 21500 > 13 × 1600 = 20800,D 正確.故選:D.【題型 8 方差、標準差的求解及應用】【例 8】(23-24 高一下·寧夏·期末)已知某 4 個數據的平均數為 6,方差為 3,現又加入一個數據 6,此時這 5 個數據的方差為( )A 24 16 14 12. 5 B. 5 C. 5 D. 5【解題思路】根據方差的定義運算化簡即可得解.【解答過程】因為4個數據的平均數為6,方差為3,1 4所以4 ( 6)2 = 3(其中四個數分別為 , = 1,2,3,4) =14故 ( 2 6) = 12, =1加入一個數據6后,5個數的平均數還是6,1 4 12+0 12則方差為5 ( 6)2 + (6 6)2 = 5 = 5 , =15 12即這 個數據的方差為 5 .故選:D.【變式 8-1】(24-25 高一·全國·單元測試)某班統計一次數學測驗成績的平均分與方差,計算完畢才發現有個同學的分數還未錄入,只好重算一次.已知原平均分和原方差分別為 , 2,新平均分和新方差分別為 1, 21,若此同學的得分恰好為 ,則( )A. = 1, 2 = 21 B. = 21, < 21C. = , 2 > 2 D. < , 2 = 21 1 1 1【解題思路】利用平均數和方差的公式即可求解.【解答過程】設這個班有 n 個同學,分數分別是 1, 2, 3,…, ,第 i 個同學的成績 = 沒錄入,第一次計算時,總分是( 1) ,1方差 2 = 1[( 1 )2 + ( 2 )2 + + ( 2 2 1 ) + ( +1 ) + + ( )2];( 1) + 第二次計算時, 1 = = ,方差 21 =1 [( 1 )2 + ( )22 + + ( 1 )2 + ( 2 2 ) + ( +1 ) + + ( 2 1 2 ) ] = ,故 2 > 21.故選:C.【變式 8-2】(24-25 高二上·吉林·開學考試)有兩位射擊運動員在一次射擊測試中各射靶 10 次,每次命中的環數如下:甲:7 8 7 9 5 4 9 10 7 4乙:9 5 7 8 7 6 8 6 7 7設甲、乙兩名運動員射擊平均環數分別記為 和 ,方差分別記為 2 21和 2.(1)求 , , 21, 22;(2)如果你是教練,你如何對這次射擊情況作出評價?如果這是一次選拔性考核,你應當如何作出選擇?【解題思路】(1)根據平均數和方差公式計算即可;(2)由(1)的結論,平均數一樣,則通過方差判斷其穩定性即可得結果.【解答過程】(1 = 7+8+7+9+5+4+9+10+7+4) 10 = 7, = 9+5+7+8+7+6+8+6+7+710 = 7, 21 2 21 = 10 [(7 7) + (8 7) + (7 7)2 + (9 7)2 + (5 7)2 + (4 7)2 + (9 7)2 + (10 7)2 + (7 7)2+ (4 7)2]= 4, 212 = 10 [(9 7)2 + (5 7)2 + (7 7)2 + (8 7)2 + (7 7)2 + (6 7)2 + (8 7)2 + (6 7)2 + (7 7)2 + (7 7)2]= 1.2.(2)由(1)知,甲乙射擊的平均成績一樣,但乙比甲射擊的成績更穩定,所以選擇乙.【變式 8-3】(23-24 高一下·江蘇蘇州·期末)2023 年 10 月 22 日,漢江生態城 2023 襄陽馬拉松在湖北省襄陽市成功舉行,志愿者的服務工作是馬拉松成功舉辦的重要保障,襄陽市新時代文明實踐中心承辦了志愿者選拔的面試工作.現隨機抽取了 100 名候選者的面試成績,并分成五組:第一組[45,55),第二組[55,65),第三組[65,75),第四組[75,85),第五組[85,95],繪制成如圖所示的頻率分布直方圖.已知第一、二組的頻率之和為 0.3,第一組和第五組的頻率相同.(1)估計這 100 名候選者面試成績的平均數和第 25 百分位數;(2)在這 100 名候選者用分層隨機抽樣的方法從第四組和第五組面試者內抽取 10 人,再從這 10 名面試者中隨機抽取兩名,求兩名面試者成績都在第五組的概率.(3)現從以上各組中用分層隨機抽樣的方法選取 20 人,擔任本市的宣傳者.若本市宣傳者中第二組面試者的面試成績的平均數和方差分別為 62 和 40,第四組面試者的面試成績的平均數和方差分別為 80 和 70,據此估計這次第二組和第四組所有面試者的面試成績的方差.【解題思路】(1)首先算出 , ,然后根據平均數、百分位數的計算公式計算即可;(2)由列舉法求解古典概型概率即可;(3)由分層抽樣方差公式計算即可.1 10 + 10 = 0.3 = 0.005【解答過程】( )由題意可知: 10(0.045 + 0.020 + ) = 0.7 ,解得 = 0.025 ,可知每組的頻率依次為:0.05,0.25,0.45,0.2,0.05,所以平均數為50 × 0.05 + 60 × 0.25 + 70 × 0.45 + 80 × 0.2 + 90 × 0.05 = 69.5,因為0.05 + 0.25 = 0.3 > 0.25,設第 25 百分位數為 ,則 ∈ [55,65),則0.05 + ( 55) × 0.025 = 0.25,解得 = 63,故第 25 百分位數為63.(2)10 人中,第四組為 8 人.第五組為 2 人,記第四組的人的編號為 1 到 8,第五組的人的編號為 9 和 10,則樣本空間Ω = {(1,2),(1,3),(1,4), (1,10),(2,3),(2,4), (2,10),(3,4),(3,5), (3,10), (4,5),(4,6), (4,10),(5,6), (5,10),(6,7), (6,10),(7,8),(7,9),(7,10),(8,9),(8,10),(9,10)}共 45 個樣本點,記兩名面試者成績都在第五組為事件 A, 則事件 = {(9,10)},故 ( ) =145;(3)設第二組、第四組面試者的面試成績的平均數與方差分別為 1, 2, 2 21, 2,0.25 5 5×62+4×80且兩組頻率之比為0.20 = 4,則第二組和第四組所有面試者的面試成績的平均數 = 9 = 70,第二組和第四組所有面試者的面試成績的方差 2 = 5 2 4 5 4 4009 1 + ( )21 + 29 2 + ( 2 )2 = 9 40 + (62 70)2 + 9 70 + (80 70)2 = 3 .400故估計第二組和第四組所有面試者的面試成績的方差是 3 .【題型 9 頻率分布直方圖中集中趨勢參數的計算】【例 9】(23-24 高一下·遼寧朝陽·開學考試)對某校高三年級學生參加社區服務的次數進行統計,隨機抽取 M 名學生,得到這 M 名學生參加社區服務的次數,根據此數據作出如下頻率分布表和頻率分布直方圖.分組 頻數 頻率[10,15) 10 0.20[15,20) 24 n[20,25) m p[25,30] 2 0.04合計 M 1(1)求出表中 M,p 及圖中 a 的值;(2)若該校有高三學生 300 人,試估計該校高三學生參加社區服務的次數在區間[15,20)內的人數;(3)估計該校高三學生參加社區服務次數的眾數、中位數及平均數.(保留一位小數)【解題思路】(1)借助頻數、頻率與總數之間的關系計算即可得;(2)以所得頻率估計概率計算即可得;(3)借助眾數、中位數及平均數的定義計算即可得.10【解答過程】(1)由分組[10,15)對應的頻數是 10,頻率是 0.20,知 = 0.20,所以 = 50, 14 24所以10 + 24 + + 2 = 50,解得 = 14,所以 = = 50 = 0.28, = 50×5 = 0.096;2 24( )估計該校高三學生參加社區服務的次數在區間[15,20)內的人數為50 × 300 = 144;3 15+20( )估計該校高三學生參加社區服務次數的眾數是 2 = 17.5. = 24因為 50 = 0.48,所以估計該校高三學生參加社區服務次數的中位數 x 滿足:0.2 + ( 15) × 0.485 = 0.5,解得 = 18.125,所以該校高三學生參加社區服務次數的中位數約為 18.1,由12.5 × 0.20 + 17.5 × 0.48 + 22.5 × 0.28 + 27.5 × 0.04 = 18.3,所以估計該校高三學生參加社區服務次數的平均數是 18.3.【變式 9-1】(23-24 高一上·內蒙古呼和浩特·期末)2023 年秋末冬初,呼和浩特市發生了流感疾病. 為了徹底擊敗病毒,人們更加講究衛生講究環保. 某學校開展組織學生參加線上環保知識競賽活動,現從中抽取200 名學生,記錄他們的首輪競賽成績并作出如圖所示的頻率直方圖,根據圖形,請回答下列問題:(1)若從成績低于 60 分的同學中按分層抽樣方法抽取 5 人成績,求 5 人中成績低于 50 分的人數;(2)以樣本估計總體,利用組中值估計該校學生首輪競賽成績的平均數;(3)首輪競賽成績位列前10%的學生入圍第二輪的復賽,請根據圖中信息,估計入圍復賽的成績(記為 ).【解題思路】(1)利用分層抽樣的定義求解即可;(2)利用平均數公式求解即可;(3)根據題意設入圍復賽的成績的臨界值為 ∈ [80,90),則(90 ) × 0.025 + 0.05 = 0.1,求出 的值即可.【解答過程】(1)成績在[40,50)的人數為0.01 × 10 × 200 = 20(人),成績在[50,60)的人數為0.015 × 10 × 200 = 30(人),則按分層抽樣方法從成績低于 60 分的同學中抽取 5 人,成績低于 50 20分的人數為5 × 20+30 = 2(人).故 5 人中成績低于 50 分的人數為 2 人;(2)由(0.01 + 0.015 + 0.015 + + 0.025 + 0.005) × 10 = 1,得 = 0.030,則平均數 = 45 × 0.1 + 55 × 0.15 + 65 × 0.15 + 75 × 0.3 + 85 × 0.25 + 95 × 0.05 = 71,故該校學生首輪競賽成績的平均數約為71分;(3)根據頻率分布直方圖可知:[90,100]的頻率為0.005 × 10 = 0.05,[80,90)的頻率為0.025 × 10 = 0.25,所以入圍復賽的成績一定在[80,90),可知入圍復賽的成績的臨界值為 ∈ [80,90),則(90 ) × 0.025 + 0.05 = 0.1,解得 = 88,故估計入圍復賽的成績為 ≥ 88分.【變式 9-2】(23-24 高一下·湖南長沙·期末) (身體質量指數)是目前國際上常用的衡量人體胖瘦程度體重(單位:kg)以及是否健康的一個標準,其計算公式是: = 2身高 單位: m2 .中國成人的 數值參考標準為: < 18.5為偏瘦;18.5 ≤ < 24為正常;24 ≤ < 28為偏胖; ≥ 28為肥胖.某公司為了解公司員工的身體肥胖情況,研究人員從公司員工體檢數據中,采用分層隨機抽樣的方法抽取了 60 名男員工,40 名女員工的身高體重數據,通過計算男女員工的 值,整理得到如下的頻率分布直方圖.(1)求頻率分布直方圖中 a 的值,并估計該公司員工為肥胖的百分比;(2)估計該公司員工的 值的眾數,中位數;(3)已知樣本中 60 名男員工 值的平均數為 1 = 22.4,根據頻率分布直方圖,估計樣本中 40 名女員工 值的平均數 2.【解題思路】(1)利用頻率之和為 1 可計算 的值,再結合頻率分布直方圖即可得肥胖的百分比;(2)利用頻率分布直方圖即可估計眾數,中位數;(3)先計算整體的平均數,然后由分層抽樣平均數的公式即可得解.【解答過程】(1)由題,2 × (0.01 + 0.02 + 0.03 + 0.06 + 0.07 + 0.08 + + 0.13) = 1,解得: = 0.1,由頻率分布直方圖可得,該公司員工為肥胖的百分比為2 × (0.01 + 0.03) × 100% = 8%;2 18+20( )由頻率分布直方圖可得,眾數為 2 = 19,因為2 × (0.08 + 0.13) = 0.42 < 0.5,2 × (0.08 + 0.13 + 0.1) = 0.62 > 0.5,故中位數在[20,22),設為 ,則 = 20 + 0.5 0.422×0.1 × (22 20) = 20.8;(3)設樣本平均數為 ,則由頻率分布直方圖可得;= 2 × (17 × 0.08 + 19 × 0.13 + 21 × 0.1 + 23 × 0.06 + 25 × 0.07 + 27 × 0.02 + 29 × 0.01 + 31 × 0.03) ,= 21.64 = 60 1+40 2又 100 ,60×22.4+40 2即 100 = 21.64,解得: 2 = 20.5.【變式 9-3】(23-24 高一下·四川達州·階段練習)有一種魚的身體吸收汞,身體中汞的含量超過其體重的1.00ppm(百萬分之一)的魚被人食用后,就會對人體產生危害.某檢測中心從一批這種魚中隨機抽取了 50 條,檢測其汞含量(單位:ppm),并將所得數據分為 6 組:[0,0.4),[0.4,0.8),[0.8,1.2),[1.2,1.6),[1.6,2.0),[2.0,2.4],整理后得到如下頻率分布直方圖.(1)由頻率分布直方圖估計樣本的80%分位數(精確到 0.01);(2)由頻率分布直方圖估計這批魚汞含量的平均值(同一組中的數據用該組區間的中點值為代表);(3)從實際情況看,許多魚的汞含量超標的原因是這些魚在出售之前沒有被檢測過.你認為每批這種魚的平均汞含量都比1.00ppm大嗎 并說明理由.【解題思路】(1)先求出每個區間的頻率,然后利用頻率和為 1 列式計算求出 ,再根據頻率預估樣本的80%分位數所在區間設為 ,列方程0.6 + 0.6( 1.2) = 0.8求解即可;(2)利用加權平均數的公式求解;(3)不一定,根據估計值不能確定準確值來說明解答.【解答過程】(1)依題意,由頻率分布直方圖可知這批魚汞含量在區間[0,0.4),[0.4,0.8),[0.8,1.2),[1.2,1.6),[1.6,2.0),[2.0,2.4]的頻率分別為0.12,0.2,0.4 ,0.24,0.12,0.04,所以0.12 + 0.2 + 0.4 + 0.24 + 0.12 + 0.04 = 1,解得 = 0.7,則0.4 = 0.28.因為0.12 + 0.2 + 0.28 = 0.6 < 0.8 < 0.6 + 0.24 = 0.84,樣本的80%分位數在區間[1.2,1.6)內,設為 ,則0.6 + 0.6( 1.2) = 0.8,解得 ≈ 1.53.所以樣本的80%分位數約為 1.53;(2)結合(1)中結論,可得這批魚汞含量的平均值為0.12 × 0.2 + 0.2 × 0.6 + 0.28 × 1 + 0.24 × 1.4 + 0.12 × 1.8 + 0.04 × 2.2 = 1.064;(3)不一定,因為我們不知道其他各批魚的汞含量分布是否都和這批魚相同,即使其他各批魚的汞含量分布與這批魚相同,上面所得的平均數也只能為這個分布作出估計,不能保證每批魚的平均汞含量都大于 1.00ppm.【題型 10 其他統計圖表中反映的集中趨勢與離散程度】【例 10】(23-24 高一下·湖北武漢·期末)近年來,“直播帶貨”受到越來越多人的喜愛,目前已經成為推動消費的一種流行的營銷形式.某直播平臺 1200 個直播商家,對其進行調查統計,發現所售商品多為小吃、衣帽、生鮮、玩具、飾品類等,各類直播商家所占比例如圖所示.(1)該直播平臺為了更好地服務買賣雙方,打算隨機抽取 60 個直播商家進行問詢交流.如果按照比例分層抽樣的方式抽取,則應抽取小吃類、生鮮類商家各多少家?(2)在問詢了解直播商家的利潤狀況時,工作人員對(1)中抽取的 60 個商家的平均日利潤進行了統計(單位:元),所得頻率分布直方圖如右圖所示,請根據頻率分布直方圖計算下面的問題:①估計該直播平臺商家平均日利潤的中位數與平均數(結果保留一位小數,求平均數時同一組中的數據用該組區間的中點值作代表);②若將平均日利潤超過 430 元的商家評為“優秀商家”,估計該直播平臺“優秀商家”的個數.【解題思路】(1)根據分層抽樣的定義計算即可;(2)①根據中位數和平均數的定義計算即可;②根據樣本中“優秀商家”的個數來估計總體中“優秀商家”的個數即可.【解答過程】(1)60 × (1 25% 15% 10% 5% 5%) = 24,60 × 15% = 9,所以應抽取小吃類24家,生鮮類9家;(2)①根據題意可得(0.001 × 3 + + 0.003 + 0.005 + 0.007) × 50 = 1,解得 = 0.002,設中位數為 ,因為(0.001 + 0.003) × 50 = 0.2,(0.001 + 0.003 + 0.007) × 50 = 0.55,所以( 300) × 0.007 + 0.2 = 0.5,解得 ≈ 342.9,平均數為:(225 × 0.001 + 275 × 0.003 + 325 × 0.007 + 375 × 0.005 + 425 × 0.002 + 475 × 0.001 + 525 × 0.001)× 50 = 352.5,所以該直播平臺商家平均日利潤的中位數為 342.9,平均數為 352.5.② 450 430 × 0.002 + 0.001 + 0.001 × 50 × 1200 = 168,50所以估計該直播平臺“優秀商家”的個數為168.【變式 10-1】(23-24 高二上·四川成都·期末)為了了解甲、乙兩個工廠生產的輪胎的寬度是否達標,分別從兩廠隨機選取了 10 個輪胎,將每個輪胎的寬度(單位:mm) 記錄下來并繪制出折線圖:(1)分別計算甲、 乙兩廠提供 10 個輪胎寬度的平均值;(2)輪胎的寬度在[193,195]內,則稱這個輪胎是標準輪胎,試比較甲、 乙兩廠分別提供的 10 個輪胎中所有標準輪胎寬度的方差的大小,根據兩廠的標準輪胎寬度的平均水平及其波動情況,判斷這兩個工廠哪個廠的輪胎相對更好.【解題思路】(1)由折線圖提供的數據,利用平均數公式代入計算即可;(2)分別找出甲乙兩廠的所有標準輪胎寬度的數據,再分別求出平均值與方差,即可判斷.【解答過程】(1)由題:甲廠輪胎寬度的平均值為:110(195 + 194 + 196 + 193 + 194 + 197 + 196 + 195 + 193 + 197) = 195;乙廠輪胎寬度的平均值為:110(195 + 196 + 193 + 192 + 195 + 194 + 195 + 192 + 195 + 193) = 194;所以甲、 乙兩廠提供 10 個輪胎寬度的平均值分別為 195,194.(2)由題,甲廠提供的 10 個輪胎中所有標準輪胎寬度為:195,194,193,194,195,193 1,其平均數為:6(195 + 194 + 193 + 194 + 195 + 193) = 194,1其方差為:6(1 + 0 + 1 + 0 + 1 + 1) =23;乙廠提供的 10 個輪胎中所有標準輪胎寬度為:195,193,195,194,195,195,193 1,其平均數為:7(195 + 193 + 195 + 194 + 195 + 195 + 193) = 19427,1(25 + 81 + 25 + 4 + 25 + 25 81 266 2其方差為:7 49 49 49 49 49 49 + 49) = 343 > 3;從平均數上來看:乙廠提供的 10 個輪胎中所有標準輪胎寬度高于甲廠提供的 10 個輪胎中所有標準輪胎寬度,但乙廠提供的 10 個輪胎中所有標準輪胎寬度方差較大,不夠穩定.【變式 10-2】(23-24 高一下·寧夏·期末)某公司為了提高職工的健身意識,鼓勵大家加入健步運動,要求200 名職工每天晚上 9:30 上傳手機計步截圖,對于步數超過 10000 的予以獎勵.圖 1 為甲乙兩名職工在某一星期內的運動步數統計圖,圖 2 為根據這星期內某一天全體職工的運動步數做出的頻率分布直方圖.(1)請根據頻率分布直方圖,求 m 的值,并求出該天運動步數不少于 15000 步的人數;(2)估計全體職工在該天運動步數的眾數、平均數和中位數;(3)如果當天甲的排名為第 130 名,乙的排名為第 40 名,試判斷做出的是星期幾的頻率分布直方圖.【解題思路】(1)根據頻率分布直方圖中各組頻率之和為 1,即可求得 m 的值;結合頻率、頻數之間的關系即可求得該天運動步數不少于 15000 步的人數;(2)根據頻率分布直方圖,依據眾數、平均數和中位數的估計方法即可求得答案;(3)計算甲乙排名的占比,結合頻率分布直方圖計算出甲乙兩人的步數,與已知的甲乙兩名職工在某一星期內的運動步數統計圖比較,即得答案.【解答過程】(1)由圖可知(0.02 + 0.03 + 0.04 + 0.06 + ) × 5 = 1,解得 = 0.05;所以該天運動步數不少于 15000 的人數為(0.05 + 0.03) × 5 × 200 = 80(人);2 10+15( )眾數是 2 = 12.5(千步);全體職工在該天的平均步數為:2.5 × 0.1+7.5 × 0.2+12.5 × 0.3 + 17.5 × 0.25 + 22.5 × 0.15 = 13.25(千步)由于前兩組頻率之和為0.1 + 0.2 = 0.3 < 0.5,前三組頻率之和為0.1 + 0.2 + 0.3 > 0.5,故設中位數為 x,則0.3 + ( 10) × 0.06 = 0.5, ∴ = 403 ,40即中位數是: 3 (千步)(3)因為40 ÷ 200 = 0.2,130 ÷ 200 = 0.65,假設甲的步數為 千步,乙的步數為 千步,由頻率分布直方圖可得:0.02 × 5 + 0.04 × 5 + ( 10) × 0.06 = 1 0.6565,解得 = 6 (千步),0.02 × 5 + 0.04 × 5 + 0.06 × 5 + ( 15) × 0.05 = 1 0.2,解得 = 19(千步),所以可得出是星期二的頻率分布直方圖.【變式 10-3】(23-24 高一下·廣東東莞·期末)樹人中學男女學生比例約為2:3,某數學興趣社團為了解該校學生課外體育鍛煉情況(鍛煉時間長短(單位:小時),采用樣本量比例分配的分層抽樣,抽取男生 人,女生 人進行調查.記男生樣本為 1, 2, , ,樣本平均數、方差分別為 、 21;女生樣本為 1, 2, , ,樣本平均數、方差分別為 、 22;總樣本平均數、方差分別為 、 2. (1)證明: ( )2 = 21 + ( )2 ; =1(2)該興趣社團通過分析給出以下兩個統計圖,假設兩個統計圖中每個組內的數據均勻分布,根據兩圖信息分別估計男生樣本、女生樣本的平均數;(3)已知男生樣本方差 21 = 5.5,女生樣本方差 22 = 5.7,請結合(2)問的結果計算總樣本方差 2的估計值.【解題思路】(1)利用平均數和方差計算公式結合完全平方運算化簡即可證明;(2)利用平均數計算公式分別計算即可;(3)先求出總樣本平均數,根據方差公式結合(1)中結論化簡求解即可. 【解答過程】(1) ( )2 = ( 2 2 2 + ) = ( ) + 2( )( ) + ( ) =1 =1 =1 = ( )2 + 2( ) ( ) + ( )2 =1 =1 =1 = ( )2 +2( ) + ( )2, =1 =11 1 因為 21 = ( )2, = , =1 =1 所以 2 2 2 = 0,則 ( ) = 1 + ( ) ; =1 =1(2)因為每個組內的數據均勻分布,所以以各組的區間中點值代表該組的各個值,由頻率分布直方圖估計男生樣本課外體育鍛煉時間的平均數為 = 1 × 0.05 × 2 + 3 × 0.1 × 2 + 5 × 0.175 × 2 + 7 × 0.1 × 2 + 9 × 0.075 × 2 = 5.2,由扇形圖估計女生樣本課外體育鍛煉時間的平均數為 = 1 × 0.15 + 3 × 0.25 + 5 × 0.30 + 7 × 0.2 + 9 × 0.1 = 4.7;(3)因為采用按比例分配的分層隨機抽樣,所以 : = 2:3, + 估計樹人中學學生課外運動時間的平均數為 = = 0.4 × 5.2 + 0.6 × 4.7 = 4.9 + , 2 = 1 ( )2 2 =1 2 2 2 2 + + ( ) =1 =1 + 1 + ( ) + 2 + ( ) 2 = + 1 + ( )2 + 2 2 + 2 + ( )= 2 35 5.5 + (5.2 4.9)2 + 5 5.7 + (4.7 4.9)2 = 5.68. 展開更多...... 收起↑ 資源列表 專題9.2 用樣本估計總體【十大題型】(舉一反三)(原卷版)2024-2025學年高一數學舉一反三系列(人教A版2019必修第二冊).pdf 專題9.2 用樣本估計總體【十大題型】(舉一反三)(解析版)2024-2025學年高一數學舉一反三系列(人教A版2019必修第二冊).pdf 縮略圖、資源來源于二一教育資源庫