資源簡介 第47講 隨機抽樣與用樣本估計總體【練基礎】1.利用簡單隨機抽樣,從n個個體中抽取一個容量為10的樣本.若第二次抽取時,余下的每個個體被抽到的概率為,則在整個抽樣過程中,每個個體被抽到的概率為( )A. B.C. D.2.為評估一種農作物的種植效果,選了n塊地作試驗田.這n塊地的畝產量(單位:kg)分別為x1,x2,…,xn,下面給出的指標中可以用來評估這種農作物畝產量穩定程度的是( )A.x1,x2,…,xn的平均數 B.x1,x2,…,xn的標準差C.x1,x2,…,xn的最大值 D.x1,x2,…,xn的中位數3.2020年全球“新冠”疫情暴發,嚴重影響了人們的常態生活.某市據統計得到5月份居民消費的各類商品及服務價格環比(與4月份相比)變動情況如圖:則下列敘述不正確的是( )A.八大消費價格環比呈現四漲四平B.其他用品服務價格環比漲幅最大C.生活用品及服務和醫療保健價格環比漲幅相同D.5月份居民消費平均價格環比持平4.某公司生產A,B,C三種不同型號的轎車,其產量之比為2∶3∶4,為檢驗該公司的產品質量,用分層抽樣的方法抽取一個容量為n的樣本,若樣本中A種型號的轎車比B種型號的轎車少8輛,則n=( )A.96 B.72C.48 D.365.甲、乙兩人在一次射擊比賽中各射靶5次,兩人成績的條形統計圖如圖所示,則( )A.甲的成績的平均數小于乙的成績的平均數B.甲的成績的中位數等于乙的成績的中位數C.甲的成績的方差小于乙的成績的方差D.甲的成績的極差小于乙的成績的極差6.在第二次高考模擬市統測結束后,某校高三年級一個班級為預估本班學生的高考成績水平,登記了全班同學的卷面成績.經查詢得知班上所有同學的學業水平考試成績22分加分均已取得,則學業水平考試加分22分前后相比,不變的數字特征是( )A.平均數 B.方差C.中位數 D.眾數7.為了改善市民的生活環境,某沿江城市決定對本市的1 000家中小型化工企業進行污染情況摸排,并把污染情況綜合折算成標準分100分,如圖為該市被調查的化工企業的污染情況標準分的頻率分布直方圖,根據該圖可估計本市標準分不低于50分的企業數為( )A.400 B.500C.600 D.8008.某校對高三年級1 600名男女學生的視力狀況進行調查,現用分層抽樣的方法抽取一個容量是200的樣本,已知樣本中女生比男生少10人,則該校高三年級的女生人數是________.9.高三某宿舍共8人,在一次體檢中測得其中7個人的體重分別為60,55,60,55,65,50,50(單位:千克),其中一人因故未測,已知該同學的體重在50~60千克之間,則此次體檢中該宿舍成員體重的中位數為55的概率為________.10.從一批零件中抽取80個,測量其直徑(單位:mm),將所得數據分為9組:[5.31,5.33),[5.33,5.35),…,[5.45,5.47),[5.47,5.49],并整理得到如下頻率分布直方圖,則在被抽取的零件中,直徑落在區間[5.43,5.47]內的個數為________.【練提升】1.要完成下列兩項調查:①從某社區125戶高收入家庭、280戶中等收入家庭、95戶低收入家庭中選出100戶調查社會購買力的某項指標;②從某中學的15名藝術特長生中選出3名調查學習負擔情況,宜采用的抽樣方法依次為( )A.①隨機抽樣法,②系統抽樣法B.①分層抽樣法,②隨機抽樣法C.①系統抽樣法,②分層抽樣法D.①②都用分層抽樣法2.一個總體中有600個個體,隨機編號為001,002,…,600,利用系統抽樣方法抽取容量為24的一個樣本,總體分組后在第一組隨機抽得的編號為006,則在編號為051~125之間抽得的編號為( )A.056,080,104 B.054,078,102C.054,079,104 D.056,081,1063.對一批產品的長度(單位:mm)進行抽樣檢測,下圖為檢測結果的頻率分布直方圖.根據標準,產品長度在區間[20,25)上的為一等品,在區間[15,20)和區間[25,30)上的為二等品,在區間[10,15)和[30,35]上的為三等品.用頻率估計概率,現從該批產品中隨機抽取一件,則其為二等品的概率為( )A.0.09 B.0.20C.0.25 D.0.454.《西游記》《三國演義》《水滸傳》和《紅樓夢》是中國古典文學瑰寶,并稱為中國古典小說四大名著.某中學為了解本校學生閱讀四大名著的情況,隨機調查了100位學生,其中閱讀過《西游記》或《紅樓夢》的學生共有90位,閱讀過《紅樓夢》的學生共有80位,閱讀過《西游記》且閱讀過《紅樓夢》的學生共有60位,則該校閱讀過《西游記》的學生人數與該校學生總數比值的估計值為( )A.0.5 B.0.6C.0.7 D.0.85.如圖為某市國慶節7天假期的樓房認購量與成交量的折線圖,小明同學根據折線圖對這7天的認購量(單位:套)與成交量(單位:套)作出如下判斷:①日成交量的中位數是16;②日成交量超過日平均成交量的有2天;③認購量與日期正相關;④10月7日認購量的增長率小于10月7日成交量的增長率.則上述判斷正確的個數為( )A.0 B.1C.2 D.36.Keep是一款具有社交屬性的健身APP,致力于提供健身教學、跑步、騎行、交友及健身飲食指導、裝備購買等一站式運動解決方案.Keep可以讓你隨時隨地進行鍛煉,記錄你每天的訓練進程.不僅如此,它還可以根據不同人的體質,制定不同的健身計劃.小明根據Keep記錄的2020年1月至2020年11月期間每月跑步的里程(單位:十公里)數據整理并繪制了下面的折線圖.根據該折線圖,下列結論不正確的是( )A.月跑步里程最小值出現在2月B.月跑步里程逐月增加C.月跑步里程的中位數為5月份對應的里程數D.1月至5月的月跑步里程相對于6月至11月波動性更小7.已知某地區中小學生人數和近視情況分別如圖甲和圖乙所示.為了了解該地區中小學生的近視形成原因,用分層抽樣的方法抽取2%的學生進行調查,則樣本容量和抽取的高中生近視人數分別為________、________.8.為了了解某校高三美術生的身體狀況,抽查了部分美術生的體重,將所得數據整理后,作出了如圖所示的頻率分布直方圖.已知圖中從左到右的前3個小組的頻率之比為1∶3∶5,第2個小組的頻數為15,則被抽查的美術生的人數是________.9.某校1 200名高三年級學生參加了一次數學測驗(滿分為100分),為了分析這次數學測驗的成績,從這1 200人的數學成績中隨機抽取200人的成績繪制成如下的統計表,請根據表中提供的信息解決下列問題:成績分組 頻數 頻率 平均分[0,20) 3 0.015 16[20,40) a b 32.1[40,60) 25 0.125 55[60,80) c 0.5 74[80,100] 62 0.31 88(1)求a,b,c的值;(2)如果從這1 200名學生中隨機抽取一人,試估計這名學生該次數學測驗及格的概率P(注:60分及60分以上為及格);(3)試估計這次數學測驗的年級平均分.10.為了了解甲、乙兩個工廠生產的輪胎的寬度是否達標,從兩廠各隨機選取了10個輪胎,將每個輪胎的寬度(單位:mm)記錄下來并繪制出如下的折線圖:(1)分別計算甲、乙兩廠提供的10個輪胎寬度的平均值;(2)若輪胎的寬度在[194,196]內,則稱這個輪胎是標準輪胎.試比較甲、乙兩廠分別提供的10個輪胎中所有標準輪胎寬度的方差的大小,根據兩廠的標準輪胎寬度的平均水平及其波動情況,判斷這兩個工廠哪個的輪胎相對更好.第47講 隨機抽樣與用樣本估計總體【練基礎】1.利用簡單隨機抽樣,從n個個體中抽取一個容量為10的樣本.若第二次抽取時,余下的每個個體被抽到的概率為,則在整個抽樣過程中,每個個體被抽到的概率為( )A. B.C. D.【答案】C 【解析】根據題意,=,解得n=28.故在整個抽樣過程中每個個體被抽到的概率為=.2.為評估一種農作物的種植效果,選了n塊地作試驗田.這n塊地的畝產量(單位:kg)分別為x1,x2,…,xn,下面給出的指標中可以用來評估這種農作物畝產量穩定程度的是( )A.x1,x2,…,xn的平均數 B.x1,x2,…,xn的標準差C.x1,x2,…,xn的最大值 D.x1,x2,…,xn的中位數【答案】B 【解析】統計問題中,衡量數據的穩定程度的指標為數據的方差或標準差.故選B.3.2020年全球“新冠”疫情暴發,嚴重影響了人們的常態生活.某市據統計得到5月份居民消費的各類商品及服務價格環比(與4月份相比)變動情況如圖:則下列敘述不正確的是( )A.八大消費價格環比呈現四漲四平B.其他用品服務價格環比漲幅最大C.生活用品及服務和醫療保健價格環比漲幅相同D.5月份居民消費平均價格環比持平【答案】D 【解析】對于A選項,由圖可知,飲食煙酒、衣著、居住、交通和通信持平,生活用品及服務、教育文化娛樂、醫療保健、其他用品服務價格環比上漲,所以A選項敘述正確.對于B選項,由圖可知,八大消費價格中,其他用品服務價格環比漲幅最大,所以B選項敘述正確.對于C選項,由圖可知,生活用品及服務和醫療保健價格環比漲幅相同,所以C選項敘述正確.對于D選項,由于八大消費價格環比呈現四漲四平,所以5月份居民消費平均價格環比上漲,所以D選項敘述不正確.故選D.4.某公司生產A,B,C三種不同型號的轎車,其產量之比為2∶3∶4,為檢驗該公司的產品質量,用分層抽樣的方法抽取一個容量為n的樣本,若樣本中A種型號的轎車比B種型號的轎車少8輛,則n=( )A.96 B.72C.48 D.36【答案】B 【解析】由題意得n-n=8,所以n=72.故選B.5.甲、乙兩人在一次射擊比賽中各射靶5次,兩人成績的條形統計圖如圖所示,則( )A.甲的成績的平均數小于乙的成績的平均數B.甲的成績的中位數等于乙的成績的中位數C.甲的成績的方差小于乙的成績的方差D.甲的成績的極差小于乙的成績的極差【答案】C 【解析】甲的平均數是=6,中位數是6,極差是4,方差是=2;乙的平均數是=6,中位數是5,極差是4,方差是=,比較可得選項C正確.6.在第二次高考模擬市統測結束后,某校高三年級一個班級為預估本班學生的高考成績水平,登記了全班同學的卷面成績.經查詢得知班上所有同學的學業水平考試成績22分加分均已取得,則學業水平考試加分22分前后相比,不變的數字特征是( )A.平均數 B.方差C.中位數 D.眾數【答案】B 【解析】學業水平考試加分22分前后相比,平均數、中位數、眾數都在原來的基礎上加上了22,而全班的成績波動性未發生變化,即方差不變.7.為了改善市民的生活環境,某沿江城市決定對本市的1 000家中小型化工企業進行污染情況摸排,并把污染情況綜合折算成標準分100分,如圖為該市被調查的化工企業的污染情況標準分的頻率分布直方圖,根據該圖可估計本市標準分不低于50分的企業數為( )A.400 B.500C.600 D.800【答案】B【解析】根據頻率分布直方圖計算得50分以上的頻率為1-(0.005×20+0.012 5×20+0.015×10)=0.50,所以本市標準分不低于50分的企業數為500.8.某校對高三年級1 600名男女學生的視力狀況進行調查,現用分層抽樣的方法抽取一個容量是200的樣本,已知樣本中女生比男生少10人,則該校高三年級的女生人數是________.【解析】設樣本中女生有x人,則男生有x+10人,所以x+x+10=200,得x=95,設該校高三年級的女生有y人,則由分層抽樣的定義可知=,解得y=760.【答案】7609.高三某宿舍共8人,在一次體檢中測得其中7個人的體重分別為60,55,60,55,65,50,50(單位:千克),其中一人因故未測,已知該同學的體重在50~60千克之間,則此次體檢中該宿舍成員體重的中位數為55的概率為________.【解析】將七個人的體重按順序排列如下:50,50,55,55,60,60,65,若此次體檢中該宿舍成員體重的中位數為55,只需未測體重的同學體重要小于等于55,又該同學的體重在50~60千克之間,所以此次體檢中該宿舍成員體重的中位數為55的概率為P==.【答案】10.從一批零件中抽取80個,測量其直徑(單位:mm),將所得數據分為9組:[5.31,5.33),[5.33,5.35),…,[5.45,5.47),[5.47,5.49],并整理得到如下頻率分布直方圖,則在被抽取的零件中,直徑落在區間[5.43,5.47]內的個數為________.【解析】由題知[5.43,5.45)與[5.45,5.47]所對應的小矩形的高分別為6.25,5.00,所以[5.43,5.47]的頻率為(6.25+5.00)×0.02=0.225,所以直徑落在區間[5.43,5.47]內的個數為80×0.225=18.【答案】18【練提升】1.要完成下列兩項調查:①從某社區125戶高收入家庭、280戶中等收入家庭、95戶低收入家庭中選出100戶調查社會購買力的某項指標;②從某中學的15名藝術特長生中選出3名調查學習負擔情況,宜采用的抽樣方法依次為( )A.①隨機抽樣法,②系統抽樣法B.①分層抽樣法,②隨機抽樣法C.①系統抽樣法,②分層抽樣法D.①②都用分層抽樣法【答案】B 【解析】∵社會購買力的某項指標,受到家庭收入的影響,而社區中各個家庭收入差別明顯,①用分層抽樣法;而從某中學的15名藝術特長生,要從中選出3人調查學習負擔情況的調查中個體之間差別不大,且總體和樣本容量較小,∴②用隨機抽樣法.2.一個總體中有600個個體,隨機編號為001,002,…,600,利用系統抽樣方法抽取容量為24的一個樣本,總體分組后在第一組隨機抽得的編號為006,則在編號為051~125之間抽得的編號為( )A.056,080,104 B.054,078,102C.054,079,104 D.056,081,106【答案】D 【解析】因為系統抽樣的間隔為=25,所以編號為051~125之間抽得的編號為006+2×25=056,006+3×25=081,006+4×25=106.3.對一批產品的長度(單位:mm)進行抽樣檢測,下圖為檢測結果的頻率分布直方圖.根據標準,產品長度在區間[20,25)上的為一等品,在區間[15,20)和區間[25,30)上的為二等品,在區間[10,15)和[30,35]上的為三等品.用頻率估計概率,現從該批產品中隨機抽取一件,則其為二等品的概率為( )A.0.09 B.0.20C.0.25 D.0.45【答案】D 【解析】由圖可知,二等品的概率為1-(0.02+0.06+0.03)×5=0.45.所以從該批產品中隨機抽取1件,則其是二等品的概率為0.45.4.《西游記》《三國演義》《水滸傳》和《紅樓夢》是中國古典文學瑰寶,并稱為中國古典小說四大名著.某中學為了解本校學生閱讀四大名著的情況,隨機調查了100位學生,其中閱讀過《西游記》或《紅樓夢》的學生共有90位,閱讀過《紅樓夢》的學生共有80位,閱讀過《西游記》且閱讀過《紅樓夢》的學生共有60位,則該校閱讀過《西游記》的學生人數與該校學生總數比值的估計值為( )A.0.5 B.0.6C.0.7 D.0.8【答案】C 【解析】設調查的100位學生中閱讀過《西游記》的學生人數為x,則x+80-60=90,解得x=70,所以該校閱讀過《西游記》的學生人數與該校學生總數比值的估計值為=0.7.5.如圖為某市國慶節7天假期的樓房認購量與成交量的折線圖,小明同學根據折線圖對這7天的認購量(單位:套)與成交量(單位:套)作出如下判斷:①日成交量的中位數是16;②日成交量超過日平均成交量的有2天;③認購量與日期正相關;④10月7日認購量的增長率小于10月7日成交量的增長率.則上述判斷正確的個數為( )A.0 B.1C.2 D.3【答案】B 【解析】7天假期的樓房認購量按由小到大順序為:91,100,105,107,112,223,276;成交量按由小到大順序為:8,13,16,26,32,38,166.對于①,日成交量的中位數是26,故錯誤;對于②,日平均成交量為:≈42.7,有1天日成交量超過日平均成交量,故錯誤;對于③,根據圖形可得認購量與日期不是正相關,故錯誤;對于④,10月7日認購量的增長率小于10月7日成交量的增長率,故正確.6.Keep是一款具有社交屬性的健身APP,致力于提供健身教學、跑步、騎行、交友及健身飲食指導、裝備購買等一站式運動解決方案.Keep可以讓你隨時隨地進行鍛煉,記錄你每天的訓練進程.不僅如此,它還可以根據不同人的體質,制定不同的健身計劃.小明根據Keep記錄的2020年1月至2020年11月期間每月跑步的里程(單位:十公里)數據整理并繪制了下面的折線圖.根據該折線圖,下列結論不正確的是( )A.月跑步里程最小值出現在2月B.月跑步里程逐月增加C.月跑步里程的中位數為5月份對應的里程數D.1月至5月的月跑步里程相對于6月至11月波動性更小【答案】B【解析】由折線圖可知,月跑步里程的最小值出現在2月,故A正確;月跑步里程不是逐月增加的,故B不正確;月跑步里程數從小到大排列分別是:2月,8月,3月,4月,1月,5月,7月,6月,11月,9月,10月對應的里程數,故5月份對應的里程數為中位數,故C正確;由圖可知,1月至5月的月跑步里程相對于6月至11月波動性更小,變化比較平穩,故D正確.7.已知某地區中小學生人數和近視情況分別如圖甲和圖乙所示.為了了解該地區中小學生的近視形成原因,用分層抽樣的方法抽取2%的學生進行調查,則樣本容量和抽取的高中生近視人數分別為________、________.【解析】由題圖甲可知學生總人數是10 000,樣本容量為10 000×2%=200,抽取的高中生人數是2 000×2%=40,由題圖乙可知高中生的近視率為50%,所以抽取的高中生的近視人數為40×50%=20.【答案】200 208.為了了解某校高三美術生的身體狀況,抽查了部分美術生的體重,將所得數據整理后,作出了如圖所示的頻率分布直方圖.已知圖中從左到右的前3個小組的頻率之比為1∶3∶5,第2個小組的頻數為15,則被抽查的美術生的人數是________.【解析】設被抽查的美術生的人數為n,因為后2個小組的頻率之和為(0.037 5+0.012 5)×5=0.25,所以前3個小組的頻率之和為0.75.又前3個小組的頻率之比為1∶3∶5,第2個小組的頻數為15,所以前3個小組的頻數分別為5,15,25,所以n==60.【答案】609.某校1 200名高三年級學生參加了一次數學測驗(滿分為100分),為了分析這次數學測驗的成績,從這1 200人的數學成績中隨機抽取200人的成績繪制成如下的統計表,請根據表中提供的信息解決下列問題:成績分組 頻數 頻率 平均分[0,20) 3 0.015 16[20,40) a b 32.1[40,60) 25 0.125 55[60,80) c 0.5 74[80,100] 62 0.31 88(1)求a,b,c的值;(2)如果從這1 200名學生中隨機抽取一人,試估計這名學生該次數學測驗及格的概率P(注:60分及60分以上為及格);(3)試估計這次數學測驗的年級平均分.【解析】(1)由題意可得,b=1-(0.015+0.125+0.5+0.31)=0.05,a=200×0.05=10,c=200×0.5=100.(2)根據已知,在抽出的200人的數學成績中,及格的有162人.∴P===0.81.(3)這次數學測驗樣本的平均分為==73,∴這次數學測驗的年級平均分大約為73分.10.為了了解甲、乙兩個工廠生產的輪胎的寬度是否達標,從兩廠各隨機選取了10個輪胎,將每個輪胎的寬度(單位:mm)記錄下來并繪制出如下的折線圖:(1)分別計算甲、乙兩廠提供的10個輪胎寬度的平均值;(2)若輪胎的寬度在[194,196]內,則稱這個輪胎是標準輪胎.試比較甲、乙兩廠分別提供的10個輪胎中所有標準輪胎寬度的方差的大小,根據兩廠的標準輪胎寬度的平均水平及其波動情況,判斷這兩個工廠哪個的輪胎相對更好.【解析】(1)甲廠10個輪胎寬度的平均值:甲=×(195+194+196+193+194+197+196+195+193+197)=195(mm),乙廠10個輪胎寬度的平均值:乙=×(195+196+193+192+195+194+195+192+195+193)=194(mm).(2)甲廠10個輪胎中寬度在[194,196]內的數據為195,194,196,194,196,195,平均數:1=×(195+194+196+194+196+195)=195,方差:s=×[(195-195)2+(194-195)2+(196-195)2+(194-195)2+(196-195)2+(195-195)2]=,乙廠10個輪胎中寬度在[194,196]內的數據為195,196,195,194,195,195,平均數:2=×(195+196+195+194+195+195)=195,方差:s=×[(195-195)2+(196-195)2+(195-195)2+(194-195)2+(195-195)2+(195-195)2]=,∵兩廠標準輪胎寬度的平均數相等,但乙廠的方差更小,∴乙廠的輪胎相對更好.第47講 隨機抽樣與用樣本估計總體【學科素養】1.會用簡單隨機抽樣方法從總體中抽取樣本,凸顯數據分析的核心素養.2.借助頻率分布表畫頻率分布直方圖、頻率折線圖,提升讀圖、數據分析的能力,凸顯直觀想象、數據分析的核心素養.3.能從樣本數據中提取樣本的數字特征(如平均數、標準差),并做出合理的解釋,凸顯數學運算的核心素養.4.會用樣本的頻率分布估計總體分布,會用樣本的基本數字特征估計總體的基本數字特征.理解用樣本估計總體的思想,會用樣本估計總體的思想解決一些簡單的實際問題,凸顯數學建模的核心素養.【課標解讀】1.理解隨機抽樣的必要性和重要性.會用簡單隨機抽樣方法從總體中抽取樣本;了解分層抽樣和系統抽樣方法.2.了解分布的意義和作用,能根據頻率分布表畫頻率分布直方圖、頻率折線圖、莖葉圖,體會它們各自的特點.3.理解樣本數據標準差的意義和作用,會計算數據標準差.4.能從樣本數據中提取基本的數字特征平均數、標準差,并作出合理的解釋.5.會用樣本的頻率分布估計總體分布,會用樣本的基本數字特征估計總體的基本數字特征,理解用樣本估計總體的思想.6.會用隨機抽樣的基本方法和樣本估計總體的思想解決一些簡單的實際問題.【備考策略】從近三年高考情況來看,本講內容為高考中的冷考點。預測2022年高考對本講將會以實際應用為背景命題考查分層抽樣或系統抽樣,用樣本估計總體,主要體現在利用頻率分布直方圖或莖葉圖估計總體,利用樣本數字特征估計總體.題型以客觀題呈現,試題難度不大,屬中、低檔題型。頻率分布直方圖與莖葉圖也可能出現于解答題中,與概率等知識綜合命題。【核心知識】1.簡單隨機抽樣(1)抽取方式:逐個不放回地抽取.(2)特點:每個個體被抽到的概率相等.(3)常用方法:抽簽法和隨機數法.2.分層抽樣(1)在抽樣時,將總體分成互不交叉的層,然后按照一定的比例,從各層獨立地抽取一定數量的個體,將各層取出的個體合在一起作為樣本,這種抽樣方法叫做分層抽樣.(2)分層抽樣的應用范圍當總體是由差異明顯的幾個部分組成時,往往選用分層抽樣.3.作頻率分布直方圖的步驟(1)求極差(即一組數據中最大值與最小值的差);(2)決定組距與組數;(3)將數據分組;(4)列頻率分布表;(5)畫頻率分布直方圖.4.頻率分布折線圖和總體密度曲線(1)頻率分布折線圖:連接頻率分布直方圖中各小長方形上端的中點,就得到頻率分布折線圖.(2)總體密度曲線:隨著樣本容量的增加,作圖時所分的組數增加,組距減小,相應的頻率折線圖會越來越接近于一條光滑曲線,統計中稱這條光滑曲線為總體密度曲線.5.樣本的數字特征(1)眾數:一組數據中出現次數最多的那個數據,叫做這組數據的眾數.(2)中位數:把n個數據按大小順序排列,處于最中間位置的一個數據(或最中間兩個數據的平均數)叫做這組數據的中位數.(3)平均數:把稱為a1,a2,…,an這n個數的平均數.(4)標準差與方差:設一組數據x1,x2,x3,…,xn的平均數為,則這組數據的標準差和方差分別是s= ,s2=.【高頻考點】高頻考點一 抽樣方法【例1】(1)某公司決定利用隨機數表對今年新招聘的800名員工進行抽樣調查他們對目前工作的滿意程度,先將這800名員工進行編號,編號分別為001,002,…,799,800,從中抽取80名進行調查,下面提供隨機數表的第4行到第6行:32 21 18 34 29 78 64 54 07 32 52 42 06 44 38 12 23 43 56 77 35 78 90 56 4284 42 12 53 31 34 57 86 07 36 25 30 07 32 86 23 45 78 89 07 23 68 96 08 0432 56 78 08 43 67 89 53 55 77 34 89 94 83 75 22 53 55 78 32 43 77 89 23 45若從表中第5行第6列開始向右依次讀取3個數據,則抽到的第5名員工的編號是( )A.007 B.253C.328 D.736(2)某市小學,初中,高中在校學生人數分別為7.5萬,4.5萬,3萬.為了調查全市中小學生的體質健康狀況,擬隨機抽取1 000人進行體質健康檢測,則應抽取的初中生人數為( )A.750 B.500C.450 D.300【方法技巧】1.應用隨機數法的兩個關鍵點(1)確定以表中的哪個數(哪行哪列)為起點,以哪個方向為讀數的方向;(2)讀數時注意結合編號特點進行讀取.若編號為兩位數字,則兩位兩位地讀取;若編號為三位數字,則三位三位地讀取,有超過總體號碼或出現重復號碼的數字舍去,這樣繼續下去,直到獲取整個樣本.2.解決分層抽樣的常用公式先確定抽樣比,然后把各層個體數乘以抽樣比,即得各層要抽取的個體數.(1)抽樣比==;(2)層1的容量∶層2的容量∶層3的容量=樣本中層1的容量∶樣本中層2的容量∶樣本中層3的容量. 【變式探究】利用簡單隨機抽樣,從n個個體中抽取一個容量為10的樣本.若第二次抽取時,余下的每個個體被抽到的概率為,則在整個抽樣過程中,每個個體被抽到的概率為( )A. B.C. D.高頻考點二 統計圖表及應用【例2】(1)某調查機構對全國互聯網行業進行調查統計,得到整個互聯網行業從業者年齡分布餅狀圖、90后從事互聯網行業者崗位分布條形圖,則下列結論中正確的是( )注:90后指1990年及以后出生,80后指1980~1989年之間出生,80前指1979年及以前出生.A.互聯網行業從業人員中90后占一半以上B.互聯網行業中從事技術崗位的人數超過總人數的20%C.互聯網行業中從事運營崗位的人數90后比80前多D.互聯網行業中從事技術崗位的人數90后比80后多(2)空氣質量指數AQI是反映空氣狀況的指數,AQI指數值越小,表明空氣質量越好,其對應關系如下表:AQI指數 0~50 51~100 101~150 151~200 201~300 >300空氣質量 優 良 輕度污染 中度污染 重度污染 嚴重污染下圖是某市10月1日~20日AQI指數變化趨勢,則下列敘述正確的是( )A.這20天中AQI指數值的中位數略高于100B.這20天中的中度污染及以上的天數占C.該市10月的前半個月的空氣質量越來越好D.總體來說,該市10月上旬的空氣質量比中旬的好【變式探究】我國是世界上嚴重缺水的國家,某市政府為了鼓勵居民節約用水,計劃調整居民生活用水收費方案,擬確定一個合理的月用水量標準x(噸),一位居民的月用水量不超過x的部分按平價收費,超出x的部分按議價收費.為了了解居民用水情況,通過抽樣,獲得了某年100位居民每人的月均用水量(單位:噸),將數據按照[0,0.5),[0.5,1),…,[4,4.5]分成9組,制成了如圖所示的頻率分布直方圖.(1)求直方圖中a的值;(2)設該市有30萬居民,估計全市居民中月均用水量不低于3噸的人數,并說明理由;(3)若該市政府希望使85%的居民每月的用水量不超過標準x(噸),估計x的值,并說明理由.高頻考點三 用樣本的數字特征估計總體的數字特征【例3】(2023·全國高考真題)有一組樣本數據,,…,,由這組數據得到新樣本數據,,…,,其中(為非零常數,則( )A.兩組樣本數據的樣本平均數相同B.兩組樣本數據的樣本中位數相同C.兩組樣本數據的樣本標準差相同D.兩組樣數據的樣本極差相同【變式探究】(2020·全國卷Ⅰ)某廠接受了一項加工業務,加工出來的產品(單位:件)按標準分為A,B,C,D四個等級.加工業務約定:對于A級品、B級品、C級品,廠家每件分別收取加工費90元,50元,20元;對于D級品,廠家每件要賠償原料損失費50元.該廠有甲、乙兩個分廠可承接加工業務.甲分廠加工成本費為25元/件,乙分廠加工成本費為20元/件.廠家為決定由哪個分廠承接加工業務,在兩個分廠各試加工了100件這種產品,并統計了這些產品的等級,整理如下:甲分廠產品等級的頻數分布表等級 A B C D頻數 40 20 20 20乙分廠產品等級的頻數分布表等級 A B C D頻數 28 17 34 21(1)分別估計甲、乙兩分廠加工出來的一件產品為A級品的概率;(2)分別求甲、乙兩分廠加工出來的100件產品的平均利潤,以平均利潤為依據,廠家應選哪個分廠承接加工業務?【方法技巧】利用樣本的數字特征解決優化決策問題的依據(1)平均數反映了數據取值的平均水平;標準差、方差描述了一組數據圍繞平均數波動的大小.標準差、方差越大,數據的離散程度越大,越不穩定;標準差、方差越小,數據的離散程度越小,越穩定.(2)用樣本估計總體就是利用樣本的數字特征來描述總體的數字特征. 高頻考點四 頻率分布直方圖的應用例4.(2023·天津高考真題)從一批零件中抽取80個,測量其直徑(單位:),將所得數據分為9組:,并整理得到如下頻率分布直方圖,則在被抽取的零件中,直徑落在區間內的個數為( )A.10 B.18 C.20 D.36【變式探究】某大學藝術專業的400名學生參加某次測評,根據男女學生人數比例,使用分層抽樣的方法從中隨機抽取了100名學生,記錄他們的分數,將數據按[20,30),[30,40),…,[80,90]分成7組,并整理得到如圖所示的頻率分布直方圖.(1)估計總體的眾數;(2)已知樣本中分數小于40的學生有5人,試估計總體中分數在區間[40,50)內的人數;(3)已知樣本中有一半男生的分數不小于70,且樣本中分數不小于70的男女學生人數相等.試估計總體中男生和女生人數的比例.第47講 隨機抽樣與用樣本估計總體【學科素養】1.會用簡單隨機抽樣方法從總體中抽取樣本,凸顯數據分析的核心素養.2.借助頻率分布表畫頻率分布直方圖、頻率折線圖,提升讀圖、數據分析的能力,凸顯直觀想象、數據分析的核心素養.3.能從樣本數據中提取樣本的數字特征(如平均數、標準差),并做出合理的解釋,凸顯數學運算的核心素養.4.會用樣本的頻率分布估計總體分布,會用樣本的基本數字特征估計總體的基本數字特征.理解用樣本估計總體的思想,會用樣本估計總體的思想解決一些簡單的實際問題,凸顯數學建模的核心素養.【課標解讀】1.理解隨機抽樣的必要性和重要性.會用簡單隨機抽樣方法從總體中抽取樣本;了解分層抽樣和系統抽樣方法.2.了解分布的意義和作用,能根據頻率分布表畫頻率分布直方圖、頻率折線圖、莖葉圖,體會它們各自的特點.3.理解樣本數據標準差的意義和作用,會計算數據標準差.4.能從樣本數據中提取基本的數字特征平均數、標準差,并作出合理的解釋.5.會用樣本的頻率分布估計總體分布,會用樣本的基本數字特征估計總體的基本數字特征,理解用樣本估計總體的思想.6.會用隨機抽樣的基本方法和樣本估計總體的思想解決一些簡單的實際問題.【備考策略】從近三年高考情況來看,本講內容為高考中的冷考點。預測2022年高考對本講將會以實際應用為背景命題考查分層抽樣或系統抽樣,用樣本估計總體,主要體現在利用頻率分布直方圖或莖葉圖估計總體,利用樣本數字特征估計總體.題型以客觀題呈現,試題難度不大,屬中、低檔題型。頻率分布直方圖與莖葉圖也可能出現于解答題中,與概率等知識綜合命題。【核心知識】1.簡單隨機抽樣(1)抽取方式:逐個不放回地抽取.(2)特點:每個個體被抽到的概率相等.(3)常用方法:抽簽法和隨機數法.2.分層抽樣(1)在抽樣時,將總體分成互不交叉的層,然后按照一定的比例,從各層獨立地抽取一定數量的個體,將各層取出的個體合在一起作為樣本,這種抽樣方法叫做分層抽樣.(2)分層抽樣的應用范圍當總體是由差異明顯的幾個部分組成時,往往選用分層抽樣.3.作頻率分布直方圖的步驟(1)求極差(即一組數據中最大值與最小值的差);(2)決定組距與組數;(3)將數據分組;(4)列頻率分布表;(5)畫頻率分布直方圖.4.頻率分布折線圖和總體密度曲線(1)頻率分布折線圖:連接頻率分布直方圖中各小長方形上端的中點,就得到頻率分布折線圖.(2)總體密度曲線:隨著樣本容量的增加,作圖時所分的組數增加,組距減小,相應的頻率折線圖會越來越接近于一條光滑曲線,統計中稱這條光滑曲線為總體密度曲線.5.樣本的數字特征(1)眾數:一組數據中出現次數最多的那個數據,叫做這組數據的眾數.(2)中位數:把n個數據按大小順序排列,處于最中間位置的一個數據(或最中間兩個數據的平均數)叫做這組數據的中位數.(3)平均數:把稱為a1,a2,…,an這n個數的平均數.(4)標準差與方差:設一組數據x1,x2,x3,…,xn的平均數為,則這組數據的標準差和方差分別是s= ,s2=.【高頻考點】高頻考點一 抽樣方法【例1】(1)某公司決定利用隨機數表對今年新招聘的800名員工進行抽樣調查他們對目前工作的滿意程度,先將這800名員工進行編號,編號分別為001,002,…,799,800,從中抽取80名進行調查,下面提供隨機數表的第4行到第6行:32 21 18 34 29 78 64 54 07 32 52 42 06 44 38 12 23 43 56 77 35 78 90 56 4284 42 12 53 31 34 57 86 07 36 25 30 07 32 86 23 45 78 89 07 23 68 96 08 0432 56 78 08 43 67 89 53 55 77 34 89 94 83 75 22 53 55 78 32 43 77 89 23 45若從表中第5行第6列開始向右依次讀取3個數據,則抽到的第5名員工的編號是( )A.007 B.253C.328 D.736(2)某市小學,初中,高中在校學生人數分別為7.5萬,4.5萬,3萬.為了調查全市中小學生的體質健康狀況,擬隨機抽取1 000人進行體質健康檢測,則應抽取的初中生人數為( )A.750 B.500C.450 D.300【解析】(1)由題意知,前五名員工的編號依次為253,313,457,736,007.故選A.(2)初中生抽取的人數為×4.5=300,故選D.【答案】(1)A (2)D【方法技巧】1.應用隨機數法的兩個關鍵點(1)確定以表中的哪個數(哪行哪列)為起點,以哪個方向為讀數的方向;(2)讀數時注意結合編號特點進行讀取.若編號為兩位數字,則兩位兩位地讀取;若編號為三位數字,則三位三位地讀取,有超過總體號碼或出現重復號碼的數字舍去,這樣繼續下去,直到獲取整個樣本.2.解決分層抽樣的常用公式先確定抽樣比,然后把各層個體數乘以抽樣比,即得各層要抽取的個體數.(1)抽樣比==;(2)層1的容量∶層2的容量∶層3的容量=樣本中層1的容量∶樣本中層2的容量∶樣本中層3的容量. 【變式探究】利用簡單隨機抽樣,從n個個體中抽取一個容量為10的樣本.若第二次抽取時,余下的每個個體被抽到的概率為,則在整個抽樣過程中,每個個體被抽到的概率為( )A. B.C. D.【答案】C 【解析】根據題意,=,解得n=28.故在整個抽樣過程中每個個體被抽到的概率為=.高頻考點二 統計圖表及應用【例2】(1)某調查機構對全國互聯網行業進行調查統計,得到整個互聯網行業從業者年齡分布餅狀圖、90后從事互聯網行業者崗位分布條形圖,則下列結論中正確的是( )注:90后指1990年及以后出生,80后指1980~1989年之間出生,80前指1979年及以前出生.A.互聯網行業從業人員中90后占一半以上B.互聯網行業中從事技術崗位的人數超過總人數的20%C.互聯網行業中從事運營崗位的人數90后比80前多D.互聯網行業中從事技術崗位的人數90后比80后多(2)空氣質量指數AQI是反映空氣狀況的指數,AQI指數值越小,表明空氣質量越好,其對應關系如下表:AQI指數 0~50 51~100 101~150 151~200 201~300 >300空氣質量 優 良 輕度污染 中度污染 重度污染 嚴重污染下圖是某市10月1日~20日AQI指數變化趨勢,則下列敘述正確的是( )A.這20天中AQI指數值的中位數略高于100B.這20天中的中度污染及以上的天數占C.該市10月的前半個月的空氣質量越來越好D.總體來說,該市10月上旬的空氣質量比中旬的好【解析】(1)由餅狀圖可知互聯網從業人員中90后占56%,一半以上,故A項正確;由條形圖知,90后從事技術崗位的人數占互聯網行業為39.6%×56%=22.176%>20%,所以互聯網行業中從事技術崗位的人數占總人數的百分比大于等于22.176%,B項正確;由條形圖知,90后從事運營崗位的人數占互聯網行業為17%×56%=9.52%,大于80前互聯網從業人數,C項正確;因為技術所占比例80后未知,且90后從事技術崗位的人數比22.176%<41%,所以D項不一定正確.(2)A項,由題圖知排序后第10個數據、第11個數據的平均數大于100,即中位數略高于100;B項,中度污染及以上的天數為5天,占;由題圖知C錯誤;D項,總體來說,該市10月上旬的空氣質量比中旬的空氣質量好.【答案】(1)ABC (2)ABD【變式探究】我國是世界上嚴重缺水的國家,某市政府為了鼓勵居民節約用水,計劃調整居民生活用水收費方案,擬確定一個合理的月用水量標準x(噸),一位居民的月用水量不超過x的部分按平價收費,超出x的部分按議價收費.為了了解居民用水情況,通過抽樣,獲得了某年100位居民每人的月均用水量(單位:噸),將數據按照[0,0.5),[0.5,1),…,[4,4.5]分成9組,制成了如圖所示的頻率分布直方圖.(1)求直方圖中a的值;(2)設該市有30萬居民,估計全市居民中月均用水量不低于3噸的人數,并說明理由;(3)若該市政府希望使85%的居民每月的用水量不超過標準x(噸),估計x的值,并說明理由.【解析】(1)由頻率分布直方圖知,月均用水量在[0,0.5)中的頻率為0.08×0.5=0.04,同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]中的頻率分別為0.08,0.20,0.26,0.06,0.04,0.02.由0.04+0.08+0.5×a+0.20+0.26+0.5×a+0.06+0.04+0.02=1,解得a=0.30.(2)由(1)可知,100位居民中每人月均用水量不低于3噸的頻率為0.06+0.04+0.02=0.12.根據樣本中的頻率,可以估計全市30萬居民中月均用水量不低于3噸的人數為 300 000×0.12=36 000.(3)因為前6組的頻率之和為0.04+0.08+0.15+0.20+0.26+0.15=0.88>0.85,前5組的頻率之和為0.04+0.08+0.15+0.20+0.26=0.73<0.85,所以2.5≤x<3.由0.30×(x-2.5)=0.85-0.73,解得x=2.9.所以估計月用水量標準為2.9噸時,85%的居民每月的用水量不超過該標準.高頻考點三 用樣本的數字特征估計總體的數字特征【例3】(2023·全國高考真題)有一組樣本數據,,…,,由這組數據得到新樣本數據,,…,,其中(為非零常數,則( )A.兩組樣本數據的樣本平均數相同B.兩組樣本數據的樣本中位數相同C.兩組樣本數據的樣本標準差相同D.兩組樣數據的樣本極差相同【答案】CD【解析】A、C利用兩組數據的線性關系有、,即可判斷正誤;根據中位數、極差的定義,結合已知線性關系可判斷B、D的正誤.【詳解】A:且,故平均數不相同,錯誤;B:若第一組中位數為,則第二組的中位數為,顯然不相同,錯誤;C:,故方差相同,正確;D:由極差的定義知:若第一組的極差為,則第二組的極差為,故極差相同,正確;故選:CD【變式探究】(2020·全國卷Ⅰ)某廠接受了一項加工業務,加工出來的產品(單位:件)按標準分為A,B,C,D四個等級.加工業務約定:對于A級品、B級品、C級品,廠家每件分別收取加工費90元,50元,20元;對于D級品,廠家每件要賠償原料損失費50元.該廠有甲、乙兩個分廠可承接加工業務.甲分廠加工成本費為25元/件,乙分廠加工成本費為20元/件.廠家為決定由哪個分廠承接加工業務,在兩個分廠各試加工了100件這種產品,并統計了這些產品的等級,整理如下:甲分廠產品等級的頻數分布表等級 A B C D頻數 40 20 20 20乙分廠產品等級的頻數分布表等級 A B C D頻數 28 17 34 21(1)分別估計甲、乙兩分廠加工出來的一件產品為A級品的概率;(2)分別求甲、乙兩分廠加工出來的100件產品的平均利潤,以平均利潤為依據,廠家應選哪個分廠承接加工業務?【解析】(1)由試加工產品等級的頻數分布表知,甲分廠加工出來的一件產品為A級品的概率的估計值為=0.4;乙分廠加工出來的一件產品為A級品的概率的估計值為=0.28.(2)由數據知甲分廠加工出來的100件產品利潤的頻數分布表為利潤 65 25 -5 -75頻數 40 20 20 20因此甲分廠加工出來的100件產品的平均利潤為=15.由數據知乙分廠加工出來的100件產品利潤的頻數分布表為利潤 70 30 0 -70頻數 28 17 34 21因此乙分廠加工出來的100件產品的平均利潤為=10.比較甲、乙兩分廠加工的產品的平均利潤,應選甲分廠承接加工業務.【方法技巧】利用樣本的數字特征解決優化決策問題的依據(1)平均數反映了數據取值的平均水平;標準差、方差描述了一組數據圍繞平均數波動的大小.標準差、方差越大,數據的離散程度越大,越不穩定;標準差、方差越小,數據的離散程度越小,越穩定.(2)用樣本估計總體就是利用樣本的數字特征來描述總體的數字特征. 高頻考點四 頻率分布直方圖的應用例4.(2023·天津高考真題)從一批零件中抽取80個,測量其直徑(單位:),將所得數據分為9組:,并整理得到如下頻率分布直方圖,則在被抽取的零件中,直徑落在區間內的個數為( )A.10 B.18 C.20 D.36【答案】B【解析】根據直方圖,直徑落在區間之間的零件頻率為:,則區間內零件的個數為:.故選:B.【變式探究】某大學藝術專業的400名學生參加某次測評,根據男女學生人數比例,使用分層抽樣的方法從中隨機抽取了100名學生,記錄他們的分數,將數據按[20,30),[30,40),…,[80,90]分成7組,并整理得到如圖所示的頻率分布直方圖.(1)估計總體的眾數;(2)已知樣本中分數小于40的學生有5人,試估計總體中分數在區間[40,50)內的人數;(3)已知樣本中有一半男生的分數不小于70,且樣本中分數不小于70的男女學生人數相等.試估計總體中男生和女生人數的比例.【解析】(1)由頻率分布直方圖可估計總體的眾數為=75.(2)由頻率分布直方圖可知,樣本中分數在區間[50,90)內的人數為(0.01+0.02+0.04+0.02)×10×100=90.因為樣本中分數小于40的學生有5人,所以樣本中分數在區間[40,50)內的人數為100-90-5=5.設總體中分數在區間[40,50)內的人數為x,則=,解得x=20,故估計總體中分數在區間[40,50)內的人數為20.(3)由頻率分布直方圖可知,樣本中分數不小于70的人數為(0.04+0.02)×10×100=60.因為樣本中分數不小于70的男女學生人數相等,所以樣本中分數不小于70的男生人數為30.因為樣本中有一半男生的分數不小于70,所以樣本中男生的人數為60,女生的人數為40.由樣本估計總體,得總體中男生和女生人數的比例約為3∶2. 展開更多...... 收起↑ 資源列表 (課標全國版)高考數學第一輪復習講練測 第47講 隨機抽樣與用樣本估計總體(練)原卷版+解析.docx (課標全國版)高考數學第一輪復習講練測 第47講 隨機抽樣與用樣本估計總體(講)原卷版+解析.docx 縮略圖、資源來源于二一教育資源庫