中文字幕精品无码一区二区,成全视频在线播放观看方法,大伊人青草狠狠久久,亚洲一区影音先锋色资源

新教材同步備課2024春高中數學第9章 統計 學案(8份打包)(含答案)

資源下載
  1. 二一教育資源

新教材同步備課2024春高中數學第9章 統計 學案(8份打包)(含答案)

資源簡介

9.1 隨機抽樣
9.1.1 簡單隨機抽樣
學習任務 1.通過實例,了解簡單隨機抽樣的含義及其解決問題的過程.(數學抽象) 2.掌握兩種簡單隨機抽樣方法:抽簽法和隨機數法.(數據分析) 3.會計算樣本均值,了解樣本與總體的關系.(數據分析)
某報告稱,食品質量檢測人員對某品牌牛奶的抽檢合格率為99.9%,你知道這一數據是怎么得到的嗎?
知識點1 全面調查和抽樣調查
項目 全面調查 抽樣調查
定義 對每一個調查對象都進行調查的方法,稱為全面調查,又稱普查 根據一定目的,從總體中抽取一部分個體進行調查,并以此為依據對總體的情況作出估計和推斷的調查方法,稱為抽樣調查
相關概念 總體:在一個調查中,我們把調查對象的全體稱為總體. 個體:組成總體的每一個調查對象稱為個體 樣本:我們把從總體中抽取的那部分個體稱為樣本. 樣本量:樣本中包含的個體數稱為樣本量
知識點2 簡單隨機抽樣
放回簡單隨機抽樣 不放回簡單隨機抽樣
一般地,設一個總體含有N(N為正整數)個個體,從中逐個抽取n(1≤n<N)個個體作為樣本
如果抽取是放回的,且每次抽取時總體內的各個個體被抽到的概率都相等,我們把這樣的抽樣方法叫做放回簡單隨機抽樣 如果抽取是不放回的,且每次抽取時總體內未進入樣本的各個個體被抽到的概率都相等,我們把這樣的抽樣方法叫做不放回簡單隨機抽樣
簡單隨機抽樣:放回簡單隨機抽樣和不放回簡單隨機抽樣統稱為簡單隨機抽樣.通過簡單隨機抽樣獲得的樣本稱為簡單隨機樣本.除非特殊聲明,所稱的簡單隨機抽樣指不放回簡單隨機抽樣
知識點3 簡單隨機抽樣的方法
1.抽簽法
先把總體中的個體編號,然后把所有編號寫在外觀、質地等無差別的小紙片(也可以是卡片、小球等)上作為號簽,并將這些小紙片放在一個不透明的盒里,充分攪拌.最后從盒中不放回地逐個抽取號簽,使與號簽上的編號對應的個體進入樣本,直到抽足樣本所需要的個體數.
2.隨機數法
(1)定義:先把總體中的個體編號,用隨機數工具產生與總體中個體數量相等的整數隨機數,把產生的隨機數作為抽中的編號,并剔除重復的編號,直到抽足樣本所需要的個體數.
(2)產生隨機數的方法:①用隨機試驗生成隨機數.②用信息技術生成隨機數.
1.簡單隨機抽樣具備哪些特點?
[提示] (1)被抽取樣本的總體中的個體數N是有限的.
(2)抽取的樣本是從總體中逐個抽取的.
(3)簡單隨機抽樣中每個個體被抽到的機會相等.
知識點4 總體均值和樣本均值
1.總體均值:一般地,總體中有N個個體,它們的變量值分別為Y1,Y2,…,YN,則稱==為總體均值,又稱總體平均數.
2.總體均值加權平均數的形式:如果總體的N個變量值中,不同的值共有k(k≤N)個,不妨記為Y1,Y2,…,Yk,其中Yi出現的頻數fi(i=1,2,…,k),則總體均值還可以寫成加權平均數的形式=.
3.樣本均值:如果從總體中抽取一個容量為n的樣本,它們的變量值分別為y1,y2,…,yn,則稱==為樣本均值,又稱樣本平均數.
2.總體均值與樣本均值有何區別與聯系?
[提示] (1)區別:總體均值是一個確定的數,樣本均值具有隨機性.
(2)聯系:在簡單隨機抽樣中,我們常用樣本均值估計總體均值.
1.思考辨析(正確的打“√”,錯誤的打“×”)
(1)從某廠生產的3 000件產品中抽取600件進行質量檢驗,適合用抽簽法. (  )
(2)從某廠生產的兩箱(每箱15件)產品中抽取6件進行質量檢驗,適合用抽簽法. (  )
(3)從某廠生產的3 000件產品中抽取10件進行質量檢驗,適合用隨機數法. (  )
(4)利用隨機數法抽取樣本時,選定的初始數是任意的,但讀數的方向只能是從左向右讀. (  )
(5)利用隨機數法抽取樣本時,若總體容量為100,則給每個個體分別編號為1,2,3,…,100. (  )
[答案] (1)× (2)√ (3)× (4)× (5)×
2.某校共有1 000名高三學生參加2023年上學期開學考試,為了了解這1 000名學生的數學成績,決定從中抽取50名學生的數學成績進行統計分析.在此抽樣過程中,總體是________;個體是________;樣本是______;樣本量是________.
[答案] 1 000名學生的數學成績 每一名學生的數學成績 50名學生的數學成績 50
3.從一個籃球訓練營中抽取10名學員進行投籃比賽,每人投10次,統計出該10名學員投籃投中的次數,4個投中5次,3個投中6次,2個投中7次,1個投中8次,則該訓練營10名學員投中的平均次數為________.
6 [10名學員投中的平均次數為=6.]
類型1 簡單隨機抽樣的理解
【例1】 (1)從52名學生中選取5名學生參加“希望杯”全國數學邀請賽,若采用簡單隨機抽樣抽取,則每人入選的可能性(  )
A.都相等,且為   B.都相等,且為
C.都相等,且為   D.都不相等
(2)下列抽樣中,是簡單隨機抽樣的是________.(填序號)
①倉庫中有1萬支奧運火炬,從中一次性抽取100支火炬進行質量檢查;
②某班從50名同學中,選出5名數學成績最優秀的同學代表本班參加數學競賽;
③一彩民選號,從裝有36個大小、形狀都相同的號簽的盒子中無放回地抽出6個號簽.
(1)C (2)③ [(1)對于簡單隨機抽樣,在抽樣過程中每一個個體被抽取的機會都相等(隨機抽樣的等可能性).若樣本容量為n,總體的個體數為N,則用簡單隨機抽樣時,每一個個體被抽到的可能性都是,體現了這種抽樣方法的客觀性和公平性.因此每人入選的可能性都相等,且為.
(2)根據簡單隨機抽樣的特點逐個判斷.①不是簡單隨機抽樣.雖然“一次性抽取”和“逐個抽取”不影響個體被抽到的可能性,但簡單隨機抽樣要求的是“逐個抽取”.②不是簡單隨機抽樣.因為5名同學是從中挑出來的,是最優秀的,每個個體被抽到的可能性不同,不符合簡單隨機抽樣中“等可能抽樣”的要求.③是簡單隨機抽樣.因為總體中的個體數是有限的,并且是從總體中逐個進行抽取的,等可能的抽樣.綜上,只有③是簡單隨機抽樣.]
 判斷一個抽樣是不是簡單隨機抽樣,一定要看它是否滿足簡單隨機抽樣的特點,這是判斷的唯一標準.
[跟進訓練]
1.(1)在簡單隨機抽樣中,某一個個體被抽到的可能性(  )
A.與第幾次抽樣有關,第一次抽到的可能性大一些
B.與第幾次抽樣無關,每次抽到的可能性都相等
C.與第幾次抽樣有關,最后一次抽到的可能性要大些
D.與第幾次抽樣無關,每次都是等可能地抽取,但各次抽取的可能性不一定
(2)為了進一步嚴厲打擊交通違法,交警隊在某一路口隨機抽查司機是否酒駕,這種抽查是(  )
A.簡單隨機抽樣    B.抽簽法
C.隨機數法   D.以上都不對
(1)B (2)D [(1)在簡單隨機抽樣中,每一個個體被抽到的可能性都相等,與第幾次抽樣無關,故A,C,D錯誤,B正確.
(2)由于不知道總體的情況(包括總體個數),因此不屬于簡單隨機抽樣.]
類型2 抽簽法與隨機數法的應用
【例2】 某班有50名學生,要從中隨機地抽出6人參加一項活動,請分別寫出利用抽簽法和隨機數法抽取該樣本的過程.
[解] (1)利用抽簽法步驟如下:
第一步:將這50名學生編號,編號為01,02,03,…,50.
第二步:將50個號碼分別寫在外觀、質地均無差別的小紙片上,并揉成團,制成號簽.
第三步:將得到的號簽放在一個不透明的容器中,攪拌均勻.
第四步:從容器中逐一抽取6個號簽,并記錄上面的號碼.
對應上面6個號碼的學生就是參加該項活動的學生.
(2)利用隨機數法步驟如下:
第一步:將這50名學生編號,編號為1,2,3,…,50.
第二步:用隨機數工具產生1~50范圍內的整數隨機數,把產生的隨機數作為抽中的編號,使與編號對應的學生進入樣本.
第三步:重復第二步的過程,直到抽足樣本所需人數.
對應上面6個號碼的學生就是參加該項活動的學生.
 抽簽法、隨機數法的步驟
[跟進訓練]
2.(1)福利彩票“雙色球”中紅球的號碼可以從01,02,03,…,32,33這33個兩位號碼中選取,小明利用如下所示的隨機數表選取紅色球的6個號碼,選取方法是從第1行第9列的數字開始,從左到右依次讀取數據,則第四個被選中的紅色球的號碼為(  )
81 47 23 68 63 93 17 90 12 69 86 81 62 93 50 60 91 33 75 85 61 39 85
06 32 35 92 46 22 54 10 02 78 49 82 18 86 70 48 05 46 88 15 19 20 49
A.12   B.33   C.06   D.16
(2)現從報名的某高校30名志愿者中選取6人組成志愿小組,請用抽簽法設計抽樣方案.
(1)C [被選中的紅色球的號碼依次為17,12,33,06,32,22.
所以第四個被選中的紅色球的號碼為06.故選C.]
(2)[解] ①將30名志愿者編號,號碼分別是01,02,…,30.
②將號碼分別寫在外觀、質地等無差別的小紙片上作為號簽.
③將小紙片放入一個不透明的盒里,充分攪勻.
④從盒中不放回地逐個抽取6個號簽,使與號簽上編號相同的志愿者進入樣本.
類型3 用樣本的平均數估計總體的平均數
【例3】 某班進行個人投籃比賽,受污損的下表記錄了在規定時間內投入n個球的人數分布情況,同時,已知進球3個或3個以上的人平均每人投進3.5個球,進球4個或4個以下的人平均每人投進2.5個球,問投進3個球和4個球的各有多少人?
進球數n 0 1 2 3 4 5
投進n個球的人數 1 2 7 2
[解] 設投進3個球的人數為a,投進4個球的人數為b,
根據已知有=3.5,=2.5,
即解得
故進3個球的有9人,進4個球的有3人.
 樣本平均數與總體平均數的關系
(1)在簡單隨機抽樣中,我們常用樣本平均數去估計總體平均數;
(2)總體平均數是一個確定的數,樣本平均數具有隨機性;
(3)一般情況下,樣本容量越大,估計值越準確.
[跟進訓練]
3.某學校抽取100位老師的年齡,得到如下數據:
年齡(單位:歲) 32 34 38 40 42 43 45 46 48
頻數 2 4 20 20 26 10 8 6 4
估計這個學校老師的平均年齡.
[解] ×(32×2+34×4+38×20+40×20+42×26+43×10+45×8+46×6+48×4)=41.1(歲),即這個學校老師的平均年齡約為41歲.
1.(多選)下列調查中,適宜采用抽樣調查的是(  )
A.調查某市中小學生每天的運動時間
B.某幼兒園準備制作校服,對此幼兒園中的小朋友進行測量
C.農業科技人員調查今年麥穗的單穗平均質量
D.調查某快餐店中8位店員的生活質量情況
AC [因為B中要對所有小朋友進行檢查,所以用普查的方式;D中共8名店員,可采用普查的方式;A,C中總體容量大,難以做到普查,故采用抽樣調查的方式.]
2.(多選)為了了解全校240名高一學生的身高情況,從中抽取了40名學生進行測量.下列說法正確的是(  )
A.總體是240名學生的身高
B.個體是每一名學生的身高
C.樣本是任意40名學生的身高
D.樣本容量是40
ABD [在這個問題中,總體是240名學生的身高,個體是每一名學生的身高,樣本是抽取的40名學生的身高,樣本容量是40.]
3.“雙色球”彩票中有33個紅色球,每個球的編號分別為01,02,…,33.一位彩民用隨機數法選取6個號碼作為6個紅色球的編號,選取方法是從下面的隨機數中第1行第5列和第6列的數字開始,從左向右讀數,則依次選出來的第5個紅色球的編號為(  )
7816 6572 0802 6314 0214 4319 9714 0198
3204 9234 4936 8200 3623 4869 6938 7181
A.01  B.02  C.14  D.19
A [從隨機數中第1行第5列和第6列的數字開始,從左向右讀數,依次是65(舍去),72(舍去),08,02,63(舍去),14,02(舍去),14(舍去),43(舍去),19,97(舍去),14(舍去),01,98(舍去),32;選出來的這6個數為:08,02,14,19,01,32,第5個紅色球的編號為01.]
4.為了解一批輪胎的性能,汽車制造廠從這批輪胎中隨機抽取了8個進行測試,每個輪胎行駛的最遠里程數(單位:1 000 km)為:96,112,97,108,100,103,86,98.則估計這批輪胎行駛的最遠里程數的平均數為________.
100 [用樣本平均數估計總體平均數,得這批輪胎行駛的最遠里程數的平均數約為=100.]
回顧本節知識,自主完成以下問題:
1.簡單隨機抽樣有哪些特點?
[提示] 簡單隨機抽樣的三個特點:總體有限、逐個抽取、等可能抽樣.
2.簡單隨機抽樣是一種簡單、基本的抽樣方法,其常用的簡單隨機抽樣方法有哪兩種,這兩種方法有什么異同?
[提示] 簡單隨機抽樣常用的抽樣方法有抽簽法和隨機數法.其具有以下異同點:
抽簽法 隨機數法
不同點 ①抽簽法比隨機數法簡單; ②抽簽法適用于總體中的個體數相對較少的情況 隨機數法適用于總體中的個體數相對較多的情況
相同點 ①都是簡單隨機抽樣,并且要求被抽取樣本的總體的個數有限; ②都是從總體中逐個不放回地抽取
課時分層作業(三十七) 簡單隨機抽樣
一、選擇題
1.下列抽樣方法是簡單隨機抽樣的是(  )
A.環保局人員取河水進行化驗
B.用抽簽的方法產生隨機數
C.福利彩票用搖獎機搖獎
D.老師抽取數學成績最優秀的2名同學代表班級參加數學競賽
C [簡單隨機抽樣要求總體中的個體數有限,每個個體有相同的可能性被抽到.故選C.]
2.使用簡單隨機抽樣從1 000件產品中抽出50件進行某項檢查,合適的抽樣方法是(  )
A.抽簽法   B.隨機數法
C.隨機抽樣法   D.以上都不對
B [由于總體相對較大,樣本容量較小,故采用隨機數法較為合適.]
3.從全校2 000名小學女生中用隨機數法抽取300名調查其身高,得到樣本量的平均數為148.3 cm,則可以推測該校女生的身高(  )
A.一定為148.3 cm
B.高于148.3 cm
C.低于148.3 cm
D.約為148.3 cm
D [由抽樣調查的意義可以知道該校女生的身高約為148.3 cm.]
4.某班對高一年級學情聯考成績進行分析,利用隨機數法抽取樣本時,先將70名同學按01,02,03,…,70進行編號,然后通過電子表格軟件生成如下隨機數,則依次選出的第7個個體的編號是(  )
29,78,64,56,07,82,52,42,07,44,38,15,51
A.07  B.44  C.15  D.51
B [符合條件的是29,64,56,07,52,42,44,故選出的第7個個體的編號是44.]
5.從某批零件中抽取50個,然后再從50個中抽出40個進行合格檢查,發現合格品有36個,則該批產品的合格率為(  )
A.36%  B.72%  C.90%  D.25%
C []
二、填空題
6.為了了解某班學生的會考合格率,要從該班70人中選30人進行考察分析,則70人的會考成績的全體是________,樣本是________,樣本量是________.
總體 30人的會考成績 30 [為了強調調查目的,由總體、樣本、樣本量的定義知,70人的會考成績的全體是總體,樣本是30人的會考成績,樣本量是30.]
7.某中學高一年級有400人,高二年級有320人,高三年級有280人,若每人被抽到的可能性都為0.2,用隨機數法在該中學抽取容量為n的樣本,則n等于________.
200 [由題意可知:=0.2,解得n=200.]
8.某工廠抽取50個機械零件檢驗其直徑大小,得到如下數據:
直徑(單位:cm) 12 13 14
頻數 12 34 4
估計這50個零件的直徑大約為________cm.
12.84 []
三、解答題
9.某電視臺舉行頒獎典禮,邀請20名藝人演出,其中從甲地30名藝人中隨機挑選10人,從乙地18名藝人中隨機挑選6人,從丙地10名藝人中隨機挑選4人.試分別用抽簽法和隨機數法確定選中的藝人.
[解] 抽簽法:
(1)將甲地30名藝人從01到30編號,然后用大小、質地完全相同的紙條做成30個號簽,在每個號簽上寫上這些編號,揉成團,然后放入一個不透明小筒中搖勻,從中逐個不放回地抽出10個號簽,則相應編號的藝人參加演出.
(2)運用相同的辦法分別從乙地18名藝人中抽取6人,從丙地10名藝人中抽取4人.
隨機數法:
(1)將甲地30名藝人從01到30編號,準備10個大小、質地完全一樣的小球.小球上分別寫上數字0,1,2,…,9.把它們放入一個不透明的袋中,從袋中有放回地摸取2次,每次摸取前充分攪勻,并把第一次、第二次摸到的數字分別作為十位、個位數字,這樣就生成了一個隨機數,如果這個隨機數在1~30范圍內,就代表了對應編號的藝人被抽中,否則舍棄編號,重復抽取隨機數,直到抽中10名藝人為止.
(2)運用相同的辦法分別從乙地18名藝人中抽取6人,從丙地10名藝人中抽取4人.
10.用簡單隨機抽樣方法從含有10個個體的總體中,抽取一個容量為3的樣本,其中某一個體a“第一次被抽到”的可能性,“第二次被抽到”的可能性分別是(  )
A.   B.
C.   D.
A [根據簡單隨機抽樣的定義知選A.]
11.從一群游戲的小孩中隨機抽出k人,一人分一個蘋果,讓他們返回繼續游戲.過了一會兒,再從中任取m人,發現其中有n個小孩曾分過蘋果,估計參加游戲的小孩的人數為(  )
A.   B.k+m-n
C.   D.不能估計
C [設參加游戲的小孩有x人,則.]
12.某校為了解學生的課外閱讀情況,通過簡單隨機抽樣抽取了40名學生,對他們一周的讀書時間進行了統計,統計數據如下:
讀書時間/時 7 8 9 10 11
學生人數 6 10 9 8 7
則該校學生一周讀書時間的平均數(  )
A.一定為9小時   B.高于9小時
C.低于9小時   D.約為9小時
D [由題目所給數據可知平均數為=9(小時),
用樣本平均數估計總體平均數,故該校學生一周讀書時間的平均數約為9小時.]
13.一個布袋中有6個同樣質地的小球,從中不放回地抽取3個小球,則某一特定小球被抽到的可能性是________;第三次抽取時,剩余小球中的某一特定小球被抽到的可能性是________.
 [因為簡單隨機抽樣時每個個體被抽到的可能性為,所以某一特定小球被抽到的可能性是.因為此抽樣是不放回抽樣,所以第一次抽樣時,每個小球被抽到的可能性均為;第二次抽取時,剩余5個小球中每個小球被抽到的可能性均為;第三次抽取時,剩余4個小球中每個小球被抽到的可能性均為.]
14.小林初三第一學期的數學書面測驗成績如下:平時考試第一單元得84分,第二單元得76分,第三單元得92分;期中考試得82分,期末考試得90分.如果按照平時、期中、期末的權重分別為10%,30%,60%計算,那么小林該學期數學書面測驗的總評成績應為多少分?
[解] 易知小林平時平均成績為(76+84+92)=84(分).
依題意,該學期小林總評成績為84×10%+82×30%+90×60%=87(分).
15.某市質監局要檢查某公司某個時間段生產的500克袋裝牛奶的質量是否達標,現從500袋牛奶中抽取10袋進行檢驗.
(1)利用隨機數法抽取樣本時,應如何操作?
(2)如果用隨機試驗生成部分隨機數如下所示,據此寫出應抽取的袋裝牛奶的編號.
162,277,943,949,545,354, 821,737, 932,354,873,520,964,384, 263,491,648,642,175,331,572,455,068,877,047,447,672,172,065,025,834,216,337,663,013,785,916,955,567,199,810,507,175,128,673,580,667.
(3)質監局對該公司生產的袋裝牛奶檢驗的質量指標有兩個:一是每袋牛奶的質量滿足500±5g,二是10袋質量的平均數≥500 g,同時滿足這兩個指標,才認為公司生產的牛奶為合格,否則為不合格.經過檢測得到10袋袋裝牛奶的質量(單位:g)為:
502,500,499,497,503,499,501,500,498,499.
計算這個樣本的平均數,并按照以上標準判斷牛奶質量是否合格.
[解] (1)第一步,將500袋牛奶編號為001,002,…,500.
第二步,用隨機數工具產生1~500范圍內的隨機數.
第三步,把產生的隨機數作為抽中的編號,使編號對應的袋裝牛奶進入樣本.
第四步,重復上述過程,直到產生不同的編號等于樣本所需要的數量.
(2)應抽取的袋裝牛奶的編號為:
162,277,354,384,263,491,175,331,455,068.
(3)=499.8<500,所以該公司的牛奶質量不合格.9.1.2 分層隨機抽樣
學習任務 1.通過實例,了解分層隨機抽樣的特點和適用范圍.(數學抽象) 2.了解分層隨機抽樣的必要性,掌握各層樣本量比例分配的方法.(數據分析) 3.結合具體實例,掌握分層隨機抽樣的樣本均值.(數學運算)
假設某地區有高中生2 400人,初中生10 900人,小學生11 000人.此地區教育部門為了了解本地區中小學生的近視情況及其形成原因,要從本地區的中小學生中抽取1%的學生進行調查.你認為應當怎樣抽取樣本才合理?
知識點1 分層隨機抽樣的相關概念
1.分層隨機抽樣的定義:一般地,按一個或多個變量把總體劃分成若干個子總體,每個個體屬于且僅屬于一個子總體,在每個子總體中獨立地進行簡單隨機抽樣,再把所有子總體中抽取的樣本合在一起作為總樣本,這樣的抽樣方法稱為分層隨機抽樣,每一個子總體稱為層.
2.比例分配:在分層隨機抽樣中,如果每層樣本量都與層的大小成比例,那么稱這種樣本量的分配方式為比例分配.
知識點2 分層隨機抽樣中的總體平均數與樣本平均數
1.在分層隨機抽樣中,如果總體分為2層,兩層包含的個體數分別為M,N,兩層抽取的樣本量分別為m,n,兩層的樣本平均數分別為,兩層的總體平均數分別為,則樣本平均數=,總體平均數=.
2.在比例分配的分層隨機抽樣中,我們可以直接用樣本平均數估計總體平均數.即.
分層隨機抽樣適合于什么樣的總體?
思考 [提示] 當總體是由差異明顯的幾部分組成時,用分層隨機抽樣.
1.某校有高一學生400人,高二學生380人,高三學生220人,現教育局督導組擬采用分層隨機抽樣的方法抽取50名學生進行問卷調查,則高一學生應抽取________人.
20 [高一學生應抽取=20人.]
2.為了解我國13歲男孩的平均身高,從北方抽取了300個男孩,平均身高為1.60 m;從南方抽取了200個男孩,平均身高為1.50 m.由此可估計我國13歲男孩的平均身高為________m.
1.56 [這500名13歲男孩的平均身高是=1.56(m),據此可估計我國13歲男孩的平均身高為1.56 m.]
類型1 對分層隨機抽樣概念的理解
【例1】 (1)某政府機關在編人員共100人,其中副處級以上干部10人,一般干部70人,工人20人,上級部門為了了解該機關對政府機構改革的意見,要從中抽取20人,則下列方法最合適的是(  )
A.抽簽法   B.隨機數法
C.簡單隨機抽樣法   D.分層隨機抽樣法
(2)分層隨機抽樣又稱類型抽樣,即將相似的個體歸入一類(層),然后每類抽取若干個個體構成樣本,所以分層隨機抽樣為保證每個個體等可能抽樣,必須進行(  )
A.每層等可能抽樣
B.每層可以不等可能抽樣
C.所有層按同一抽樣比等可能抽樣
D.所有層抽取的個體數量相同
(1)D (2)C [(1)總體由差異明顯的三部分構成,應選用分層隨機抽樣法.
(2)保證每個個體等可能的被抽取是三種基本抽樣方式的共同特征,為了保證這一點,分層隨機抽樣時必須在所有層都按同一抽樣比等可能抽取.]
 使用分層隨機抽樣的前提
分層隨機抽樣的使用前提條件是總體可以分層、層與層之間有明顯區別,而層內個體間差異較小.
[跟進訓練]
1.下列問題中,最適合用分層隨機抽樣抽取樣本的是(  )
A.從10名同學中抽取3人參加座談會
B.某社區有500個家庭,其中高收入的家庭125戶,中等收入的家庭280戶,低收入的家庭95戶,為了了解生活購買力的某項指標,要從中抽取一個容量為100戶的樣本
C.從1 000名工人中,抽取100人調查上班途中所用時間
D.從生產流水線上,抽取樣本檢查產品質量
B [A中總體所含個體無差異且個數較少,適合用簡單隨機抽樣;C和D中總體所含個體無差異且個數較多,不適合用分層隨機抽樣;B中總體所含個體差異明顯,適合用分層隨機抽樣.]
類型2 分層隨機抽樣的應用
【例2】 某學校有在職人員160人,其中行政人員有16人,教師有112人,后勤人員有32人.教育部門為了了解在職人員對學校機構改革的意見,要從中抽取一個容量為20的樣本,請利用分層隨機抽樣的方法抽取,寫出抽樣過程.
[解] 抽樣過程如下:
第一步,確定抽樣比,樣本容量與總體容量的比為.
第二步,確定分別從三類人員中抽取的人數,從行政人員中抽取16×=2(人);從教師中抽取112×=14(人);從后勤人員中抽取32×=4(人).
第三步,采用簡單隨機抽樣的方法,抽取行政人員2人,教師14人,后勤人員4人.
第四步,把抽取的個體組合在一起構成所需樣本.
 1.分層隨機抽樣的相關計算的2個關系
(1).
(2)總體中某兩層的個體數之比等于樣本中這兩層抽取的個體數之比.
2.分層隨機抽樣的步驟
第一步,按某種特征將總體分成若干部分(層);
第二步,計算各層所占比例;
第三步,計算各層抽取的個體數;
第四步,按簡單隨機抽樣從各層抽取樣本;
第五步,綜合每層抽樣,組成總樣本.
[跟進訓練]
2.(1)交通管理部門為了解機動車駕駛員(簡稱駕駛員)對某新法規的知曉情況,對甲、乙、丙、丁四個社區做分層隨機抽樣調查,假設四個社區駕駛員的總人數為N,其中甲社區有駕駛員96人.若在甲、乙、丙、丁四個社區抽取駕駛員的人數分別為12,21,25,43,則這四個社區駕駛員的總人數N為(  )
A.101  B.808  C.1 212  D.2 012
(2)將一個總體分為A,B,C三層,其個體數之比為5∶3∶2.若用分層隨機抽樣方法抽取容量為100的樣本,則應從C中抽取________個個體.
(1)B (2)20 [(1)因為甲社區有駕駛員96人,并且在甲社區抽取的駕駛員的人數為12,所以四個社區抽取駕駛員的比例為,所以駕駛員的總人數為(12+21+25+43)÷=808.
(2)∵A,B,C三層個體數之比為5∶3∶2,總體中每個個體被抽到的可能性相等,∴分層隨機抽樣應從C中抽取100×=20(個)個體.]
類型3 分層隨機抽樣中的平均數
【例3】 某校有初中、高中兩個部門,其中初中有學生850人,高中有學生650人,小軍想要進行一個視力調查,對學校按部門進行按比例分配分層隨機抽樣,得到初中生、高中生平均視力分別為1.0,0.8,其中樣本量為60,則在初中部、高中部各抽取多少人?整個學校平均視力是多少?
[解] 初中部抽取人數為60×=34,
高中部抽取人數為60×=26,
學校平均視力為×1.0+×0.8≈0.91,
所以在初中部、高中部各抽取34,26人,學校平均視力約為0.91.
 樣本的平均數和各層的樣本平均數的關系為:.
[跟進訓練]
3.通過分層隨機抽樣的方法估測某校高三年級全體學生的身高水平,抽取總樣本量為100,抽取的男生的平均身高為170 cm,抽取的女生的平均身高為160 cm,估測得到高三全體學生的平均身高為166 cm,則抽取總樣本量中男生、女生人數分別為(  )
A.60,40   B.70,30
C.80,20   D.90,10
A [設抽取的總樣本量中男生、女生人數分別為m, n,則由題意可得
故選A. ]
1.某學校為了了解三年級、六年級、九年級這三個年級之間的學生的作業負擔情況,擬從這三個年級中按人數比例抽取部分學生進行調查,則最合理的抽樣方法是(  )
A.抽簽法   B.簡單隨機抽樣
C.分層隨機抽樣   D.隨機數法
C [根據年級不同產生差異及按人數比例抽取易知應為分層隨機抽樣.]
2.某學校高一年級有300名男生,200名女生,通過分層隨機抽樣的方法調查數學考試成績,抽取總樣本量為50,男生平均成績為120分,女生平均成績為110分,那么可以推測高一年級學生的數學平均成績約為(  )
A.110分  B.115分  C.116分  D.120分
C [由題意可得抽取的50人中,男生為30人,女生為20人,所以樣本平均數×110=116,所以可以估計高一年級學生的數學平均成績為116分.]
3.(多選)某公司生產三種型號的轎車,產量分別為1 200輛,6 000輛和2 000輛,為檢驗該公司的產品質量,公司質監部門要抽取46輛進行檢驗,則(  )
A.應采用分層隨機抽樣法抽取
B.應采用抽簽法抽取
C.三種型號的轎車依次抽取6輛、30輛、10輛
D.這三種型號的轎車,每一輛被抽到的概率都是相等的
ACD [由于總體按型號分為三個子總體,所以應采用分層隨機抽樣法抽取,A正確;設三種型號的轎車依次抽取x輛、y輛、z輛,
則有 解得
所以三種型號的轎車依次抽取6輛、30輛、10輛,故C正確;由分層隨機抽樣的定義可知D正確.]
4.某工廠甲、乙、丙三個車間生產了同一種產品,數量分別為120件,80件,60件.為了解它們的產品質量是否存在顯著差異,用比例分配的分層隨機抽樣的方法抽取了一個容量為n的樣本進行調查,其中從丙車間的產品中抽取了3件,則n等于________.
13 [∵,∴n=13.]
回顧本節知識,自主完成以下問題:
1.在分層隨機抽樣中,總體容量、樣本容量、各層的個體數、各層抽取的樣本數這四者之間有何關系?
[提示] 設總體容量為N,樣本容量為n,第i(i=1,2,…,k)層的個體數為Ni,各層抽取的樣本數為ni,則,這四者中,已知其中三個可以求出另外一個.
2.簡單隨機抽樣與分層隨機抽樣有何區別與聯系?
[提示] 
類別 共同點 各自特點 相互聯系 適用范圍
簡單隨機抽樣 抽樣過程中每個個體被抽到的可能性相等 從總體中逐個抽取 — 總體中的個體數較少
分層隨機抽樣 將總體分成幾層,分層進行抽取 在各層抽樣時采用簡單隨機抽樣 總體由存在明顯差異的幾部分組成
3.如何用分層隨機抽樣中的樣本平均數估計總體平均數?
[提示] 可以用.
課時分層作業(三十八) 分層隨機抽樣
一、選擇題
1.要完成下列兩項調查:(1)某社區有100戶高收入家庭,210戶中等收入家庭,90戶低收入家庭,從中抽取100戶調查有關消費購買力的某項指標;(2)從某中學高二年級的10名體育特長生中抽取3人調查學習情況.應采用的抽樣方法分別是(  )
A.(1)用簡單隨機抽樣,(2)用分層隨機抽樣
B.(1)用分層隨機抽樣,(2)用其他抽樣方法
C.(1)用分層隨機抽樣,(2)用簡單隨機抽樣
D.(1)(2)都用分層隨機抽樣
C [(1)中收入差距較大,采用分層隨機抽樣較合適;(2)中總體個數較少,采用簡單隨機抽樣較合適.]
2.北京2022年冬奧會吉祥物“冰墩墩”和冬殘奧會吉祥物“雪容融”很受歡迎,現工廠決定從20只“冰墩墩”,15只“雪容融”和10個北京2022年冬奧會會徽中,采用按比例分配的分層隨機抽樣的方法,抽取一個容量為n的樣本進行質量檢測,若“冰墩墩”抽取了4只,則n為(  )
A.3  B.2  C.5  D.9
D []
3.“互聯網+”時代,全民閱讀的內涵已然多元化,某校為了解高中學生的閱讀情況,從該校1 800名高一學生中,采用分層隨機抽樣的方法抽取一個容量為200的樣本進行調查,其中女生有88人.則該校高一男生共有(  )
A.1 098人   B.1 008人
C.1 000人   D.918人
B [設該校高一男生有x人.
法一:由題意可得,求得x=1 008,故選B.
法二:,求得x=1 008,故選B.]
4.某班45名同學都參加了立定跳遠和100米跑兩項體育學業水平測試,立定跳遠和100米跑合格的人數分別為30和35,兩項都不合格的人數為5.現從這45名同學中按測試是否合格分層(分成兩項都合格、僅立定跳遠合格、僅100米跑合格、兩項都不合格四種)抽出9人進行復測,那么抽出來復測的同學中兩項都合格的有(  )
A.1人  B.2人  C.5人  D.6人
C [設這兩項成績均合格的人數為x,則立定跳遠合格但100米跑不合格的人數為30-x,則30-x+35+5=45,得x=25,即這兩項成績均合格的有25人,則抽出來復測的同學中兩項都合格的有9×=5(人),故選C.]
5.(多選)某旅行社分年齡段統計了某景區5月份的老、中、青旅客的人數比為5∶2∶3,現使用分層隨機抽樣的方法從這些旅客中隨機抽取n名,若青年旅客抽到60人,則下列說法正確的是(  )
A.老年旅客抽到150人 
B.中年旅客抽到40人
C.n=200  
D.被抽到的老年旅客和中年旅客人數之和超過200
BC [因為老、中、青旅客的人數比為5∶2∶3,青年旅客抽到60人,
所以,解得n=200,所以老年旅客抽到200×=100(人),
中年旅客抽到200×=40(人),100+40=140<200.故選BC.]
二、填空題
6.一支田徑隊有男、女運動員98人,其中男運動員有56人.按男、女比例用分層隨機抽樣的方法,從全體運動員中抽出一個容量為28的樣本,那么應抽取女運動員的人數是________.
12 [抽取女運動員的人數為×28=12.]
7.為了解某地區對中小學生“雙減”政策的落實情況,現采用分層隨機抽樣的方法從該地區24所小學,18所初中,12所校外培訓機構中抽取9所進行調查,則應抽取初中________所.
3 [抽取初中9×=3所.]
8.某分層隨機抽樣中,有關數據如下:
層數 樣本量 平均數
第1層 45 3
第2層 35 4
此樣本的平均數為________.
3.437 5 []
三、解答題
9.為了了解全區科級干部“黨風廉政知識”的學習情況,按照分層隨機抽樣的方法,從全區320名正科級干部和1 280名副科級干部中抽取40名科級干部預測全區科級干部“黨風廉政知識”的學習情況.現將這40名科級干部分為正科級干部組和副科級干部組,利用同一份試卷分別進行預測.經過預測后,兩組各自將預測成績統計分析如下表:
分組 人數 平均成績
正科級干部組 a 80
副科級干部組 b 70
(1)求a,b;
(2)求這40名科級干部預測成績的平均分.
[解] (1)樣本量與總體中的個體數的比為,
則抽取的正科級干部人數a=320×=8,
副科級干部人數b=1 280×=32.
(2)這40名科級干部預測成績的平均分=72.
10.(多選)某高中3 000名學生均已接種某疫苗,現按照高一、高二、高三學生人數的比例用分層隨機抽樣方法,抽取一個容量為150的樣本,并調查他們接種疫苗的情況,所得數據如表:
年級 高一 高二 高三
只接種第一、 二劑疫苗人數 50 44 45
接種第一、二、 三劑疫苗人數 0 1 10
則下列判斷正確的是(  )
A.該校高一、高二、高三的學生人數比為10∶9∶11
B.該校高三學生的人數比高一人數多50
C.估計該校高三接種第三劑疫苗的人數為200
D.估計該校學生中第三劑疫苗的接種率不足8%
ACD [由表可知,該校高一、高二、高三的學生人數比為50∶45∶55,即10∶9∶11,A正確;高三學生人數為3 000×=1 100人,高一學生人數為3 000×=1 000人,故高三學生的人數比高一人數多1 100-1 000=100人,故B錯誤;高三接種第三劑疫苗的人數約為3 000×=200人,C正確;該校學生中第三劑疫苗的接種率約為≈7.33%,故D正確.故選ACD.]
11.(多選)在《九章算術》第三章“衰分”中有如下問題:“今有甲持錢五百六十,乙持錢三百五十,丙持錢一百八十,凡三人俱出關,關稅百錢.欲以錢多少衰出之,問各幾何?”其譯文為:今有甲持560錢,乙持350錢,丙持180錢,甲、乙、丙三人一起出關,關稅共100錢,要按照各人持錢多少的比例進行交稅,問三人各應付多少稅?則下列說法正確的是(  )
A.甲應付51 錢
B.乙應付32 錢
C.丙應付16 錢
D.三者中甲付的錢最多,丙付的錢最少
ACD [依題意由分層隨機抽樣可知,,
則甲應付(錢);
乙應付(錢);
丙應付(錢).]
12.某校共有2 000名學生參加跑步和登山比賽,每人都參加且每人只參加其中一項比賽,各年級參加比賽的人數情況如下表:
年級 高一年級 高二年級 高三年級
跑步人數 a b c
登山人數 x y z
其中a∶b∶c=2∶5∶3,全校參加登山的人數占總人數的.為了了解學生對本次活動的滿意程度,按分層隨機抽樣的方式從中抽取一個容量為200的樣本進行調查,則高三年級參加跑步的學生中應抽取的人數為(  )
A.25  B.35  C.45  D.55
C [由題意知,全校參加跑步的人數占總人數的,高三年級參加跑步的總人數為×2 000×=450,由分層隨機抽樣的特征得高三年級參加跑步的學生中應抽取×450=45(人).]
13.高一和高二兩個年級的同學參加了數學競賽,高一年級有450人,高二年級有350人,通過分層隨機抽樣的方法抽取了160個樣本,得到兩年級的競賽成績的平均分別為80分和90分,則
(1)高一、高二抽取的樣本量分別為________.
(2)高一和高二數學競賽的平均分約為________分.
(1)90,70 (2)84.375 [(1)由題意可得高一年級抽取的樣本量為×160=90,高二年級抽取的樣本量為×160=70.
(2)高一和高二數學競賽的平均分約為×90=84.375分.]
14.某企業五月中旬生產A,B,C三種產品共3 000件,根據分層隨機抽樣的結果,該企業統計員制作了如下表格:
由于不小心,表格中A,C產品的有關數據已被污染,統計員只記得A產品的樣本容量比C產品的樣本容量多10,請你根據以上信息補全表格中的數據.
[解] 根據題意,可設A產品的數量為m件,樣本容量為n,則C產品的數量為(1 700-m)件,樣本容量為n-10.
根據分層隨機抽樣的特點可得,解得m=900,n=90,故補全后的表格如下.
產品類型 A B C
產品數量/件 900 1 300 800
樣本容量 90 130 80
15.某單位最近組織了一次健身活動,活動分為登山組和游泳組,且每個職工只能參加其中一組.在參加活動的職工中,青年人占42.5%,中年人占47.5%,老年人占10%;登山組的職工占參加活動總人數的,且該組中,青年人占50%,中年人占40%,老年人占10%.為了了解各組不同年齡層的職工對本次活動的滿意程度,現用分層隨機抽樣的方法從參加活動的全體職工中抽取容量為200的樣本.試求:
(1)游泳組中,青年人、中年人、老年人分別所占的比例;
(2)游泳組中,青年人、中年人、老年人分別應抽取的人數.
[解] (1)設登山組人數為x,游泳組中,青年人、中年人、老年人各占比例分別為a,b,c,則有=47.5%,=10%.
解得b=50%,c=10%.
故a=1-50%-10%=40%.
即游泳組中,青年人、中年人、老年人各占的比例為40%,50%,10%.
(2)游泳組中,抽取的青年人為200××40%=60(人);
抽取的中年人為200××50%=75(人);
抽取的老年人為200××10%=15(人).9.1.3 獲取數據的途徑
學習任務 知道獲取數據的途徑多種多樣,包括統計報表和年鑒、社會調查、普查和抽樣、互聯網、試驗設計等.(數據分析)
生活中遇到的很多問題,都需要借助數據才可能得到答案.例如,校園中每天產生多少可回收垃圾,食堂有多少人就餐,城市里的車輛有多少,公共汽車平均每天的載客量是多少,某旅游旺季有出門旅游意向的人有多少……要得到這些問題的答案,就需要獲取相關數據.
知識點 獲取數據的基本途徑
獲取數據的基本途徑 適用類型 注意問題
通過調查獲取數據 對于有限總體問題,我們一般通過抽樣調查或普查的方法獲取數據 要充分有效地利用背景信息選擇或創建更好的抽樣方法,并有效避免抽樣過程中的人為錯誤
通過試驗獲取數據 沒有現存的數據可以查詢 嚴格控制試驗環境,通過精心的設計安排試驗,以提高數據質量
通過觀察 獲取數據 自然現象 要通過長久的持續觀察獲取數據
通過查詢 獲得數據 眾多專家研究過,其收集的數據有所存儲 必須根據問題背景知識“清洗”數據,去偽存真
(1)利用統計報表和年鑒屬于哪種獲取數據的途徑?
(2)要了解一種新型燈管的壽命,能通過觀察獲取數據嗎?
[提示] (1)屬于通過查詢獲取數據的途徑.
(2)不能,應該通過試驗獲取數據.
思考辨析(正確的打“√”,錯誤的打“×”)
(1) 要了解一批節能燈的使用壽命,可以采用普查的方式. (  )
(2)農科院獲取小麥新品種的產量可以通過查詢獲取數據. (  )
(3)普查獲取的資料更加全面、系統,抽樣調查更方便、快捷. (  )
[答案] (1)× (2)× (3)√
類型1 獲取數據途徑的選擇
【例1】 (1)下列數據中是通過試驗獲取的是(  )
A.2022年濟南市的降雨量
B.2022年中國新生兒人口數量
C.某學校2023級同學的數學期末測試成績
D.某種特效中成藥的配方
(2)“中國天眼”為500米口徑球面射電望遠鏡(簡稱FAST),是具有我國自主知識產權、世界最大單口徑、最靈敏的射電望遠鏡.建造“中國天眼”的目的是(  )
A.通過調查獲取數據    B.通過試驗獲取數據
C.通過觀察獲取數據   D.通過查詢獲得數據
(1)D (2)C [(1)某種特效中成藥的配方的數據只能通過試驗獲得.
(2)“中國天眼”主要是通過觀察獲取數據.]
 選擇獲取數據的途徑的依據
選擇獲取數據的途徑主要是根據所要研究問題的類型,以及獲取數據的難易程度.有的數據可以有多種獲取途徑,有的數據只能通過一種途徑獲取,選擇合適的方法和途徑能夠更好地提高數據的可靠性.
[跟進訓練]
1.要得到某鄉鎮的貧困人口數據,應采取的方法是(  )
A.通過調查獲取數據   B.通過試驗獲取數據
C.通過觀察獲取數據   D.通過查詢獲得數據
A [某鄉鎮的貧困人口數據屬于有限總體問題,所以可以通過調查獲取數據.]
類型2 獲取數據途徑的方法的設計
【例2】 為了緩解城市的交通擁堵情況,某市準備出臺限制私家車的政策,為此要進行民意調查.某個調查小組調查了一些擁有私家車的市民,你認為這樣的調查結果能很好地反映該市市民的意愿嗎?
[解] (1)一個城市的交通狀況的好壞將直接影響著生活在這個城市中的每個人,關系到每個人的利益.為了調查這個問題,在抽樣時應當關注到各種人群,既要抽到擁有私家車的市民,也要抽到沒有私家車的市民.
(2)調查時,如果只對擁有私家車的市民進行調查,結果一定是片面的,不能代表所有市民的意愿.因此,在調查時,要對生活在該城市的所有市民進行隨機地抽樣調查,不要只關注到擁有私家車的市民.
 在統計活動中,尤其是大型的統計活動,為避免一些外界因素的干擾,通常需要確定調查的對象、調查的方法與策略,需要精心設計前期的準備工作和收集數據的方法,然后對數據進行分析,得出統計推斷.
[跟進訓練]
2.一些期刊雜志社經常會請一些曾經高考落榜而在某方面的事業上取得成就的著名專家、學者,談他們對高考落榜的看法,這些名人所講的都是大同小異,不外乎“我也有過落榜的沮喪,但從長遠看,它有益于我的人生”“我是因禍得福,落榜使我走了另一條成功之路”等.小明據此得出結論“上大學不如高考落榜”,他的結論正確嗎?
[解] 小明的結論是錯誤的,在眾多的高考落榜生中,走出另外一條成功之路的是少數,小明通過研究一些期刊雜志社報道過的一些成功人士就得出結論是片面的,因為他的抽樣不具有代表性.
1.下列調查方式中,可用“普查”方式的是(  )
A.調查某品牌電視機的市場占有率
B.調查某電視連續劇在全國的收視率
C.調查某校七年級一班的男女同學的比例
D.調查某型號炮彈的射程
[答案] C
2.(多選)影響獲取數據可靠程度的因素包括(  )
A.獲取數據方法的設計
B.所用專業測量設備的精度
C.調查人員的認真程度
D.數據的大小
ABC [數據的大小不影響獲取數據的可靠程度.]
3.糧食安全是每一個國家必須高度關注的問題,在現有條件下,降雨量對糧食生產的影響是非常巨大的,某次降雨之后該地氣象臺播報說本次降雨量是該地有氣象記錄以來最大的一次,氣象臺獲取這些數據的途徑是(  )
A.通過調查獲取數據    B.通過試驗獲取數據
C.通過觀察獲取數據    D.通過查詢獲得數據
C [該地的氣象記錄和本次的降雨量數據都是通過觀察獲取的.]
4.小明從網上查詢到某地區10戶居民家庭人均年收入(單位:萬元)如表所示:
編號 1 2 3 4 5 6 7 8 9 10
年收入 1.2 1.3 1.8 2.0 4.6 1.7 0.9 2.1 1.0 1.6
根據以上數據,我們認為有一個數據是不準確的,需要剔除,這個數據是________.
4.6 [由于編號為5的數據為4.6,明顯高于其他數據,所以這個數據是不準確的.]
回顧本節知識,自主完成以下問題:
獲取數據的基本途徑有哪些?
[提示] 具有四種基本途徑:(1)通過調查獲取數據;(2)通過試驗獲取數據;(3)通過觀察獲取數據;(4)通過查詢獲取數據.
課時分層作業(三十九) 獲取數據的途徑
一、選擇題
1.為了研究近年來我國高等教育發展狀況,小明需要獲取近年來我國大學生入學人數的相關數據,他獲取這些數據的途徑最好是(  )
A.通過調查獲取數據
B.通過試驗獲取數據
C.通過觀察獲取數據
D.通過查詢獲得數據
D [因為近年來我國大學生入學人數的相關數據有所存儲,所以小明獲取這些數據的途徑最好是通過查詢獲得數據.]
2.若要研究某城市家庭的收入情況,獲取數據的途徑應該是(  )
A.通過調查獲取數據
B.通過試驗獲取數據
C.通過觀察獲取數據
D.通過查詢獲得數據
A [因為要研究的是某城市家庭的收入情況,所以通過調查獲取數據.]
3.下列調查方案中,抽樣方法合適、樣本具有代表性的是(  )
A.用一本書第1頁的字數估計全書的字數
B.為調查某校學生對航天科技知識的了解程度,上學期間,在該校門口,每隔2分鐘隨機調查一位學生
C.在省內選取一所城市中學,一所農村中學,向每個學生發一張卡片,上面印有一些名人的名字,要求每個學生只能在一個名字下面畫“√”,以了解全省中學生最崇拜的人物是誰
D.為了調查我國小學生的健康狀況,共抽取了100名小學生進行調查
B [A中樣本缺少代表性(第1頁的字數一般較少);B中抽樣保證了隨機性原則,樣本具有代表性;對于C,城市中學與農村中學的規模往往不同,學生崇拜的人物也未必在所列的名單之中,這些都會影響數據的代表性;D中總體數量很大,而樣本容量太少,不足以體現總體特征.]
4.以下獲取的數據不是通過查詢獲取的是(  )
A.某領導想了解A市的大氣環境質量,向當地有關部門咨詢該市的PM2.5的濃度
B.張三利用互聯網了解到某市居民平均壽命達到82.2歲
C.某中學為了了解學生對課堂禁用手機的認同度,進行了問卷調查
D.從某公司員工年度報告中獲知某種信息
C [A,B,D都是通過查詢獲取的數據,C是通過調查獲取的數據.]
5.研究下列問題:
①某城市元旦前后的氣溫;②某種新型電器元件使用壽命的測定;③電視臺想知道某一個節目的收視率;④銀行在收進儲戶現金時想知道有沒有假鈔.
一般通過試驗獲取數據的是(  )
A.①②  B.③④  C.②  D.④
C [①通過觀察獲取數據,③④通過調查獲取數據,只有②通過試驗獲取數據.]
二、填空題
6.為了研究我國房地產市場發展的狀況,小李從圖書館借閱了《中國統計年鑒》,小李獲得數據的途徑是________.
通過查詢獲得數據 [借閱《中國統計年鑒》屬于通過查詢獲得數據.]
7.為了調查本班同學對班級體育活動的意見,應該如何合理安排抽樣才能提高樣本的代表性?答:________.
[答案] 按照男、女生人數分層隨機抽樣
8.學校興趣小組要對本市某社區的居民睡眠時間進行研究,得到了以下10個數據(單位:h):
5.6,7.8,8.0,7.3, 3.2,7.9,6.8,7.5,8.6,7.8.
去掉數據________能很好地提高樣本數據的代表性.
3.2 [因為數據3.2明顯低于其他幾個數據,是極端值,所以去掉這個數據,能夠更好地提高樣本數據的代表性.]
三、解答題
9.某公司想調查一下本公司員工對某項規章制度的意見,由于本公司車間工人工作任務繁重,負責該項事務的公司辦公室向本公司的50名中層及以上領導干部派發了問卷,統計后便得到了調查意見,公司辦公室獲取數據的途徑是什么?你認為該調查結果具有代表性嗎?為什么?
[解] 公司辦公室是通過調查獲取數據的,但是這些數據不具有代表性.因為公司的規章制度往往是領導干部制訂的,而這部分員工的意見不能很好地代表全體員工,所以結果是片面的,不合理的,不具有代表性.
10.下列調查工作適合采用普查的是(  )
A.環保部門對淮河水域的水污染情況的調查
B.電視臺對某電視節目收視率的調查
C.質檢部門對各廠家生產的電池使用壽命的調查
D.企業在給職工做工作服前進行的尺寸大小的調查
D [A、B中的調查,在理論上來說采用普查是可行的,但是普查會費時費力;C中,質檢部門對各廠家生產的電池使用壽命的調查不能采用普查,因為調查時的檢驗對電池具有破壞性;D中,企業在給職工做工作服前進行的尺寸大小的調查必須采用普查,否則工人的工作服會不合體.故選D.]
11.下列調查所抽取的樣本具有代表性的是(  )
A.利用某地七月份的日平均最高氣溫值估計該地全年的日平均最高氣溫
B.在農村調查市民的平均壽命
C.利用一塊實驗水稻田的產量估計水稻的實際產量
D.為了了解一批洗衣粉的質量情況,從倉庫中任意抽取100袋進行檢驗
D [A項中某地七月份的日平均最高氣溫值不能代表全年的日平均最高氣溫;B項中在農村調查得到的平均壽命不能代表市民的平均壽命;C項中實驗田的產量與水稻的實際產量相差可能較大,只有D項正確.]
12.國家統計局、國家殘聯決定對國家殘疾人生活、就業等情況進行調查,某同學設計的調查方案是在國家殘聯的網站上設立一個調查表,根據網站上的數據進行分析.你認為他的方案________(填“合理”或“不合理”).
不合理 [由于很多視力殘疾的人不具有上網的條件,因此所獲取的數據不具有代表性.]
13.下列試驗適合用抽樣調查方法獲取數據的序號是________.
①考察一片草皮的平均高度;
②檢查某食品單位職工的身體狀況;
③考察參加某次考試的3萬考生的數學答題情況;
④檢驗一個人的血液中白細胞的含量是否正常.
①③④ [①該問題用普查的方法很難實現,適合用抽樣調查的方法獲取數據;
②體檢,必須了解每個職工的身體狀況,不適合用抽樣調查的方法獲取數據;
③3萬考生的答題情況用普查的方法獲取數據不合適,適合用抽樣調查的方法獲取數據;
④該問題只能用抽樣調查的方法獲取數據.]
14.某地氣象臺記錄了本地6月份的日最高氣溫(如下表所示).
日最高氣溫(單位:℃) 20 22 24 25 26 28 29 30
頻數 5 4 6 6 4 2 2 1
(1)氣象臺獲取數據的途徑是什么?
(2)求本地6月份的日最高氣溫的平均數.(精確到0.1)
[解] (1)通過觀察獲取數據.
(2)本地6月份的日最高氣溫的平均數=≈24.3℃.
15.某校高中學生有900人,校醫務室想對全體高中學生的身高情況做一次調查,為了不影響正常教學活動,準備抽取50名學生作為調查對象.校醫務室若從高一年級中抽取50名學生的身高來估計全校高中學生的身高,你認為這樣的調查結果會怎樣?該問題中的總體和樣本是什么?
[解] 由于學生的身高會隨著年齡的增長而增高,校醫務室想了解全校高中學生的身高情況,在抽樣時應當關注高中各年級學生的身高,并且還要分性別進行抽查.如果只抽取高一的學生,結果一定是片面的.
這個問題涉及的調查對象的總體是某校全體高中學生的身高,其中準備抽取的50名學生的身高是樣本.9.2 用樣本估計總體
9.2.1 總體取值規律的估計
學習任務 1.理解并掌握統計圖表的畫法及應用.(直觀想象) 2.結合實例,能用樣本估計總體的取值規律.(數據分析)
情境1 某工廠生產一批產品,經調查只有10個不合格品.
情境2 某工廠生產一批產品,經調查產品不合格率為1%.
上面哪一種情境能更好地反映工廠的生產情況?
知識點1 頻率分布直方圖
畫頻率分布直方圖的步驟
(1)求極差:極差為一組數據中最大值與最小值的差.
(2)決定組距與組數:當樣本容量不超過100時,常分成5~12組,為了方便起見,一般取等長組距,并且組距應力求“取整”.
(3)將數據分組.
(4)列頻率分布表:一般分四列:分組、頻數累計、頻數、頻率.其中頻數合計應是樣本容量,頻率合計是1.
(5)畫頻率分布直方圖:橫軸表示分組,縱軸表示.小長方形的面積=組距×=頻率.各小長方形的面積總和等于1.
知識點2 其他統計圖表
統計圖表 主要應用
扇形圖 直觀描述各類數據占總數的比例
條形圖和直方圖 直觀描述不同類別或分組數據的頻數和頻率
折線圖 描述數據隨時間的變化趨勢
1.如圖所示是一個容量為1 000的樣本頻率分布直方圖.
(1)樣本數據落在范圍[5,9)的頻率為________;
(2)樣本數據落在范圍[9,13)的頻數為________.
[答案] (1)0.32 (2)360
2.下列四個圖中,用來表示不同品種的奶牛的平均產奶量最為合適的是________.(填序號)
[答案] ④
類型1 頻率分布直方圖的畫法
【例1】 為了了解中學生身體發育情況,對某中學15歲的60名女生的身高(單位:cm)進行了測量,結果如下:
154 159 166 169 159 156 166
162 158 159 156 166 160 164
160 157 151 157 161 162 158
153 158 164 158 163 158 153
157 168 162 159 154 165 166
157 155 146 151 158 160 165
158 163 163 162 161 154 165
161 162 159 157 159 149 164
168 159 153 160
列出樣本的頻率分布表,繪出頻率分布直方圖.
[解] 第一步,求極差:上述60個數據中最大為169,最小為146.故極差為169-146=23(cm).
第二步,確定組距和組數:可取組距為3 cm,
則組數為=7 ,可將全部數據分為8組.
第三步,分組:[145.5,148.5),[148.5,151.5),[151.5,154.5),[154.5,157.5),[157.5,160.5),[160.5,163.5),[163.5,166.5),[166.5,169.5].
第四步,列頻率分布表:
分組 頻率累計 頻數 頻率
[145.5,148.5) 一 1 0.017
[148.5,151.5) 3 0.050
[151.5,154.5) 正一 6 0.100
[154.5,157.5) 正 8 0.133
[157.5,160.5) 正正正 18 0.300
[160.5,163.5) 正正一 11 0.183
[163.5,166.5) 正正 10 0.167
[166.5,169.5] 3 0.050
合計 60 1.000
第五步,根據上述數據繪制頻率分布直方圖.
 繪制頻率分布直方圖的注意點
(1)各組頻率的和等于1,因此,各小矩形的面積的和也等于1.
(2)橫軸表示樣本數據,縱軸表示,這樣每一組的頻率可以用該組的組距為底、為高的小矩形的面積表示.
(3)畫頻率分布直方圖的關鍵是確定矩形的高,一般地,頻率分布直方圖中兩坐標軸上的單位長度不一致.
[跟進訓練]
1. 從某校高三學生中抽取50名參加數學競賽,成績(單位:分)分組及各組的頻數如下:
[40,50),2;[50,60),3;[60,70),10;[70,80),15;[80,90),12;[90,100],8.
(1)列出樣本的頻率分布表;
(2)畫出頻率分布直方圖;
(3)估計成績在[60,90)的學生比例.
[解] (1)頻率分布表如下,
成績分組 頻數累計 頻數 頻率
[40,50) 2 0.04
[50,60) 3 0.06
[60,70) 正正 10 0.2
[70,80) 正正正 15 0.3
[80,90) 正正 12 0.24
[90,100] 正 8 0.16
合計 50 1.00
(2)頻率分布直方圖如圖所示.
(3)學生成績在[60,90)的頻率為(0.2+0.3+0.24)×100%=74%,所以估計成績在[60,90)的學生比例為74%.
類型2 頻率分布直方圖的應用
【例2】 為了了解高一年級學生的體能情況,某校抽取部分學生進行一分鐘跳繩次數測試,將所得數據整理后,畫出頻率分布直方圖(如圖所示),圖中從左到右各小長方形的面積之比為2∶4∶17∶15∶9∶3,第二小組的頻數為12.
(1)第二小組的頻率是多少?樣本容量是多少?
(2)若次數在110次以上(含110次)為達標,則該校全體高一年級學生的達標率是多少?
[解] (1)頻率分布直方圖是以面積的形式反映了數據落在各小組內的頻率大小的,因此第二小組的頻率為=0.08.
又因為第二小組的頻率=,
所以樣本容量==150.
(2)由頻率分布直方圖可估計該校高一年級學生的達標率為×100%=88%.
 頻率分布直方圖具備的性質
(1)因為小長方形的面積=組距×=頻率,所以各小長方形的面積表示相應各組的頻率.這樣,頻率分布直方圖就以面積的形式反映了數據落在各個小組內的頻率大小.
(2)在頻率分布直方圖中,各小長方形的面積之和等于1.
(3)樣本容量=.
[跟進訓練]
2.某校100名學生期中考試語文成績(單位:分)的頻率分布直方圖如圖所示,其中成績分組區間是[50,60),[60,70),[70,80),[80,90),[90,100].
(1)求圖中a的值;
(2)若這100名學生的語文成績在某些分數段的人數x與數學成績相應分數段的人數y之比如下表所示,求數學成績在[50,90)之外的人數.
分數段 [50,60) [60,70) [70,80) [80,90)
x∶y 1∶1 2∶1 3∶4 4∶5
[解] (1)依題意得,10×(2a+0.02+0.03+0.04)=1,解得a=0.005.
(2)數學成績在[50,60)之間的人數為100×0.05=5,數學成績在[60,70)之間的人數為100×0.4×=20,數學成績在[70,80)之間的人數為100×0.3×=40,數學成績在[80,90)之間的人數為100×0.2×=25,所以數學成績在[50,90)之外的人數為100-5-20-40-25=10.
類型3 其他統計圖表
【例3】 (1)如圖所示的是某學校某年級的三個班和該年級在一學期內的六次數學測試的平均成績y關于測試序號x的圖象,為了容易看出一個班級的成績變化,將離散的點用虛線連接,根據圖象,給出下列結論:
①一班成績始終高于年級平均水平,整體成績比較好;
②二班成績不夠穩定,波動程度較大;
③三班成績雖然多次低于年級平均水平,但在穩步提升.
其中正確結論的個數為(  )
A.0   B.1   C.2   D.3
(2)已知某地區中小學生人數和近視情況分別如圖(1)和圖(2)所示,為了解該地區中小學生的近視形成原因,用按比例分配分層隨機抽樣的方法抽取了2%的學生進行調查,則樣本容量和抽取的高中生近視人數分別為________和________.
(1)D (2)200 20 [(1)由題圖可知,一班每次考試的平均成績都在年級平均成績之上,故①正確;二班平均成績的圖象高低變化明顯,成績不穩定,波動程度較大,故②正確;三班平均成績的圖象呈上升趨勢,并且圖象的大部分都在年級平均成績圖象的下方,故③正確.故選D.
(2)該地區中小學生總人數為3 500+2 000+4 500=10 000,則樣本容量為10 000×2%=200,其中抽取的高中生近視人數為2 000×2%×50%=20.]
 不同的統計圖適用的數據類型也不同.例如,條形圖適用于描述離散型的數據,直方圖適用描述連續型數據等.因此,在解決問題的過程中,要根據實際問題的特點,選擇恰當的統計圖對數據進行可視化描述,以使我們能通過圖形直觀地發現樣本數據的分布情況,進而估計總體的分布規律.
[跟進訓練]
3.如圖是根據某市3月1日至3月10日的最低氣溫(單位:℃)的情況繪制的折線統計圖,試根據折線統計圖反映的信息,繪制該市3月1日到10日最低氣溫(單位:℃)的扇形統計圖.
[解] 該城市3月1日至10日的最低氣溫(單位:℃)情況如下表:
日期 1 2 3 4 5 6 7 8 9 10
最低氣溫(℃) -3 -2 0 -1 1 2 0 -1 2 2
其中最低氣溫為-3 ℃的有1天,占10%,最低氣溫為-2 ℃的有1天,占10%,最低氣溫為-1℃的有2天,占20%,最低氣溫為0 ℃的有2天,占20%,最低氣溫為1 ℃的有1天,占10%,最低氣溫為2 ℃的有3天,占30%,扇形統計圖如圖所示.
1.某集團董事長想了解集團旗下五個超市的銷售情況,通知五個超市經理把最近一周內的銷售金額統計上報,要求既要反映一周內每天銷售金額的多少,又要反映一周內每天銷售金額的變化情況和趨勢,則最好選用的統計圖表為(  )
A.頻率分布直方圖  B.折線統計圖
C.扇形統計圖   D.統計表
B [折線統計圖的一個顯著特點就是能反映統計量的變化趨勢,所以既要反映一周內每天銷售金額的多少,又要反映一周內每天銷售金額的變化情況和趨勢,則最好選用的統計圖表為折線統計圖,故選B.]
2.如圖是甲、乙、丙、丁四組人數的扇形統計圖的部分結果,根據扇形統計圖的情況可以知道丙、丁兩組人數和為(  )
A.250   B.150
C.400   D.300
A [甲組人數是120,占30%,則總人數是=400(人).則乙組人數是400×7.5%=30(人),則丙、丁兩組人數和為400-120-30=250.]
3.學校為了調查學生在課外讀物方面的支出情況,抽取了一個容量為n的樣本,其頻率分布直方圖
如圖所示,其中支出(單位:元)在[50,60]內的學生有30人,則n的值為(  )
A.100   B.1 000   C.90   D.900
A [由題意可知,前三組的頻率之和為(0.01+0.024+0.036)×10=0.7,
∴支出在[50,60]內的頻率為1-0.7=0.3,∴n==100.]
4.小張剛參加工作時,月工資為5 000元,各種用途占比統計如圖(1)所示的條形圖.后來他加強了體育鍛煉,目前月工資的各種用途占比統計如圖(2)所示的折線圖,已知目前的月就醫費比剛參加工作時少200元,則目前小張的月工資為________元.
5 500 [小張剛參加工作時,月工資為5 000元,小張每月就醫費為5 000×15%=750(元),又已知目前的月就醫費比剛參加工作時少200元,即550元,則目前小張的月工資為=5 500(元).]
回顧本節知識,自主完成以下問題:
1.畫頻率分布直方圖的步驟是什么?
[提示] 繪制頻率分布直方圖的步驟如下:
①求極差;②決定組距與組數;③將數據分組;④列頻率分布表;⑤畫頻率分布直方圖.
2.頻率分布直方圖具備哪些性質?
[提示] ①因為小矩形的面積=組距×=頻率,所以各小矩形的面積表示相應各組的頻率.這樣,頻率分布直方圖就以面積的形式反映了數據落在各個小組內的頻率大小;
②在頻率分布直方圖中,各小矩形的面積之和等于1;
③=樣本容量.
3.常用的統計圖有哪幾種?這些統計圖對于數據分析能夠起到什么作用?
[提示] 統計圖有條形圖、扇形圖、折線圖、頻率分布直方圖;從統計圖中可以獲取有用的數據信息,并能直觀、準確地理解相關的結果.
課時分層作業(四十) 總體取值規律的估計
一、選擇題
1.一個容量為80的樣本中數據的最大值是140,最小值是51,組距是10,則應將樣本數據分為(  )
A.10組  B.9組  C.8組  D.7組
B [極差為140-51=89,而組距為10,故應將樣本數據分為9組.]
2.容量為100的樣本數據,按從小到大的順序分為8組,如下表:
組號 1 2 3 4 5 6 7 8
頻數 10 13 x 14 15 13 12 9
則第三組的頻數和頻率分別是(  )
A.14和0.14   B.0.14和14
C.和0.14   D.和
A [x=100-(10+13+14+15+13+12+9)=100-86=14,第三組的頻率為=0.14.]
3.為研究某藥品的療效,選取若干名志愿者進行臨床試驗,所有志愿者的舒張壓數據(單位:kPa)的分組區間為[12,13),[13,14),[14,15),[15,16),[16,17],將其按從左到右的順序分別編號為第一組,第二組,…,第五組,如圖是根據試驗數據制成的頻率分布直方圖.已知第一組與第二組共有20人,第三組中沒有療效的有6人,則第三組中有療效的人數為(  )
A.8  B.12  C.16  D.18
B [志愿者的總人數為=50,
∴第3組的人數為50×0.36=18,有療效的人數為18-6=12人.故選B.]
4.(多選)某城市為了解游客人數的變化規律,提高旅游服務質量,收集并整理了2020年1月至2022年12月期間月接待游客量(單位:萬人)的數據,繪制了下面的折線圖.
根據該折線圖,下列結論正確的是(  )
A.月接待游客量逐月增加
B.年接待游客量逐年增加
C.各年的月接待游客量高峰期大致在7,8月
D.各年1月至6月的月接待游客量相對于7月至12月,波動性更小,變化比較平穩
BCD [由折線圖,可知2020年8月到9月的月接待游客量在減少,A錯誤,其余選項均正確.]
5.(多選)某地區經過一年的新農村建設,農村的經濟收入增加了一倍,實現翻番.為更好地了解該地區農村的經濟收入變化情況,統計了該地區新農村建設前后農村的經濟收入構成比例,得到如下餅圖:
建設前經濟收入構成比例 建設后經濟收入構成比例
則下面結論中正確的是(  )
A.新農村建設后,種植收入減少
B.新農村建設后,其他收入增加了一倍以上
C.新農村建設后,養殖收入增加了一倍
D.新農村建設后,養殖收入與第三產業收入的總和超過了經濟收入的一半
BCD [設新農村建設前的收入為M,而新農村建設后的收入為2M,則新農村建設前種植收入為0.6M,而新農村建設后的種植收入為0.74M,所以種植收入增加了,所以A項不正確;新農村建設前其他收入為0.04M,新農村建設后其他收入為0.1M,故增加了一倍以上,所以B項正確;新農村建設前,養殖收入為0.3M,新農村建設后為0.6M,所以增加了一倍,所以C項正確;新農村建設后,養殖收入與第三產業收入的綜合占經濟收入的30%+28%=58%>50%,所以超過了經濟收入的一半,所以D正確.故選BCD.]
二、填空題
6.甲、乙兩個城市2023年4月中旬每天的最高氣溫統計圖如圖所示,則這9天里,氣溫比較穩定的是________(選填“甲”或“乙”)城市.
甲 [這9天里,乙城市的最高氣溫約為35 ℃,最低氣溫約為20 ℃;甲城市的最高氣溫約為25 ℃,最低氣溫約為21 ℃.故甲城市氣溫較穩定.]
7.一個樣本的容量為72,分成5組,已知第一、五組的頻數都為8,第二、四組的頻率都為,則第三組的頻數為________.
24 [因為頻率=,所以第二、四組的頻數都為72×=16.所以第三組的頻數為72-2×8-2×16=24.]
8.如圖所示是某校高一年級學生到校方式的條形統計圖,根據圖形可得出騎自行車人數占高一年級學生總人數的百分比為________.
30% [某校高一年級學生總數為60+90+150=300(人),騎自行車人數為90,所以騎自行車人數占高一年級學生總數的百分比為×100%=30%.]
三、解答題
9.某公司為了提高職工的健身意識,鼓勵大家進行健步運動,要求200名職工每天晚上9:30上傳手機計步截圖,對于步數超過10 000的職工予以獎勵,圖(1)為甲、乙兩名職工在某一星期內的運動步數統計圖,圖(2)為根據這星期內某一天全體職工的運動步數作出的頻率分布直方圖.
(1)根據頻率分布直方圖,求出該天運動步數不少于15 000的人數;
(2)如果當天甲的排名為130,乙的排名為40,試判斷作出的是星期幾的頻率分布直方圖.
[解] (1)由圖(2)可知,(0.02+0.03+0.04+0.06+m)×5=1,解得m=0.05,
∴該天運動步數不少于15 000的人數為
(0.05+0.03)×5×200=80.
(2)40÷200=0.2,130÷200=0.65.
假設甲的步數為x,乙的步數為y,
由頻率分布直方圖可得0.2-0.15=(20-y)×0.05,解得y=19.
(1-0.65)-0.3=(x-10)×0.06,解得x=≈10.833,故作出的是星期二的頻率分布直方圖.
10.(多選)樣本容量為100的樣本,其數據分布在[2,18]內,將樣本數據分為4組:[2,6),[6,10),[10,14),[14,18],得到頻率分布直方圖如圖所示,則下列說法中正確的是(  )
A.樣本數據分布在[6,10)內的頻率為0.32
B.樣本數據分布在[10,14)內的頻數為40
C.樣本數據分布在[2,10)內的頻數為40
D.估計總體數據大約有10%分布在[10,14)內
ABC [對于A,由題圖可得,樣本數據分布在[6,10)內的頻率為0.08×4=0.32,故A正確;對于B,由題圖可得,樣本數據分布在[10,14)內的頻數為100×0.1×4=40,故B正確;對于C,由題圖可得,樣本數據分布在[2,10)內的頻數為100×(0.02+0.08)×4=40,故C正確;對于D,由題圖可估計,總體數據分布在[10,14)內的比例約為0.1×4=0.4=40%,故D錯誤.]
11. (多選)(2022·泰安期末)旅游城市為向游客介紹本地的氣溫情況,繪制了一年中各月平均最高氣溫和平均最低氣溫的雷達圖.圖中A點表示十月的平均最高氣溫約為15 ℃,B點表示四月的平均最低氣溫約為5 ℃,下面敘述正確的是(  )
A.各月的平均最低氣溫都在0 ℃以上
B.八月的平均溫差比十一月的平均溫差大
C.平均最高氣溫高于20℃的月份有4個
D.四月和十一月的平均最低氣溫基本相同
ABD [對于A,由圖可知各月的平均最低氣溫都在0 ℃以上,故A正確;對于B,由圖知八月的平均最高氣溫點與平均最低氣溫點之間的距離長度大于十一月的平均最高氣溫點與平均最低氣溫點之間的距離,故B正確,對于C,平均最高氣溫高于20℃的月份有八月和七月,只有兩個月份,故C錯誤;對于D,四月和十一月的平均最低氣溫均為5 ℃,D正確.故選ABD.]
12.(多選)隨著人口增多,對住房要求也隨之而來,而選擇購買商品房時,住戶對商品房的戶型結構越來越重視,因此某商品房調查機構隨機抽取n名市民,針對其居住的戶型結構和滿意度進行了調查,如圖1調查的所有市民中四居室共200戶,所占比例為,二居室住戶占.如圖2是用分層隨機抽樣的方法從所有調查的市民的滿意度問卷中,抽取10%的調查結果繪制成的統計圖,則下列說法錯誤的是(  )
A.樣本容量為70
B.樣本中三居室住戶共抽取了25戶
C.根據樣本可估計對四居室滿意的住戶有70戶
D.樣本中對三居室滿意的有15戶
ABC [A選項,總體容量為600,樣本容量為600×10%=60,故選項A錯誤;
B選項,樣本中三居室住戶共抽取300×10%=30(戶),故選項B錯誤;
C選項,對四居室滿意的住戶共有200×40%=80(戶),故選項C錯誤;
D選項,樣本中三居室住戶有300×10%=30(戶),
對三居室滿意的住戶有30×50%=15(戶),故選項D正確.故選ABC.]
13.為了解學生的身體狀況,某校隨機抽取了一批學生測量體重.經統計,這批學生的體重數據(單位:千克)全部介于45至70之間.將數據分成以下5組:第1組[45,50),第2組[50,55),第3組[55,60),第4組[60,65),第5組[65,70],得到如圖所示的頻率分布直方圖,則a=________.現采用分層隨機抽樣的方法,從第3,4,5組中隨機抽取6名學生,則第3,4,5組抽取的學生人數依次為________.
0.04 3,2,1 [由(0.01+0.02+a+0.06+0.07)×5=1,得a=0.04.
設第3,4,5組抽取的學生人數依次為x,y,z,
則x∶y∶z=0.06∶0.04∶0.02=3∶2∶1,
又x+y+z=6,所以x=3,y=2,z=1.]
14.某省有關部門要求各中小學要把“每天鍛煉一小時”寫入課程表,為了響應這一號召,某校圍繞著“你最喜歡的體育活動項目是什么?(只寫一項)”的問題,對在校學生進行了隨機抽樣調查,從而得到一組數據.圖1是根據這組數據繪制的柱形圖.請結合柱形圖回答下列問題:
(1)該校對多少名學生進行了抽樣調查?
(2)本次抽樣調查中,最喜歡籃球活動的有多少人?占被調查人數的百分比是多少?
(3)若該校九年級共有200名學生,圖2是根據各年級學生人數占全校學生總人數的百分比繪制的扇形圖,請你估計全校學生中最喜歡跳繩活動的人數約為多少?
[解] (1)由圖1知4+8+10+18+10=50(名),所以該校對50名學生進行了抽樣調查.
(2)本次調查中,最喜歡籃球活動的有18人,占被調查人數的×100%=36%.
(3)1-(30%+26%+24%)=20%,200÷20%=1 000(人),×100%×1 000=160(人),所以估計全校學生中最喜歡跳繩活動的人數約為160人.
15.為了了解學生參加體育活動的情況,學校對學生進行隨機抽樣調查,其中一個問題是“你平均每天參加體育活動的時間是多少?”,共有4個選項:①1.5小時以上;②1~1.5小時;③0.5~1小時;④0.5小時以下.如圖是根據調查結果繪制的兩幅不完整的統計圖,請你根據統計圖提供的信息解答以下問題:
(1)本次一共調查了多少名學生?
(2)在圖(1)中將②對應的部分補充完整;
(3)若該校有3 000名學生,試估計全校學生平均每天參加體育活動的時間在0.5小時以下的人數.
[解] (1)從題圖中知,選①的共60名學生,占總學生數的百分比為30%,所以總學生數為60÷30%=200,即本次一共調查了200名學生.
(2)被調查的學生中,選②的有200-60-30-10=100名,補充完整的條形統計圖如圖所示.
(3)3 000×5%=150(名),估計全校有150名學生平均每天參加體育活動的時間在0.5小時以下.9.2.2 總體百分位數的估計
學習任務 結合實例,能用樣本估計百分位數,理解百分位數的統計含義.(數學抽象、數學運算)
某省數學考試結果揭曉,0.8%的同學需要補考.
問題:那么如何確定需要補考的分數線呢?
知識點 百分位數
1.第p百分位數的定義
一般地,一組數據的第p百分位數是這樣一個值,它使得這組數據中至少有p%的數據小于或等于這個值,且至少有(100-p)%的數據大于或等于這個值.
1.“這次數學測試成績的第70百分位數是85分”,這句話是什么意思?
[提示] 有70%的同學數學測試成績小于或等于85分.
2.計算一組n個數據的第p百分位數的步驟
第1步,按從小到大排列原始數據.
第2步,計算i=n×p%.
第3步,若i不是整數,而大于i的比鄰整數為j,則第p百分位數為第j項數據;若i是整數,則第p百分位數為第i項與第(i+1)項數據的平均數.
2.某組數據的第p百分位數在此組數據中一定存在嗎?為什么?
[提示] 不一定.因為按照計算第p百分位數的步驟,第2步計算所得的i=n×p%,如果是整數,則第p百分位數為第i項與第(i+1)項數據的平均數,若第i項與第(i+1)項數據不相等,則第p百分位數在此組數據中就不存在.
3.四分位數
25%,50%,75%這三個分位數把一組由小到大排列后的數據分成四等份,因此稱為四分位數.
數據7.0,8.4,8.4,8.4,8.6,8.7,9.0,9.1的第30百分位數是________.
8.4 [因為8×30%=2.4,故第30百分位數是第三項數據8.4.]
類型1 一組數據的第p百分位數
【例1】 從某珍珠公司生產的產品中,任意抽取12顆珍珠,得到它們的質量(單位:g)如下:
7.9,9.0,8.9,8.6,8.4,8.5,8.5,8.5,9.9,7.8,8.3,8.0.
(1)分別求出這組數據的第25,75,95百分位數;
(2)請你找出珍珠質量較小的前15%的珍珠質量.
[解] (1)將所有數據從小到大排列,得
7.8,7.9,8.0,8.3,8.4,8.5,8.5,8.5,8.6,8.9,9.0,9.9,
因為共有12個數據,所以12×25%=3,12×75%=9,12×95%=11.4,則第25百分位數是=8.15,第75百分位數是=8.75,第95百分位數是第12個數據為9.9.
(2)因為共有12個數據,所以12×15%=1.8,則第15百分位數是第2個數據為7.9.
即產品質量較小的前15%的產品有2個,它們的質量分別為7.8 g,7.9 g.
 百分位數是用于衡量數據位置的度量,它提供了有關數據在最小值與最大值之間位置的信息.需注意,在求百分位數時,一定要將數據按照從小到大的順序排列.
[跟進訓練]
1.已知甲、乙兩組按順序排列的數據:甲組:27,28,37,m,40,50;乙組:24,n,34,43,48,52;若這兩組數據的第30百分位數、第50百分位數分別對應相等,則等于(  )
A.   B.   C.   D.
B [因為30%×6=1.8,50%×6=3,所以第30百分位數為n=28,第50百分位數為,所以m=40,所以,故選B.]
類型2 頻率分布直方圖計算百分位數
【例2】 為了了解一片經濟林的生長情況,隨機抽測了其中60株樹木的底部周長(單位:cm),所得數據均在區間[80,130]上,其頻率分布直方圖如圖所示,你能估計一下60株樹木的第50百分位數和第75百分位數嗎?
[解] 由題意知分別落在各區間上的頻數
在[80,90)上為60×0.015×10=9,
在[90,100)上為60×0.025×10=15,
在[100,110)上為60×0.030×10=18,
在[110,120)上為60×0.020×10=12,
在[120,130]上為60×0.010×10=6.
從以上數據可知第50百分位數一定落在區間[100,110)上,由100+10×≈103.3;
第75百分位數一定落在區間[110,120)上,由110+10×=112.5.
綜上可知,第50百分位數和第75百分位數分別為103.3 cm,112.5 cm.
 頻率分布直方圖中第p百分位數的計算
(1)確定百分位數所在的區間[a,b).
(2)確定小于a和小于b的數據所占的百分比分別為fa%,fb%,則第p百分位數為.
[跟進訓練]
2.某學校組織學生參加數學測試,成績的頻率分布直方圖如圖,數據的分組依次為[20,40),[40,60),[60,80),[80,100],則60分為成績的第________百分位數.
30 [因為[20,40),[40,60)的頻率為(0.005+0.01)×20=0.3,所以60分為成績的第30百分位數.]
3.某省教育廳為了了解和掌握2023年高考考生的實際答卷情況,隨機地取出了100名考生的數學成績(單位:分),將數據分成了11組,制成了如圖所示的頻率分布表:
分組 頻數 頻率
[80,85) 1 0.01
[85,90) 2 0.02
[90,95) 4 0.04
[95,100) 14 0.14
[100,105) 24 0.24
[105,110) 15 0.15
[110,115) 12 0.12
[115,120) 9 0.09
[120,125) 11 0.11
[125,130) 6 0.06
[130,135] 2 0.02
合計 100 1
(1)求樣本數據的第60,80百分位數;
(2)估計2023年高考考生的數學成績的90%分位數.
[解] 從頻率分布表得,前六組的頻率之和為
0.01+0.02+0.04+0.14+0.24+0.15=0.60,
前七組的頻率之和為0.60+0.12=0.72,
前八組的頻率之和為0.72+0.09=0.81,
前九組的頻率之和為0.81+0.11=0.92.
(1)由前六組的頻率之和為0.60,得樣本數據的第60百分位數為110,樣本數據的第80百分位數一定在第八組[115,120)內,由115+5×≈119.4,估計樣本數據的第80百分位數約為119.4.
(2)由前八組的頻率之和為0.81,前九組的頻率之和為0.92,知90%分位數一定在第九組[120,125)內,由120+5×≈124.1,估計2023年高考考生的數學成績的90%分位數為124.1分.
1.對于考試成績的統計,如果你的成績處在第95百分位數上,以下說法正確的是(  )
A.你得了95分
B.你答對了95%的試題
C.95%的參加考試者得到了和你一樣的考分或還要低的分數
D.你排名在第95名
C [第95百分位數是指把數據從小到大排序,有至少95%數據小于或等于這個數,至少有5%的數據大于或等于這個值,只有C正確.]
2.已知一組數據按從小到大排列為1,1,2,2,3,3,4,5,7,7,8,10,那么數據的25%分位數、75%分位數分別是(  )
A.3,9  B.2,7  C.9,3  D.7,2
B [因為這組數據有12個數,所以12×25%=3,12×75%=9,所以數據的25%分位數是=2,數據的75%分位數是=7.故選B.]
3.某組數據的中位數是2 023,那么它的第50百分位數是________.
2 023 [某組數據的中位數是2 023,第50百分位數就是中位數,它的第50百分位數是2 023.]
4.某市舉行“中學生詩詞大賽”,某校有1 000名學生參加了比賽,從中抽取100名學生,統計他們的成績(單位:分),并進行適當的分組(每組為左閉右開的區間),得到的頻率分布直方圖如圖所示,則估計該校學生成績的80%分位數為________.
122 [根據頻率分布直方圖可知,成績在130分以下的學生所占比例為1-0.005 0×20=0.9,成績在110分以下的學生所占比例為1-(0.012 5+0.005 0)×20=0.65,因此80%分位數一定位于[110,130)內,由110+20×=122,故可估計該校學生成績的80%分位數為122.]
回顧本節知識,自主完成以下問題:
1.百分位數告訴我們什么信息?
[提示] 對于無大量重復的數據,第p百分位數將它分為兩個部分,大約有p%的數據項的值比第p百分位數小,而大約有(100-p)%的數據項的值比第p百分位數大.
2.計算第p百分位數時應注意什么?
[提示] 對于數據型的第p百分位數計算時應注意以下兩點:
(1)求百分位數時,一定要將數據按照從小到大的順序排列;
(2)計算i=n×p%后要弄清i是整數還是非整數.
對于由頻率分布直方圖求百分位數時應注意頻率分布直方圖中小矩形的面積,就是數據確定在哪個區間.
課時分層作業(四十一) 總體百分位數的估計
一、選擇題
1.(多選)在秋季運動會的跳遠比賽中,張明是選手中跳得最遠的,李華是選手中跳得最近的,總共有20名選手,則下列描述中正確的有(  )
A.張明跳遠成績的百分位數約為100 
B.張明跳遠成績的百分位數約為20
C.李華跳遠成績的百分位數約為0 
D.李華跳遠成績的百分位數約為6
AC [對于A,跳遠成績從小到大排序,因為張明是選手中跳得最遠的,即至少有100%數據小于或等于張明的成績,至少有0%的數據大于或等于這個值,所以張明跳遠成績的百分位數約為100,故A正確, B不正確;對于C,跳遠成績從小到大排序,因為李華是選手中跳得最近的,即有至少0%數據小于或等于李華的成績,至少有100%的數據大于或等于這個值,所以李華跳遠成績的百分位數約為0,故C正確,D不正確.故選AC.]
2.數據12,14,15,17,19,23,27,30的第70百分位數是(  )
A.14   B.17   C.19   D.23
D [因為8×70%=5.6,故70%分位數是第6項數據23.]
3.以下數據為參加數學競賽決賽的15人的成績:
78,70,72,86,88,79,80,81,94,84,56,98,83,90,91,
則這15人成績的第80百分位數是(  )
A.90   B.90.5   C.91   D.91.5
B [把成績按從小到大的順序排列為:56,70,72,78,79,80,81,83,84,86,88,90,91,94,98,因為15×80%=12,所以這15人成績的第80百分位數是=90.5.]
4.數據3.2,3.4,3.8,4.2,4.3,4.5,x,6.6的第65百分位數是4.5,則實數x的取值范圍是(  )
A.[4.5,+∞)   B.[4.5,6.6)
C.(4.5,+∞)   D.(4.5,6.6]
A [因為8×65%=5.2,這組數據的第65百分位數是第6項數據4.5,則x≥4.5,故選A.]
5.某棉紡廠為了了解一批棉花的質量,從中隨機抽取了100根棉花纖維的長度(棉花纖維的長度是棉花質量的重要指標),所得數據都在區間[5,40]之間,其頻率分布直方圖如圖所示.估計棉花纖維的長度的樣本數據的90%分位數是(  )
A.32.5 mm   B.33 mm
C.33.5 mm   D.34 mm
A [棉花纖維的長度在30 mm以下的比例為
(0.01+0.01+0.04+0.06+0.05)×5=0.85=85%,
在35 mm以下的比例為85%+10%=95%,
因此,90%分位數一定位于[30,35)內,
由30+5×=32.5,可以估計棉花纖維的長度的樣本數據的90%分位數是32.5 mm.]
二、填空題
6.為了調查某廠工人生產某種產品的能力,隨機抽查了40位工人某天生產該產品的數量得到頻率分布直方圖如圖所示.
估計樣本數據的50%分位數為________.
62.5 [依題意,產品數量在[45,55)的頻率為0.020×10=0.2,前兩組頻率和為(0.020+0.040)×10=0.6,所以50%分位數應位于[55,65)內,由55+10×=62.5.所以估計樣本數據的50%分位數為62.5.]
7.已知30個數據的第60百分位數是8.2,這30個數據從小到大排列后第18個數據是7.8,則第19個數據是________.
8.6 [由于30×60%=18,設第19個數據為x,則=8.2,解得x=8.6,即第19個數據是8.6.]
8.某年級120名學生在一次百米測試中,成績全部介于13秒與18秒之間.將測試結果分成5組:[13,14),[14,15),[15,16),[16,17),[17,18],得到如圖所示的頻率分布直方圖.如果從左到右的5個小矩形的面積之比為1∶3∶7∶6∶3,那么成績的70%分位數約為________秒.
16.5 [設成績的70%分位數為x,因為=0.55,=0.85,所以x∈ [16,17),所以0.55+(x-16)×=0.70,解得x=16.5秒.]
三、解答題
9.在①55%分位數,②眾數這兩個條件中任選一個,補充在下面問題中的橫線上,并解答問題.維生素C又叫L-抗壞血酸,是一種水溶性維生素,是高等靈長類動物與其他少數生物的必需營養素.現從獼猴桃、柚子兩種食物中測得每100克維生素C的含量(單位:mg)各10個數據如下,其中獼猴桃的一個數據x被污損.
獼猴桃:104,119,106,102,132,107,113,134,116,x;
柚子:121,113,109,122,114,116,132,121,131,117.
已知x等于柚子的10個數據中的________.
(1)求x的值與獼猴桃的數據的中位數;
(2)分別計算上述獼猴桃、柚子兩種食物中測得每100克維生素C含量的平均數.
[解] (1)柚子的10個數據按照從小到大的順序排列為:109,113,114,116,117,121,121,122,131,132.
選①,因為10×55%=5.5,所以柚子10個數據的55%分位數為第6個數,即121,所以x=121.
獼猴桃的10個數據按照從小到大的順序排列為:102,104,106,107,113,116,119,121,132,134,則中位數為(113+116)=114.5.
選②,因為柚子的10個數據的眾數為121,所以x=121.
獼猴桃的10個數據按照從小到大的順序排列為:102,104,106,107,113,116,119,121,132,134,則中位數為(113+116)=114.5.
(2)由(1)得每100克獼猴桃維生素C含量的平均數為×(102+104+106+107+113+116+119+121+132+134)=115.4 mg,
每100克柚子維生素C含量的平均數為×(109+113+114+116+117+121+121+122+131+132)=119.6 mg.
10.某廠10名工人在一小時內生產零件的個數分別是15,17,14,10,15,17,17,16,14,12,設該組數據的平均數為a,第50百分位數為b,則有(  )
A.a=13.7,b=15.5   B.a=14, b=15
C.a=12, b=15.5   D.a=14.7, b=15
D [把該組數據按從小到大的順序排列為10,12,14,14,15,15,16,17,17,17,其平均數a=×(10+12+14+14+15+15+16+17+17+17)=14.7,第50百分位數為b==15.]
11.某城市抽樣了100戶居民月均用水量(單位:t),并作出頻率分布表如表,
分組 頻數 頻率
[1,1.5) 6 0.060
[1.5,2) 18 0.180
[2,2.5) 44 0.440
[2.5,3) 16 0.160
[3,3.5) 11 0.110
[3.5,4] 5 0.050
則第80百分位數為(  )
A.2.625 B.2.750
C.2.875 D.3.125
C [∵0.06+0.18+0.44=0.68,0.06+0.18+0.44+0.16=0.84,
∴第80百分位數位于[2.5,3),則第80百分位數為2.5+×0.5=2.875.故選C.]
12.(多選)一組數據為6,47,49,15,42,41,7,39,43,40,36,這組數據的一個四分位數是15,則它是(  )
A.第一四分位數 B.下四分位數
C.第三四分位數 D.上四分位數
AB [將數據由小到大排列為6,7,15,36,39,40,41,42,43,47,49,共11項.由11×25%=2.75,故15是第一四分位數或下四分位數.]
13.如圖是某市2023年4月1日至4月7日每天最高、最低氣溫的折線統計圖,這7天的日最高氣溫的第10百分位數為_______,日最低氣溫的第80百分位數為_______.
24 16 [由折線圖可知,把日最高氣溫按照從小到大排序,得24,24.5,24.5,25,26,26,27.
因為共有7個數據,所以7×10%=0.7,不是整數,所以這7天日最高氣溫的第10百分位數是第1個數據,為24.
把日最低氣溫按照從小到大排序,得12,12,13,14,15,16,17.
因為共有7個數據,所以7×80%=5.6,不是整數,所以這7天日最低氣溫的第80百分位數是第6個數據,為16.]
14.從某保險公司的推銷員中隨機抽取50名,統計這些推銷員某月的月銷售額(單位:千元),由統計結果得如下頻數分布表:
月銷售 額分組 [12.25, 14.75) [14.75, 17.25) [17.25, 19.75) [19.75, 22.25) [22.25, 24.75]
頻數 4 10 24 8 4
(1)作出這些數據的頻率分布直方圖;
(2)根據以上抽樣調查數據,公司將推銷員的月銷售指標確定為17.875千元,試判斷是否有60%的推銷員能夠完成該銷售指標.
[解] (1)根據題意作出頻率分布表:
月銷售 額分組 [12.25,14.75) [14.75,17.25) [17.25,19.75) [19.75,22.25) [22.25,24.75]
頻數 4 10 24 8 4
頻率 0.08 0.20 0.48 0.16 0.08
作出頻率分布直方圖如圖所示.
(2)由(1)得,月銷售額小于17.875千元的頻率為0.08+0.2+×0.48=0.4,所以有60%的推銷員能夠完成該銷售指標.
15.某市為了鼓勵市民節約用電,實行“階梯式”電價,將該市每戶居民的月用電量劃分為三檔,月用電量不超過200千瓦時的部分按0.5元/千瓦時收費,超過200千瓦時但不超過400千瓦時的部分按0.8元/千瓦時收費,超過400千瓦時的部分按1.0元/千瓦時收費.
(1)求某戶居民用電費用y(單位:元)關于月用電量x(單位:千瓦時)的函數解析式;
(2)為了了解居民的用電情況,通過抽樣獲得了今年1月份100戶居民每戶的用電量,統計分析后得到如圖所示的頻率分布直方圖.若這100戶居民中,今年1月份用電費用不超過260元的占80%,求a,b的值.
(3)根據(2)中求得的數據計算用電量的75%分位數.
[解] (1)當0≤x≤200時,y=0.5x;
當200當x>400時,y=0.5×200+0.8×200+1.0×(x-400)=x-140.
所以y與x之間的函數解析式為y=
(2)由(1)可知,當y=260時,x=400,即用電量不超過400千瓦時的占80%,
結合頻率分布直方圖可知
解得a=0.001 5,b=0.002 0.
(3)設75%分位數為m,
因為用電量低于300千瓦時的所占比例為(0.001+0.002+0.003)×100=60%,
用電量不超過400千瓦時的占80%,
所以75%分位數在[300,400)內,設為m,
所以0.6+(m-300)×0.002=0.75,解得m=375千瓦時,即用電量的75%分位數為375千瓦時.9.2.3 總體集中趨勢的估計
學習任務 1.結合實例,能用樣本估計總體的集中趨勢參數(平均數、中位數、眾數).(數學抽象、數據分析) 2.理解集中趨勢參數的統計含義.(直觀想象)
甲、乙兩位同學相約晚上在某餐館吃飯.他們分別在A,B兩個網站查看同一家餐館的好評率.甲在網站A查到的好評率是98%,而乙在網站B查到的好評率是85%.綜合考慮這兩個網站的信息,應該如何得到這家餐館的總好評率?
知識點 眾數、中位數、平均數
1.眾數、中位數和平均數的定義
(1)眾數:一組數據中出現次數最多的數.
(2)中位數:一組數據按大小順序排列后,處于中間位置的數.如果個數是偶數,則取中間兩個數據的平均數.
(3)平均數:一組數據的和除以數據個數所得到的數.
1.中位數一定是樣本數據中的一個數嗎?
[提示] 不一定.一組數據按大小順序排列后,如果有奇數個數據,處于中間位置的數是中位數;如果有偶數個數據,則中間兩個數據的平均數是中位數.
2.一組數據的眾數一定唯一嗎?
[提示] 不一定,數據的眾數可能有一個,也可能有多個.
2.頻率分布直方圖中的眾數、中位數、平均數
(1)單峰頻率分布直方圖中的平均數與中位數
①如果直方圖的形狀是對稱的,那么平均數與中位數大體上差不多.
②如果直方圖在右邊“拖尾”,那么平均數大于中位數;如果直方圖在左邊“拖尾”,那么平均數小于中位數,也就是說,和中位數相比,平均數總是在“長尾巴”那邊.
(2)在頻率分布直方圖中,眾數是最高矩形底邊中點的橫坐標;中位數左邊和右邊的直方圖的面積應該相等;樣本平均數的估計值等于頻率分布直方圖中每個小矩形底邊中點的橫坐標與小矩形的面積的乘積之和.
思考辨析(正確的打“√”,錯誤的打“×”)
(1)平均數、眾數與中位數從不同的角度描述了一組數據的集中趨勢. (  )
(2)樣本的平均數是頻率分布直方圖中最高長方形的中點對應的數據. (  )
(3)若改變一組數據中其中的一個數,則這組數據的平均數、中位數、眾數都會發生改變. (  )
[答案] (1)√ (2)× (3)×
類型1 一組數據的平均數、中位數和眾數
【例1】 已知10名工人生產同一零件,生產的件數分別是16,18,15,11,16,18,18,17,15,13,設其平均數為a,中位數為b,眾數為c,則有(  )
A.a>b>c   B.a>c>b
C.c>a>b   D.c>b>a
D [由題意得a=(16+18+15+11+16+18+18+17+15+13)==15.7,中位數為16,眾數為18,則b=16,c=18,∴c>b>a.]
 平均數、眾數、中位數的計算方法
平均數一般是根據公式來計算的;計算中位數時,可先將這組數據按從小到大或從大到小的順序排列,再根據相關數據的總數是奇數還是偶數而定;眾數是看出現次數最多的數.
[跟進訓練]
1.(1)已知一組數據x1,x2,x3,x4,x5的平均數是2,那么另一組數據2x1-3,2x2-3,2x3-3,2x4-3,2x5-3的平均數為(  )
A.1   B.2   C.3   D.4
(2)某籃球隊甲、乙兩名運動員練習罰球,每人練習10組,每組罰球40個,命中個數如下所示:
甲:20,22,27,8,12,13,37,25,24,26;
乙:14,9,13,18,19,20,23,21,21,11.
則下面結論中正確的是________(填序號).
①甲的極差是29;②乙的眾數是21;③甲的平均數為21.4;④甲的中位數是24.
(1)A (2)①②③ [(1)因為一組數據x1,x2,x3,x4,x5的平均數是2,所以另一組數據2x1-3,2x2-3,2x3-3,2x4-3,2x5-3的平均數為2×2-3=1.故選A.
(2)把兩組數據按從小到大的順序排列,得
甲:8,12,13,20,22,24,25,26,27,37
乙:9,11,13,14,18,19,20,21,21,23
故甲的最大值為37,最小值為8,則極差為29,所以①正確;乙中出現最多的數據是21,所以②正確;甲的平均數為×(8+12+13+20+22+24+25+26+27+37)=21.4,所以③正確;甲的中位數為×(22+24)=23,故④不正確.]
類型2 頻率分布直方圖中的平均數、中位數和眾數
【例2】 某校從參加高一年級期末考試的學生中抽出60名,將其物理成績(均為整數)分成六段[40,50),[50,60),…,[90,100]后,畫出如圖所示的頻率分布直方圖.觀察圖中的信息,回答下列問題:
(1)估計這次考試的物理成績的眾數m與中位數n(結果保留一位小數);
(2)估計這次考試的物理成績的及格率(60分及以上為及格)和平均分.
[解] (1)眾數是頻率分布直方圖中最高小矩形底邊中點的橫坐標,所以眾數為m=75.0.
前3個小矩形面積和為0.01×10+0.015×10+0.015×10=0.4<0.5,
前4個小矩形面積和為0.4+0.03×10=0.7>0.5,
所以中位數n=70+≈73.3.
(2)依題意,60及60以上的分數在第三、四、五、六組,頻率和為(0.015+0.03+0.025+0.005)×10=0.75,
所以估計這次考試的物理成績的及格率是75%.
利用組中值估算抽樣學生的平均分為45×f1+55×f2+65×f3+75×f4+85×f5+95×f6=45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71.
所以估計這次考試的物理成績的平均分是71分.
 用頻率分布直方圖估計眾數、中位數、平均數
(1)眾數:取最高小長方形底邊中點的橫坐標作為眾數.
(2)中位數:在頻率分布直方圖中,把頻率分布直方圖劃分為左右兩個面積相等的部分的分界線與x軸交點的橫坐標稱為中位數.
(3)平均數:平均數是頻率分布直方圖的“重心”,等于頻率分布直方圖中每個小矩形的面積乘以小矩形底邊中點的橫坐標之和.
[跟進訓練]
2.某中學舉行電腦知識競賽,現將高一參賽學生的成績進行整理后分成五組繪制成如圖所示的頻率分布直方圖.
求:(1)成績的眾數、中位數的估計值;
(2)平均成績的估計值(同一組中的數據用該組區間的中點值作代表).
[解] (1)由圖可知眾數的估計值為65分.
設中位數為x,
又∵第一個小矩形的面積為0.3,
則0.3+(x-60)×0.04=0.5,得x=65.
∴中位數的估計值為65分.
(2)依題意,平均成績為55×0.3+65×0.4+75×0.15+85×0.1+95×0.05=67(分),
∴平均成績的估計值為67分.
類型3 平均數、中位數和眾數的實際應用
【例3】 (源自湘教版教材)某公司全體職工的月工資如下:
月工資/元 18 000 12 000 8 000 6 000 4 000 2 500 2 000 1 500 1 200
人數 1 (總經理) 2 (副總經理) 3 4 10 20 22 12 6
(1)試求出該公司月工資數據中的眾數、中位數和平均數;
(2)你認為用平均數、中位數或眾數中的哪一個更能反映該公司的工資水平?
(3)對于職工月工資數據的平均數、中位數和眾數,你認為該公司總經理、普通員工及應聘者將分別關注哪一個?說說你的理由.
[解] (1)在上述80個數據中,2 000出現了22次,出現的次數最多,因此這組數據的眾數是2 000.
把這80個數據按從小到大的順序排列后,位于中間的數是2 000,2 500,因此這組數據的中位數是=2 250.
這組數據的平均數為=3 115.
(2)由于大多數員工的月工資達不到平均數3 115,顯然用平均數作為該公司員工月工資的代表值并不
合適;眾數2 000及中位數2 250在一定程度上代表了大多數人的工資水平,較能反映月工資水平的實際情況.
(3)公司總經理最關心的是月工資的總額,所以他關注的是平均數;普通員工關注的是自己的收入在本公司職工群體中的位置,中位數能幫助職工了解自己的工資收入處于什么樣的水平;應聘者最想知道公司發給大多數員工的工資數額,這也是一般應聘者將會拿到的工資,因此應聘者關注的是該公司月工資的眾數.
 平均數、中位數、眾數應用問題的兩個關注點
(1)平均數與每一個數據都有關,可以反映更多的總體信息,但受極端值的影響大;中位數是樣本數據所占頻率的等分線,不受幾個極端值的影響;眾數只能體現數據的最大集中點,無法客觀反映總體特征.
(2)當平均數大于中位數時,說明數據中存在許多較大的極端值.
[跟進訓練]
3.如表是五年級兩個班各11名同學1分鐘仰臥起坐的成績(單位:次):
一班 19 33 26 29 28 33 34 35 33 33 30
二班 25 27 29 28 29 30 29 35 29 30 29
(1)這兩組數據的平均數,中位數和眾數各是多少?
(2)你認為哪個數表示兩個班的成績更合適?
[解] (1)一班平均數:(19+33+26+29+28+33+34+35+33+33+30)÷11=333÷11≈30.27(次),
一班數據從小到大排列為:19,26,28,29,30,33,33,33,33,34,35,
所以一班中位數為33次,
33出現的次數最多,眾數是33次;
二班平均數:(25+27+29+28+29+30+29+35+29+30+29)÷11=320÷11≈29.09(次),
二班數據從小到大排列為:25,27,28,29,29,29,29,29,30,30,35,
所以二班的中位數是29次,
29出現的次數最多,所以二班的眾數是29次.
(2)運用平均數表示兩個班的成績更合適.
1.(多選)在一次體育測試中,某班6名同學的成績(單位:分)分別為66,83,87,83,77,96.關于這組數據,下列說法正確的是(  )
A.眾數是83   B.中位數是83
C.極差是30   D.平均數是83
ABC [由于83出現的次數最多,所以眾數是83,故A正確;把數據按從小到大排列為66,77,83,83,87,96,中間兩個數為83,83,所以中位數是83,故B正確;極差是96-66=30,故C正確;由于平均數為(66+83+87+83+77+96)÷6=82,故D錯誤.]
2.下列關于平均數、中位數、眾數的說法中正確的是(  )
A.中位數可以準確地反映出總體的情況
B.平均數可以準確地反映出總體的情況
C.眾數可以準確地反映出總體的情況
D.平均數、中位數、眾數都有局限性,都不能準確地反映出總體的情況
D [中位數不受少數極端值的影響,對極端值的不敏感也會成為缺點,故A錯誤;平均數可以較好地反映樣本數據全體的信息,但是樣本數據質量較差時,使用平均數描述數據的中心位置就可能會與實際情況產生較大差異,故B錯誤;眾數體現了樣本數據的最大集中點,但對其他數據信息的忽略使得無法客觀反映總體特征,故C錯誤;綜上可知,D正確.]
3.已知一組數據按從小到大排列為-1,0,4,x,6,15,且這組數據的中位數是5,那么數據的眾數是________,平均數是________.
6 5 [因為-1,0,4,x,6,15的中位數是5,所以(4+x)=5,x=6.所以這組數據的眾數是6,平均數是(-1+0+4+6+6+15)=5.]
4.某校從參加高二年級學業水平測試的學生中抽出80名學生,其數學成績(均為整數)的頻率分布直方圖如圖所示.
(1)這次測試數學成績的眾數為________;
(2)這次測試數學成績的中位數為________;
(3)這次測試數學成績的平均分為________.
(1)75 (2) (3)72 [(1)由題干圖知眾數為=75.
(2)由題干圖知,設中位數為x,由于前三個矩形面積之和為0.4,第四個矩形面積為0.3,0.3+0.4>0.5,因此中位數位于第四個矩形內,得0.1=0.03(x-70),所以x=.
(3)由題干圖知這次數學成績的平均數為:×0.005×10+×0.015×10+×0.02×10+×0.03×10+×0.025×10+×0.005×10=72.]
回顧本節知識,自主完成以下問題:
1.在頻率分布直方圖中,如何確定眾數、中位數和平均數?
[提示] 在頻率分布直方圖中,眾數是最高小矩形底邊的中點所對應的數據;中位數左邊和右邊的直方圖的面積應該相等;平均數等于頻率分布直方圖中每個小矩形的面積乘以小矩形底邊中點的橫坐標之和.
2.眾數、中位數和平均數的各有哪些優缺點?
[提示] 
名稱 優點 缺點
平均數 與中位數相比,平均數反映出樣本數據中更多的信息,對樣本中的極端值更加敏感 任何一個數據的改變都會引起平均數的改變.數據越“離群”,對平均數的影響越大
中位數 不受少數幾個極端數據(即排序靠前或靠后的數據)的影響 對極端值不敏感
眾數 體現了樣本數據的最大集中點 眾數只能傳遞數據中的信息的很少一部分,對極端值不敏感
課時分層作業(四十二) 總體集中趨勢的估計
一、選擇題
1.七位評委為某跳水運動員打出的分數如下:
84,79,86,87,84,93,84,
則這組分數的中位數和眾數分別是(  )
A.84,85    B.84,84
C.85,84    D.85,85
B [把七位評委打出的分數按從小到大的順序排列為:79,84,84,84,86,87,93,可知眾數是84,中位數是84.]
2.16位參加百米半決賽同學的成績各不相同,按成績取前8位進入決賽.如果小劉知道了自己的成績后,要判斷他能否進入決賽.則其他15位同學成績的下列數據中,能使他得出結論的是(  )
A.平均數   B.極差
C.中位數   D.方差
C [判斷是不是能進入決賽,只要判斷是不是前8名,所以只要知道其他15位同學的成績中是不是有8個高于他,也就是把其他15位同學的成績排列后看第8個的成績即可,小劉的成績高于這個成績就能進入決賽,低于這個成績就不能進入決賽,這個第8名的成績就是這15位同學成績的中位數.]
3.平均數和中位數都描述了數據的集中趨勢,它們的大小關系和數據分布的形態有關,在如圖兩種分布形態中,a,b,c,d分別對應平均數和中位數之一,則可能的對應關系是(  )
A.a為中位數,b為平均數,c為平均數,d為中位數
B.a為平均數,b為中位數,c為平均數,d為中位數
C.a為中位數,b為平均數,c為中位數,d為平均數
D.a為平均數,b為中位數,c為中位數,d為平均數
A [在頻率分布直方圖中,中位數兩側小矩形的面積相等,平均數是每組頻率的中間值乘頻數再相加之和,結合兩個頻率分布直方圖得:a為中位數,b為平均數,c為平均數,d為中位數.
故選A.]
4.(多選)下列說法中正確的是(  )
A.數據2,4,6,8的中位數是4,6
B.數據1,2,3,4,4的眾數是4
C.一組數據的平均數、眾數、中位數有可能是同一個數據
D.8個數據的平均數為5,另3個數據的平均數為7,則這11個數據的平均數是
BCD [數據2,4,6,8的中位數為=5,顯然A是錯誤的,B,C,D都是正確的.]
5.(多選)在某次高中學科競賽中,4 000名考生的參賽成績統計如圖所示,60分以下視為不及格,若同一組中的數據用該組區間中點值為代表,則下列說法中正確的是(  )
A.成績在[70,80)內的考生人數最多
B.不及格的考生人數為1 000
C.考生競賽成績的平均分約為70.5分
D.考生競賽成績的中位數為75分
ABC [由頻率分布直方圖可得,成績在[70,80)內的頻率最高,因此考生人數最多,故A正確.由頻率分布直方圖可得,成績在[40,60)內的頻率為0.25,因此,不及格的人數為4 000×0.25=1 000,故B正確.由頻率分布直方圖可得,平均分為45×0.1+55×0.15+65×0.2+75×0.3+85×0.15+95×0.1=70.5,故C正確.因為成績在[40,70)內的頻率為0.45,[70,80)的頻率為0.3,所以中位數為70+10×≈71.67,故D錯誤.故選ABC.]
二、填空題
6.一組數據1,10,5,2,x,2,且24 [因為27.數據:1,2,2,3,4,5,6,6,7,8,其中位數為m,第60百分位數為a,則m+a=________.
10 [中位數m==4.5,因為10×60%=6,所以第60百分位數a==5.5,所以m+a=10.]
8.對一批底部周長在[80,130](單位:cm)內的樹木進行研究,從中隨機抽出200株樹木并測出其底部周長,得到頻率分布直方圖如圖所示,由此估計,這批樹木的底部周長的眾數是________cm,中位數是________cm.
105  [由題圖知,這批樹木的底部周長的眾數約是=105(cm),中位數約是(cm).]
三、解答題
9.某校課外活動小組對該市做空氣含塵量調查,下面是一天中每隔兩小時測得的數據(單位:g/m3):
0.03,0.04,0.03,0.02,0.04,0.01,0.03,0.03,
0.04,0.05,0.01,0.03.
(1)求出這組數據的眾數和中位數;
(2)若國標(國家環境保護部的標準)是平均值不得超過0.025 g/m3,則這一天該城市的空氣是否符合國標?
[解] (1)由題意知眾數是0.03 g/m3(出現5次),將這12個數從小到大排列,中間的兩個數都是0.03,故中位數是0.03 g/m3.
(2)這組數據的平均數×(0.01×2+0.02+0.03×5+0.04×3+0.05)=0.03(g/m3),
也就是說,這一天該城市的空氣含塵量的平均值是0.03 g/m3,超過了0.025 g/m3,故不符合國標.
10.(多選)某研究所檢測甲、乙兩組實驗小白鼠的某醫學指標值,得到樣本數據的頻率分布直方圖(如圖所示),則下列結論正確的是(  )
A.甲組數據中位數大于乙組數據中位數
B.甲組數據平均數小于乙組數據平均數
C.甲組數據平均數大于甲組數據中位數
D.乙組數據平均數小于乙組數據中位數
BCD [根據甲組的樣本數據的頻率分布直方圖可知為單峰的,直方圖在右邊“拖尾”,所以甲組的平均數大于中位數,且都小于7,
同理可得乙組的平均數小于中位數,且都大于7,
故甲組數據中位數小于乙組數據中位數,故A錯誤;
甲組數據平均數小于乙組數據平均數,故B正確;
甲組數據平均數大于甲組數據中位數,故C正確;
乙組數據平均數小于乙組數據中位數,故D正確.
故選BCD.]
11.(多選)已知一組數據丟失了其中一個,剩下的六個數據分別是3,3,5,3,6,11,若這組數據的平均數a、中位數b、眾數c滿足a+c=2b,則丟失的數據可能為(  )
A.-10   B.4   C.12   D.18
ABD [設丟失的數據為x,則七個數據的平均數a=,眾數c=3,由題意,若x≤3,則中位數b=3,此時平均數a=2b-c,即=3,解得x=-10;若312.某學生5次考試的成績(單位:分)分別為85,67,m,80,93,其中m>0,若該學生在這5次考試中成績的中位數為80,則得分的平均數不可能為(  )
A.70  B.75  C.80  D.85
D [設平均數為,因為中位數為80,所以5次成績排序為67,m,80,85,93或m,67,80,85,93.則,m=-325.
∵m≤80,∴5-325≤80,解得≤81.故選D.]
13.某校開展“愛我家鄉”攝影比賽,9位評委給參賽作品A打出的分數如下:88,89,89,93,92,9■,92,91,94.記分員在去掉一個最高分和一個最低分后,算得平均分為91.復核員在復核時,發現有一個數的個位數字無法看清.若記分員計算無誤,則該數應該是________.
91 [設該數的個位數字為x,則這個數為90+x,由題意,知最低分為88.若90+x為最高分,則平均分為≈91.4≠91,故最高分為94,則去掉最高分94和最低分88,平均分為=91,解得x=1,故該數為91.]
14.現有某城市100戶居民的月平均用電量(單位:度)的數據,根據這些數據,以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分組的頻率分布直方圖如圖所示.
(1)求直方圖中x的值;
(2)求月平均用電量的眾數和中位數;
(3)在月平均用電量為[220,240),[240,260),[260,280),[280,300]的四組用戶中,用分層隨機抽樣的方法抽取11戶居民,則月平均用電量在[220,240)內的用戶中應抽取多少戶?
[解] (1)由(0.002+0.009 5+0.011+0.012 5+x+0.005+0.002 5)×20=1,得x=0.007 5,
故直方圖中x的值是0.007 5.
(2)月平均用電量的眾數為=230.
∵(0.002+0.009 5+0.011)×20=0.45<0.5,
∴月平均用電量的中位數在[220,240)內,設中位數為a,
由(0.002+0.009 5+0.011)×20+0.012 5×(a-220)=0.5,得a=224,
即月平均用電量的中位數為224度.
(3)月平均用電量在[220,240)內的有0.012 5×20×100=25(戶),月平均用電量在[240,260)內的有0.007 5×20×100=15(戶),月平均用電量在[260,280)內的有0.005×20×100=10(戶),月平均用電量在[280,300]內的有0.002 5×20×100=5(戶),抽取比例為,∴月平均用電量在[220,240)內的用戶中應抽取25×=5(戶).
15.隨著移動互聯網的發展,與餐飲美食相關的手機軟件層出不窮.現從某市使用A和B兩款訂餐軟件的商家中分別隨機抽取100個商家,對它們的“平均送達時間”進行統計,得到頻率分布直方圖如下.
(1)試估計該市使用A款訂餐軟件的商家的“平均送達時間”的眾數及平均數(同一組中的數據用該組區間的中點值代表);
(2)如果以“平均送達時間”的平均數作為決策依據,從A和B兩款訂餐軟件中選擇一款訂餐,你會選擇哪款?
[解] (1)依題意得,使用A款訂餐軟件的商家中“平均送達時間”的眾數為55,平均數為15×0.06+25×0.34+35×0.12+45×0.04+55×0.4+65×0.04=40.
(2)使用B款訂餐軟件的商家中“平均送達時間”的平均數為15×0.04+25×0.2+35×0.56+45×0.14+55×0.04+65×0.02=35<40,所以選B款訂餐軟件.9.2.4 總體離散程度的估計
學習任務 1.結合實例,能用樣本估計總體的離散程度參數(標準差、方差、極差).(數學抽象、數據分析) 2.理解離散程度參數的統計含義.(直觀想象)
甲、乙兩名戰士在相同條件下各射靶10次,每次命中的環數分別是:
甲:8,6,7,8,6,5,9,10,4,7;
乙:6,7,7,8,6,7,8,7,9,5.
經過計算可知甲、乙的命中環數的平均數都是7環.
問題:若從二人中選一人去參加射擊大賽,只用平均數能否作出選擇?
知識點 方差、標準差
1.一組數據x1,x2,…,xn的方差和標準差
數據x1,x2,…,xn的方差為=,標準差為.
2.總體方差和標準差
(1)總體方差和標準差:如果總體中所有個體的變量值分別為Y1,Y2,…,YN,總體的平均數為,則稱S2=為總體方差,S=為總體標準差.
(2)總體方差的加權形式:如果總體的N個變量值中,不同的值共有k(k≤N)個,不妨記為Y1,Y2,…,Yk,其中Yi出現的頻數為fi(i=1,2,…,k),則總體方差為S2=.
3.樣本方差和標準差
如果一個樣本中個體的變量值分別為y1,y2,…,yn,樣本平均數為,則稱s2=為樣本方差,s=為樣本標準差.
4.標準差的意義
標準差刻畫了數據的離散程度或波動幅度,標準差越大,數據的離散程度越大;標準差越小,數據的離散程度越小.
5.分層隨機抽樣的方差
設樣本容量為n,平均數為,其中兩層的個體數量分別為n1,n2,兩層的平均數分別為,方差分別為,則這個樣本的方差為s2=.
1.思考辨析(正確的打“√”,錯誤的打“×”)
(1)若一組數據的值大小相等,沒有波動變化,則標準差為0. (  )
(2)標準差、方差的取值范圍為[0,+∞). (  )
(3)標準差越大,表明各個樣本數據在樣本平均數周圍越集中;標準差越小,表明各個樣本數據在樣本平均數周圍越分散. (  )
(4)一般情況下數據中絕大部分數據落在內,也有可能落在外. (  )
(5)計算分層隨機抽樣中總樣本的平均數與方差時,必須已知各層的權重. (  )
[答案] (1)√ (2)√ (3)× (4)√ (5)√
2.已知一個樣本中的數據為1,2,3,4,5,則該樣本的方差為________;標準差為________.
[答案] 2 
3.某班為了了解學生每周購買零食的支出情況,利用分層隨機抽樣抽取了一個15人的樣本統計如下:
性別 學生數 平均支出(元) 方差
男生 9 40 6
女生 6 35 4
則全班學生每周購買零食的平均費用為________;方差為________.
[答案] 38 11.2
類型1 方差和標準差的性質與計算
【例1】 (1)已知某7個數的平均數為4,方差為2,現加入一個新數據4,此時這8個數的平均數為,方差為s2,則(  )
A.=4,s2<2  B.=4,s2>2
C.>4,s2<2   D.>4,s2>2
(2)若40個數據的平方和是56,平均數是,則這組數據的方差是________,標準差是________.
(1)A (2)0.9  [(1)因為某7個數的平均數為4,所以這7個數的和為4×7=28,因為加入一個新數據4,所以=4.又因為這7個數的方差為2,且加入一個新數據4,所以這8個數的方差s2=<2.故選A.
(2)由方差公式
s2=,
得s2==.
由已知得n=.
∴s2==0.9,s=.]
 方差和標準差的計算技巧與性質
(1)方差的計算
①基本公式:s2=2+2+…+].
②簡化計算公式:s2=-,即方差等于原數據平方的平均數減去平均數的平方.
(2)方差和標準差的性質
若把一組數據的每一個數變為原來的k倍并加上或減去常數a,則它的標準差變為原來的k倍,方差變為原來的k2倍,而與a的大小無關.
[跟進訓練]
1.(1)(多選)下列四個選項中,正確的是(  )
A.極差與方差都反映了數據的集中程度
B.方差是沒有單位的統計量
C.標準差比較小時,數據比較分散
D.只有兩個數據時,極差是標準差的2倍
(2)樣本中共有五個個體,其值分別為a,0,1,2,3.若該樣本的平均數為1,則樣本的方差為________.
(1)AD (2)2 [(1)設兩個數據分別為x1,x2,則極差等于標準差等于,故D正確.由定義可知A正確,B,C錯誤.
(2)由平均數為1可得=1,
解得a=-1.所以樣本的方差s2==2.]
類型2 方差和標準差的應用
【例2】 為響應“綠色出行”號召,某市先后推出了“共享單車”和“新能源分時租賃汽車”,并計劃在甲、乙兩個工廠選擇一個工廠生產汽車輪胎,現分別從甲、乙兩廠各隨機選取10個輪胎,將每個輪胎的寬度(單位:mm)記錄下來并繪制出如下的折線圖:
(1)分別計算甲、乙兩廠提供的10個輪胎寬度的平均數;
(2)輪胎的寬度在[194,196]內,則稱這個輪胎是標準輪胎.試比較甲、乙兩廠分別提供的10個輪胎中所有標準輪胎寬度的方差的大小,根據兩廠的標準輪胎寬度的平均水平及其波動情況,判斷這兩個工廠哪個工廠會被選擇.
[解] (1)甲廠提供的10個輪胎寬度的平均數為
×(195+194+196+193+194+197+196+195+193+197)=195.
乙廠提供的10個輪胎寬度的平均數為
×(195+196+193+192+195+194+195+192+195+193)=194.
(2)甲廠提供的10個輪胎的寬度在[194,196]內的數據為195,194,196,194,196,195,共6個,標準輪胎寬度的平均數為=195,方差為×(0+1+1+1+1+0)=.
乙廠提供的10個輪胎的寬度在[194,196]內的數據為195,196,195,194,195,195,共6個,標準輪胎寬度的平均數為=195,
方差為×(0+1+0+1+0+0)=.
由于甲、乙兩廠標準輪胎寬度的平均數相等,但乙的方差更小,所以乙廠的輪胎會被選擇.
 在實際問題中,僅靠平均數不能完全反映問題,還要研究方差,方差描述了數據相對平均數的離散程度.在平均數相同的情況下,方差越大,離散程度越大,數據波動性越大,穩定性越差;方差越小,離散程度越小,數據越集中,越穩定.
[跟進訓練]
2.汽車行業是碳排放量比較大的行業之一,某檢測單位對甲、乙兩類MI型品牌的新車各抽取了5輛進行CO2排放量檢測,記錄如下(單位:g/km),則甲、乙兩品牌汽車CO2的排放量穩定性更好的是(  )
甲 80 110 120 140 150
乙 100 120 100 120 160
A.甲   B.乙
C.甲、乙相同   D.無法確定
B [甲類品牌汽車的CO2排放量的平均值
=120(g/km),
甲類品牌汽車的CO2排放量的方差
×[(80-120)2+(110-120)2+(120-120)2+(140-120)2+(150-120)2]=600.
乙類品牌汽車的CO2排放量的平均值
=120(g/km),
乙類品牌汽車的CO2排放量的方差
×[(100-120)2+(120-120)2+(100-120)2+(120-120)2+(160-120)2]=480,
所以.
故選B.]
類型3 分層隨機抽樣的方差
【例3】 某市教育部門采用分層隨機抽樣的方法從甲、乙、丙三個學校選取了100名學生的某次考試數學成績(單位:分),并制成如下表格:
學校 學生數 平均數 方差
甲 40 98 10
乙 30 92 12
丙 30 95 15
試估計這次考試數學成績的平均數與方差.
[解] 由題意可得,樣本平均數(40×98+30×92+30×95)=95.3(分),方差s2={40×[10+(98-95.3)2]+30×[12+(92-95.3)2]+30×[15+(95-95.3)2]}=18.31,所以估計這次考試數學成績的平均數為95.3分,方差為18.31.
 分層隨機抽樣的方差
設樣本中不同層的平均數分別為,…,,方差分別為,…,,相應的權重分別為w1,w2,…,wn,則這個樣本的方差為s2=(為樣本的平均數).
[跟進訓練]
3.甲、乙兩支田徑隊體檢結果為:甲隊體重的平均數為60 kg,方差為200,乙隊體重的平均數為70 kg,方差為300,又已知甲、乙兩隊的隊員人數之比為1∶4,求甲、乙兩隊全部隊員的平均體重和方差.
[解] 由題意可知=60,甲隊隊員在所有隊員中所占權重為=70,乙隊隊員在所有隊員中所占權重為,則甲、乙兩隊全部隊員的平均體重為×60+×70=68 kg,甲、乙兩隊全部隊員的體重的方差為s2=[200+(60-68)2]+[300+(70-68)2]=296.
1.甲、乙、丙、丁四名射手在選拔賽中所得的平均環數及其方差s2如表所示,則選送決賽的最佳人選應是(  )
項目 甲 乙 丙 丁
7 8 8 7
s2 6.3 6.3 7 8.7
A.甲   B.乙   C.丙   D.丁
B [∵>,且,故應選擇乙進入決賽.]
2.已知一組數據x1,x2,x3,x4,x5的平均數是3,方差是,那么另一組數據2x1-1,2x2-1,2x3-1,2x4-1,2x5-1的平均數、方差分別是(  )
A.5,  B.5,2  C.3,2  D.3,
B [因為數據x1,x2,x3,x4,x5的平均數是3,方差是,所以,因此數據2x1-1,2x2-1,2x3-1,2x4-1,2x5-1的平均數為-1=5,方差為====2.故選B.]
3.某學員在一次射擊測試中射靶10次,命中環數如下:7,8,7,9,5,4,9,10,7,4,
則:(1)平均命中環數為________;
(2)命中環數的標準差為________.
(1)7 (2)2 [(1)=7.
(2)∵s2=×[(7-7)2+(8-7)2+(7-7)2+(9-7)2+(5-7)2+(4-7)2+(9-7)2+(10-7)2+(7-7)2+(4-7)2]=4,∴s=2.]
4.在對某中學高一學生體重的調查中,采取按樣本量比例分配的分層隨機抽樣,已知抽取了男生30人,其平均數和方差分別為55和15,抽取了女生20人,其平均數和方差分別為45和20.根據以上數據估計該校高一學生體重的總樣本的平均數為________,方差為________.
51 41 [總樣本的平均數為×45=51,總樣本的方差為×[15+(55-51)2]+×[20+(45-51)2]=41.]
回顧本節知識,自主完成以下問題:
1.描述數據的離散程度的量有哪些?分別如何描述的?
[提示] 數據的離散程度可以通過極差、方差或標準差來描述.
(1)極差是數據的最大值與最小值的差.它反映了一組數據變化的最大幅度,它對一組數據中的極端值非常敏感.
(2)方差則反映了一組數據圍繞平均數波動的大小.為了得到以樣本數據的單位表示的波動幅度通常用標準差.在平均數相同的情況下,方差(或標準差)越大,離散程度越大,數據波動性越大,穩定性差;方差(或標準差)越小,數據越集中、越穩定.
2.如何計算一組數據的方差或標準差?
[提示] (1)公式法:s2=2+2+…+]=-;
(2)性質法:若x1,x2,…,xn的方差為s2,則mx1+a,mx2+a,…,mxn+a的方差為m2s2.
3.如何計算分層隨機抽樣的方差?
[提示] 計算分層隨機抽樣的方差s2的步驟
(1)分層隨機抽樣中兩組數據x,y的抽樣比例是;
(2)總體均值為;
(3)總體方差s2=+]+·+].
課時分層作業(四十三) 總體離散程度的估計
一、選擇題
1.為評估一種農作物的種植效果,選了n塊地作試驗田.這n塊地的畝產量(單位:kg)分別為x1,x2,…,xn,下面給出的指標中可以用來評估這種農作物畝產量穩定程度的是(  )
A.x1,x2,…,xn的平均數
B.x1,x2,…,xn的標準差
C.x1,x2,…,xn的最大值
D.x1,x2,…,xn的中位數
B [平均數能反映一組數據的平均水平;中位數是把一組數據從小到大或從大到小排列,若該組數據的個數為奇數,則取中間的數據,若該組數據的個數為偶數,則取中間兩個數據的平均數.平均數和中位數都能反映一組數據的集中趨勢,標準差和方差都能反映一組數據的穩定程度.]
2.(多選)已知一組數據x1,x2,x3,x4,x5的平均數和方差均為2,則下列敘述正確的是(  )
A.x1+1,x2+1,x3+1,x4+1,x5+1的平均數為3
B.x1+1,x2+1,x3+1,x4+1,x5+1的方差為3
C.2x1,2x2,2x3,2x4,2x5的方差為4
D.2x1+2,2x2+2,2x3+2,2x4+2,2x5+2的方差為8
AD [將每個數據在原基礎上加1,故平均數加1,但是方差保持不變,故其平均數是3,方差是2,故A正確,B錯誤;將每個數據乘以2,故其方差變為原來的4倍,即為8,故C錯誤;將每個數據乘以2再加2,故其方差也變為原來的4倍,即為8,故D正確.故選AD.]
3.甲、乙、丙三名學生在一項集訓中的40次測試分數都在[50,100]內,將他們的測試分數分別繪制成頻率分布直方圖,如圖所示,記甲、乙、丙的分數的標準差分別為s1,s2,s3,則它們的大小關系為(  )
A.s1>s2>s3    B.s1>s3>s2
C.s3>s1>s2   D.s3>s2>s1
B [比較三個頻率分布直方圖知,甲為“雙峰”直方圖,兩端數據最多,最分散,方差最大;乙為“單峰”直方圖,數據最集中,方差最小;丙為“單峰”直方圖,但數據分布相對均勻,方差介于甲、乙之間.綜上可知s1>s3>s2.]
4.在高一期中考試中,甲、乙兩個班的數學成績統計如下表:
班級 人數 平均數 方差
甲 20 2
乙 30 3
其中,則兩個班數學成績的方差為(  )
A.3   B.2   C.2.6   D.2.5
C [由題意可知兩個班的數學成績的平均數為,則兩個班數學成績的方差為s2=+=×3=2.6.]
5.某選手的9個得分分別為87,87,94,90,91,90,9x,99,91,其中有一個數據的個位數模糊,無法辨認,以x表示.若去掉1個最高分,去掉1個最低分,7個剩余分數的平均分為91,則7個剩余分數的方差為(  )
A.  B.  C.36  D.
B [由題意知去掉的兩個數是87,99,所以87+90×2+91×2+94+90+x=91×7,解得x=4.
故s2=[(87-91)2+(90-91)2×2+(91-91)2×2+(94-91)2×2]=.]
二、填空題
6.已知樣本9,10,11,x,y的平均數是10,方差是4,則xy=________.
91 [由平均數是10,得x+y=20.①
由方差是4,得x2+y2=218.②
①2-②得2xy=182,∴xy=91.]
7.現有10個數,其平均數是4,且這10個數的平方和是200,那么這組數的標準差是________.
2 [由題意知=200,
所以s=

==2.]
8.為了調查公司員工的健康狀況,用分層隨機抽樣的方法抽取樣本,已知所抽取的所有員工的平均體重為60 kg,標準差為60,男員工的平均體重為70 kg,標準差為50,女員工的平均體重為50 kg,標準差為60,若樣本中有20名男員工,則女員工的人數為________.
200 [設男、女員工的權重分別為ω男,ω女,由題意可知s2=ω男[+]+ω女[+],即ω男[502+(70-60)2]+(1-ω男)·[602+(50-60)2]=602,解得ω男=,ω女=,因為樣本中有20名男員工,所以樣本中女員工的人數為200.]
三、解答題
9.某班20位女同學平均分為甲、乙兩組,她們的勞動技術課考試成績(單位:分)如下:
甲組:60,90,85,75,65,70,80,90,95,80;
乙組:85,95,75,70,85,80,85,65,90,85.
(1)試分別計算兩組數據的極差、方差;
(2)哪一組的成績較穩定?
[解] (1)甲組:最高分為95,最低分為60,極差為95-60=35,
平均數為×(60+90+85+75+65+70+80+90+95+80)=79,
方差為×[(60-79)2+(90-79)2+(85-79)2+(75-79)2+(65-79)2+(70-79)2+(80-79)2+(90-79)2+(95-79)2+(80-79)2]=119.
乙組:最高分為95,最低分為65,極差為95-65=30,
平均數為×(85+95+75+70+85+80+85+65+90+85)=81.5,
方差為=75.25.
(2)由于乙組的方差小于甲組的方差,因此乙組的成績較穩定.
從(1)中得到的極差也可看出乙組的成績比較穩定.
10.一組數據中的每一個數據都乘2,再都減80,得一組新數據,若求得新數據的平均數是1.2,方差是4.4,則原來數據的平均數和方差分別是(  )
A.40.6,1.1   B.48.8,4.4
C.81.2,44.4   D.78.8,75.6
A [法一:設原來的數據為x1,x2,x3,…,xn,則新數據為2x1-80,2x2-80,2x3-80,…,2xn-80,
所以=1.2,
所以=1.2,
即=40.6.
[(2x1-80-1.2)2+(2x2-80-1.2)2+…+(2xn-80-1.2)2]=4.4,
即[(2x1-81.2)2+(2x2-81.2)2+…+(2xn-81.2)2]=4.4,
所以[(2x1-81.2)2+(2x2-81.2)2+…+(2xn-81.2)2]=×4.4=1.1.
法二:設原數據的平均數為,方差為s2,則數據中的每一個數都乘2,再都減80,得一組新數據后,新數據的平均數為-80,方差為22s2,
由題意得2-80=1.2,22s2=4.4,解得=40.6,s2=1.1.]
11.如圖,樣本A和B分別取自兩個不同的總體,它們的樣本平均數分別為和,樣本標準差分別為sA和sB,則(  )
A.>,sA>sB
B.<,sA>sB
C.>,sAD.<,sAB [由題圖知,A組的6個數分別為2.5,10,5,7.5,2.5,10;B組的6個數分別為15,10,12.5,10,12.5,10,
所以,
.
顯然<.
又由圖形可知,B組數據的分布比A組的均勻,變化幅度不大,故B組數據比較穩定,方差較小,從而標準差較小,所以sA>sB.]
12.(多選)已知樣本x1,x2,…,xl的平均數為,方差為,樣本y1,y2,…,ym的平均數為,方差為,樣本z1,z2,…,zn的平均數為,方差為,設樣本x1,,…,,…,,…,的平均數為,方差為s2,則下列說法正確的是(  )
A.
B.
D.s2=+]+m[]+n[+]}
ACD [依題意,x1+x2+…+xl=l·,A正確、B錯誤;由方差的定義知=
=+]+m[+]},D正確.故選ACD.]
13.從某企業生產的某種產品中抽取500件,測量這些產品的一項質量指標值,由測量結果得頻率分布直方圖如圖,則這500件產品質量指標值的樣本方差s2=________(同一組中的數據用該組區間的中點值作代表).
110 [由頻率分布直方圖得抽取產品的質量指標值的樣本平均值為(100×0.010+110×0.020+120×0.035+130×0.030+140×0.005)×10=120,
∴樣本方差s2=[(100-120)2×0.010+(110-120)2×0.020+(120-120)2×0.035+(130-120)2×0.030+(140-120)2×0.005]×10=110.]
14.(2021·全國乙卷)某廠研制了一種生產高精產品的設備,為檢驗新設備生產產品的某項指標有無提高,用一臺舊設備和一臺新設備各生產了10件產品,得到各件產品該項指標數據如下:
舊設備 9.8 10.3 10.0 10.2 9.9 9.8 10.0 10.1 10.2 9.7
新設備 10.1 10.4 10.1 10.0 10.1 10.3 10.6 10.5 10.4 10.5
舊設備和新設備生產產品的該項指標的樣本平均數分別記為和,樣本方差分別記為和.
(1)求;
(2)判斷新設備生產產品的該項指標的均值較舊設備是否有顯著提高(如果,則認為新設備生產產品的該項指標的均值較舊設備有顯著提高,否則不認為有顯著提高).
[解] (1)由表格中數據可得:
=+10.0=10.0,
=+10.0=10.3,
=0.036,
×[(10.0-10.3)2+3×(10.1-10.3)2+(10.3-10.3)2+2×(10.4-10.3)2+2×(10.5-10.3)2+(10.6-10.3)2]=0.04.
(2)由(1)中數據可得>,所以認為新設備生產產品的該項指標的均值較舊設備有顯著提高.
15.甲、乙兩人在相同條件下各打靶10次,每次打靶的成績情況如圖所示.
(1)填寫下表:
項目 平均數 方差 中位數 命中9環及以上
甲 7 1.2 1
乙 5.4 3
(2)請從三個不同的角度對這次測試進行分析.
①由平均數和方差結合分析誰的成績更穩定;
②由平均數和中位數結合分析誰的成績更好些;
③由折線圖上兩人射擊命中環數及走勢分析誰更有潛力.
[解] (1)由題圖可知,乙的射靶環數依次為2,4,6,8,7,7,8,9,9,10,所以(2+4+6+8+7+7+8+9+9+10)=7.
乙的射靶環數從小到大排列為2,4,6,7,7,8,8,9,9,10,所以中位數是=7.5.
甲的射靶環數從小到大排列為5,6,6,7,7,7,7,8,8,9,所以中位數為7.
于是填充后的表格如下表所示.
平均數 方差 中位數 命中9環及以上
甲 7 1.2 7 1
乙 7 5.4 7.5 3
(2)①甲、乙的平均數相同,均為7,但,說明甲偏離平均數的程度小,而乙偏離平均數的程度大,故甲的成績更穩定.
②甲、乙的平均水平相同,而乙的中位數比甲大,故從平均數和中位數的角度分析乙射靶成績比甲好.
③從折線圖可以看出乙的成績有明顯進步,甲的較為穩定,所以乙更有潛力.
9.3 統計案例 公司員工的肥胖情況調查分析(略)第9章 統計 章末綜合提升
類型1 抽樣方法
1.抽樣方法有:簡單隨機抽樣、分層隨機抽樣.對抽樣方法的考查,主要有兩點:一是兩種抽樣方法的判斷;二是關于分層隨機抽樣的樣本容量的計算問題,特別與其他的問題結合在一起的問題要引起重視.
2.掌握兩種抽樣方法,提升數據分析素養.
【例1】 (1)某市舉行以“學習黨的二十大精神,培根鑄魂育新人”為主題的中小學教師演講比賽.若將報名的50位教師編號為00,01,…,49,利用下面的隨機數表來決定他們的出場順序,選取方法是從下面隨機數表第1行第5列開始橫向依次選取兩個數字,重復的剔除,則選出來的第8個個體的編號為(  )
45 67 32 12 12 31 02 01 04 52 15 20 01 12 51 29
32 04 92 34 49 35 82 00 36 23 48 69 69 38 74 81
A.12   B.20   C.29   D.23
(2)(多選)(2022·山東聊城一中月考)某校高二年級有男生600人,女生400人,張華按男生、女生進行分層,通過分層隨機抽樣的方法,得到一個總樣本量為100的樣本,計算得到男生、女生的平均身高分別為170 cm和160 cm,方差分別為15和30,則下列說法正確的有(  )
A.若張華采用樣本量比例分配的方式進行抽樣,則男生、女生分別應抽取60人和40人
B.若張華采用樣本量比例分配的方式進行抽樣,則樣本的方差為37.8
C.若張華采用樣本量比例分配的方式進行抽樣,則樣本的平均數為166,此時可用樣本平均數估計總體的平均數
D.若張華采用等額抽取,即男生、女生分別抽取50人,則某男生甲被抽到的概率為
(1)B (2)AC [(1)根據隨機數表的讀數規則,依次從隨機數表中讀出的有效編號為:32,12,31,02,01,04,15,20,得到選出來的第8個個體的編號為20.故選B.
(2)A選項,男生抽取100×=60,女生抽取100-60=40人,A選項正確.
C選項,樣本平均數為×160=166,可以用樣本平均數估計總體的平均數,C選項正確.
B選項,樣本方差為==45,所以B選項錯誤.
D選項,男生甲被抽到的概率為,D選項錯誤.
故選AC.]
類型2 統計圖表及其應用
1.常見的統計圖表有:頻率分布直方圖、條形圖、折線圖、扇形圖等等,不同的統計圖表在表示數據上有不同的特點.
2.掌握常見的統計圖表,提升直觀想象、數據分析和數學運算素養.
【例2】 (1)(多選)(2022·江蘇沭陽縣修遠中學期末)某中學舉行安全知識競賽,對全校參賽的1 000名學生的得分情況進行了統計,把得分數據按照[50,60),[60,70),[70,80),[80,90),[90,100]分成了5組,繪制了如圖所示的頻率分布直方圖,根據圖中信息,下列說法正確的是(  )
A.這組數據的極差為50 
B.這組數據的眾數為76
C.這組數據的中位數為 
D.這組數據的第75百分位數為85
(2)(多選)(2022·山東濟南市歷城第二中學月考)某保險公司為客戶定制了A,B,C,D,E共5個險種,并對5個險種參保客戶進行抽樣調查,得出如下的統計圖:
用該樣本估計總體,以下說法正確的有(  )
A.57周歲以上參保人數最少 
B.18~30周歲人群參保總費用最少
C.C險種更受參保人青睞
D.31周歲以上的人群約占參保人群80%
(1)CD (2)ACD [(1)對于A:由頻率分布直方圖無法得到這組數據的最大值和最小值,
故這組數據的極差無法準確判斷,故A錯誤;
數據的眾數為(70+80)=75,故B錯誤;
(0.005+0.02+0.035)×10=0.6>0.5,(0.005+0.02)×10=0.25<0.5,所以中位數位于[70-80)之間,設中位數為x,則(0.005+0.02)×10+×0.035=0.5,解得x=,即這組數據的中位數為,故C正確;
∵(0.005+0.02+0.035)×10=0.6,(0.005+0.02+0.035+0.03)×10=0.9,故估計第75分位數是80+×10=85,故D正確.故選CD.
(2)由扇形圖可知,57周歲以上參保人數最少,故A正確;
由折線圖可知,18~30周歲人群人均參保費用最少,但是由扇形圖知參保人數并不是最少的,所以參保總費用不是最少,故B錯誤;
由條形圖可知,C險種參保比例最高,故C正確;
由扇形圖可知,31周歲以上的人群約占參保人群80%,故D正確.故選ACD.]
類型3 用樣本的集中趨勢、離散程度估計總體
1.為了從整體上更好地把握總體規律,我們還可以通過樣本數據的眾數、中位數、平均數估計總體的集中趨勢,通過樣本數據的方差或標準差估計總體的離散程度.
2.掌握樣本數據的眾數、中位數、平均數及方差的計算方法,提升數據分析和數學運算素養.
【例3】 某工廠36名工人的年齡(單位:歲)數據如下:
40,44,40,41,33,40,45,42,43,36,31,38,39,43,45,39,38,36,27,43,41,37,24,42,37,44,42,34,39,43,38,42,53,37,49,39.
利用簡單隨機抽樣抽取容量為9的樣本,其年齡數據為44,40,36,43,36,37,44,43,37.
(1)計算樣本的平均數和方差s2;
(2)36名工人中年齡在-s與+s之間的有多少人?所占的百分比是多少?(精確到0.01%)
[解] (1)由平均數公式知,×(44+40+36+43+36+37+44+43+37)=40,由方差公式知,s2=×[(44-40)2+(40-40)2+…+(37-40)2]=.
(2)因為s2=,則s=,所以36名工人中年齡在+s之間的人數等于年齡在區間[37,43]內的人數,共23人.
所以36名工人中年齡在+s之間的人數所占的百分比為×100%≈63.89%.
章末綜合測評(四) 統計
(時間:120分鐘 滿分:150分)
一、選擇題(本大題共8小題,每小題5分,共40分.在每小題給出的四個選項中,只有一項是符合題目要求的)
1.某工廠為了了解加工的一批零件的長度,抽測了其中200個零件的長度,在這個問題中,200個零件的長度是(  )
A.總體 B.個體 C.樣本 D.樣本量
C [總體是這一批零件的長度,個體是每個零件的長度,樣本是抽取的200個零件的長度,樣本量是200.]
2.在實際生活中,有的問題適合普查,例如人口變化,有的問題適合抽樣調查,例如產品質量.下列最適合抽樣調查的是(  )
A.高一·一班數學作業完成情況
B.了解一批牛奶的質量
C.某汽車4S店想知曉新客戶對服務的評價
D.環保局調查管轄范圍內湖泊的水質情況
B [依據總體的特殊性,B項最適合抽樣調查.]
3.某地每十萬人中擁有的各類受教育程度的人口情況,繪制了如圖所示的扇形統計圖,則(  )
A.每十萬人中擁有高中(含中專)文化程度的人數最少
B.每十萬人中擁有大專及以上文化程度的人數少于2萬
C.每十萬人中擁有小學文化程度的人數最多
D.每十萬人中擁有初中和高中(含中專)文化程度的人數占比不到50%
B [對于A,每十萬人中其他文化程度的人數最少,占比為10%,錯誤;
對于B,每十萬人中擁有大專及以上文化程度的人數為10×15%=1.5萬,正確;
對于C,每十萬人中擁有初中文化程度的人數最多,占比為35%,錯誤;
對于D,每十萬人中擁有初中和高中(含中專)文化程度的人數占比為50%,錯誤.故選B.]
4.為了普及環保知識,增強環保意識,某大學隨機抽取30名學生參加環保知識測試,得分(十分制)如圖所示,假設得分的中位數為a,眾數為b,平均值為c,則(  )
A.a=b=c   B.a=b<c 
C.a<b<c   D.b<a<c
D [由統計圖知眾數b=5.
將30名學生得分從小到大排列,第15個數是5,第16個數是6,所以中位數a==5.5.
又平均值c=≈5.97.所以b<a<c.]
5.(2022·全國甲卷)某社區通過公益講座以普及社區居民的垃圾分類知識.為了解講座效果,隨機抽取10位社區居民,讓他們在講座前和講座后各回答一份垃圾分類知識問卷,這10位社區居民在講座前和講座后問卷答題的正確率如下圖:
則(  )
A.講座前問卷答題的正確率的中位數小于70%
B.講座后問卷答題的正確率的平均數大于85%
C.講座前問卷答題的正確率的標準差小于講座后正確率的標準差
D.講座后問卷答題的正確率的極差大于講座前正確率的極差
B [講座前中位數為>70%,所以A錯誤;
講座后問卷答題的正確率只有一個是80%,4個85%,剩下全部大于等于90%,所以講座后問卷答題的正確率的平均數大于85%,所以B正確;
講座前問卷答題的正確率更加分散,所以講座前問卷答題的正確率的標準差大于講座后正確率的標準差,所以C錯誤;
講座后問卷答題的正確率的極差為100%-80%=20%,
講座前問卷答題的正確率的極差為95%-60%=35%>20%,所以D錯誤.故選B.]
6.(2022·河北邯鄲摸底考試)某高中2022年的高考考生人數是2021年高考考生人數的1.5倍.為了更好地對比該校考生的升學情況,統計了該校2021年和2022年高考分數達線情況,得到如圖所示扇形統計圖:
下列結論正確的是(  )
A.該校2022年與2021年的本科達線人數比為6∶5
B.該校2022年與2021年的專科達線人數比為6∶7
C.2022年該校本科達線人數增加了80%
D.2022年該校不上線的人數有所減少
C [不妨設2021年的高考人數為100,則2022年的高考人數為150.
2021年本科達線人數為50,2022年本科達線人數為90,得2022年與2021年的本科達線人數比為9∶5,本科達線人數增加了80%,故選項A錯誤,選項C正確;
2021年專科達線人數為35,2022年專科達線人數為45,所以2022年與2021年的專科達線人數比為9∶7,選項B錯誤; 2021年不上線人數為15,2022年不上線人數也是15,不上線的人數無變化,選項D錯誤.故選C.]
7.某班有48名學生,在一次考試中統計出平均分為70分,方差為75,后來發現有2名同學的分數錄錯了,甲實得80分,卻記了50分,乙實得70分,卻記了100分,更正后平均分和方差分別是(  )
A.70,75   B.70,50
C.75,1.04   D.65,2.35
B [因甲少記了30分,乙多記了30分,故平均分不變,設更正后的方差為s2,則由題意可得s2=[(x1-70)2+(x2-70)2+…+(80-70)2+(70-70)2+…+(x48-70)2],而更正前有75=[(x1-70)2+(x2-70)2+…+(50-70)2+(100-70)2+…+(x48-70)2],化簡整理得s2=50.]
8.(2022·山東泰安期末)某校組織歌詠比賽,已知5位評委按百分制分別給出某參賽班級的評分(評分為整數),則下列選項中,可以判斷出評分中一定出現100分的是(  )
A.平均數為97,中位數為95
B.中位數為95,眾數為98
C.平均數為98,眾數為98
D.中位數為96,極差為8
A [對于A,設這5個數為a,b,95,c,d,其中a≤b≤95≤c≤d≤100,則a+b≤190,=97,所以a+b+c+d=390,
因為a+b≤190,所以c+d≥200,所以c=d=100,
所以平均數為97,中位數為95時,評分中一定出現100分,故A符合;
對于B,當這5個數分別為93,94,95,98,98時,
則中位數為95,眾數為98,沒有出現100分,故B不一定;
對于C,當這5個數分別為98,98,98,98,98時,
則平均數為98,眾數為98,沒有出現100分,故C不一定;
對于D,當這5個數分別為90,92,96,98,98時,
則中位數為96,極差為8,沒有出現100分,故D不一定.故選A.]
二、選擇題(本大題共4小題,每小題5分,共20分.在每小題給出的選項中,有多項符合題目要求,全部選對的得5分,部分選對的得2分,有選錯的得0分)
9.(2021·新高考Ⅰ卷)有一組樣本數據x1,x2,…,xn,由這組數據得到新樣本數據y1,y2,…,yn,其中yi=xi+c(i=1,2,…,n),c為非零常數,則(  )
A.兩組樣本數據的樣本平均數相同
B.兩組樣本數據的樣本中位數相同
C.兩組樣本數據的樣本標準差相同
D.兩組樣本數據的樣本極差相同
CD [設樣本數據x1,x2,…,xn的平均數、中位數、標準差、極差分別為,m,σ,t,依題意得,新樣本數據y1,y2,…,yn的平均數、中位數、標準差、極差分別為+c,m+c,σ,t,因為c≠0,所以C,D正確,故選CD.]
10.(2022·重慶市兩江育才中學月考)為落實黨中央的“三農”政策,某市組織該市所有鄉鎮干部進行了一期“三農”政策專題培訓,并在培訓結束時進行了結業考試.如圖是該次考試成績隨機抽樣樣本的頻率分布直方圖.則下列關于這次考試成績的估計正確的是(  )
A.眾數為82.5 
B.第80百分位數為91.7
C.平均數為88 
D.沒有一半以上干部的成績在80~90分之間
AB [由圖知:眾數出現在[80,85)之間,故眾數為82.5,故A正確;由圖可得該次考試成績在90分以下所占比例為5×(0.01+0.03+0.06+0.05)=0.75,在95分以下所占比例為5×(0.01+0.03+0.06+0.05+0.03)=0.9,因此,第80百分位數一定位于[90,95)內,所以第80百分位數為90+5×≈91.7,故B正確;由(0.01×72.5+0.03×77.5+0.06×82.5+0.05×87.5+0.03×92.5+0.02×97.5)×5=85.5,C錯誤;由(0.06+0.05)×5=0.55>0.5,有一半以上干部的成績在80~90分之間,D錯誤.故選AB.]
11.下列命題是真命題的是(  )
A.分層隨機抽樣調查后的樣本中甲、乙、丙三種個體的比例為3∶1∶2,如果抽取的甲個體數為9,則樣本容量為30
B.某一組樣本數據為125,120,122,105,130,114,116,95,120,134,則樣本數據落在區間[114.5,124.5]內的頻率為0.4
C.甲、乙兩隊隊員體重的平均數分別為60,68,人數之比為1∶3,則甲、乙兩隊全部隊員體重的平均數為67
D.一組數6,5,4,3,3,3,2,2,2,1的85%分位數為5
BD [對于選項A:根據樣本的抽樣比等于各層的抽樣比,樣本容量為9÷=18,故選項A錯誤;
對于選項B:樣本數據落在區間[114.5,124.5]內的有120,122,116,120共4個,所以樣本數據落在區間[114.5,124.5]內的頻率為=0.4,故選項B正確;
對于選項C:甲、乙兩隊的人數之比為1∶3,則甲隊隊員在所有隊員中所占權重為=,乙隊隊員在所有隊員中所占權重為=,則甲、乙兩隊全部隊員體重的平均數為=×60+×68=66,故選項C錯誤;
對于選項D:將該組數據從小到大排列為:1,2,2,2,3,3,3,4,5,6,由10×85%=8.5,則該組數據的85%分位數是第9個數,該數為5,故選項D正確.]
12.某學校共有學生2 000人,其中高一800人,高二、高三各600人,學校對學生在暑假中每天的讀書時間做了調查統計,全體學生每天的讀書時間的平均數為=3小時,方差為s2= 2.003,其中高一學生、高二學生每天讀書時間的平均數分別為=2.6,=3.2,又已知三個年級學生每天讀書時間的方差分別為===3,則高三學生每天讀書時間的平均數可能是(  )
A.3.2   B.3.3   C.2.7   D.4.5
BC [由題意可得2.003=[1+(2.6-3)2]+[2+(3.2-3)2]+[3+(-3)2],解得=3.3或2.7.]
三、填空題(本大題共4小題,每小題5分,共20分)
13.下列數據的70%分位數為________.
20,14,26,18,28,30,24,26,33,12,35,22.
28 [把所給的數據按照從小到大的順序排列可得:
12,14,18,20,22,24,26,26,28,30,33,35,
因為有12個數據,所以12×70%=8.4,不是整數,所以數據的70%分位數為第9個數28.]
14.我國高鐵發展迅速,技術先進.經統計在經停某站的高鐵列車中,有10個車次的正點率為0.97,有20個車次的正點率為0.98,有10個車次的正點率為0.99,則經停該站高鐵列車所有車次的平均正點率的估計值為________.
0.98 [==0.98,則經停該站高鐵列車所有車次的平均正點率的估計值為0.98.]
15.(2022·江西貴溪一中月考)某口罩生產商為了檢驗產品質量,從總體編號為001,002,003,…,499,500的500盒口罩中,利用隨機數表(以下摘取了隨機數表中第12行至第13行)選取10個樣本進行抽檢,選取方法是從隨機數表第12行第5列的數字開始由左向右讀取,則選出的第4個樣本的編號為________.
16 00 11 66 14 90 84 45 11 65 73 88 05 90 52 27 41 14 86 22 98
12 22 08 07 52 74 95 80 35 69 68 32 50 61 28 47 39 75 34 58 62
222 [從隨機數表第12行第5列的數字開始由左向右讀取,依次可以得到:116,445,148,222,080,356,…,則選出的第4個樣本的編號為222.]
16.從某小學隨機抽取100名學生,將他們的身高(單位:厘米)數據繪制成頻率分布直方圖(如圖).由圖中數據可知a=________.若要從身高在[120,130),[130,140),[140,150]三組內的學生中,用分層隨機抽樣的方法選取18人參加一項活動,則從身高在[140,150]內的學生中選取的人數應為________.
0.030 3 [∵5個矩形面積之和為1,
即(0.005+0.010+0.020+a+0.035)×10=1,
∴a=0.030.
∵三組內學生數的頻率分別為:0.3,0.2,0.1,
∴三組內學生的人數分別為30,20,10.
∴從身高在[140,150]內的學生選取的人數為18×=3.]
四、解答題(本大題共6小題,共70分.解答應寫出文字說明,證明過程或演算步驟)
17.(本小題滿分10分)(2022·黑龍江哈爾濱四中月考)從甲、乙、丙三個廠家生產的同一種產品中抽取8件產品,對其使用壽命(單位:年)進行追蹤調查,結果如下:
甲:5,5,6,6,8,8,8,10;
乙:4,5,6,7,8,9,12,13;
丙:3,3,4,7,9,10,11,12.
(1)三個廠家的廣告中都稱該產品的使用壽命是8年,請指出________(從“甲、乙、丙”三廠家中選擇一個)廠家在廣告中依據了統計數據中的哪個特征數?
(2)計算甲廠家抽取的8件產品的方差.
[解] (1)選擇甲廠家,因為甲廠家抽取的8件產品的眾數是8,所以甲廠家的廣告依據了統計數據中的眾數;
選擇乙廠家,因為乙廠家抽取的8件產品的平均數是8,所以乙廠家的廣告依據了統計數據中的平均數;
選擇丙廠家,因為丙廠家抽取的8件產品的中位數是8,所以丙廠家的廣告依據了統計數據中的中位數.
(2)甲廠家抽取的8件產品的使用壽命為5,5,6,6,8,8,8,10,
其平均數為=×(5+5+6+6+8+8+8+10)=7,
方差為s2=×(22+22+12+12+12+12+12+32)=2.75.
18.(本小題滿分12分)隨機抽取某4S店分公司20位員工今年的銷售業績,統計如下所示(單位:輛):
26 34 28 32 35 38 22 39 23 25
28 30 24 38 33 33 22 34 21 27
(1)若需要有10%的優秀員工,應將標準設定在多少?
(2)若要給至少80%的員工年度考評評級為通過,應將標準設定在多少?
[解] (1)將20個樣本數據從小到大進行排序如下所示(單位:輛):
21 22 22 23 24 25 26 27 28 28
30 32 33 33 34 34 35 38 38 39
由于20×90%=18是整數,所以臨界值為有序樣本中第18和19兩個數的平均數,故為38.因此,可以規定如下:若需要有10%的優秀員工,應將標準設定在38輛.
(2)由于20×20%=4是整數,所以臨界值為有序樣本中第4和5兩個數的平均數,故為23.5.因此,可以規定如下:若要給至少80%的員工年度考評評級為通過,應將標準設定23輛,或22輛,或21輛.
19.(本小題滿分12分)某公司為了了解近期內的用水情況,抽取了10天的用水量,如下表所示:
天數 1 1 1 2 2 1 2
用水量/噸 22 38 40 41 44 50 95
(1)在這10天中,該公司用水量的平均數是多少?
(2)在這10天中,該公司每天用水量的中位數是多少?
(3)你認為用平均數和中位數中的哪一個數來描述該公司每天的用水量更合適?
[解] (1)=(22+38+40+2×41+2×44+50+2×95)=51(噸).
(2)中位數為=42.5(噸).
(3)平均數受數據中的極端值(2個95)影響較大,使用平均數在估計總體時可靠性降低,10天的用水量有8天都在平均值以下,故用中位數描述每天的用水量更合適.
20.(本小題滿分12分)隨著老年人消費需求從“生存型”向“發展型”轉變,消費層次不斷提升,“銀發經濟”成為社會熱門話題之一,被各企業持續關注.某企業為了解該地老年人消費能力情況,對該地年齡在[60,80)的老年人的年收入按年齡[60,70),[70,80)分成兩組進行分層抽樣調查,已知抽取了年齡在[60,70)的老年人500人,年齡在[70,80)的老年人300人.現作出年齡在[60,70)的老年人年收入的頻率分布直方圖(如圖所示).
(1)根據頻率分布直方圖,估計該地年齡在[60,70)的老年人年收入的平均數及第95百分位數;
(2)已知年齡在[60,70)的老年人年收入的方差為3,年齡在[70,80)的老年人年收入的平均數和方差分別為3.75和1.4,試估計年齡在[60,80)的老年人年收入的方差.
[解] (1)頻率分布直方圖中,該地年齡在[60,70)的老年人年收入的平均數約為:
0.04×2+0.08×3+0.18×4+0.26×5+0.20×6+0.15×7+0.05×8+0.04×9=5.35,
由頻率分布直方圖,年收入在8.5萬元以下的老年人所占比例為1-0.04×1=0.96,
年收入在7.5萬元以下的老年人所占比例為1-(0.05×1+0.04×1)=0.91,
因此,第95百分位數一定位于[7.5,8.5)內,由7.5+1×=8.3,
可以估計該地年齡在[60,70)的老年人年收入的第95百分位數為8.3.
(2)設年齡在[60,70)的老年人樣本的平均數記為,方差記為;
年齡在[70,80)的老年人樣本的平均數記為,方差記為;
年齡在[60,80)的老年人樣本的平均數記為,方差記為s2.
由(1)得,由題意得,==1.4,
則==4.75.
由s2=×{500×+300×+()2]},可得s2=×{500×[3+(5.35-4.75)2]+300×[1.4+(3.75-4.75)2]}=3,
即估計該地年齡在[60,80)的老年人的年收入方差為3.
21.(本小題滿分12分) 某校高一年級學生全部參加了體育科目的達標測試,現從中隨機抽取40名學生的測試成績(單位:分),整理數據并按分數段[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]進行分組.已知測試分數均為整數,現用每組區間的中點值代替該組中的每個數據,得到體育成績的折線圖如圖所示.
(1)若體育成績大于或等于70分的學生為“體育良生”,已知該校高一年級有1 000名學生,試估計該校高一年級學生“體育良生”的人數;
(2)用樣本估計總體的思想,試估計該校高一年級學生達標測試的平均分;
(3)假設甲、乙、丙三人的體育成績分別為a,b,c,且a∈[70,80),b∈[80,90),c∈[90,100],當三人的體育成績方差s2最小時,寫出a,b,c的所有可能取值(不要求證明).
[解] (1)由折線圖得體育成績大于或等于70分的學生有14+3+13=30(人),所以估計該校高一年級學生“體育良生”的人數為1 000×=750(人).
(2)用樣本估計總體的思想,估計該校高一年級學生達標測試的平均分為=×(45×2+55×6+65×2+75×14+85×3+95×13)=77.25(分).
(3)因為甲、乙、丙三人的體育成績分別為a,b,c,且a∈[70,80),b∈[80,90),c∈[90,100],其中a,b,c∈N,
所以當三人的體育成績方差s2最小時,a,b,c的所有可能取值為79,84,90或79,85,90.
22.(本小題滿分12分)為了監控某種零件的一條生產線的生產過程,檢驗員每隔30 min從該生產線上隨機抽取一個零件,并測量其尺寸(單位:cm).下面是檢驗員在一天內依次抽取的16個零件的尺寸:
抽取次序 1 2 3 4 5 6 7 8
零件尺寸 9.95 10.12 9.96 9.96 10.01 9.92 9.98 10.04
抽取次序 9 10 11 12 13 14 15 16
零件尺寸 10.26 9.91 10.13 10.02 9.22 10.04 10.05 9.95
0.212,其中xi為抽取的第i個零件的尺寸,i=1,2,…,16. 一天內抽檢零件中,如果出現了尺寸在(-3s,+3s)之外的零件,就認為這條生產線在這一天的生產過程可能出現了異常情況,需對當天的生產過程進行檢查.
(1)從這一天抽檢的結果看,是否需對當天的生產過程進行檢查?
(2)在(-3s,+3s)之外的數據稱為離群值,試剔除離群值,估計這條生產線當天生產的零件尺寸的均值與標準差.(精確到0.01)
附:≈0.09.
[解] (1)由于≈0.212,由樣本數據可以看出抽取的第13個零件的尺寸在+3s)以外,因此需對當天的生產過程進行檢查.
(2)剔除離群值,即第13個數據,剩下數據的平均數為(16×9.97-9.22)=10.02,
這條生產線當天生產的零件尺寸的均值的估計值為10.02.
剔除第13個數據,剩下數據的樣本方差為(1 591.134-9.222-15×10.022)≈0.008,
所以這條生產線當天生產的零件尺寸的標準差的估計值為≈0.09.

展開更多......

收起↑

資源列表

    <track id="r4fhd"></track>

    <pre id="r4fhd"><abbr id="r4fhd"><code id="r4fhd"></code></abbr></pre>
      <ul id="r4fhd"></ul>

        <menu id="r4fhd"></menu>
        1. 主站蜘蛛池模板: 翁源县| 南岸区| 肇东市| 遂平县| 津南区| 拜城县| 兴文县| 察哈| 孙吴县| 邻水| 来宾市| 夏津县| 长治市| 皮山县| 元阳县| 巴青县| 渝北区| 全州县| 遂平县| 额尔古纳市| 田林县| 杭锦后旗| 宁城县| 嘉黎县| 和龙市| 寿阳县| 安仁县| 麟游县| 探索| 高州市| 汉阴县| 句容市| 东平县| 马龙县| 绵竹市| 雷州市| 天镇县| 黔江区| 白城市| 赤壁市| 岑巩县|