中文字幕精品无码一区二区,成全视频在线播放观看方法,大伊人青草狠狠久久,亚洲一区影音先锋色资源

新教材適用2023_2024學年高中數學第9章統計學案(打包6份)(含解析)

資源下載
  1. 二一教育資源

新教材適用2023_2024學年高中數學第9章統計學案(打包6份)(含解析)

資源簡介

9.1.1 簡單隨機抽樣
課標要求
1.通過實例,了解簡單隨機抽樣的含義及其解決問題的過程.
2.掌握兩種簡單隨機抽樣方法:抽簽法和隨機數法.
3.會計算樣本均值,了解樣本與總體的關系.
素養要求
在簡單隨機抽樣的實施過程中,掌握抽簽法和隨機數法的抽樣步驟,發展學生數據分析素養.
知識點 1 全面調查與抽樣調查
調查方式 全面調查 抽樣調查
定義 對每一個調查對象都進行_調查__的方法,稱為全面調查,又稱普查 根據一定目的,從總體中_抽取一部分__個體進行調查,并以此為依據對總體的情況作出估計和推斷的調查方法
相關概念 總體:在一個調查中,我們把_調查對象__的全體稱為總體.個體:組成總體的每一個調查對象稱為個體 樣本:我們把從_總體__中抽取的那部分個體稱為樣本.樣本量:樣本中包含的_個體數__稱為樣本量
練一練:
某學校為了解高一800名新入學同學的數學學,從中隨機抽取100名同學的中考數學成績進行分析,在這個問題中,下列說法正確的是( D )
A.800名同學是總體
B.100名同學是樣本
C.每名同學是個體
D.樣本量是100
[解析] 據題意,總體是指800名新入學同學的中考數學成績,樣本是指抽取的100名同學的中考數學成績,個體是指每名同學的中考數學成績,樣本量是100,故只有D正確.
知識點 2 簡單隨機抽樣
放回簡單隨機抽樣 不放回簡單隨機抽樣
一般地,設一個總體含有N(N為正整數)個個體,從中_逐個__抽取n(1≤n如果抽取是放回的,且每次抽取時總體內的各個個體被抽到的概率都_相等__,我們把這樣的抽樣方法叫做放回簡單隨機抽樣 如果抽取是不放回的,且每次抽取時總體內_未進入樣本的各個個體__被抽到的概率都相等,我們把這樣的抽樣方法叫做不放回簡單隨機抽樣
簡單隨機抽樣:放回簡單隨機抽樣和不放回簡單隨機抽樣統稱為簡單隨機抽樣.通過簡單隨機抽樣獲得的樣本稱為簡單隨機樣本
[提醒] 簡單隨機抽樣有如下四個特征:
(1)它要求被抽取樣本的總體的個數確定,且較少,個體之間差異不明顯.
(2)它是從總體中逐個抽取.
(3)它是一種不放回抽取.
(4)它是一種等概率抽樣.不僅每次從總體中抽取一個個體時,各個個體被抽到的概率都相等,而且在整個抽樣過程中,各個個體被抽到的概率也相等,從而保證了這種抽樣方法的公平性.
知識點 3 抽簽法、隨機數法
1.抽簽法:先把總體中的個體編號,然后把所有編號寫在外觀、質地等無差別的小紙片(也可以使卡片、小球等)上作為號簽,并將這些小紙片放在一個_不透明__的盒里,充分 _攪拌__.最后從盒中不放回地逐個抽取號簽,使與號簽上的編號對應的個體進入樣本,直到抽足樣本所需要的個體數.
2.隨機數法
(1)定義:先把總體中的個體編號,用隨機數根據產生與總體中個體數量_相等__的整數隨機數,把產生的隨機數作為抽中的編號,并剔除_重復__的編號,直到抽足樣本所需要的個體數.
(2)產生隨機數的方法:①用隨機試驗生成隨機數;②用信息技術生成隨機數.
想一想:
抽簽法與隨機數法有什么異同?
相同點 ①都屬于簡單隨機抽樣,并且要求被抽取樣本的總體的個體數有限;②都是從總體中逐個不放回地進行抽取
不同點 ①抽簽法比隨機數法操作簡單;②隨機數法更適用于總體中個體數較多的時候,而抽簽法適用于總體中個體數較少的情況,所以當總體中的個體數較多時,應當選用隨機數法,可以節約大量的人力和制作號簽的成本
練一練:
全國高中數學聯合競賽是中國高中數學學科的較高等級的數學競賽,在每年9月第二個星期日舉行,在這項競賽中取得優異成績的全國約200名學生有資格參加由中國數學會主辦的中國數學奧林匹克(CMO).某校從初賽成績優秀的52名學生中選取5名學生參加省賽,若采用簡單隨機抽樣抽取,則每人入選的可能性( C )
A.都相等,且為 B.都相等,且為
C.都相等,且為 D.都不相等
[解析] 根據隨機抽樣的等可能性可知,每人入選的可能性都相等,且為,故選C.
知識點 4 總體均值和樣本均值
(1)總體均值:一般地,總體中有N個個體,它們的變量值分別為Y1,Y2,…,YN,則稱=  = i 為總體均值,又稱總體平均數.
(2)總體均值加權平均數的形式:如果總體的N個變量值中,不同的值共有k個(k≤N)個,不妨記為Y1,Y2,…,Yk,其中Yi出現的頻數fi(i=1,2,…,k),則總體均值還可以寫成加權平均數的形式= iYi .
(3)如果從總體中抽取一個容量為n的樣本,它們的變量值分別為y1,y2,…,yn,則稱=  = i 為樣本均值,又稱樣本平均數.在簡單隨機抽樣中,我們常用樣本平均數去估計總體平均數.
練一練:
1.用抽簽法抽取的一個容量為5的樣本,它們的變量值分別為2,3,5,7,9,則該樣本的平均數為( C )
A.4.5 B.4.8
C.5.2 D.6
[解析] ==5.2.
2.隨機抽取某商場4月份5天的營業額(單位:萬元)分別為3.4,2.9,3.0,3.1,2.6,則這個商場4月份的營業額大約是( A )
A.90萬元 B.450萬元
C.3萬元 D.15萬元
[解析] 樣本平均數為×(3.4+2.9+3.0+3.1+2.6)=3,所以這個商場4月份營業額約為3×30=90(萬元).
題型探究
題型一 簡單隨機抽樣的概念
典例1 (1)關于簡單隨機抽樣的特點有以下幾種說法,其中不正確的是( D )
A.要求總體中的個體數有限
B.從總體中逐個抽取
C.這是一種不放回抽樣
D.每個個體被抽到的機會不一樣,與先后順序有關
(2)下列問題中最適合用簡單隨機抽樣方法的是( C )
A.某學校有學生1 320人,衛生部門為了了解學生身體發育情況,準備從中抽取一個容量為300的樣本
B.為了準備省政協會議,某政協委員計劃從1 135個村莊中抽取50個進行收入調查
C.從全班30名學生中,任意選取5名進行家訪
D.為了解某地區癌癥的發病情況,從該地區的5 000人中抽取200人進行統計
[解析] (1)簡單隨機抽樣,除具有A,B,C三個特點外,還具有等可能性,每個個體被抽取的機會相等,與先后順序無關.
(2)A中不同年級的學生身體發育情況差別較大,B,D的總體容量較大,C的總體容量較小,適宜用簡單隨機抽樣.
[歸納提升] 可用簡單隨機抽樣抽取樣本的依據
(1)總體中的個體之間無明顯差異.
(2)總體中個體數N有限.
(3)抽取的樣本個體數n小于總體中的個體數N.
(4)逐個不放回地抽取.
(5)每個個體被抽到的可能性均為.
對點練習 (1)下列4個抽樣中,簡單隨機抽樣的個數是( B )
①從無數個個體中抽取50個個體作為樣本;
②倉庫中有1萬支奧運火炬,從中一次性抽取100支火炬進行質量檢查;
③一彩民選號,從裝有36個大小、形狀都相同的號簽的盒子中無放回地逐個抽出6個號簽;
④箱子里共有100個零件,從中選出10個零件進行質量檢驗,在抽樣操作中,從中任意取出1個零件進行質量檢驗后,再把它放回箱子里.
A.0 B.1
C.2 D.3
(2)從某年級的500名學生中抽取60名學生進行體重的統計分析,下列說法正確的是( C )
A.500名學生是總體
B.每個學生是個體
C.抽取的60名學生的體重是一個樣本
D.抽取的60名學生的體重是樣本量
[解析] (1)根據簡單隨機抽樣的特點逐個判斷.①不是簡單隨機抽樣.因為簡單隨機抽樣要求被抽取的樣本總體的個數是有限的.②不是簡單隨機抽樣.雖然“一次性抽取”和“逐個抽取”不影響個體被抽到的可能性,但簡單隨機抽樣要求的是“逐個抽取”.③是簡單隨機抽樣.因為總體中的個體數是有限的,并且是從總體中逐個進行抽取的,是不放回、等可能的抽樣.④不是簡單隨機抽樣,因為它是有放回抽樣.綜上,只有③是簡單隨機抽樣.
(2)應該是500名學生的體重是總體,故A錯;每個被抽查的學生的體重是個體,故B錯;抽查的60名學生的體重是一個樣本,故C正確;D中樣本量應為60,不是60名學生的體重.故D錯.
題型二 抽簽法及隨機數表法的應用
典例2 (1)從20架鋼琴中抽取5架進行質量檢查,請用抽簽法確定這5架鋼琴;
(2)某市質監局要檢查某公司某個時間段生產的500克袋裝牛奶的質量是否達標,現從500袋牛奶中抽取10袋進行檢驗.
①利用隨機數法抽取樣本時,應如何操作?
②如果用隨機試驗生成部分隨機數如下所示,據此寫出應抽取的袋裝牛奶的編號.
162,277,943,949,545,354,821,737,932,354,873,520,964,384,263,491,648,642,175,331,572,455,068,877,047,447,672,172,065,025,834,216,337,663,013,785,916,955,567,199,810,507,175,128,673,580,667.
[解析] (1)第一步,將20架鋼琴編號,號碼是1,2,…,20.
第二步,將號碼分別寫在外觀、質地等無差別的小紙片上作為號簽.
第三步,將小紙片放入一個不透明的盒里,充分攪勻.
第四步,從盒中不放回地逐個抽取5個號簽,使與號簽上編號相同的鋼琴進入樣本.
(2)①第一步,將500袋牛奶編號為001,002,…,500;
第二步,用隨機數工具產生1~500范圍內的隨機數;
第三步,把產生的隨機數作為抽中的編號,使編號對應的袋裝牛奶進入樣本;
第四步,重復上述過程,直到產生的不同編號等于樣本所需要的數量.
②應抽取的袋裝牛奶的編號為:162,277,354,384,263,491,175,331,455,068.
[歸納提升] 1.一個抽樣試驗能否用抽簽法,關鍵看兩點:
一是制簽是否方便;二是個體之間差異不明顯.
2.應用抽簽法時應注意以下幾點:
(1)編號時,如果已有編號可不必重新編號.
(2)號簽要求大小、形狀完全相同.
(3)號簽要均勻攪拌.
(4)根據實際需要采用有放回或無放回抽取.
對點練習 (1)總體由編號為01,02,…,19,20的20個個體組成,利用下面的隨機數表選取5個個體,選取方法:從隨機數表第1行的第5列和第6列數字開始由左到右一次選取兩個數字,則選出來的第5個個體的編號為( D )
7816 6572 0802 6314 0702 4369 9728 0198
3204 9234 4935 8200 3623 4869 6938 7481
A.08 B.07
C.02 D.01
(2)為提高學生的交通安全意識,某交警隊從學校報名的30名志愿者中選取6人組成志愿宣傳小組,請用抽簽法設計抽樣方案.
[解析] (1)從隨機數表第1行的第5列和第6列數字開始由左到右一次選取兩個數字開始向右讀,第一個數為65,不符合條件,第二個數為72,不符合條件,第三個數為08,符合條件,以下符合條件的數字依次為08,02,14,07,01,故第5個數為01.故選D.
(2)①將30名志愿者編號,號碼分別是1,2,…,30.
②將號碼分別寫在外觀、質地等無差別的小紙片上作為號簽.
③將小紙片放入一個不透明的盒里,充分攪勻.
④從盒中不放回地逐個抽取6個號簽,使與號簽上編號相同的志愿者進入樣本.
題型三 用樣本平均數估計總體平均數
典例3 某學校為了調查高一年級學生的體育鍛煉情況,從甲、乙、丙3個班中,按簡單隨機抽樣的方法獲得了部分學生一周的鍛煉時間(單位:h),數據如表.
甲 6 6.5 7 7.5 8
乙 6 7 8 9 10 11 12
丙 3 4.5 6 7.5 9 10.5 12 13.5
(1)估計這個學校高一年級的學生中,一周的鍛煉時間超過 10 個小時的百分比;
(2)估計這個學校高一年級學生一周的平均鍛煉時間.
[分析] (1)利用表中數據計算百分比;
(2)計算樣本的平均數來估計.
[解析] (1)由題意知,抽取的20個學生中,一周的鍛煉時間超過10小時的有5人,故一周的鍛煉時間超過10個小時的百分比為=25%.
(2)從甲班抽取的5名學生的總時間為6+6.5+7+7.5+8=35.
從乙班抽取的7名學生的總時間為6+7+8+9+10+11+12=63.
從丙班抽取的8名學生的總時間為3+4.5+6+7.5+9+10.5+12+13.5=66.
則==8.2.
即這個學校高一年級學生一周的平均鍛煉時間約為8.2小時.
[歸納提升] 關于總體平均數
總體平均數是總體的一項重要特征,但是當總體量較大時,計算總體平均數較困難.利用樣本平均數估計總體平均數時抽取有代表性的樣本,利用樣本平均數估計總體平均數顯得尤為重要.
對點練習 某學校抽取100位老師的年齡,得到如下數據:
年齡(單位:歲) 32 34 38 40 42 43 45 46 48
頻數 2 4 20 20 26 10 8 6 4
估計這個學校老師的平均年齡.
[解析] =×(32×2+34×4+38×20+40×20+42×26+43×10+45×8+46×6+48×4)=41.1(歲),
估計這個學校老師的平均年齡約為 41.1歲.
易錯警示
對簡單隨機抽樣的等可能性理解不透致誤
典例4 在簡單隨機抽樣中,某一個個體被抽到的可能性( C )
A.與第幾次抽樣有關,第一次抽到的可能性最大
B.與第幾次抽樣有關,第一次抽到的可能性最小
C.與第幾次抽樣無關,每一次抽到的可能性相等
D.與第幾次抽樣無關,與樣本量也無關
[錯解] B
[錯因分析] 簡單隨機抽樣在每一次抽取時被抽到的可能性相等,都是,但是要將每個個體被抽到的可能性與第n次被抽到的可能性區分開來,避免出錯.
[正解] 由簡單隨機抽樣的定義知簡單隨機抽樣與第幾次抽樣無關,在每一次抽取時被抽到的可能性相等,不能認為先抽可能性大,后抽可能性小.故C正確.
對點練習 對于簡單隨機抽樣,每個個體被抽到的機會( B )
A.不相等 B.相等
C.不確定 D.與抽樣次序有關
1.抽簽法確保樣本代表性的關鍵是( B )
A.制簽 B.攪拌均勻
C.逐一抽取 D.抽取不放回
[解析] 若樣本具有很好的代表性,則每一個個體被抽取的機會相等,故需要對號簽攪拌均勻.
2.下列調查中,調查方式選擇合理的是( D )
A.了解某一品牌家具的甲醛含量,選擇普查
B.了解神舟飛船的設備零件的質量情況,選擇抽樣調查
C.了解一批袋裝食品是否含有防腐劑,選擇普查
D.了解某公園全年的游客流量,選擇抽樣調查
[解析] 了解某一品牌家具的甲醛含量,選擇抽樣調查更符合經濟效益,A錯誤;了解神舟飛船的設備零件的質量情況,安全是最重要的,應該采取普查,B錯誤;了解一批袋裝食品是否含有防腐劑,選擇抽樣調查更符合經濟效益,C錯誤;了解某公園全年的游客流量,選擇抽樣調查比較符合經濟效益,D正確.故選D.
3.為了準確地調查我國某一時期的人口總量、人口分布、民族人口、城鄉人口、受教育的程度、遷徙流動、就業狀況等多方面的情況,需要用_普查__的方法進行調查.
[解析] 要獲得系統、全面、準確的信息,在對總體沒有破壞的前提下,普查無疑是一個非常好的方法,要全面、準確地調查人口的狀況,應當用普查的方法進行調查.故答案為普查.
4.在總體為N的一批零件中抽取一個容量為30的樣本,若每個零件被抽取的可能性為25%,則N的值為_120__.
[解析] 據題意=0.25,故N=120.
5.某大學要去貧困地區參加支教活動,需要從每班選10名男生,8名女生參加,某班有男生32名,女生28名,試用抽簽法確定該班參加支教活動的同學.
[解析] 第一步,將32名男生從0到31進行編號.
第二步,用相同的小紙片制成32個號簽,在每個號簽上寫上這些編號.
第三步,將寫好的號簽放在一個不透明的容器內搖勻,不放回地從中逐個抽出10個號簽.
第四步,相應編號的男生參加支教活動.
第五步,用相同的辦法從28名女生中選出8名,則此8名女生參加支教活動.9.1.2 分層隨機抽樣
9.1.3 獲取數據的途徑
課標要求
1.通過實例,了解分層隨機抽樣的特點和適用范圍.
2.了解分層隨機抽樣的必要性,掌握各層樣本量比例分配的方法.掌握分層隨機抽樣的樣本均值.
3.知道獲取數據的基本途徑,包括:統計報表和年鑒、社會調查、試驗設計、普查和抽樣、互聯網等.
素養要求
1.在分層隨機抽樣的實施過程中,掌握分層隨機抽樣的抽樣步驟,發展學生數據分析素養.
2.在學習獲取數據的途徑過程中,掌握獲取數據的方法,發展學生數據分析和數學建模的素養.
知識點 1 分層隨機抽樣
一般地,按_一個或多個__變量把總體劃分成若干個_子總體__,每個個體_屬于且僅屬于__一個子總體,在每個子總體中獨立地進行_簡單隨機抽樣__,再把所有子總體中抽取的樣本合在一起作為_總樣本__,這樣的抽樣方法稱為分層隨機抽樣.
(1)每一個子總體稱為層,在分層隨機抽樣中,如果每層樣本量都與層的大小成比例,那么稱這種樣本量的分配方式為_比例分配__.
(2)如果總體分為2層,兩層包含的個體數分別為M,N,兩層抽取的樣本量分別為m,n,兩層的樣本平均數分別為,,兩層的總體平均數分別為,,總體平均數為,樣本平均數為.
則= + ,=+.由于可用每層的樣本平均數,估計每層的總體平均,故可用 + 估計總體平均數.
(3)在比例分配的分層隨機抽樣中,可以直接用 樣本平均數 估計 總體平均數 .
[拓展] 分層隨機抽樣的步驟、特點及公平性
(1)分層隨機抽樣的操作步驟為:
①根據已掌握的信息,將總體分成互不相交的層;
②根據總體中的個體數N和樣本量n計算抽樣比k=;
③確定第i層應該抽取的個體數目ni≈Ni×k(Ni為第i層所包含的個體數,ni為第i層所抽取的個體數),各Ni之和為N;
④在各個層中按步取③中確定的數目在各層中隨機抽取個體,合在一起得到容量為n的樣本.
(2)分層隨機抽樣的特點:
①適用于總體由差異明顯的幾部分組成的情況;
②更充分地反映了總體的情況;
③等可能抽樣,每個個體被抽到的可能性都相等.
(3)分層隨機抽樣的公平性:
在分層隨機抽樣的過程中每個個體被抽到的可能性是相同的,與層數及分層無關.
(4)分層隨機抽樣下總體平均數的估計
在分層隨機抽樣中,如果層數分為2層,第1層和第2層包含的個體數分別為M和N,抽取的樣本量分別為m和n.我們用X1,X2,…,XM表示第1層各個個體的變量值,用x1,x2,…,xm表示第1層樣本的各個個體的變量值;用Y1,Y2,…,YN表示第2層各個個體的變量值,用y1,y2,…,yn表示第2層樣本的各個個體的變量值,則第1層的總體平均數和樣本平均數分別為
==i,
==i.
第2層的總體平均數和樣本平均數分別為
==i,
==i.
總體平均數和樣本平均數分別為
=,=.
在比例分配的分層隨機抽樣中,
==,
+=+=.
因此,在比例分配的分層隨機抽樣中,我們可以直接用樣本平均數估計總體平均數.
練一練:
某單位有職工160人,其中業務員104人,管理人員32人,后勤服務人員24人,現用比例分配的分層隨機抽樣法從中抽取一容量為20的樣本,則抽取管理人員有( B )
A.3人 B.4人
C.7人 D.12人
[解析] 由=,設抽取管理人員x人,則=,得x=4.故選B.
知識點 2 獲取數據的途徑
獲取數據的基本途徑有_通過調查獲取數據__、_通過試驗獲取數據__、_通過觀察獲取數據__、_通過查詢獲得數據__等.
練一練:
為了研究近年我國高等教育發展狀況,小明需要獲取近年來我國大學生入學人數的相關數據,他獲取這些數據的途徑最好是( D )
A.通過調查獲取數據 B.通過試驗獲取數據
C.通過觀察獲取數據 D.通過查詢獲得數據
[解析] 因為近年來我國大學生入學人數的相關數據有所存儲,所以小明獲取這些數據的途徑最好是通過查詢獲得數據.
題型探究
題型一 分層隨機抽樣概念
典例1 (1)某政府機關在編人員共100人,其中副處級以上干部10人,一般干部70人,工人20人,上級部門為了了解該機關對政府機構改革的意見,要從中抽取20人,用下列哪種方法最合適( D )
A.抽簽法 B.隨機數
C.簡單隨機抽樣 D.分層隨機抽樣
(2)分層隨機抽樣又稱類型抽樣,即將相似的個體歸入一類(層),然后每類抽取若干個個體構成樣本,所以分層隨機抽樣為保證每個個體被等可能抽取,必須進行( C )
A.每層等可能抽樣
B.每層可以不等可能抽樣
C.所有層按同一抽樣比等可能抽樣
D.所有層抽取的個體數量相同
[分析] 是否適合用分層隨機抽樣,首先判斷總體是否可以“分層”.
[解析] (1)總體由差異明顯的三部分構成,應選用分層隨機抽樣.
(2)為了保證每個個體等可能的被抽取,分層隨機抽樣時必須在所有層都按同一抽樣比等可能抽取.
[歸納提升] 1.使用分層抽樣的前提
分層隨機抽樣的總體按一個或多個變量劃分成若干個子總體,并且每一個個體屬于且僅屬于一個子總體,而層內個體間差異較小.
2.使用分層隨機抽樣應遵循的原則
(1)將相似的個體歸入一類,即為一層,分層要求每層的各個個體互不交叉,即遵循不重復、不遺漏的原則.
(2)分層隨機抽樣為保證每個個體等可能抽取,需遵循在各層中進行簡單隨機抽樣,每層樣本量與每層個體數量的比等于抽樣比.
對點練習 (1)下列問題中,適合用分層隨機抽樣抽取樣本的是( B )
A.學校從10個優秀節目中抽取3個參加縣元旦晚會
B.某社區有500個家庭,其中高收入的家庭125戶,中等收入的家庭280戶,低收入的家庭95戶,為了了解生活購買力的某項指標,要從中抽取一個容量為100的樣本
C.某學校有男、女學生各500名,為了解學生的期末復習情況,擬抽取100名學生進行調查
D.某啤酒廠質檢員從生產流水線上,抽取樣本檢查產品質量
(2)某校有高一學生400人,高二學生380人,高三學生220人,現教育局督導組欲用分層隨機抽樣的方法抽取50名學生進行問卷調查,則下列判斷正確的是( D )
A.高一學生被抽到的可能性最大
B.高二學生被抽到的可能性最大
C.高三學生被抽到的可能性最大
D.每位學生被抽到的可能性相等
[解析] (1)A中總體所含個體無差異且個數較少,適合用簡單隨機抽樣;C中總體雖然分男、女兩個層,但是要了解期末復習情況,沒有必要采取分層隨機抽樣;D中總體所含個體無差異,不適合用分層隨機抽樣;B中總體所含個體差異明顯,并且要了解購買能力,與收入關系密切,適合用分層隨機抽樣.
(2)分層抽樣在每一層中的抽樣比是相同的,所以每位學生被抽到的可能性相等.
題型二 分層隨機抽樣的應用
典例2 一個單位有職工500人,其中不到35歲的有125人,35歲至49歲的有280人,50歲及50歲以上的有95人.為了了解這個單位職工與身體狀態有關的某項指標,要從中抽取100名職工作為樣本,職工年齡與這項指標有關,應該怎樣抽取?
[解析] 用分層隨機抽樣來抽取樣本,步驟如下:
(1)分層.按年齡將500名職工分成三層:不到35歲的職工;35歲至49歲的職工;50歲及50歲以上的職工.
(2)確定每層抽取個體的個數.抽樣比為=,則在不到35歲的職工中抽取125×=25(人);
在35歲至49歲的職工中抽取280×=56(人);
在50歲及50歲以上的職工中抽取95×=19(人).
(3)在各層分別按簡單隨機抽樣抽取樣本.
(4)匯總每層抽樣,組成樣本.
[歸納提升] 分層隨機抽樣的步驟
對點練習 某校500名學生中,有200人的血型為O型,有125人的血型為A型,有125人的血型為B型,有50人的血型為AB型.為了研究血型與色弱的關系,需從中抽取一個容量為20的樣本.怎樣抽取樣本?
[解析] 用分層隨機抽樣抽取樣本.
∵=,即抽樣比為,
∴200×=8,125×=5,50×=2.
故O型血抽取8人,A型血抽取5人,B型血抽取5人,AB型血抽取2人.
題型三 分層抽樣的相關計算
典例3 (1)交通管理部門為了解機動車駕駛員(簡稱駕駛員)對某新法規的知曉情況,對甲、乙、丙、丁四個社區做分層隨機抽樣調查,假設四個社區駕駛員的總人數為N,其中甲社區有駕駛員96人.若在甲、乙、丙、丁四個社區抽取駕駛員的人數分別為12,21,25,43,則這四個社區駕駛員的總人數N為( B )
A.101 B.808
C.1 212 D.2 012
(2)將一個總體分為A,B,C三層,其個體數之比為5∶3∶2,若用分層隨機抽樣方法抽取容量為100的樣本,則應從C中抽取_20__個個體.
(3)分層隨機抽樣中,總體共分為2層,第1層的樣本量為20,樣本平均數為3,第2層的樣本量為30,樣本平均數為8,則該樣本的平均數為_6__.
[解析] (1)因為甲社區有駕駛員96人,并且在甲社區抽取的駕駛員的人數為12人,
所以四個社區抽取駕駛員的比例為=,
所以駕駛員的總人數為
(12+21+25+43)÷=808(人).
(2)∵A,B,C三層個體數之比為5∶3∶2,又有總體中每個個體被抽到的概率相等,∴分層隨機抽樣應從C中抽取100×=20(個)個體.
(3)=×3+×8=6.
[歸納提升] (1)進行分層隨機抽樣的相關計算時,常用到的兩個關系
①=;
②總體中某兩層的個體數之比等于樣本中這兩層抽取的個體數之比.
(2)樣本的平均數和各層的樣本平均數的關系為:
=+=+.
對點練習 (1)我國古代數學專著《九章算術》中有一衰分問題:今有北鄉八千一百人,西鄉七千四百八十八人,南鄉六千九百一十二人,凡三鄉,發役三百人,則北鄉遣( B )
A.104人 B.108人
C.112人 D.120人
(2)某學校高一年級在校人數為600人,其中男生320人,女生280人,為了解學生身高發展情況,按分層隨機抽樣的方法抽取50名男生身高為一個樣本,其樣本平均數為170.2 cm,抽取50名女生身高為一個樣本,其樣本平均數為162.0 cm,則該校高一學生的平均身高的估計值為_166.4_cm__.
[解析] (1)由題意可知,這是一個分層隨機抽樣的問題,其中北鄉可抽取的人數為300×=300×=108.
(2)由題意可知,=170.2,=162.0且M=320,N=280,
所以樣本平均數=+=×170.2+×162.0≈166.4(cm),
故該校高一學生的平均身高的估計值為166.4 cm.
易錯警示
忽略抽樣的公平性致錯
典例4 某單位有老年人28人、中年人54人、青年人81人,為了調查他們的身體情況,需從中抽取一個樣本量為36的樣本,則下列抽樣方法適合的是_②__.
①簡單隨機抽樣;
②直接運用分層隨機抽樣;
③先從老年人中剔除1人,再用分層隨機抽樣.
[錯解] ③
[錯因分析] 由于按抽樣,無法得到整數解,因此先剔除1人,將抽樣比變為=.若從老年人中隨機地剔除1人,則老年人應抽取27×=6(人),中年人應抽取54×=12(人),青年人應抽取81×=18(人),從而組成樣本量為36的樣本.事實上,若用簡單隨機抽樣法先從老年人中剔除1人,則老年人中每個人被抽到的機會顯然比中年人、青年人中每個人被抽到的機會小了,這不符合隨機抽樣的特征——每個個體入樣的機會都相等.
[正解] 因為總體由差異明顯的三部分組成,所以考慮用分層隨機抽樣.因為總人數為28+54+81=163,樣本量為36,所以抽樣比為.因此,從老年人、中年人和青年人中應抽取的人數分別為×28≈6,×54≈12,×81≈18.
[誤區警示] 分層隨機抽樣的一個很重要的特點是每個個體被抽到的機會是相等的.當按照比例計算出的值不是整數時,一般采用四舍五入的方法取值.若四舍五入后得到的樣本量與要求的不盡相同,則可根據問題的實際意義適當處理,使之相同,這只是細節性問題,并未改變分層隨機抽樣的本質.
對點練習 為了解某地區的中小學生的視力情況,擬從該地區的中小學生中抽取部分學生進行調查,事先已了解到該地區小學、初中、高中三個學段學生的視力情況有較大差異,且男女生視力情況差異不大.在下面的抽樣方法中,最合理的抽樣方法是( C )
A.簡單隨機抽樣 B.按性別分層隨機抽樣
C.按學段分層隨機抽樣 D.隨機數法抽樣
[解析] 依據題意,了解到該地區小學、初中、高中三個學段學生的視力情況有較大差異,且男女生視力情況差異不大,故要了解該地區學生的視力情況,應按學段分層隨機抽樣.故選C.
1.分層隨機抽樣適合的總體是( C )
A.總體容量較多 B.樣本量較多
C.總體中個體有差異 D.任何總體
[解析] 分層隨機抽樣適合總體中個體有差異的總體.故選C.
2.下列數據一般需要通過實驗獲取的是( A )
A.某子彈的射程
B.某學校的男女生比例
C.華為手機的市場占有率
D.期中考試的班級數學成績
[解析] 某子彈的射程沒有現存數據可以查詢,因而需要通過實驗獲取,A項正確;某學校的男女生比例可以通過查詢獲取,不需要通過實驗獲取,B項錯誤;華為手機的市場占有率可以通過調查獲取,不需要通過實驗獲取,C項錯誤;期中考試的班級數學成績可以通過查詢獲取,不需要通過實驗獲取,D項錯誤;故選A.
3.某學校現有小學和初中學生共2 000人,為了解學生的體質健康合格情況,決定采用分層抽樣的方法從全校學生中抽取一個容量為400的樣本,其中被抽到的初中學生人數為180,那么這所學校的初中學生人數為( B )
A.800 B.900
C.1 000 D.1 100
[解析] 樣本容量與總體容量的比值為=,設這所學校的初中學生人數為x,則被抽到的初中學生人數為x×=180,那么這所學校的初中學生人數為x=900.
故選B.
4.某工廠生產A,B,C三種不同型號的產品,產品的數量之比依次為3∶4∶7.現在按分層隨機抽樣的方法抽取一個容量為n的樣本,樣本中A號產品有15件,那么樣本量n為( C )
A.50 B.60
C.70 D.80
[解析] 由分層隨機抽樣定義知=,
∴n=70,故選C.
5.A中學高一年級的500名同學中有218名女生,在調查全年級同學的平均身高時,預備抽樣調查50名同學.
(1)設計一個合理的分層抽樣方案.
(2)你的設計中,第一層和第二層分別是什么?
(3)分層抽樣是否在得到全年級同學平均身高的估計時,還分別得到了男生和女生的平均身高的估計?
[解析] (1)因為男生、女生身高有差異性,故按男生、女生在總人數中所占比例采取分層抽樣.
因為500名同學中有218名女生,故女生抽取人數為50×≈22人;
500名同學中有282名男生故男生抽取人數為50×≈28人.
然后測量這50人的身高數據,從而得到50人的身高數據樣本.
(2)第一層為總體500名學生中的所有女生的身高數據,第二層為總體500名學生中的所有男生的身高數據.
(3)是的,可以用男、女生身高數據之和除以各自樣本中的人數,得到男、女生平均身高的估計值.9.2.1 總體取值規律的估計
課標要求
能選擇恰當的統計圖表對數據進行可視化描述,體會合理使用統計圖表的重要性.結合實例,能用樣本估計總體的取值規律.
素養要求
在學習繪制頻率分布直方圖的過程中,掌握應用頻率分布直方圖等統計圖表估計總體的取值規律,發展學生數據分析的素養.
知識點 1 畫頻率分布直方圖的步驟
1.求極差:極差是一組數據中_最大值__與_最小值__的差.
2.決定組距與組數:當樣本容量不超過100時,常分成_5~12__組,一般取等長組距,并且組距應力求“取整”.
3.將數據分組.
4.列頻率分布表:一般分四列,即分組、_頻數累計__、頻數、_頻率__.其中頻數合計應是樣本容量,頻率合計是_1__.
5.畫頻率分布直方圖:橫軸表示樣本數據,縱軸表示.小長方形的面積=組距×=_頻率__.各小長方形的面積和等于1.
[拓展] 
1.數據分組及確定區間的技巧
(1)組距是指每個小組的兩個端點之間的距離.為了方便起見,組距的選擇應力求“取整”.極差、組距、組數有如下關系:
①若為整數,則=組數;
②若不為整數,則+1=組數.([x]表示不大于x的最大整數)
(2)組數與樣本容量有關,一般地,樣本容量越大,分的組數也就越多.當樣本容量不超過100時,常分成5~12組.
(3)為方便起見,往往按等距分組,或者除了第一和最后的兩段,其他各段按等距分組.
2.頻率分布表的理解
由頻率的定義不難得出,各組數據的頻率之和為1,因為各組數據的個數之和等于樣本容量,故在列頻率分布表時,可以利用這種方法檢查是否有數據的丟失.因此表格最后一行可加上“合計”.
3.頻率分布直方圖的理解
(1)每一組對應的矩形高度是,而不是.
(2)因為小長方形的面積=組距×=頻率,所以各個小長方形的面積表示相應各組的頻率.這樣,頻率分布直方圖就以面積的形式反映了數據落在各個小組內的頻率大小.
(3)在頻率分布直方圖中,所有小長方形的面積之和等于1.
練一練:
下圖為某校100名學生期中考試語文成績的頻率分布直方圖,其中成績分組區間是:[50,60),[60,70),[70,80),[80,90),[90,100].則分數在[60,80)的學生數為_70__.
[解析] 由頻率分布直方圖先求出分數在[60,80)的頻率為(0.04+0.03)×10=0.7,
所以分數在[60,80)的學生數為100×0.7=70人,
故答案為70.
知識點 2 三種統計圖的用途、優點、缺點
(1)條形圖
用途:直觀描述不同類別或分組數據的頻數和頻率.
優點:當數據量很大時,它能更直觀地反映數據分布的大致情況,并能清晰地表示出各個區間的具體數目.
缺點:會損失數據的部分信息.
(2)折線圖
用途:描述數據隨時間的變化趨勢.
優點:可以表示數量的多少,直觀反映數量的增減情況,即變化趨勢.
缺點:不能直觀反映數據的分布情況.
(3)扇形圖
用途:直觀描述各類數據占總數的比例.
優點:可以直觀地反映出各種情況所占的比例.
缺點:看不出具體數據的多少.
練一練:
要反映某市一周內每天的最高氣溫的變化情況,宜采用( C )
A.條形統計圖
B.扇形統計圖
C.折線統計圖
D.頻率分布直方圖
[解析] 描述數據隨時間的變化趨勢宜采用折線統計圖.
題型探究
題型一 頻率分布直方圖的作法
典例1 為了檢測某種產品的質量,抽取了一個樣本量為100的樣本,數據的分組如下:
[10.75,10.85),3;[10.85,10.95),9;[10.95,11.05),13;[11.05,11.15),16;[11.15,11.25),26;[11.25,11.35),20;[11.35,11.45),7;[11.45,11.55),4;[11.55,11.65],2.
(1)列出頻率分布表;
(2)畫出頻率分布直方圖.
[分析] 題目要求列出樣本的頻率分布表、畫出頻率分布直方圖,應注意到已知條件中雖未提供原始數據,但組距、組數及頻數都已給出,可由此來列表、畫圖.
[解析] (1)頻率分布表如下:
分組 頻數 頻率
[10.75,10.85) 3 0.03
[10.85,10.95) 9 0.09
[10.95,11.05) 13 0.13
[11.05,11.15) 16 0.16
[11.15,11.25) 26 0.26
[11.25,11.35) 20 0.20
[11.35,11.45) 7 0.07
[11.45,11.55) 4 0.04
[11.55,11.65] 2 0.02
合計 100 1.00
(2)頻率分布直方圖如圖
[歸納提升] 繪制頻率分布直方圖應注意的問題
(1)在繪制出頻率分布表后,畫頻率分布直方圖的關鍵就是確定小矩形的高.一般地,頻率分布直方圖中兩坐標軸上的單位長度是不一致的,合理的定高方法是“以一個恰當的單位長度”(沒有統一規定),然后以各組的“”所占的比例來定高.如我們預先設定以“”為1個單位長度,代表“0.1”,則若一個組的為0.2,則該小矩形的高就是“”(占兩個單位長度),如此類推.
(2)數據要合理分組,組距要選取恰當,一般盡量取整,數據為30~100個左右時,應分成5~12組,在頻率分布直方圖中,各個小長方形的面積等于各組的頻率,小長方形的高與頻數成正比,各組頻數之和等于樣本量,頻率之和為1.
(3)頻率分布表從數值直觀反映各組的頻率,頻率分布直方圖則更形象地描繪出頻率與樣本分布趨勢.所以通常通過兩者綜合考查估計樣本的某些特征.
對點練習 在生產過程中,測得纖維產品的纖度(表示纖細的一種量)共有100個數據,將數據分組如下表:
分組 頻數 頻率
[1.30,1.34) 4
[1.34,1.38) 25
[1.38,1.42) 30
[1.42,1.46) 29
[1.46,1.50) 10
[1.50,1.54] 2
合計 100
(1)完成頻率分布表,并畫出頻率分布直方圖;
(2)估計纖度落在[1.38,1.50)內的可能性及纖度小于1.42的可能性各是多少?
[解析] (1)頻率分布表如下:
分組 頻數 頻率
[1.30,1.34) 4 0.04
[1.34,1.38) 25 0.25
[1.38,1.42) 30 0.30
[1.42,1.46) 29 0.29
[1.46,1.50) 10 0.10
[1.50,1.54] 2 0.02
合計 100 1.00
頻率分布直方圖如圖所示.
(2)利用樣本估計總體,則纖度落在[1.38,1.50)的可能性即為纖度落在[1.38,1.50)的頻率,即為0.30+0.29+0.10=0.69=69%.
纖度小于1.42的可能性即為纖度小于1.42的頻率,即為0.04+0.25+0.30=0.59=59%.
題型二 頻率分布直方圖的應用
典例2 400名大學生參加某次測評,根據男女學生人數比例,使用分層抽樣的方法從中隨機抽取了100名學生,記錄他們的分數,將數據分成7組:[20,30],[30,40],…,[80,90],并整理得到如下頻率分布直方圖:
(1)在頻率分布直方圖中,求分數小于70的頻率;
(2)已知樣本中分數小于40的學生有5人,試估計總體中分數在區間[40,50)內人數;
(3)已知樣本中有一半男生的分數不小于70,且樣本中分數不小于70的男女生人數相等.試估計總體中男生和女生人數的比例.
[分析] (1)根據頻率分布直方圖求得分數不小于70的頻率為0.6,進而求得樣本中分數小于70的頻率;
(2)根據題意,求得樣本中分數不小于50的頻率為0.9,得到分數在區間[40,50)內的人數為5,進而求得總體中分數在區間[40,50)內的人數;
(3)根據題意分別求得樣本中的男生和女生人數,得到男生和女生人數的比例,結合分層抽樣的概念,即可求解.
[解析] (1)根據頻率分布直方圖可知,樣本中分數不小于70的頻率為(0.02+0.04)×10=0.6
所以樣本中分數小于70的頻率為1-0.6=0.4.
(2)根據題意,樣本中分數不小于50的頻率為(0.01+0.02+0.04+0.02)×10=0.9,
分數在區間[40,50)內的人數為100-100×0.9-5=5.
所以總體中分數在區間[40,50)內的人數估計為400×=20.
(3)由題意可知,樣本中分數不小于70的學生人數為(0.02+0.04)×10×100=60,
所以樣本中分數不小于70的男生人數為60×=30.
所以樣本中的男生人數為30×2=60,女生人數為100-60=40,
男生和女生人數的比例為60∶40=3∶2.
所以根據分層抽樣原理,總體中男生和女生人數的比例估計為3∶2.
[歸納提升] 頻率分布直方圖的性質
(1)因為小矩形的面積=組距×=頻率,所以各小矩形的面積表示相應各組的頻率.這樣,頻率分布直方圖就以面積的形式反映了數據落在各個小組內的頻率大小.
(2)在頻率分布直方圖中,各小矩形的面積之和等于1.
(3)樣本量=頻數/相應的頻率.
對點練習 杭州市某高中從學生中招收志愿者參加迎亞運專題活動,現已有高一540人、高二360人,高三180人報名參加志愿活動.根據活動安排,擬采用分層抽樣的方法,從已報名的志愿者中抽取120名.對抽出的120名同學某天參加運動的時間進行了統計,運動時間均在39.5至99.5分鐘之間,其頻率分布直方圖如下:
(1)需從高一、高二、高三報名的學生中抽取多少人;
(2)請補全頻率分布直方圖.
[分析] (1)根據分層抽樣的定義按比例求解即可;
(2)由各組的頻率和為1求出第三組的頻率,從而可求出第三組的小矩形的高度,進而可補全頻率分布直方圖.
[解析] (1)報名的學生共有1 080人,抽取的比例為=,
所以高一抽取540×=60人,高二抽取360×=40人,高三抽取180×=20人;
(2)第三組的頻率為1-(0.1+0.15+0.3+0.25+0.05)=0.15,
故第三組的小矩形的高度為0.015,補全頻率分布直方圖得
題型三 折線圖、條形圖、扇形圖及應用
典例3 如圖是根據某市3月1日至3月10日的最低氣溫(單位:℃)的情況繪制的折線統計圖,試根據折線統計圖反映的信息,繪制該市3月1日到10日最低氣溫(單位:℃)的扇形統計圖和條形統計圖.
[解析] 該城市3月1日至10日的最低氣溫(單位:℃)情況如下表:
日期 1 2 3 4 5 6 7 8 9 10
最低氣溫(℃) -3 -2 0 -1 1 2 0 -1 2 2
其中最低氣溫為-3 ℃的有1天,占10%,最低氣溫為-2 ℃的有1天,占10%,最低氣溫為-1 ℃的有2天,占20%,最低氣溫為0 ℃的有2天,占20%,最低氣溫為1 ℃的有1天,占10%,最低氣溫為2 ℃的有3天,占30%,扇形統計圖如圖所示.
條形統計圖如下圖所示:
[歸納提升] 1.條形圖是用一個單位長度表示一定的數量或頻率,根據數量的多少或頻率的大小畫成長短不同的矩形條,條形圖能清楚地表示出每個項目的具體數目或頻率.
2.扇形圖是用整個圓面積表示總數(100%),用圓內的扇形面積表示各個部分所占總數的百分數.
3.在畫折線圖時,要注意明確橫軸、縱軸的實際含義.
對點練習 如圖是某市2021年5月1日至5月7日每天最高、最低氣溫的折線統計圖,在這7天中,日溫差最大的一天是( D )
A.5月1日 B.5月2日
C.5月3日 D.5月5日
[解析] 由折線圖可以看出,該市日溫差最大的一天是5月5日.
易錯警示
誤將頻率分布直方圖中的縱坐標當作頻率
典例4 中小學生的視力狀況受到社會的廣泛關注.某市有關部門從全市6萬名高一學生中隨機抽取400名學生,對他們的視力狀況進行一次調查統計,將所得到的有關數據繪制成頻率分布直方圖,如圖.從左至右五個小組的頻率之比為5∶7∶12∶10∶6,則該市6萬名高一學生中視力在[3.95,4.25)內的學生約有多少人?
[錯解] 由圖可知,第五小組的頻率為0.5,所以第一小組的頻率為0.5×=.
所以該市6萬名高一學生中視力在[3.95,4.25)內的學生約有60 000×=25 000(人).
[錯因分析] 造成錯解的原因是將該頻率分布直方圖中的縱坐標(頻率與組距的比)看成頻率.
[正解] 由圖可知,第五小組的頻率為0.5×0.3=0.15,
所以第一小組的頻率為0.15×=0.125.
所以該市6萬名高一學生中視力在[3.95,4.25)內的學生約有60 000×0.125=7 500(人).
[誤區警示] 頻率分布直方圖中的縱軸上所標數據是小矩形的高,表示,計算頻率時不要忘了乘組距.
對點練習 如圖所示是一容量為100的樣本的頻率分布直方圖,則由圖中的數據可知,樣本落在[15,20]內的頻數為( B )
A.20 B.30
C.40 D.50
[解析] 樣本數據落在[15,20]內的頻數為100×[1-5×(0.04+0.1)]=30.
1.如圖是甲、乙、丙、丁四組人數的扇形統計圖的部分結果,根據扇形統計圖的情況可以知道丙、丁兩組人數和為( A )
A.250 B.150
C.400 D.300
[解析] 甲組人數是120,占30%,則總人數是=400.則乙組人數是400×7.5%=30,則丙、丁兩組人數和為400-120-30=250.
2.一個容量為80的樣本中數據的最大值是140,最小值是51,組距是10,則應將樣本數據分為( B )
A.10組 B.9組
C.8組 D.7組
[解析] ==8.9,所以分為9組較為恰當.
3.甲、乙兩個城市2022年4月中旬每天的最高氣溫統計圖如圖所示,則這9天里,氣溫比較穩定的是_甲__城市(填“甲”“乙”).
[解析] 從折線統計圖可以很清楚地看到乙城市的氣溫變化較大,而甲城市氣溫相對來說較穩定,變化基本不大.
4.某班計劃開展一些課外活動,全班有40名學生報名參加,他們就乒乓球、足球、跳繩、羽毛球4項活動的參加人數做了統計,繪制了條形統計圖(如圖所示),那么參加羽毛球活動的人數的頻率是_0.1__.
[解析] 參加羽毛球活動的人數是4,則頻率是=0.1.
5.為了解某中學高一學生的某次月考的數學成績,備課組人員隨機抽取了100名學生的數學成績并進行調查,根據所得數據制成如圖所示的頻率分布直方圖.已知不低于90分為及格,不低于130分為優秀.
(1)求實數a的值;
(2)若參加本次月考的學生總人數為1 500,試根據樣本的相關信息估計本次月考數學成績及格和優秀的人數.
[解析] (1)由20(0.006+0.014+0.020+0.008+a)=1,
得:a=0.002.
(2)由(1)知,
樣本中及格人數的頻率為:20×0.020+20×0.008+20×0.002=0.6,
樣本中優秀人數的頻率為:20×0.002=0.04,
從而本次月考及格和優秀的人數估計分別為:1 500×0.6=900和1 500×0.04=60.9.2.2 總體百分位數的估計
9.2.3 總體集中趨勢的估計
課標要求
學會計算樣本百分位數,會對總體百分位數做出合理估計.
理解平均數、眾數、中位數的定義,會從已知數據中獲得上述特征數值.
素養要求
在學習和應用特征數值的過程中,要把實際問題轉化為數學問題,并進行計算,對數據進行分析,發展學生的數學建模、數學運算素養和數據分析素養.
知識點 1 百分位數
(1)概念
一般地,一組數據的第p百分位數是這樣一個值,它使得這組數據中至少有 p% 的數據小于或等于這個值,且至少有(100-p)%的數據大于或等于這個值.
(2)求解步驟
可以通過下面的步驟計算一組n個數據的第p百分位數:
第1步,按_從小到大__排列原始數據.
第2步,計算i= n×p% .
第3步,若i不是整數,而大于i的比鄰整數為j,則第p百分位數為_第j項數據__;若i是整數,則第p百分位數為第_i__項與第_(i+1)__項數據的_平均數__.
(3)四分位數
第25百分位數,第50百分位數,第75百分位數這三個分位數把一組_從小到大__排列后的數據分成
_四等份__ ,因此稱為_四分位數__,其中第25 百分位數也稱為_第一四分位數__或_下四分位數__,第75百分位數也稱為_第三四分位數__或_上四分位數__.
練一練:
1.下列關于一組數據的第50百分位數的說法正確的是( A )
A.第50百分位數就是中位數
B.總體數據中的任意一個數小于它的可能性一定是50%
C.它一定是這組數據中的一個數據
D.它適用于總體是離散型的數據
[解析] 由百分位數的意義可知選項B、C、D錯誤.
2.數據7.0,8.4,8.4,8.4,8.6,8.7,9.0,9.1的第30百分位數是_8.4__.
[解析] 因為8×30%=2.4,故30%分位數是第三項數據8.4.
知識點 2 眾數、中位數、平均數
(1)眾數:一組數據中出現次數_最多__的數.
(2)中位數:把一組數據按_大小__順序排列,處在_中間__位置的數(或中間兩個數的_平均數__)叫做這組數據中位數.
(3)平均數:如果有n個數x1,x2,…,xn,那么=  叫做這n個數的平均數.
知識點 3 總體集中趨勢的估計
(1)平均數、中位數和眾數等都是刻畫_數據集中趨勢__的量,它們從不同角度刻畫了一組數據的集中趨勢.
(2)一般地,對數值型數據(如用水量、身高、收入、產量等)集中趨勢的描述,可以用_平均數__、_中位數__;而對分類型數據(如校服規格、性別、產品質量等級等)集中趨勢的描述,可以用_眾數__.
想一想:
眾數、中位數和平均數的優缺點分別是什么?
名稱 優點 缺點
眾數 體現了樣本數據的最大集中點 眾數只能傳遞數據中的信息的很少一部分,對極端值不敏感
中位數 不受少數幾個極端數據(即排序靠前或靠后的數據)的影響 對極端值不敏感
平均數 與中位數相比,平均數反映出樣本數據中更多的信息,對樣本中的極端值更加敏感 任何一個數據的改變都會引起平均數的改變,數據越“離群”,對平均數的影響越大
練一練:
1.判斷正誤.(正確的畫“√”,錯誤的畫“×”)
(1)中位數是一組數據中間的數.( × )
(2)眾數是一組數據中出現次數最多的數.( √ )
(3)平均數反映了一組數據的平均水平,任何一個樣本數據的改變都會引起平均數的變化.( √ )
2.已知一組數據4,6,5,8,7,6,那么這組數據的平均數為_6__.
[解析] =6.
知識點 4 頻率分布直方圖中平均數、中位數、眾數的求法
(1)樣本平均數:可以用每個小矩形底邊中點的橫坐標與小矩形的_面積__的乘積之和近似代替.
(2)在頻率分布直方圖中,中位數左邊和右邊的直方圖的面積應_相等__.
(3)將_最高的__小矩形所在的區間_中點橫坐標__作為眾數的估計值.
練一練:
如圖所示是一樣本的頻率分布直方圖,則由圖中的數據可以估計眾數與中位數分別是( B )
A.12.5,12.5
B.12.5,13
C.13,12.5
D.13,13
題型探究
題型一 百分位數的計算
典例1 從某珍珠公司生產的產品中,任意抽取12顆珍珠,得到它們的質量(單位:g)如下:
7.9,9.0,8.9,8.6,8.4,8.5,8.5,8.5,9.9,7.8,8.3,8.0.
(1)分別求出這組數據的第25,50,95百分位數;
(2)請你找出珍珠質量較小的前15%的珍珠質量;
(3)若用第25,50,95百分位數把公司生產的珍珠劃分為次品、合格品、優等品和特優品,依照這個樣本的數據,給出該公司珍珠等級的劃分標準.
[解析] (1)將所有數據從小到大排列,得
7.8,7.9,8.0,8.3,8.4,8.5,8.5,8.5,8.6,8.9,9.0,9.9,
因為共有12個數據,
所以12×25%=3,12×50%=6,12×95%=11.4,
則第25百分位數是=8.15,
第50百分位數是=8.5,
第95百分位數是第12個數據為9.9.
(2)因為共有12個數據,所以12×15%=1.8,則第15百分位數是第2個數據為7.9.
即產品質量較小的前15%的產品有2個,它們的質量分別為7.8,7.9.
(3)由(1)可知樣本數據的第25百分位數是8.15 g,第50百分位數為8.5 g,第95百分位數是9.9 g,所以質量小于或等于8.15 g的珍珠為次品,質量大于8.15 g且小于或等于8.5 g的珍珠為合格品,質量大于8.5 g且小于或等于9.9 g的珍珠為優等品,質量大于9.9 g的珍珠為特優品.
[歸納提升] 1.計算一組n個數據的第p百分位數的一般步驟:
(1)排列:按照從小到大排列原始數據;
(2)算i:計算i=n×p%;
(3)定數:若i不是整數,大于i的最小整數為j,則第p百分位數為第j項數據;若i是整數,則第p百分位數為第i項與第(i+1)項數據的平均數.
2.根據頻率分布直方圖計算樣本數據的百分位數,首先要理解頻率分布直方圖中各組數據頻率的計算,其次估計百分位數在哪一組,再應用方程的思想方法,設出百分位數,解方程可得.
對點練習 (2023·北京市通州區期末)已知一組樣本數據依次為:3,9,0,4,1,6,6,8,2,7.該組數據的40%分位數是_3.5__,85%分位數是_8__.
[解析] 將10個樣本數據按照從小到大的順序排列為:0,1,2,3,4,6,6,7,8,9.∵10×40%=4,得到該組數據的40%分位數是第4個數與第5個數的平均數,∴該組數據的40%分位數是=3.5.∵10×85%=8.5,得到85%分位數是第9個數,
∴該組數據的85%分位數是8.
題型二 眾數、中位數、平均數的計算
典例2 已知一組數據按從小到大排列為-1,0,4,x,6,15,且這組數據的中位數是5,那么這組數據的眾數是_6__,平均數是_5__.
[解析] 因為中位數為5,所以=5,即x=6.
所以該組數據為-1,0,4,6,6,15.
所以該組數據的眾數為6,
平均數為=5.
[歸納提升] 平均數、眾數、中位數的計算方法
平均數一般是根據公式來計算的;計算眾數、中位數時,可先將這組數據按從小到大或從大到小的順序排列,再根據各自的定義計算.
對點練習 (1)某班50名學生的一次安全知識競賽成績分布如表所示:(滿分10分)
成績 0 1 2 3 4 5 6 7 8 9 10
人數 0 0 0 1 0 1 3 5 6 19 15
這次安全知識競賽成績的眾數是( C )
A.5分 B.6分
C.9分 D.10分
(2)如果5個數x1,x2,x3,x4,x5的平均數是7,那么x1+1,x2+1,x3+1,x4+1,x5+1這5個數的平均數是( D )
A.5 B.6
C.7 D.8
[解析] (1)9分在這組數據中出現的次數最多有19次,故眾數為9分.
(2)解法一(定義法):依題意x1+x2+…+x5=35,所以(x1+1)+(x2+1)+…+(x5+1)=40,故所求平均數為=8.
解法二(性質法):顯然新數據(記為yi)與原有數據的關系為yi=xi+1(i=1,2,3,4,5),故新數據的平均數為+1=8.
題型三 總體集中趨勢的估計
典例3 某校從參加高二年級學業水平測試的學生中抽出80名學生,其數學成績(均為整數)的頻率分布直方圖如圖所示.
(1)求這次測試數學成績的眾數、中位數、平均分;
(2)估計該校參加高二年級學業水平測試的學生的眾數、中位數和平均數.
[解析] (1)①由題圖知眾數為=75.
②由題圖知,設中位數為x,由于前三個矩形面積之和為0.4,第四個矩形面積為0.3,0.3+0.4>0.5,因此中位數位于第四個矩形內,得0.1=0.03(x-70),所以x≈73.3.
③由題圖知這次數學成績的平均分為:
×0.005×10+×0.015×10+×0.02×10+×0.03×10+×0.025×10+×0.005×10=72.
(2)由于數據是來自高二年級全部參加學業水平測試的學生的簡單隨機樣本,所以可以估計高二年級參加學業水平測試的學生的眾數是75,中位數是73.3,平均數是72.
[歸納提升] 用頻率分布直方圖估計眾數、中位數、平均數
(1)眾數:取最高小長方形底邊中點的橫坐標作為眾數.
(2)中位數:在頻率分布直方圖中,把頻率分布直方圖劃分為左右兩個面積相等的部分的分界線與x軸交點的橫坐標稱為中位數.
(3)平均數:平均數是頻率分布直方圖的“重心”,等于頻率分布直方圖中每個小矩形的面積乘以小矩形底邊中點的橫坐標之和.
對點練習 某校1 500名學生參加交通安全知識競賽,隨機抽取了100名學生的競賽成績(單位:分),成績的頻率分布直方圖如圖所示,則下列說法正確的是( B )
A.頻率分布直方圖中a的值為0.004 5
B.估計這100名學生競賽成績的第60百分位數為80
C.估計這100名學生競賽成績的眾數為80
D.估計總體中成績落在內的學生人數為500
[解析] 因為10×(2a+3a+7a+6a+2a)=1,可得a=0.005,故A錯誤;
可知每組的頻率依次為0.10,0.15,0.35,0.30,0.10.
前三組的頻率和為0.10+0.15+0.35=0.6,
所以這100名學生競賽成績的第60百分位數為80,故B正確;
因為[70,80)的頻率最大,所以這100名學生競賽成績的眾數為75,故C錯誤;
總體中成績落在[70,80)內的學生人數為0.35×1500=525,故D錯誤.
故選B.
易錯警示
不能正確理解平均數的含義
典例4 下列判斷正確的是( D )
A.樣本平均數一定小于總體平均數
B.樣本平均數一定大于總體平均數
C.樣本平均數一定等于總體平均數
D.樣本量越大,樣本平均數越接近于總體平均數
[錯解] A或B或C.
[錯因分析] 錯解的原因是對樣本平均數與總體平均數之間關系的理解不到位.對用樣本數據估計總體要有一個辯證的理解,即要考慮到它有時會出現偏差,要解決這一問題,可適度增加樣本量,樣本量越大,它與總體的接近程度就越大,可信度也就越大.
[正解] D
[誤區警示] 對于樣本平均數與總體平均數,若樣本的選取較為合理,能夠代替總體,則它們間的平均數差距較小,否則樣本與總體之間不具備可比性.
對點練習 判斷:
樣本的平均數是頻率分布直方圖中最高長方形的中點對應的數據.( × )
1.下列一組數據的第25百分位數是( A )
2.1,3.0,3.2,3.8,3.4,4.0,4.2,4.4,5.3,5.6
A.3.2 B.3.0
C.4.4 D.2.5
[解析] 由i=10×25%=2.5,不是整數,則第3個數據3.2是第25百分位數.(按從小到大排列)
2.某班甲、乙兩位同學在5次階段性檢測中的數學成績(百分制)如下所示,
甲的成績是75,83,85,85,92,
乙的成績是74,84,84,85,98,
甲、乙兩位同學得分的中位數分別為x1,x2,得分的平均數分別為y1,y2,則下列結論正確的是( D )
A.x1y2
C.x1>x2,y1>y2 D.x1>x2,y1[解析] 由題意可得x1=85,x2=84,
故x1>x2,而甲的平均數
y1=×(75+83+85+85+92)=84,乙的平均數y2=×(74+84+84+85+98)=85,故y13.(2020·江蘇卷)已知一組數據4,2a,3-a,5,6的平均數為4,則a的值是_2__.
[解析] ∵數據4,2a,3-a,5,6的平均數為4,
∴4+2a+3-a+5+6=20,即a=2.
4.為了調查某廠工人生產某種產品的能力,隨機抽查了20位工人某天生產該產品的數量得到頻率分布直方圖如圖所示.
求:(1)這20名工人中一天生產該產品的數量在[55,75)的人數;
(2)這20名工人中一天生產該產品的數量的中位數;
(3)這20名工人中一天生產該產品的數量的平均數.
[解析] (1)這20名工人中一天生產該產品的數量在[55,75)的人數為(0.04×10+0.025×10)×20=13.
(2)設中位數為x,則0.2+(x-55)×0.04=0.5,解得x=62.5.
(3)這20名工人中一天生產該產品的數量的平均數為0.2×50+0.4×60+0.25×70+0.1×80+0.05×90=64.9.2.4 總體離散程度的估計
課標要求
理解方差、標準差的含義,會計算方差和標準差.
結合實例,能用樣本估計總體的離散程度參數(標準差、方差、極差),理解離散程度參數的統計含義.
素養要求
在學習和應用標準差、方差和極差的過程中,要進行運算,對數據進行分析,發展學生的數學運算素養和數據分析素養.
知識點 1 一組數據x1,x2,…,xn的方差和標準差
數據x1,x2,…,xn的方差為 (xi-)2 = -2 ,標準差為  .
知識點 2 總體方差和標準差
(1)總體方差和標準差:如果總體中所有個體的變量值分別為Y1,Y2,…,YN,總體的平均數為,則稱s2= (Yi-)2 為總體方差,s=  為總體標準差.
(2)總體方差的加權形式:如果總體的N個變量值中,不同的值共有k(k≤N)個,不妨記為Y1,Y2,…,Yk,其中Yi出現的頻數為fi(i=1,2,…,k),則總體方差為s2= i(Yi-)2 .
知識點 3 樣本方差和標準差
如果一個樣本中個體的變量值分別為y1,y2,…,yn,樣本平均數為,則稱s2= (yi-)2 為樣本方差,s=  為樣本標準差.
知識點 4 標準差的意義
標準差刻畫了數據的_離散程度__或_波動幅度__,標準差越大,數據的離散程度越_大__;標準差越小,數據的離散程度越_小__.
[拓展] 對方差、標準差的理解
(1)標準差、方差描述了一組數據圍繞平均數波動的大小.標準差、方差越大,數據的離散程度越大;標準差、方差越小,數據的離散程度越小.
(2)標準差、方差的取值范圍:[0,+∞).
標準差、方差為0時,樣本各數據全相等,表明數據沒有波動幅度,數據沒有離散性.
(3)標準差的平方s2稱為方差,有時用方差代替標準差測量樣本數據的離散程度.方差與標準差的測量效果是一致的,在實際應用中一般多采用標準差.
(4)標準差的單位與樣本數據一致.
(5)方差s2=-2.
知識點 5 分層隨機抽樣的方差
設樣本容量為n,平均數為,其中兩層的個體數量分別為n1,n2,兩層的平均數分別為1,2,方差分別為s,s,則這個樣本的方差為s2= [s+(1-)2]+[s+(2-)2] .
練一練:
1.現有10個數,其平均數為3,且這10個數的平方和是100,那么這組數據的標準差是( A )
A.1 B.2
C.3 D.4
[解析] 由s2=-2,得s2=×100-32=1,∴s=1.
2.國家射擊隊要從甲、乙、丙、丁四名隊員中選出一名選手去參加射擊比賽,四人的平均成績和方差如下表:
甲 乙 丙 丁
平均成績 8.5 8.8 8.8 8
方差s2 3.5 3.5 2.1 8.7
則應派_丙__參賽最為合適.
[解析] 由表可知,丙的平均成績較高,且發揮比較穩定,應派丙去參賽最合適.
題型探究
題型一 標準差、方差的計算
典例1 (1)計算數據5,7,7,8,10,11的標準差、方差.
(2)若40個數據的平方和是56,平均數是,則這組數據的方差是_0.9__,標準差是  .
[解析] (1)∵=(5+7+7+8+10+11)÷6=8,且
數據xi 5 7 7 8 10 11
xi- -3 -1 -1 0 2 3
(xi-)2 9 1 1 0 4 9
∴s2=(9+1+1+0+4+9)÷6=4,
∴s==2,
∴這組數據的方差為4,標準差為2.
(2)由方差公式
s2=
得s2=
=-2
由已知n=40,x+x+…+x=56.=.
∴s2=-2=0.9,∴s=.
[歸納提升] (1)記準公式,照式求值,分清先后,按部就班,不急不躁,水到渠成.
(2)列表是一個好方法!
對點練習 (1)抽樣統計甲、乙兩位射擊運動員的5次訓練成績(單位:環),結果如下:
運動員 第1次 第2次 第3次 第4次 第5次
甲 87 91 90 89 93
乙 89 90 91 88 92
則成績較為穩定(方差較小)的那位運動員成績的方差為_2__.
(2)某醫院急救中心隨機抽取20位病人等待急診的時間記錄如下表:
等待時間/分 [0,5) [5,10) [10,15) [15,20) [20,25]
頻數 4 8 5 2 1
用上述數據計算出病人平均等待時間的估計值=_9.5__分,病人等待時間方差的估計值s2=_28.5__.
[解析] (1)根據數據可得甲=90,乙=90.
s=[(87-90)2+(91-90)2+(90-90)2+(89-90)2+(93-90)2]=4;
s=[(89-90)2+(90-90)2+(91-90)2+(88-90)2+(92-90)2]=2.
所以乙運動員的成績穩定,方差為2.
(2)由題意,=(2.5×4+7.5×8+12.5×5+17.5×2+22.5×1)=9.5.
s2=[(2.5-9.5)2×4+(7.5-9.5)2×8+(12.5-9.5)2×5+(17.5-9.5)2×2+(22.5-9.5)2×1]=28.5.
題型二 標準差、方差的性質
典例2 (1)已知一組數據x1,x2,…,xn的方差是a,求另一組數據x1-2,x2-2,…,xn-2的方差;
(2)設一組數據x1,x2,…,xn的標準差為sx,另一組數據3x1+a,3x2+a,…,3xn+a的標準差為sy,求sx與sy的關系.
[解析] (1)由題意知,設原數據的平均數為,則新數據的平均數為-2,原數據的方差s2=[(x1-)2+(x2-)2+…+(xn-)2]=a.
新數據的方差s2=[(x1-2-+2)2+(x2-2-+2)2+…+(xn-2-+2)2]
=[(x1-)2+(x2-)2+…+(xn-)2]
=a,所以方差不變.
(2)設原數據的平均數為,則新數據的平均數為3+a.
sy=



=3Sx.
[歸納提升] (1)一組數據中的每一個數據都加上或減去同一個常數,所得的一組新數據的方差不變,標準差也不變.
(2)若把一組數據的每一個數變為原來的k倍并加上或減去常數a,則它的標準差變為原來的k倍,方差變為原來的k2倍,而與a的大小無關.
對點練習 若樣本數據x1,x2,…,x10的標準差為8,則數據2x1-1,2x2-1,…,2x10-1的標準差為( C )
A.8 B.15
C.16 D.32
[解析] 令yi=2xi-1(i=1,2,3,…,10),則所求的標準差為s=2×8=16.
題型三 分層隨機抽樣的方差
典例3 在了解全校學生每年平均閱讀了多少本文學經典名著時,甲同學抽取了一個容量為10的樣本,并算得樣本的平均數為5,方差為9;乙同學抽取了一個容量為8的樣本,并算得樣本的平均數為6,方差為16.已知甲、乙兩同學抽取的樣本合在一起組成一個容量為18的樣本,求合在一起后的樣本平均數與方差.(精確到0.1)
[解析] 把甲同學抽取的樣本的平均數記為,方差記為s;把乙同學抽取的樣本的平均數記為,方差記為s;把合在一起后的樣本的平均數記為,方差記為s2.
則=≈5.4,
s2=

≈12.4.
即樣本的平均數為5.4,方差為12.4.
[歸納提升] 兩層及以上的分層隨機抽樣的平均數及方差
1.分層隨機抽樣的平均數的求法
設樣本中不同層的平均數和相應權重分別為1,2,…,n和w1,w2,…,wn,則這個樣本的平均數:=w11+w22+…+wnn.
2.方差計算公式
設樣本中不同層的平均數分別為1,2,…,n,方差分別為s,s,…,s,相應的權重分別為w1,w2,…,wn,則這個樣本的方差為s2=i[s+(i-)2],為總樣本數據的平均數.
此處,某層的權重=.
對點練習 甲、乙兩支田徑隊的體檢結果為:甲隊體重的平均數為60 kg,方差為200,乙隊體重的平均數為70 kg,方差為300,又已知甲、乙兩隊的隊員人數之比為1∶4,那么甲、乙兩隊全部隊員的平均體重和方差分別是多少?
[解析] 由題意可知甲=60,甲隊隊員在所有隊員中所占權重為=,
乙=70,乙隊隊員在所有隊員中所占權重為=,
則甲、乙兩隊全部隊員的平均體重為=×60+×70=68(kg),
甲、乙兩隊全部隊員的體重的方差為
s2=[200+(60-68)2]+[300+(70-68)2]=296.
題型四 其他統計圖表中反映的集中趨勢與離散程度
典例4 甲、乙兩人在相同條件下各射靶10次,每次射靶的成績情況如圖所示.
(1)請填寫下表:
平均數 方差 中位數 命中9環及9環以上的次數


(2)請從下列四個不同的角度對這次測試結果進行分析:
①從平均數和方差相結合看,誰的成績更穩定;
②從平均數和中位數相結合看,誰的成績好些;
③從平均數和命中9環及9環以上的次數相結合看,誰的成績好些;
④從折線圖上兩人射擊命中環數的走勢看,誰更有潛力.
[解析] (1)由圖可知,甲打靶的成績為9,5,7,8,7,6,8,6,7,7,乙打靶的成績為2,4,6,8,7,7,8,9,9,10.
則可求得,甲的成績的平均數為7,方差為1.2,中位數是7,命中9環及9環以上的次數為1;乙的成績的平均數為7,方差為5.4,中位數是7.5,命中9環及9環以上的次數為3.如下表:
平均數 方差 中位數 命中9環及9環以上的次數
甲 7 1.2 7 1
乙 7 5.4 7.5 3
(2)①甲、乙的平均數相同,乙的方差較大,所以甲的成績更穩定.
②甲、乙的平均數相同,乙的中位數較大,所以乙的成績好些.
③甲、乙的平均數相同,乙命中9環及9環以上的次數比甲多,所以乙的成績好些.
④從折線圖上看,乙基本上呈上升趨勢,而甲趨于穩定,故乙更有潛力.
對點練習 在某校高中籃球聯賽中,某班甲、乙兩名籃球運動員在8場比賽中的單場得分用莖葉圖表示(如圖一),莖葉圖中甲的得分有部分數據丟失,但甲得分的折線圖(如圖二)完好,則下列結論正確的是( B )
      圖一       圖二
A.甲得分的極差是18
B.乙得分的中位數是16.5
C.甲得分更穩定
D.甲的單場平均得分比乙低
[解析] 對于甲,其得分的極差大于或等于28-9=19,故A錯誤;
從折線圖看,甲的得分中最低分小于10,最高分大于或等于28,且大于或等于20的分數有3個,故其得分不穩定,故C錯誤;
乙的數據由小到大依次為:9,14,15,16,17,18,19,20
乙得分的中位數為=16.5,故B正確.
乙得分的平均數為=16,
從折線圖上,莖葉圖中甲的得分中丟失的數據為一個為15,另一個可設為m,
其中10故其平均數為=>>16,故D錯誤.故選B.
易錯警示
忽略方差的統計意義致錯
典例5 甲、乙兩種冬小麥實驗品種連續5年平均單位面積產量如下(單位:t/km2):
第1年 第2年 第3年 第4年 第5年
甲 9.8 9.9 10.1 10 10.2
乙 9.4 10.3 10.8 9.7 9.8
若某村要從中引進一種冬小麥大量種植,給出你的建議.
[錯解] 由題意得甲=×(9.8+9.9+10.1+10+10.2)=10,
乙=×(9.4+10.3+10.8+9.7+9.8)=10,
甲、乙兩種冬小麥的平均產量都等于10,所以引進兩種冬小麥中的任意一種都可以.
[錯因分析] 造成錯解的原因是只比較了兩種冬小麥的平均產量,而忽略了對冬小麥產量穩定性的討論.
[正解] 由題意得甲=×(9.8+9.9+10.1+10+10.2)=10,
乙=×(9.4+10.3+10.8+9.7+9.8)=10,
s=×[(9.8-10)2+(9.9-10)2+(10.1-10)2+(10-10)2+(10.2-10)2]=0.02,
s=×[(9.4-10)2+(10.3-10)2+(10.8-10)2+(9.7-10)2+(9.8-10)2]=0.244.
甲、乙兩種冬小麥的平均產量都等于10,且s[誤區警示] 平均數反映的是樣本的平均水平,方差和標準差反映了樣本的波動、離散程度.對于形如“誰發揮更好”“誰更優秀”的題目,除比較數據的平均值外,還應該比較方差或標準差的大小,以作出更為公正、合理的判斷.
對點練習 在去年的足球甲A聯賽上,一隊每場比賽平均失球數是1.6,全年比賽失球個數的標準差為1.2;二隊每場比賽平均失球數是2.2,全年比賽失球個數的標準差是0.5.下列說法正確的有( D )
①平均來說一隊比二隊防守技術好;
②二隊比一隊技術水平更穩定;
③一隊有時表現很差,有時表現又非常好;
④二隊很少不失球.
A.1個 B.2個
C.3個 D.4個
[解析] 一隊每場比賽平均失球數是1.6,二隊每場比賽平均失球數是2.2,所以平均來說一隊比二隊防守技術好,故①正確;一隊全年比賽失球個數的標準差為1.2,二隊全年比賽失球個數的標準差是0.5,所以二隊比一隊技術水平更穩定,故②正確;一隊全年比賽失球個數的標準差為1.2,二隊全年比賽失球個數的標準差是0.5,所以一隊有時表現很差,有時表現又非常好,故③正確;二隊每場比賽平均失球數是2.2,全年比賽失球個數的標準差是0.5,所以二隊很少不失球,故④正確.故選D.
1.(多選題)下列說法中正確的是( ACD )
A.數據的極差越小,樣本數據分布越集中、穩定
B.數據的平均數越小,樣本數據分布越集中、穩定
C.數據的標準差越小,樣本數據分布越集中、穩定
D.數據的方差越小,樣本數據分布越集中、穩定
[解析] 由數據的極差、標準差、方差的定義可知,它們都可以影響樣本數據的分布和穩定性,而數據的平均數則與之無關,故B不正確,ACD正確.
2.已知一組數據1,3,2,5,4,那么這組數據的標準差為( A )
A. B.
C.2 D.3
[解析] ∵樣本容量n=5,∴=(1+2+3+4+5)=3,
∴s=
=.
3.將10名小學生的身高(單位:cm)分成了甲、乙兩組數據,甲組:115,122,105,111,109;乙組:125,132,115,121,119.兩組數據中相等的數字特征是( C )
A.中位數、極差 B.平均數、方差
C.方差、極差 D.極差、平均數
[解析] 甲組數據由小到大依次排列為105,109,111,115,122,故極差為17,平均數為112.4,中位數為111,方差為33.44;乙組數據由小到大依次排列為115,119,121,125,132,故極差為17,平均數為122.4,中位數為121,方差為33.44.
因此,兩組數據相等的是極差和方差.故選C.
4.已知甲、乙兩名同學在五次數學測驗中的得分如下:
甲:85,91,90,89,95;
乙:95,80,98,82,95.
則甲、乙兩名同學數學成績( A )
A.甲比乙穩定 B.甲、乙穩定程度相同
C.乙比甲穩定 D.無法確定
[解析] 甲=×(85+91+90+89+95)=90,
s=×[(85-90)2+(91-90)2+(90-90)2+(89-90)2+(95-90)2]=10.4,
乙=×(95+80+98+82+95)=90,
s=×[(95-90)2+(80-90)2+(98-90)2+(82-90)2+(95-90)2]=55.6.
∵甲=乙,s5.某班50名學生騎自行車,騎電動車到校所需時間統計如下:
到校方式 人數 平均用時(分鐘) 方差
騎自行車 20 30 36
騎電動車 30 20 16
則這50名學生到校時間的方差為( A )
A.48 B.46
C.28 D.24
[解析] 由已知可得,騎自行車平均用時(分鐘):1=30,方差S=36;騎電動車平均用時(分鐘):2=20,方差S=16;騎自行車人數占總數的,騎電動車人數占總數的.
這50名學生到校時間的平均數為=×30+×20=24,方差為S2=[36+(30-24)2]+[16+(20-24)2]=48.故選A.章末知識梳理
一、隨機抽樣
1.簡單隨機抽樣
(1)特征:①逐個不放回的抽取;②每個個體被抽到的概率都相等.
(2)常用方法:①抽簽法;②隨機數法.
2.分層隨機抽樣
(1)定義:按一個或多個變量把總體劃分成若干個子總體,每個個體屬于且僅屬于一個子總體,在每個子總體中獨立地進行簡單隨機抽樣,再把所有子總體中抽取的樣本合在一起作為總樣本.
(2)比例分配:在分層隨機抽樣中,如果每層樣本量都與層的大小成比例,那么稱這種樣本量的分配方式為比例分配.在比例分配的分層隨機抽樣中,==.
(3)在比例分配的分層隨機抽樣中.我們可以直接用樣本平均數估計總體平均數.
二、用樣本估計總體
1.頻率分布直方圖
可以利用頻率分布直方圖估計總體的取值規律.
2.百分位數與總體百分位數的估計
(1)第p百分位數:一般地,一組數據的第p百分位數是這樣一個值,它使得這組數據中至少有p%的數據小于或等于這個值,且至少有(100-p)%的數據大于或等于這個值.
(2)可以用樣本數據的百分位數估計總體的百分位數.
3.眾數、中位數和平均數與總體集中趨勢的估計
4.總體集中趨勢的估計
要點一 抽樣方法的選取及應用
1.兩種抽樣方法的適用范圍:當總體容量較小,樣本容量也較小時,可采用抽簽法;當總體容量較大,樣本容量較小時,可采用隨機數法;當總體中個體差異較顯著時,可采用分層隨機抽樣.
2.掌握兩種抽樣方法,提升數據分析素養.
典例1 為了了解學生學習的情況,某校采用分層隨機抽樣的方法從高一1 200人、高二1 000人、高三n人中,抽取90人進行問卷調查.已知高一被抽取的人數為36,那么高三被抽取的人數為( B )
A.20 B.24
C.30 D.32
[分析] 各層中抽樣比例相同.
[解析] 根據題意可知,抽取比例為:=,
所以總人數為:90×=3 000,
所以高三被抽取的人數為×(3 000-1 200-1 000)=24.
對點練習 某地共有10萬戶居民,從中隨機調查1 000戶居民擁有電腦的情況,調查結果如下表:
電腦 城市 農村
有 432 400
無 48 120
若該地區城市與農村住戶之比為4∶6,估計該地區無電腦的農村居民總戶數約為( B )
A.0.923萬戶 B.1.385萬戶
C.1.8萬戶 D.1.2萬戶
[解析] 無電腦的農村居民總戶數約為10××≈1.385(萬戶).
要點二 用樣本的取值規律估計總體的取值規律
與頻率分布直方圖有關問題的常見類型及解題策略
(1)已知頻率分布直方圖中的部分數據,求其他數據,可利用頻率和等于1求解.
(2)已知頻率分布直方圖,求某種范圍內的數據,可利用圖形及某范圍結合求解.
典例2 下表給出了某校500名12歲男孩中用隨機抽樣得出的120人的身高資料(單位:cm):
區間界限 [122,126) [126,130) [130,134) [134,138) [138,142)
人數 5 8 10 22 33
區間界限 [142,146) [146,150) [150,154) [154,158]
人數 20 11 6 5
(1)列出樣本的頻率分布表(頻率保留兩位小數);
(2)畫出頻率分布直方圖;
(3)估計身高低于134 cm的人數占總人數的百分比.
[解析] (1)列出樣本頻率分布表:
分組 頻數 頻率
[122,126) 5 0.04
[126,130) 8 0.07
[130,134) 10 0.08
[134,138) 22 0.18
[138,142) 33 0.28
[142,146) 20 0.17
[146,150) 11 0.09
[150,154) 6 0.05
[154,158] 5 0.04
合計 120 1.00
(2)畫出頻率分布直方圖,如圖所示.
(3)因為樣本中身高低于134 cm的人數的頻率為=≈0.19.
所以估計身高低于134 cm的人數約占總人數的19%.
對點練習 某保險公司為客戶定制了5個險種:甲,一年期短險;乙,兩全保險;丙,理財類保險;丁,參保險種比例定期壽險;戊,重大疾病保險.各種保險按相關約定進行參保與理賠.已知該保險公司對5個險種的參保客戶進行抽樣調查,得出如上統計圖例,則以下四個選項錯誤的是( A )
A.18~29周歲人群參保總費用最少
B.30周歲以下的參保人群約占參保人群的20%
C.54周歲以上的參保人數最少
D.丁險種更受參保人青睞
[解析] 由扇形統計圖及折線圖可知,8%×6 000<20%×4 000,故不小于54周歲人群參保總費用最少,故A錯誤;由扇形統計圖可知,30周歲以下參保人群約占參保人群的20%,故B正確;由扇形統計圖可知,54周歲以上的參保人數約占8%,人數最少,故C正確;由柱狀圖可知,丁險種更受參保人青睞,故D正確;故選A.
要點三 樣本的百分位數
1.四分位數:第25分位數,第50分位數,第75分位數,這三個分位數把一組由小到大排列后的數據分成四等份,因此稱為四分位數.
2.由頻率分布直方圖求百分位數時,一般采用方程的思想,設出第p百分位數,根據其意義列出方程求解.
典例3 數學興趣小組調查了12位大學畢業生的起始月薪,具體如表:
學生編號 起始月薪
1 3 850
2 3 950
3 4 050
4 3 880
5 3 755
6 3 710
7 3 890
8 4 130
9 3 940
10 4 325
11 3 920
12 3 880
試確定第85百分位數.
[分析] 首先從小到大排列各數,再計算i.
[解析] 將數據從小到大排列:3 710,3 755,3 850,3 880,3 880,3 890,3 920,3 940,3 950,4 050,4 130,4 325.計算i=n×p%=12×85%=10.2,顯然i不是整數,所以將i=10.2向上取整,大于i的比鄰整數11即為第85百分位數的位置,所以第85百分位數是4 130.
對點練習 (2023·北京市延慶區期中)“幸福感指數”是指某個人主觀地評價他對自己目前生活狀態的滿意程度的指標,常用0~10內的一個數來表示,該數越接近10表示滿意度越高.現隨機抽取10位北京市民,他們的幸福感指數為3,4,5,5,6,7,7,8,9,10.則這組數據的75%分位數是( C )
A.7 B.7.5
C.8 D.8.5
[解析] 由題意,這10個人的幸福感指數已經從小到大排列,因為75%×10=7.5,所以這10個數據的75%分位數是從左數第8個數,為8,故選C.
要點四 用樣本的集中趨勢、離散程度估計總體
為了從整體上更好地把握總體規律,我們還可以通過樣本數據的眾數、中位數、平均數估計總體的集中趨勢,通過樣本數據的方差或標準差估計總體的離散程度.眾數就是樣本數據中出現次數最多的那個值;中位數就是把樣本數據按照由小到大(或由大到小)的順序排列,如果數據的個數是奇數,中位數為處于中間位置的數,如果數據的個數是偶數,中位數為中間兩個數據的平均數;平均數就是所有樣本數據的平均值,用表示;標準差是反映樣本數據分散程度大小的最常用統計量,其計算公式是
s=.有時也用標準差的平方(方差)來代替標準差.
典例4 (2021·全國乙卷)某廠研制了一種生產高精產品的設備,為檢驗新設備生產產品的某項指標有無提高,用一臺舊設備和一臺新設備各生產了10件產品,得到各件產品該項指標數據如下:
舊設備 9.8 10.3 10.0 10.2 9.9 9.8 10.0 10.1 10.2 9.7
新設備 10.1 10.4 10.1 10.0 10.1 10.3 10.6 10.5 10.4 10.5
舊設備和新設備生產產品的該項指標的樣本平均數分別記為和,樣本方差分別記為s和s.
(1)求,,s,s;
(2)判斷新設備生產產品的該項指標的均值較舊設備是否有顯著提高.
[解析] (1)各項所求值如下所示.
=×(9.8+10.3+10.0+10.2+9.9+9.8+10.0+10.1+10.2+9.7)=10.0,
=×(10.1+10.4+10.1+10.0+10.1+10.3+10.6+10.5+10.4+10.5)=10.3,
s=×[(9.7-10.0)2+2×(9.8-10.0)2+(9.9-10.0)2+2×(10.0-10.0)2+(10.1-10.0)2+2×(10.2-10.0)2+(10.3-10.0)2]=0.036.
s=×[(10.0-10.3)2+3×(10.1-10.3)2+(10.3-10.3)2+2×(10.4-10.3)2+2×(10.5-10.3)2+(10.6-10.3)2]=0.04.
(2)由(1)中數據得-=0.3,2≈0.39.
顯然-<2.所以不認為新設備生產產品的該項指標的均值較舊設備有顯著提高.
對點練習 (多選題)某學校組織學生參加數學測試,某班成績的頻率分布直方圖如圖,數據的分組依次為,,,.若不低于80分的人數是35人,且同一組中的數據用該組區間的中點值代表,則下列說法中正確的是( ACD )
A.該班的學生人數是50
B.成績在[80,90)的學生人數是12
C.估計該班成績的眾數是95分
D.估計該班成績的方差為100
[解析] ∵不低于80分對應的頻率為1-×10=0.7,
∴該班的學生人數為=50,A正確;
∵×10=1,∴a=0.03,
∴成績在的學生人數為50a×10=15,B錯誤;
∵成績在對應的矩形面積最大,∴估計該班成績的眾數為95分,C正確;
∵估計該班成績的平均數為65×0.01×10+75×0.02×10+85×0.03×10+95×0.04×10=85,
∴方差為0.01×10×2+0.02×10×2+0.03×10×2+0.04×10×2=100,D正確.
故選ACD.

展開更多......

收起↑

資源列表

    <track id="r4fhd"></track>

    <pre id="r4fhd"><abbr id="r4fhd"><code id="r4fhd"></code></abbr></pre>
      <ul id="r4fhd"></ul>

        <menu id="r4fhd"></menu>
        1. 主站蜘蛛池模板: 吉安县| 洞头县| 通辽市| 博野县| 津南区| 洪雅县| 余江县| 云林县| 南安市| 松溪县| 石台县| 古蔺县| 泸水县| 云安县| 松溪县| 全椒县| 朔州市| 堆龙德庆县| 淮北市| 道真| 蓬溪县| 磴口县| 绥德县| 集安市| 贵州省| 奈曼旗| 宁陵县| 铜川市| 奈曼旗| 崇仁县| 旺苍县| 陇西县| 新竹县| 西乌| 永修县| 昌平区| 嘉善县| 正定县| 亚东县| 芜湖市| 金沙县|