資源簡介 專題55 隨機抽樣、統計圖表(新高考專用)【知識梳理】 2【真題自測】 4【考點突破】 11【考點1】簡單隨機抽樣 11【考點2】分層隨機抽樣及其應用 14【考點3】統計圖表 17【分層檢測】 22【基礎篇】 22【能力篇】 30考試要求:1.理解隨機抽樣的必要性和重要性.2.會用簡單隨機抽樣方法從總體中抽取樣本,了解分層隨機抽樣方法.3.理解統計圖表的含義.1.簡單隨機抽樣(1)簡單隨機抽樣分為放回簡單隨機抽樣和不放回簡單隨機抽樣.除非特殊聲明,本章簡單隨機抽樣指不放回簡單隨機抽樣.(2)簡單隨機樣本通過簡單隨機抽樣獲得的樣本稱為簡單隨機樣本.(3)簡單隨機抽樣的常用方法實現簡單隨機抽樣的方法很多,抽簽法和隨機數法是比較常用的兩種方法.2.總體平均數與樣本平均數名稱 定義總體均值 (總體平均數) 一般地,總體中有N個個體,它們的變量值分別為Y1,Y2,…,YN,則稱==Yi為總體均值,又稱總體平均數.如果總體的N個變量值中,不同的值共有k(k≤N)個,不妨記為Y1,Y2,…,Yk,其中Yi出現的頻數fi(i=1,2,…,k),則總體均值還可以寫成加權平均數的形式=fiYi.樣本均值(樣本平均數) 如果從總體中抽取一個容量為n的樣本,它們的變量值分別為y1,y2,…,yn,則稱==yi為樣本均值,又稱樣本平均數.說明:(1)在簡單隨機抽樣中,我們常用樣本平均數去估計總體平均數; (2)總體平均數是一個確定的數,樣本平均數具有隨機性(因為樣本具有隨機性); (3)一般情況下,樣本量越大,估計越準確.3.分層隨機抽樣(1)分層隨機抽樣的概念一般地,按一個或多個變量把總體劃分成若干個子總體,每個個體屬于且僅屬于一個子總體,在每個子總體中獨立地進行簡單隨機抽樣,再把所有子總體中抽取的樣本合在一起作為總樣本,這樣的抽樣方法稱為分層隨機抽樣,每一個子總體稱為層.(2)分層隨機抽樣的平均數計算在分層隨機抽樣中,以層數是2層為例,如果第1層和第2層包含的個體數分別為M和N,抽取的樣本量分別為m和n,第1層和第2層的樣本平均數分別為,,樣本平均數為,則=+=+.我們可以用樣本平均數估計總體平均數.4.統計圖表(1)常見的統計圖表有條形圖、扇形圖、折線圖、頻數分布直方圖、頻率分布直方圖等.(2)頻率分布表、頻率分布直方圖的制作步驟及意義1.不論哪種抽樣方法,總體中的每一個個體入樣的概率都是相同的.2.分層隨機抽樣是按比例抽樣,每一層入樣的個體數為該層的個體數乘抽樣比.3.頻率分布直方圖中小長方形高=.一、單選題1.(2024·全國·高考真題)某農業研究部門在面積相等的100塊稻田上種植一種新型水稻,得到各塊稻田的畝產量(單位:kg)并整理如下表畝產量 [900,950) [950,1000) [1000,1050) [1050,1100) [1100,1150) [1150,1200)頻數 6 12 18 30 24 10根據表中數據,下列結論中正確的是( )A.100塊稻田畝產量的中位數小于1050kgB.100塊稻田中畝產量低于1100kg的稻田所占比例超過80%C.100塊稻田畝產量的極差介于200kg至300kg之間D.100塊稻田畝產量的平均值介于900kg至1000kg之間2.(2023·天津·高考真題)鳶是鷹科的一種鳥,《詩經·大雅·旱麓》曰:“鳶飛戾天,魚躍余淵”. 鳶尾花因花瓣形如鳶尾而得名,寓意鵬程萬里、前途無量.通過隨機抽樣,收集了若干朵某品種鳶尾花的花萼長度和花瓣長度(單位:cm),繪制散點圖如圖所示,計算得樣本相關系數為,利用最小二乘法求得相應的經驗回歸方程為,根據以上信息,如下判斷正確的為( )A.花瓣長度和花萼長度不存在相關關系B.花瓣長度和花萼長度負相關C.花萼長度為7cm的該品種鳶尾花的花瓣長度的平均值為D.若從樣本中抽取一部分,則這部分的相關系數一定是3.(2022·天津·高考真題)將1916到2015年的全球年平均氣溫(單位:),共100個數據,分成6組:,并整理得到如下的頻率分布直方圖,則全球年平均氣溫在區間內的有( )A.22年 B.23年 C.25年 D.35年4.(2022·全國·高考真題)某社區通過公益講座以普及社區居民的垃圾分類知識.為了解講座效果,隨機抽取10位社區居民,讓他們在講座前和講座后各回答一份垃圾分類知識問卷,這10位社區居民在講座前和講座后問卷答題的正確率如下圖:則( )A.講座前問卷答題的正確率的中位數小于B.講座后問卷答題的正確率的平均數大于C.講座前問卷答題的正確率的標準差小于講座后正確率的標準差D.講座后問卷答題的正確率的極差大于講座前正確率的極差5.(2022·北京·高考真題)在北京冬奧會上,國家速滑館“冰絲帶”使用高效環保的二氧化碳跨臨界直冷制冰技術,為實現綠色冬奧作出了貢獻.如圖描述了一定條件下二氧化碳所處的狀態與T和的關系,其中T表示溫度,單位是K;P表示壓強,單位是.下列結論中正確的是( )A.當,時,二氧化碳處于液態B.當,時,二氧化碳處于氣態C.當,時,二氧化碳處于超臨界狀態D.當,時,二氧化碳處于超臨界狀態二、多選題6.(2023·全國·高考真題)有一組樣本數據,其中是最小值,是最大值,則( )A.的平均數等于的平均數B.的中位數等于的中位數C.的標準差不小于的標準差D.的極差不大于的極差三、解答題7.(2023·全國·高考真題)某廠為比較甲乙兩種工藝對橡膠產品伸縮率的處理效應,進行10次配對試驗,每次配對試驗選用材質相同的兩個橡膠產品,隨機地選其中一個用甲工藝處理,另一個用乙工藝處理,測量處理后的橡膠產品的伸縮率.甲、乙兩種工藝處理后的橡膠產品的伸縮率分別記為,.試驗結果如下:試驗序號 1 2 3 4 5 6 7 8 9 10伸縮率 545 533 551 522 575 544 541 568 596 548伸縮率 536 527 543 530 560 533 522 550 576 536記,記的樣本平均數為,樣本方差為.(1)求,;(2)判斷甲工藝處理后的橡膠產品的伸縮率較乙工藝處理后的橡膠產品的伸縮率是否有顯著提高(如果,則認為甲工藝處理后的橡膠產品的伸縮率較乙工藝處理后的橡膠產品的伸縮率有顯著提高,否則不認為有顯著提高)8.(2023·全國·高考真題)某研究小組經過研究發現某種疾病的患病者與未患病者的某項醫學指標有明顯差異,經過大量調查,得到如下的患病者和未患病者該指標的頻率分布直方圖: 利用該指標制定一個檢測標準,需要確定臨界值c,將該指標大于c的人判定為陽性,小于或等于c的人判定為陰性.此檢測標準的漏診率是將患病者判定為陰性的概率,記為;誤診率是將未患病者判定為陽性的概率,記為.假設數據在組內均勻分布,以事件發生的頻率作為相應事件發生的概率.(1)當漏診率%時,求臨界值c和誤診率;(2)設函數,當時,求的解析式,并求在區間的最小值.參考答案:題號 1 2 3 4 5 6答案 C C B B D BD1.C【分析】計算出前三段頻數即可判斷A;計算出低于1100kg的頻數,再計算比例即可判斷B;根據極差計算方法即可判斷C;根據平均值計算公式即可判斷D.【詳解】對于 A, 根據頻數分布表可知, ,所以畝產量的中位數不小于 , 故 A 錯誤;對于B,畝產量不低于的頻數為,所以低于的稻田占比為,故B錯誤;對于C,稻田畝產量的極差最大為,最小為,故C正確;對于D,由頻數分布表可得,平均值為,故D錯誤.故選;C.2.C【分析】根據散點圖的特點及經驗回歸方程可判斷ABC選項,根據相關系數的定義可以判斷D選項.【詳解】根據散點的集中程度可知,花瓣長度和花萼長度有相關性,A選項錯誤散點的分布是從左下到右上,從而花瓣長度和花萼長度呈現正相關性,B選項錯誤,把代入可得,C選項正確;由于是全部數據的相關系數,取出來一部分數據,相關性可能變強,可能變弱,即取出的數據的相關系數不一定是,D選項錯誤故選:C3.B【分析】由頻率分布直方圖可得所求區間的頻率,進而可以求得結果.【詳解】全球年平均氣溫在區間內的頻率為,則全球年平均氣溫在區間內的有年.故選:B.4.B【分析】由圖表信息,結合中位數、平均數、標準差、極差的概念,逐項判斷即可得解.【詳解】講座前中位數為,所以錯;講座后問卷答題的正確率只有一個是個,剩下全部大于等于,所以講座后問卷答題的正確率的平均數大于,所以B對;講座前問卷答題的正確率更加分散,所以講座前問卷答題的正確率的標準差大于講座后正確率的標準差,所以C錯;講座后問卷答題的正確率的極差為,講座前問卷答題的正確率的極差為,所以錯.故選:B.5.D【分析】根據與的關系圖可得正確的選項.【詳解】當,時,,此時二氧化碳處于固態,故A錯誤.當,時,,此時二氧化碳處于液態,故B錯誤.當,時,與4非常接近,故此時二氧化碳處于固態,對應的是非超臨界狀態,故C錯誤.當,時,因, 故此時二氧化碳處于超臨界狀態,故D正確.故選:D6.BD【分析】根據題意結合平均數、中位數、標準差以及極差的概念逐項分析判斷.【詳解】對于選項A:設的平均數為,的平均數為,則,因為沒有確定的大小關系,所以無法判斷的大小,例如:,可得;例如,可得;例如,可得;故A錯誤;對于選項B:不妨設,可知的中位數等于的中位數均為,故B正確;對于選項C:因為是最小值,是最大值,則的波動性不大于的波動性,即的標準差不大于的標準差,例如:,則平均數,標準差,,則平均數,標準差,顯然,即;故C錯誤;對于選項D:不妨設,則,當且僅當時,等號成立,故D正確;故選:BD.7.(1),;(2)認為甲工藝處理后的橡膠產品的伸縮率較乙工藝處理后的橡膠產品的伸縮率有顯著提高.【分析】(1)直接利用平均數公式即可計算出,再得到所有的值,最后計算出方差即可;(2)根據公式計算出的值,和比較大小即可.【詳解】(1),,,的值分別為: ,故(2)由(1)知:,,故有,所以認為甲工藝處理后的橡膠產品的伸縮率較乙工藝處理后的橡膠產品的伸縮率有顯著提高.8.(1),;(2),最小值為.【分析】(1)根據題意由第一個圖可先求出,再根據第二個圖求出的矩形面積即可解出;(2)根據題意確定分段點,即可得出的解析式,再根據分段函數的最值求法即可解出.【詳解】(1)依題可知,左邊圖形第一個小矩形的面積為,所以,所以,解得:,.(2)當時,;當時,,故,所以在區間的最小值為.【考點1】簡單隨機抽樣一、單選題1.(2022·黑龍江哈爾濱·三模)為了了解學生上網課期間作息情況,現從高三年級702人中隨機抽取20人填寫問卷調查,首先用簡單隨機抽樣剔除2人,然后在剩余的700人中再用系統抽樣的方法抽取20人,則( )A.每個學生入選的概率都為 B.每個學生人選的概率都為C.每個學生人選的概率都為 D.由于有剔除,學生入選的概率不全相等2.(2024·福建泉州·模擬預測)從一個含有個個體的總體中抽取一容量為的樣本,當選取抽簽法、隨機數法和分層隨機抽樣三種不同方法時,總體中每個個體被抽中的概率分別為,三者關系可能是( )A. B. C. D.二、多選題3.(2024·廣西南寧·模擬預測)給出下列命題,其中錯誤的命題為( )A.若樣本數據的方差為3,則數據的方差為6.B.具有相關關系的兩個變量x,y的相關系數為r,那么越接近于0,x,y之間的線性相關程度越高;C.在一個列聯表中,根據表中數據計算得到的觀測值k,若k的值越大,則認為兩個變量間有關的把握就越大;D.甲同學所在的某校高三共有5003人,先剔除3人,再按簡單隨機抽樣的方法抽取容量為200的一個樣本,則甲被抽到的概率為.4.(2022·湖北·模擬預測)某地區公共部門為了調查本地區中學生的吸煙情況,對隨機抽出的編號為1~1000的1000名學生進行了調查.調查中使用了兩個問題,問題1:你的編號是否為奇數?問題2:你是否吸煙?被調查者從設計好的隨機裝置(內有除顏色外完全相同的白球50個,紅球50個)中摸出一個小球(摸完放回):摸到白球則如實回答問題1,摸到紅球則如實回答問題2,回答“是”的人在一張白紙上畫一個“√”,回答“否”的人什么都不用做,由于問題的答案只有“是”和“否”,而且回答的是哪個問題也是別人不知道的,因此被調查者可以毫無顧忌的給出真實的答案.最后統計得出,這1000人中,共有265人回答“是”,則下列表述正確的是( )A.估計被調查者中約有15人吸煙 B.估計約有15人對問題2的回答為“是”C.估計該地區約有3%的中學生吸煙 D.估計該地區約有1.5%的中學生吸煙三、填空題5.(23-24高三上·上海·期中)現利用隨機數表發從編號為的20支水筆中隨機選取6支,選取方法是從下列隨機數表第1行的第9個數字開始由左到右依次選取兩個數字,則選出來的第6支水筆的編號為 .6.(2022·新疆烏魯木齊·模擬預測)我國古代數學名著《數書九章》中有“米谷粒分”問題:“開倉受納,有甲戶米一千五百三十四石到廊.驗得米內夾谷,乃于樣內取米一捻,數計二百五十四粒,內有谷二十八顆.今欲知米內雜谷多少.”意思是:官府開倉接受百姓納糧,甲戶交米1534石到廊前,檢驗出米里夾雜著谷子,于是從米樣粒取出一捻,數出共254粒,其中有谷子28顆,則這批米內有谷子約 石(結果四舍五入保留整數);參考答案:題號 1 2 3 4答案 C B ABD BC1.C【分析】根據簡單隨機抽和系統抽樣都是等可能抽樣以及概率公式計算可得結果.【詳解】因為簡單隨機抽和系統抽樣都是等可能抽樣,所以每個學生入選的概率都相等,且入選的概率等于.故選:C.2.B【分析】根據抽樣的概念,每個個體被抽中的概率是均等的,進而即可選擇答案.【詳解】因為在抽簽法抽樣、隨機數法抽樣和分層隨機抽樣中,每個個體被抽中的概率均為,所以.故選:B.3.ABD【分析】根據方差的性質可判斷A;根據相關系數的性質可判斷B;根據的性質可判斷C;根據簡單隨機抽樣每個個體被抽到的概率是等可能的可判斷D。【詳解】若樣本數據的方差為3,則數據的方差為,故A錯誤;由相關系數的實際意義知越接近于1,x,y之間的線性相關程度越高,故B錯誤;的觀測值越大,則認為兩個變量間有關的把握就越大,故C正確;簡單隨機抽樣中每個個體被抽到的概率是等可能的,概率等于,故D錯誤;故選:ABD4.BC【分析】先求出回答問題2且回答的“是”的人數,從而估計出該地區中學生吸煙人數的百分比,即得解.【詳解】隨機抽出的1000名學生中,回答第一個問題的概率是,其編號是奇數的概率也是,所以回答問題1且回答的“是”的學生人數為,回答問題2且回答的“是”的人數為,從而估計該地區中學生吸煙人數的百分比為,估計被調查者中吸煙的人數為.故選:BC.5.18【分析】根據隨機數表法的讀取規則,即可求解.【詳解】依次選出的編號為:則選出來的第6支水筆的編號為18,故答案為:.6.【分析】求出米內夾谷的比例,再乘以即可得解.【詳解】依題意可得米內夾谷的比例為,所以這批米內有谷子石.故答案為:.反思提升:1.簡單隨機抽樣需滿足:(1)被抽取的樣本總體的個體數有限;(2)逐個抽取;(3)是不放回抽取;(4)是等可能抽取.2.簡單隨機抽樣常有抽簽法(適用于總體中個體數較少的情況)、隨機數法(適用于個體數較多的情況).【考點2】分層隨機抽樣及其應用一、單選題1.(2024·江西鷹潭·一模)某單位為了解職工體重情況,采用分層隨機抽樣的方法從800名職工中抽取了一個容量為80的樣本.其中,男性平均體重為64千克,方差為151;女性平均體重為56千克,方差為159,男女人數之比為,則單位職工體重的方差為( )A.166 B.167 C.168 D.1692.(2024·云南·模擬預測)某學校高三年級男生共有個,女生共有個,為調查該年級學生的年齡情況,通過分層抽樣,得到男生和女生樣本數據的平均數和方差分別為和,已知,則該校高三年級全體學生年齡的方差為( )A. B.C. D.二、多選題3.(2024·江西宜春·模擬預測)某學校高三年級共有900人,其中男生500人,現采用按性別比例分配的分層抽樣抽取了容量為90的樣本. 經計算得男生的身高均值為170,方差為19,女生樣本的身高均值為161,方差為19,則下列說法中正確的是( )A.女生的樣本容量為40B.女生甲被抽到的概率為C.估計該校高三年級學生身高的均值為166D.估計該校高三年級學生身高的方差大于194.(2023·山西臨汾·一模)某學生社團有男生32名,女生24名,從中隨機抽取一個容量為7的樣本,某次抽樣結果為:抽到3名男生和4名女生,則下列說法正確的是( )A.這次抽樣可能采用的是抽簽法B.這次抽樣不可能是按性別分層隨機抽樣C.這次抽樣中,每個男生被抽到的概率一定小于每個女生被抽到的概率D.這次抽樣中,每個男生被抽到的概率不可能等于每個女生被抽到的概率三、填空題5.(2024·山東泰安·模擬預測)某高中為了了解學生參加數學建模社團的情況,采用了分層隨機抽樣的方法從三個年級中抽取了300人進行問卷調查,其中高一、高二年級各抽取了90人.已知該校高三年級共有720名學生,則該校共有學生 人.6.(2024·陜西安康·模擬預測)杭州亞運會期間,某社區有200人參加協助交通管理的志愿團隊,為了解他們參加這項活動的感受,用按比例分配的分層抽樣的方法隨機抽取了一個容量為40的樣本,若樣本中女性有16人,則該志愿團隊中的男性人數為 .參考答案:題號 1 2 3 4答案 D C ACD AB1.D【分析】利用分層抽樣的平均數和方差公式即可得解.【詳解】依題意,單位職工平均體重為,則單位職工體重的方差為.故選:D.2.C【分析】結合分層隨機抽樣的方差公式可得答案【詳解】學校高三年級男生共有個,所占比例為,女生個,所占比例為,故該校高三年級全體學生的年齡方差為:,當時,,,故選:C3.ACD【分析】由題意先得抽樣比例,進而得男生和女生的樣本容量即可判斷A、B,再根據分層隨機抽樣總樣本均值公式和方差公式即可求解.【詳解】由題抽樣比例為,故男生被抽到人數為人;女生被抽到人數為人,故A對;所以女生甲被抽到的概率為,故B錯;由上以及題意得總樣本均值為:;總樣本方差為:,故C、D對.故選:ACD.4.AB【分析】根據抽樣方法的概念求解即可.【詳解】根據抽樣結果,此次抽樣可能采用的是抽簽法,A正確;若按分層抽樣,則抽得的男女人數應為4人,3人,所以這次抽樣不可能是按性別分層隨機抽樣,B正確;若按抽簽法,則每個男生被抽到的概率和每個女生被抽到的概率均相等,C,D錯誤.故選:AB.5.1800【分析】根據按比例分配的分層隨機抽樣的特點確定抽樣的比例即可求解.【詳解】由題意可知從三個年級中抽取的300人進行問卷調查,其中高三有120人,所以抽取的比例為設該校共有名學生,可得,解得人,即該校共有1800名學生.故答案為:1800.6.【分析】根據題意,結合分層抽樣的概念和計算方法,即可求解.【詳解】根據題意,結合分層抽樣的概念及運算,可得愿團隊中的男性人數為.故答案為:.反思提升:1.求某層應抽個體數量:按該層所占總體的比例計算.2.已知某層個體數量,求總體數量或反之求解:根據分層隨機抽樣就是按比例抽樣,列比例式進行計算.3.在分層隨機抽樣中,如果第一層的樣本量為m,平均值為x;第二層的樣本量為n,平均值為y,則樣本的平均值為.【考點3】統計圖表一、單選題1.(2022·安徽馬鞍山·模擬預測)下圖為國家統計局給出的2016-2020年福利彩票銷售額、增長率及籌集公益金情況統計圖,則下列說法正確的是( ) A.2016-2020年福利彩票銷售額呈遞減趨勢B.2016-2020年福利彩票銷售額的年增長率呈遞減趨勢C.2016-2020年福利彩票銷售額、籌集公益金均在2018年取得最大值D.2017-2018年福利彩票銷售額增長的最多2.(2021·廣西柳州·一模)空氣質量的指標是反映空氣質量狀況的指數,指數的值越小,表明空氣質量越好,指數不超過50,空氣質量為優,指數大于50且不超過100,空氣質量為良,指數大于100,空氣質量為污染,如圖是某市2020年空氣質量指標的月折線圖.下列關于該市2020年空氣質量的敘述中不一定正確的是( )A.全年的平均指數對應的空氣質量等級為優或良.B.每月都至少有一天空氣質量為優.C.空氣質量為污染的天數最多的月份是2月份.D.2月,8月,9月和12月均出現污染天氣.二、多選題3.(2024·遼寧·二模)下圖為某市2023年第一季度全市居民人均消費支出構成圖.已知城鎮居民人均消費支出7924元,與上一年同比增長4.4%;農村居民人均消費支出4388元,與上一年同比增長7.8%,則關于2023年第一季度該市居民人均消費支出,下列說法正確的是( )A.2023年第一季度該市居民人均消費支出6393元B.居住及食品煙酒兩項的人均消費支出總和超過了總人均消費支出的50%C.城鄉居民人均消費支出的差額與上一年同比在縮小D.醫療保健與教育文化娛樂兩項人均消費支出總和約占總人均消費支出的20.6%4.(2021·廣東佛山·模擬預測)在“世界杯”足球賽閉幕后,某中學學生會對本校高三年級1000名學生收看比賽的情況用隨機抽樣方式進行調查,樣本容量為50,將數據分組整理后,列表如下:觀看場數 0 1 2 3 4 5 6 7觀看人數占調查人數的百分比 8% 10% 20% 26% m% 12% 6% 2%從表中可以得出正確的結論為( )A.表中m的數值為16B.估計全年級觀看比賽低于4場的學生約為32人C.估計全年級觀看比賽不低于4場的學生約為360D.估計全年級觀看比賽場數的眾數為2三、填空題5.(2024·河北石家莊·三模)為了解全市高三學生的體能素質情況,在全市高三學生中隨機抽取了1000名學生進行體能測試,并將這1000名學生的體能測試成績整理成如下頻率分布直方圖.則直方圖中實數的值為 .6.(2024·四川成都·模擬預測)某校為了解高三學生身體素質情況,從某項體育測試成績中隨機抽取個學生的成績進行分析,得到成績頻率分布直方圖(如圖所示),估計該校高三學生此項體育成績的中位數為 .(結果保留整數)參考答案:題號 1 2 3 4答案 C C ABD AC1.C【分析】根據給定的條形圖及折線圖,逐項分析判斷即可.【詳解】對于A,2016-2020年福利彩票銷售額先遞增后遞減,A錯誤;對于B,2016-2020年福利彩票銷售額的年增長率先遞增后遞減,B錯誤;對于C,2016-2020年福利彩票銷售額、籌集公益金均在2018年取得最大值,C正確;對于D,2017-2018年福利彩票銷售額增長75.8億元,2016-2017年福利彩票銷售額增長104.9億元,D錯誤.故選:C2.C【分析】根據折線圖的信息即可判斷出答案.【詳解】對于A,由折線圖知平均AQI指數值不超過100 所以A正確;對于B,通過折線圖知平均AQI指數均在50以下,說明至少有一天空氣質量為優,所以B正確;對于C,根據折線圖2月份出現最大值,并不表示空氣質量為“污染”的天數最多的月份是2月份,所以C錯誤;對于D,2月,8月,9月和12月的最大值AQI指數有大于100,空氣質量為“污染”,所以D正 確;故選: C.3.ABD【分析】根據消費支出構成圖及已知條件分析數據一一判定選項即可.【詳解】2023年第一季度全市居民人均消費支出為(元),故A正確;易知居住及食品煙酒兩項的人均消費支出總和為(元),占總人均消費支出的,故B正確:依題意可得2022年第一季度城鄉居民人均消費支出的差額為(元),2023年第一季度城鄉居民人均消費支出的差額為(元),由于,故C錯誤;醫療保健與教育文化娛樂兩項人均消費支出總和占總人均消費支出的,故D正確.故選:ABD.4.AC【分析】由頻率分布表的性質,求出;先由頻率分布表求出觀看比賽不低于4場的學生所占比率,由此估計觀看比賽不低于4場的學生人數;根據頻率分布表讀出眾數.【詳解】解:由頻率分布表的性質,得:,故正確;觀看比賽低于4場的學生所占比率為:,估計觀看比賽低于4場的學生約為:人,故錯誤,觀看比賽不低于4場的學生所占比率為:,估計觀看比賽不低于4場的學生約為:人,故正確,出現頻率最高的為3.故估計全年級觀看比賽場數的眾數為,故錯誤;故選:.5.【分析】利用直方圖直方塊總面積為,進行運算解出即可.【詳解】由直方圖可知:組距為,所以,解得.故答案為:.6.【分析】由概率之和為計算出后,結合中位數的定義計算即可得.【詳解】,解得,由,,設中位數為,則,有,解得.故答案為:.反思提升:(1)通過扇形圖可以很清楚地表示出各部分數量同總數之間的關系.(2)折線圖可以顯示隨時間(根據常用比例放置)而變化的連續數據,因此非常適用于顯示在相等時間間隔下數據的趨勢.(3)頻率分布直方圖的數據特點:①頻率分布直方圖中縱軸上的數據是各組的頻率除以組距的結果,不要誤以為縱軸上的數據是各組的頻率,不要和條形圖混淆.②頻率分布直方圖中各小長方形的面積之和為1,這是解題的關鍵,常利用頻率分布直方圖估計總體分布.【基礎篇】一、單選題1.(2024·云南貴州·二模)本次月考分答題卡的任務由高三16班完成,現從全班55位學生中利用下面的隨機數表抽取10位同學參加,將這55位學生按01、02、、55進行編號,假設從隨機數表第1行第2個數字開始由左向右依次選取兩個數字,重復的跳過,讀到行末則從下一行行首繼續,則選出來的第6個號碼所對應的學生編號為( )0627 4313 2432 5327 0941 2512 6317 6323 2616 8045 60111410 9577 7424 6762 4281 1457 2042 5332 3732 2707 36070140 0523 2617 3726 3890 5124 5179 3014 2310 2118 2191A.51 B.25 C.32 D.122.(2024·河南駐馬店·二模)電影《孤注一擲》的上映引發了電信詐騙問題的熱議,也加大了各個社區反電信詐騙的宣傳力度.已知某社區共有居民480人,其中老年人200人,中年人200人,青少年80人,若按年齡進行分層隨機抽樣,共抽取36人作為代表,則中年人比青少年多( )A.6人 B.9人 C.12人 D.18人3.(2021·全國·模擬預測)在某次射擊比賽中,甲、乙兩人各射擊5次,射中的環數如圖,則下列說法正確的是( )A., B.,C., D.,4.(2024·湖北黃岡·模擬預測)為了解高中學生每天的體育活動時間,某市教育部門隨機抽取高中學生進行調查,把每天進行體育活動的時間按照時長(單位:分鐘)分成組:,,,,,.然后對統計數據整理得到如圖所示的頻率分布直方圖,則可估計這名學生每天體育活動時間的第百分位數為( )A. B. C. D.二、多選題5.(2021·江蘇南京·三模)面對新冠肺炎疫情沖擊,我國各地區各部門統籌疫情防控和經濟社會發展均取得顯著成效.下表顯示的是年月份到月份中國社會消費品零售總額數據,其中同比增長率是指和去年同期相比較的增長率,環比增長率是指與上個月份相比較的增長率,則下列說法正確的是( )中國社會消費品零售總額月份 零售總額(億元) 同比增長 環比增長 累計(億元)4 28178 -7.50% 6.53% 1067585 31973 -2.80% 13.47% 1387306 33526 -1.80% 4.86% 1722567 32203 -1.10% -3.95% 2044598 33571 0.50% 4.25% 2380299 35295 3.30% 5.14% 27332410 38576 4.30% 9.30% 31190111 39514 5.00% 2.43% 35141512 40566 4.60% 2.66% 391981A.年月份到月份,社會消費品零售總額逐月上升B.年月份到月份,月份同比增長率最大C.年月份到月份,月份環比增長率最大D.第季度的月消費品零售總額相比第季度的月消費品零售總額,方差更小6.(2024·浙江杭州·三模)南丁格爾是一位英國護士、統計學家及社會改革者,被譽為現代護理學的奠基人.1854年,在克里米亞戰爭期間,她在接到英國政府的請求后,帶領由38名志愿女護士組成的團隊前往克里米亞救治傷員,并收集士兵死亡原因數據繪制了如下“玫瑰圖”.圖中圓圈被劃分為12個扇形,按順時針方向代表一年中的各個月份.每個扇形的面積與該月的死亡人數成比例.扇形中的白色部分代表因疾病或其他原因導致的死亡,灰色部分代表因戰爭受傷導致的死亡.右側圖像為1854年4月至1855年3月的數據,左側圖像為1855年4月至1856年3月的數據.下列選項正確的為( )A.由于疾病或其他原因而死的士兵遠少于戰場上因傷死亡的士兵B.1854年4月至1855年3月,冬季(12月至來年2月)死亡人數相較其他季節顯著增加C.1855年12月之后,因疾病或其他原因導致的死亡人數總體上相較之前顯著下降D.此玫瑰圖可以佐證,通過改善軍隊和醫院的衛生狀況,可以大幅度降低不必要的死亡7.(2024·黑龍江·三模)在某市初三年級舉行的一次體育考試中(滿分100分),所有考生成績均在[50,100]內,按照[50,60),[60,70),[70,80),[80,90),[90,100]分成五組,甲、乙兩班考生的成績占比如圖所示,則下列說法錯誤的是( ) A.成績在[70,80)的考生中,甲班人數多于乙班人數B.甲班成績在[80,90)內人數最多C.乙班成績在[70,80)內人數最多D.甲班成績的極差比乙班成績的極差小三、填空題8.(2022·山西臨汾·二模)現從某學校450名同學中用隨機數表法隨機抽取30人參加一項活動.將這450名同學編號為001,002,…,449,450,要求從下表第2行第5列的數字開始向右讀,則第5個被抽到的編號為 .16 22 77 94 39 49 54 43 54 82 17 37 93 23 78 87 35 20 96 43 84 26 34 91 6484 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 7663 01 63 78 59 16 95 55 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 799.(2023·湖南常德·模擬預測)為調查某地區中學生每天睡眠時間,采用樣本量比例分配的分層隨機抽樣,現抽取初中生800人,其每天睡眠時間均值為9小時,方差為0.5,抽取高中生1200人,其每天睡眠時間均值為8小時,方差為1,則估計該地區中學生每天睡眠時間的方差為 .10.(2023·廣西河池·模擬預測)雅言傳承文明,經典浸潤人生,南寧市某校每年舉辦“品經誦典浴書香,提雅增韻享閱讀”中華經典誦讀大賽,比賽內容有三類:“誦讀中國”、“詩教中國”、“筆墨中國”.已知高一、高二、高三報名人數分別為:100人、150人和250人.現采用分層抽樣的方法,從三個年級中抽取25人組成校代表隊參加市級比賽,則應該從高一年級學生中抽取的人數為 .四、解答題11.(2024·陜西渭南·模擬預測)某高中為配合愛國主義教育,開展國防科技知識競賽,預賽后,將成績最好的甲、乙兩個班學生(每班都是40人)的得分情況做成如下的條形圖(20道單項選擇題,每題5分,滿分100分).記甲、乙兩班學生得分的平均數分別為,方差分別為,已求得(1)分別求出甲、乙兩班的學生得分為95分及以上的頻率;(2)試計算,并判斷哪個班的學生的成績波動更小.12.(2024·陜西西安·模擬預測)某高科技公司組織大型招聘會,全部應聘人員的筆試成績統計如圖所示:(1)求m的值,并估計全部應聘人員筆試成績的中位數;(2)該公司2020—2024年每年招聘的新員工人數逐年增加,且這五年招聘的新員工總人數為500,若用這五年的數據求出每年招聘的新員工人數y關于年份代碼x(x=年份-2019)的線性回歸方程為,請根據此回歸模型預測該公司2026年招聘的新員工人數是否會超過250.參考答案:題號 1 2 3 4 5 6 7答案 A B C A BCD BCD ACD1.A【分析】根據隨機數表按照規則讀數即可得解.【詳解】根據隨機數表讀取,分別抽到的編號為31,32,43,25,12,51,26,04,01,11,所以選出來的第6個號碼所對應的學生編號為51,故選:A2.B【分析】根據題意可以計算出分層隨機抽樣的抽樣比例,進而計算出中年人和青年人的人數,進而可以知道中年人比青少年多多少個.【詳解】設中年人抽取人,青少年抽取人,由分層隨機抽樣可知,解得,故中年人比青少年多9人.故選:B.3.C【分析】由圖表進行數據分析,得到甲射擊5次所得環數分別為:9,8,10,9,10;乙射擊5次所得環數分別為:6,9, 9,8,10;利用平均數公式及方差公式計算即可.【詳解】由圖可知,甲射擊5次所得環數分別為:9,8,10,9,10;乙射擊5次所得環數分別為:6,9, 9,8,10;故,,,,故選:C.4.A【分析】根據第百分位數的概念,知道它在第二組里.運用概率之和為,構造方程,解出即可.【詳解】第百分位數設為,而,則所求百分位數在第二組,則可列方程解得.故選:A.5.BCD【分析】根據表格中數據可判斷ABC選項的正誤,根據表格中第季度的月消費品零售總額相比第季度的月消費品零售總額所分布的區間比較兩個季度數據的集中性,可判斷D選項的正誤.【詳解】對于A選項,月份的零售總額比月份的少,A選項錯誤;對于B選項,由表格中數據可知,年月份到月份,月份同比增長率最大,B選項正確;對于C選項,由表格中數據可知,年月份到月份,月份環比增長率最大,C選項正確;對于D選項,第季度的零售總額在內,而第季度的零售總額在內,前者數據更集中,方差更小,D選項正確.故選:BCD.6.BCD【分析】根據每個扇形的面積與該月的死亡人數成比例,分析相應的面積大小或面積變化,就能判斷出選項A、B、C的正確與否,隨著38名志愿女護士的加入,分析未來一年“玫瑰圖”每個扇形白色部分面積在逐步的變少,可以判斷出因疾病或其他原因導致的死亡的士兵越來越少,是由于志愿女護士的加入,改善了軍隊和醫院的衛生狀況,從而降低了不必要的死亡,所以D選項是正確的.【詳解】對于A選項,1854年4月至1855年3月,因為每個扇形白色部分面積遠大于灰色部分的面積,根據每個扇形的面積與該月的死亡人數成比例,可以得出由于疾病或其他原因而死的士兵遠大于戰場上因傷死亡的士兵;錯誤;對于B選項,從右側圖像可以看出,冬季(12月至來年2月)相應的扇形面積,大于其他季節時扇形的面積,表明在冬季死亡人數相較其他季節顯著增加,正確;對于C選項,從左側圖像可以看出,1855年12月之后,每個扇形白色部分的面積較大幅度的在減少,表明因疾病或其他原因導致的死亡人數總體上相較之前顯著下降,正確;對于D選項,隨著38名志愿女護士的加入,分析未來一年“玫瑰圖”每個扇形白色部分面積、在逐步的變少,可以判斷出因疾病或其他原因導致的死亡的士兵越來越少,因此,可以推斷出隨著志愿女護士的加入,改善了軍隊和醫院的衛生狀況,從而使得因疾病或其他原因導致的死亡的士兵越來越少,大幅度降低了不必要的死亡,正確,故選:BCD.7.ACD【分析】根據折線統計圖逐個分析判斷即可.【詳解】對于A,由圖知,每一組中的成績占比都是以各自班級的總人數為基數的,所以每一組中的甲班、乙班人數不能從所占的百分比來判斷,故A錯誤;對于BC,由圖可知甲班成績主要集中在[80,90),乙班成績主要集中在[60,70),B正確,C錯誤;對于D,由圖可知甲班成績的極差和乙班成績的極差的大小無法確定,故D錯誤.故選:ACD8.447【分析】根據隨機數表法,依次抽取即可得解.【詳解】根據隨機數表的讀取方法,依次抽取到的編號分別為:175,331,068,047,447,…,故第5個被抽到的編號為447,故答案為:447.9.【分析】根據給定條件,求出該地區中學生每天睡眠時間的平均數,再利用分層抽樣方差的計算方法求得結果.【詳解】該地區中學生每天睡眠時間的平均數為:(小時),該地區中學生每天睡眠時間的方差為:.故答案為:10.5【分析】根據分層抽樣的性質運算求解.【詳解】根據題意可得:高一、高二、高三報名人數之比為,故從高一年級學生中抽取的人數為.故答案為:5.11.(1)0.3,0.425;(2),甲班學生的成績波動更小.【分析】(1)利用條形圖計算頻率即可;(2)利用方差公式計算結合及方差的意義判定即可.【詳解】(1)甲班得分為95分及以上的學生有人,故頻率為; 乙班得分為95分及以上的學生有人,故頻率為(2)因為,所以方差;顯然,所以,甲班學生的成績波動更小.12.(1),68(2)預測該公司2026年招聘的新員工人數不超過250【分析】(1)根據頻率分布直方圖中的數據直接進行計算;(2)根據回歸方程過點,先求出線性回歸方程,再代入進行預測、比較即可.【詳解】(1)依題意,,解得,前兩組的頻率之和為,前三組的頻率之和為,所以中位數在區間內,估計中位數為.(2)依題意,,把代入中,有,解得,故線性回歸方程為,當時,,故預測該公司2026年招聘的新員工人數不超過250.【能力篇】一、單選題1.(22-23高三上·浙江杭州·期末)給出下列命題,其中不正確的命題為( )①若樣本數據的方差為3,則數據的方差為6;②回歸方程為時,變量x與y具有負的線性相關關系;③隨機變量X服從正態分布,則;④甲同學所在的某校高三共有5003人,先剔除3人,再按簡單隨機抽樣的方法抽取容量為200的一個樣本,則甲被抽到的概率為.A.①③④ B.③④ C.①②③ D.①②③④二、多選題2.(2024·貴州黔東南·二模)某學校為了解學生身高(單位:cm)情況,采用分層隨機抽樣的方法從4000名學生(該校男女生人數之比為)中抽取了一個容量為100的樣本.其中,男生平均身高為175,方差為184,女生平均身高為160,方差為179.則下列說法正確的是參考公式:總體分為2層,各層抽取的樣本量、樣本平均數和樣本方差分別為:,,,,,.記總的樣本平均數為,樣本方差為,則( )參考公式:A.抽取的樣本里男生有60人B.每一位學生被抽中的可能性為C.估計該學校學生身高的平均值為170D.估計該學校學生身高的方差為236三、填空題3.(2022·吉林·模擬預測)中國于2022年2月在北京成功地舉辦了第二十四屆冬季奧林匹克運動會.共赴冰雪之約,共享冬奧機遇,“冰雪經濟”逐漸升溫,“帶動三億人參與冰雪運動”已從愿景變為現實,中國各地滑雪場的數量也由2015年的1255家增加到2021年的3100家.下面是2016年至2021年中國滑雪場新增數量和滑雪場類型統計圖,下列說法中正確的序號是 .①2021年中國滑雪場產業中大眾娛樂型滑雪場占比最高②2016年至2021年中國滑雪場數量逐年上升③2016年至2021年中國滑雪場新增數量逐年增加④2021年業余玩家型滑雪場比2020年大眾娛樂型滑雪場數量多四、解答題4.(2024·陜西安康·模擬預測)首屆中國航協航空大會的一個鮮明的特色是在各個展區中設置了多項互動體驗活動,吸引了很多的中小學生,其中模擬飛行體驗區是讓這些中小學生戴上VR眼鏡模擬從起飛到降落,大大激發了他們的興趣愛好.現從某個有互動體驗的展區中隨機抽取60名中小學生,統計他們的參觀時間(從進入該展區到離開該展區的時長,單位:分鐘,時間取整數),將時間分成六組,并繪制成如圖所示的頻率分布直方圖.(1)由頻率分布直方圖,估計樣本的平均數和方差;(每組數據以區間的中點值為代表)(2)為對比展區是否有體驗區對中小學生的吸引程度,某工作人員給出了一份該展區中沒有體驗區的參觀時間的隨機數據,經計算得到該組數據參觀時長平均值為65分鐘,方差為,試判斷有體驗區的參觀時長均值比沒有體驗區的參觀時長均值是否有顯著提高?(如果,則認為有顯著提高,否則不認為有顯著提高)(3)利用(2)中的結果,你認為展區是否應該設置互動體驗展區?請說明理由.參考答案:題號 1 2答案 A ABD1.A【分析】根據方差的性質可判斷①;根據變量x,y的線性回歸方程的系數,判斷變量x,y是負相關關系可判斷②;利用正態分布的對稱性,計算求得結果可判斷③;根據簡單隨機抽樣概率均等,計算出每人被抽取的概率可判斷④.【詳解】對于①,若,則,故①錯誤;對于②,回歸方程為,可知,則變量x與y具有負的線性相關關系,故②正確;對于③,∵,∴,∴,∴,∴,故③錯誤;對于④,根據簡單隨機抽樣概率均等可知,甲被抽到的概率為,故④錯誤.故選:A.2.ABD【分析】根據分層抽樣的公式,以及利用每層樣本的平均數和方差公式,代入總體的均值和方差公式,即可判斷選項.【詳解】對于項,抽取的樣本里男生有人,所以A項正確;對于B項,由題可知,每一位學生被抽中的可能性為,所以B項正確;對于C項,估計該學校學生身高的平均值為,所以C項錯誤;對于D,估計該學校學生身高的方差為,所以D項正確.故選:ABD3.①②④【分析】根據柱狀圖和扇形圖,分別判斷選項.【詳解】由扇形統計圖可知,2021年中國滑雪場產業中大眾娛樂型滑雪場占比最高,故①正確;由柱狀圖可知,2016年至2021年中國滑雪場數量逐年上升,故②正確;由柱狀圖可知,2020年比2019年下降了,故③不正確;由圖可知,2021年業余玩家型滑雪場比2020年大眾娛樂型滑雪場數量多,故④正確.故答案為:①②④4.(1)71,194(2)有顯著提高(3)答案見解析【分析】(1)根據頻率分布直方圖平均數和方差公式計算;(2)應用公式計算判斷即可;(3)根據結果判斷是否設置互動體驗展區即可.【詳解】(1)由題得,所以樣本的方差為(2)由題得,所以,所以有體驗區的參觀時長均值比沒有體驗區的參觀時長均值有顯著提高.從(2)中可知展區應該設置互動體驗展區,這樣可以吸引更多的參觀者進行觀看與體驗,使他們能更多地了解產品,并能更大程度地激發中小學生的興趣愛好.21世紀教育網(www.21cnjy.com)專題55 隨機抽樣、統計圖表(新高考專用)【知識梳理】 2【真題自測】 4【考點突破】 7【考點1】簡單隨機抽樣 7【考點2】分層隨機抽樣及其應用 9【考點3】統計圖表 10【分層檢測】 13【基礎篇】 13【能力篇】 18考試要求:1.理解隨機抽樣的必要性和重要性.2.會用簡單隨機抽樣方法從總體中抽取樣本,了解分層隨機抽樣方法.3.理解統計圖表的含義.1.簡單隨機抽樣(1)簡單隨機抽樣分為放回簡單隨機抽樣和不放回簡單隨機抽樣.除非特殊聲明,本章簡單隨機抽樣指不放回簡單隨機抽樣.(2)簡單隨機樣本通過簡單隨機抽樣獲得的樣本稱為簡單隨機樣本.(3)簡單隨機抽樣的常用方法實現簡單隨機抽樣的方法很多,抽簽法和隨機數法是比較常用的兩種方法.2.總體平均數與樣本平均數名稱 定義總體均值 (總體平均數) 一般地,總體中有N個個體,它們的變量值分別為Y1,Y2,…,YN,則稱==Yi為總體均值,又稱總體平均數.如果總體的N個變量值中,不同的值共有k(k≤N)個,不妨記為Y1,Y2,…,Yk,其中Yi出現的頻數fi(i=1,2,…,k),則總體均值還可以寫成加權平均數的形式=fiYi.樣本均值(樣本平均數) 如果從總體中抽取一個容量為n的樣本,它們的變量值分別為y1,y2,…,yn,則稱==yi為樣本均值,又稱樣本平均數.說明:(1)在簡單隨機抽樣中,我們常用樣本平均數去估計總體平均數; (2)總體平均數是一個確定的數,樣本平均數具有隨機性(因為樣本具有隨機性); (3)一般情況下,樣本量越大,估計越準確.3.分層隨機抽樣(1)分層隨機抽樣的概念一般地,按一個或多個變量把總體劃分成若干個子總體,每個個體屬于且僅屬于一個子總體,在每個子總體中獨立地進行簡單隨機抽樣,再把所有子總體中抽取的樣本合在一起作為總樣本,這樣的抽樣方法稱為分層隨機抽樣,每一個子總體稱為層.(2)分層隨機抽樣的平均數計算在分層隨機抽樣中,以層數是2層為例,如果第1層和第2層包含的個體數分別為M和N,抽取的樣本量分別為m和n,第1層和第2層的樣本平均數分別為,,樣本平均數為,則=+=+.我們可以用樣本平均數估計總體平均數.4.統計圖表(1)常見的統計圖表有條形圖、扇形圖、折線圖、頻數分布直方圖、頻率分布直方圖等.(2)頻率分布表、頻率分布直方圖的制作步驟及意義1.不論哪種抽樣方法,總體中的每一個個體入樣的概率都是相同的.2.分層隨機抽樣是按比例抽樣,每一層入樣的個體數為該層的個體數乘抽樣比.3.頻率分布直方圖中小長方形高=.一、單選題1.(2024·全國·高考真題)某農業研究部門在面積相等的100塊稻田上種植一種新型水稻,得到各塊稻田的畝產量(單位:kg)并整理如下表畝產量 [900,950) [950,1000) [1000,1050) [1050,1100) [1100,1150) [1150,1200)頻數 6 12 18 30 24 10根據表中數據,下列結論中正確的是( )A.100塊稻田畝產量的中位數小于1050kgB.100塊稻田中畝產量低于1100kg的稻田所占比例超過80%C.100塊稻田畝產量的極差介于200kg至300kg之間D.100塊稻田畝產量的平均值介于900kg至1000kg之間2.(2023·天津·高考真題)鳶是鷹科的一種鳥,《詩經·大雅·旱麓》曰:“鳶飛戾天,魚躍余淵”. 鳶尾花因花瓣形如鳶尾而得名,寓意鵬程萬里、前途無量.通過隨機抽樣,收集了若干朵某品種鳶尾花的花萼長度和花瓣長度(單位:cm),繪制散點圖如圖所示,計算得樣本相關系數為,利用最小二乘法求得相應的經驗回歸方程為,根據以上信息,如下判斷正確的為( )A.花瓣長度和花萼長度不存在相關關系B.花瓣長度和花萼長度負相關C.花萼長度為7cm的該品種鳶尾花的花瓣長度的平均值為D.若從樣本中抽取一部分,則這部分的相關系數一定是3.(2022·天津·高考真題)將1916到2015年的全球年平均氣溫(單位:),共100個數據,分成6組:,并整理得到如下的頻率分布直方圖,則全球年平均氣溫在區間內的有( )A.22年 B.23年 C.25年 D.35年4.(2022·全國·高考真題)某社區通過公益講座以普及社區居民的垃圾分類知識.為了解講座效果,隨機抽取10位社區居民,讓他們在講座前和講座后各回答一份垃圾分類知識問卷,這10位社區居民在講座前和講座后問卷答題的正確率如下圖:則( )A.講座前問卷答題的正確率的中位數小于B.講座后問卷答題的正確率的平均數大于C.講座前問卷答題的正確率的標準差小于講座后正確率的標準差D.講座后問卷答題的正確率的極差大于講座前正確率的極差5.(2022·北京·高考真題)在北京冬奧會上,國家速滑館“冰絲帶”使用高效環保的二氧化碳跨臨界直冷制冰技術,為實現綠色冬奧作出了貢獻.如圖描述了一定條件下二氧化碳所處的狀態與T和的關系,其中T表示溫度,單位是K;P表示壓強,單位是.下列結論中正確的是( )A.當,時,二氧化碳處于液態B.當,時,二氧化碳處于氣態C.當,時,二氧化碳處于超臨界狀態D.當,時,二氧化碳處于超臨界狀態二、多選題6.(2023·全國·高考真題)有一組樣本數據,其中是最小值,是最大值,則( )A.的平均數等于的平均數B.的中位數等于的中位數C.的標準差不小于的標準差D.的極差不大于的極差三、解答題7.(2023·全國·高考真題)某廠為比較甲乙兩種工藝對橡膠產品伸縮率的處理效應,進行10次配對試驗,每次配對試驗選用材質相同的兩個橡膠產品,隨機地選其中一個用甲工藝處理,另一個用乙工藝處理,測量處理后的橡膠產品的伸縮率.甲、乙兩種工藝處理后的橡膠產品的伸縮率分別記為,.試驗結果如下:試驗序號 1 2 3 4 5 6 7 8 9 10伸縮率 545 533 551 522 575 544 541 568 596 548伸縮率 536 527 543 530 560 533 522 550 576 536記,記的樣本平均數為,樣本方差為.(1)求,;(2)判斷甲工藝處理后的橡膠產品的伸縮率較乙工藝處理后的橡膠產品的伸縮率是否有顯著提高(如果,則認為甲工藝處理后的橡膠產品的伸縮率較乙工藝處理后的橡膠產品的伸縮率有顯著提高,否則不認為有顯著提高)8.(2023·全國·高考真題)某研究小組經過研究發現某種疾病的患病者與未患病者的某項醫學指標有明顯差異,經過大量調查,得到如下的患病者和未患病者該指標的頻率分布直方圖: 利用該指標制定一個檢測標準,需要確定臨界值c,將該指標大于c的人判定為陽性,小于或等于c的人判定為陰性.此檢測標準的漏診率是將患病者判定為陰性的概率,記為;誤診率是將未患病者判定為陽性的概率,記為.假設數據在組內均勻分布,以事件發生的頻率作為相應事件發生的概率.(1)當漏診率%時,求臨界值c和誤診率;(2)設函數,當時,求的解析式,并求在區間的最小值.【考點1】簡單隨機抽樣一、單選題1.(2022·黑龍江哈爾濱·三模)為了了解學生上網課期間作息情況,現從高三年級702人中隨機抽取20人填寫問卷調查,首先用簡單隨機抽樣剔除2人,然后在剩余的700人中再用系統抽樣的方法抽取20人,則( )A.每個學生入選的概率都為 B.每個學生人選的概率都為C.每個學生人選的概率都為 D.由于有剔除,學生入選的概率不全相等2.(2024·福建泉州·模擬預測)從一個含有個個體的總體中抽取一容量為的樣本,當選取抽簽法、隨機數法和分層隨機抽樣三種不同方法時,總體中每個個體被抽中的概率分別為,三者關系可能是( )A. B. C. D.二、多選題3.(2024·廣西南寧·模擬預測)給出下列命題,其中錯誤的命題為( )A.若樣本數據的方差為3,則數據的方差為6.B.具有相關關系的兩個變量x,y的相關系數為r,那么越接近于0,x,y之間的線性相關程度越高;C.在一個列聯表中,根據表中數據計算得到的觀測值k,若k的值越大,則認為兩個變量間有關的把握就越大;D.甲同學所在的某校高三共有5003人,先剔除3人,再按簡單隨機抽樣的方法抽取容量為200的一個樣本,則甲被抽到的概率為.4.(2022·湖北·模擬預測)某地區公共部門為了調查本地區中學生的吸煙情況,對隨機抽出的編號為1~1000的1000名學生進行了調查.調查中使用了兩個問題,問題1:你的編號是否為奇數?問題2:你是否吸煙?被調查者從設計好的隨機裝置(內有除顏色外完全相同的白球50個,紅球50個)中摸出一個小球(摸完放回):摸到白球則如實回答問題1,摸到紅球則如實回答問題2,回答“是”的人在一張白紙上畫一個“√”,回答“否”的人什么都不用做,由于問題的答案只有“是”和“否”,而且回答的是哪個問題也是別人不知道的,因此被調查者可以毫無顧忌的給出真實的答案.最后統計得出,這1000人中,共有265人回答“是”,則下列表述正確的是( )A.估計被調查者中約有15人吸煙 B.估計約有15人對問題2的回答為“是”C.估計該地區約有3%的中學生吸煙 D.估計該地區約有1.5%的中學生吸煙三、填空題5.(23-24高三上·上海·期中)現利用隨機數表發從編號為的20支水筆中隨機選取6支,選取方法是從下列隨機數表第1行的第9個數字開始由左到右依次選取兩個數字,則選出來的第6支水筆的編號為 .6.(2022·新疆烏魯木齊·模擬預測)我國古代數學名著《數書九章》中有“米谷粒分”問題:“開倉受納,有甲戶米一千五百三十四石到廊.驗得米內夾谷,乃于樣內取米一捻,數計二百五十四粒,內有谷二十八顆.今欲知米內雜谷多少.”意思是:官府開倉接受百姓納糧,甲戶交米1534石到廊前,檢驗出米里夾雜著谷子,于是從米樣粒取出一捻,數出共254粒,其中有谷子28顆,則這批米內有谷子約 石(結果四舍五入保留整數);反思提升:1.簡單隨機抽樣需滿足:(1)被抽取的樣本總體的個體數有限;(2)逐個抽取;(3)是不放回抽取;(4)是等可能抽取.2.簡單隨機抽樣常有抽簽法(適用于總體中個體數較少的情況)、隨機數法(適用于個體數較多的情況).【考點2】分層隨機抽樣及其應用一、單選題1.(2024·江西鷹潭·一模)某單位為了解職工體重情況,采用分層隨機抽樣的方法從800名職工中抽取了一個容量為80的樣本.其中,男性平均體重為64千克,方差為151;女性平均體重為56千克,方差為159,男女人數之比為,則單位職工體重的方差為( )A.166 B.167 C.168 D.1692.(2024·云南·模擬預測)某學校高三年級男生共有個,女生共有個,為調查該年級學生的年齡情況,通過分層抽樣,得到男生和女生樣本數據的平均數和方差分別為和,已知,則該校高三年級全體學生年齡的方差為( )A. B.C. D.二、多選題3.(2024·江西宜春·模擬預測)某學校高三年級共有900人,其中男生500人,現采用按性別比例分配的分層抽樣抽取了容量為90的樣本. 經計算得男生的身高均值為170,方差為19,女生樣本的身高均值為161,方差為19,則下列說法中正確的是( )A.女生的樣本容量為40B.女生甲被抽到的概率為C.估計該校高三年級學生身高的均值為166D.估計該校高三年級學生身高的方差大于194.(2023·山西臨汾·一模)某學生社團有男生32名,女生24名,從中隨機抽取一個容量為7的樣本,某次抽樣結果為:抽到3名男生和4名女生,則下列說法正確的是( )A.這次抽樣可能采用的是抽簽法B.這次抽樣不可能是按性別分層隨機抽樣C.這次抽樣中,每個男生被抽到的概率一定小于每個女生被抽到的概率D.這次抽樣中,每個男生被抽到的概率不可能等于每個女生被抽到的概率三、填空題5.(2024·山東泰安·模擬預測)某高中為了了解學生參加數學建模社團的情況,采用了分層隨機抽樣的方法從三個年級中抽取了300人進行問卷調查,其中高一、高二年級各抽取了90人.已知該校高三年級共有720名學生,則該校共有學生 人.6.(2024·陜西安康·模擬預測)杭州亞運會期間,某社區有200人參加協助交通管理的志愿團隊,為了解他們參加這項活動的感受,用按比例分配的分層抽樣的方法隨機抽取了一個容量為40的樣本,若樣本中女性有16人,則該志愿團隊中的男性人數為 .反思提升:1.求某層應抽個體數量:按該層所占總體的比例計算.2.已知某層個體數量,求總體數量或反之求解:根據分層隨機抽樣就是按比例抽樣,列比例式進行計算.3.在分層隨機抽樣中,如果第一層的樣本量為m,平均值為x;第二層的樣本量為n,平均值為y,則樣本的平均值為.【考點3】統計圖表一、單選題1.(2022·安徽馬鞍山·模擬預測)下圖為國家統計局給出的2016-2020年福利彩票銷售額、增長率及籌集公益金情況統計圖,則下列說法正確的是( ) A.2016-2020年福利彩票銷售額呈遞減趨勢B.2016-2020年福利彩票銷售額的年增長率呈遞減趨勢C.2016-2020年福利彩票銷售額、籌集公益金均在2018年取得最大值D.2017-2018年福利彩票銷售額增長的最多2.(2021·廣西柳州·一模)空氣質量的指標是反映空氣質量狀況的指數,指數的值越小,表明空氣質量越好,指數不超過50,空氣質量為優,指數大于50且不超過100,空氣質量為良,指數大于100,空氣質量為污染,如圖是某市2020年空氣質量指標的月折線圖.下列關于該市2020年空氣質量的敘述中不一定正確的是( )A.全年的平均指數對應的空氣質量等級為優或良.B.每月都至少有一天空氣質量為優.C.空氣質量為污染的天數最多的月份是2月份.D.2月,8月,9月和12月均出現污染天氣.二、多選題3.(2024·遼寧·二模)下圖為某市2023年第一季度全市居民人均消費支出構成圖.已知城鎮居民人均消費支出7924元,與上一年同比增長4.4%;農村居民人均消費支出4388元,與上一年同比增長7.8%,則關于2023年第一季度該市居民人均消費支出,下列說法正確的是( )A.2023年第一季度該市居民人均消費支出6393元B.居住及食品煙酒兩項的人均消費支出總和超過了總人均消費支出的50%C.城鄉居民人均消費支出的差額與上一年同比在縮小D.醫療保健與教育文化娛樂兩項人均消費支出總和約占總人均消費支出的20.6%4.(2021·廣東佛山·模擬預測)在“世界杯”足球賽閉幕后,某中學學生會對本校高三年級1000名學生收看比賽的情況用隨機抽樣方式進行調查,樣本容量為50,將數據分組整理后,列表如下:觀看場數 0 1 2 3 4 5 6 7觀看人數占調查人數的百分比 8% 10% 20% 26% m% 12% 6% 2%從表中可以得出正確的結論為( )A.表中m的數值為16B.估計全年級觀看比賽低于4場的學生約為32人C.估計全年級觀看比賽不低于4場的學生約為360D.估計全年級觀看比賽場數的眾數為2三、填空題5.(2024·河北石家莊·三模)為了解全市高三學生的體能素質情況,在全市高三學生中隨機抽取了1000名學生進行體能測試,并將這1000名學生的體能測試成績整理成如下頻率分布直方圖.則直方圖中實數的值為 .6.(2024·四川成都·模擬預測)某校為了解高三學生身體素質情況,從某項體育測試成績中隨機抽取個學生的成績進行分析,得到成績頻率分布直方圖(如圖所示),估計該校高三學生此項體育成績的中位數為 .(結果保留整數)反思提升:(1)通過扇形圖可以很清楚地表示出各部分數量同總數之間的關系.(2)折線圖可以顯示隨時間(根據常用比例放置)而變化的連續數據,因此非常適用于顯示在相等時間間隔下數據的趨勢.(3)頻率分布直方圖的數據特點:①頻率分布直方圖中縱軸上的數據是各組的頻率除以組距的結果,不要誤以為縱軸上的數據是各組的頻率,不要和條形圖混淆.②頻率分布直方圖中各小長方形的面積之和為1,這是解題的關鍵,常利用頻率分布直方圖估計總體分布.【基礎篇】一、單選題1.(2024·云南貴州·二模)本次月考分答題卡的任務由高三16班完成,現從全班55位學生中利用下面的隨機數表抽取10位同學參加,將這55位學生按01、02、、55進行編號,假設從隨機數表第1行第2個數字開始由左向右依次選取兩個數字,重復的跳過,讀到行末則從下一行行首繼續,則選出來的第6個號碼所對應的學生編號為( )0627 4313 2432 5327 0941 2512 6317 6323 2616 8045 60111410 9577 7424 6762 4281 1457 2042 5332 3732 2707 36070140 0523 2617 3726 3890 5124 5179 3014 2310 2118 2191A.51 B.25 C.32 D.122.(2024·河南駐馬店·二模)電影《孤注一擲》的上映引發了電信詐騙問題的熱議,也加大了各個社區反電信詐騙的宣傳力度.已知某社區共有居民480人,其中老年人200人,中年人200人,青少年80人,若按年齡進行分層隨機抽樣,共抽取36人作為代表,則中年人比青少年多( )A.6人 B.9人 C.12人 D.18人3.(2021·全國·模擬預測)在某次射擊比賽中,甲、乙兩人各射擊5次,射中的環數如圖,則下列說法正確的是( )A., B.,C., D.,4.(2024·湖北黃岡·模擬預測)為了解高中學生每天的體育活動時間,某市教育部門隨機抽取高中學生進行調查,把每天進行體育活動的時間按照時長(單位:分鐘)分成組:,,,,,.然后對統計數據整理得到如圖所示的頻率分布直方圖,則可估計這名學生每天體育活動時間的第百分位數為( )A. B. C. D.二、多選題5.(2021·江蘇南京·三模)面對新冠肺炎疫情沖擊,我國各地區各部門統籌疫情防控和經濟社會發展均取得顯著成效.下表顯示的是年月份到月份中國社會消費品零售總額數據,其中同比增長率是指和去年同期相比較的增長率,環比增長率是指與上個月份相比較的增長率,則下列說法正確的是( )中國社會消費品零售總額月份 零售總額(億元) 同比增長 環比增長 累計(億元)4 28178 -7.50% 6.53% 1067585 31973 -2.80% 13.47% 1387306 33526 -1.80% 4.86% 1722567 32203 -1.10% -3.95% 2044598 33571 0.50% 4.25% 2380299 35295 3.30% 5.14% 27332410 38576 4.30% 9.30% 31190111 39514 5.00% 2.43% 35141512 40566 4.60% 2.66% 391981A.年月份到月份,社會消費品零售總額逐月上升B.年月份到月份,月份同比增長率最大C.年月份到月份,月份環比增長率最大D.第季度的月消費品零售總額相比第季度的月消費品零售總額,方差更小6.(2024·浙江杭州·三模)南丁格爾是一位英國護士、統計學家及社會改革者,被譽為現代護理學的奠基人.1854年,在克里米亞戰爭期間,她在接到英國政府的請求后,帶領由38名志愿女護士組成的團隊前往克里米亞救治傷員,并收集士兵死亡原因數據繪制了如下“玫瑰圖”.圖中圓圈被劃分為12個扇形,按順時針方向代表一年中的各個月份.每個扇形的面積與該月的死亡人數成比例.扇形中的白色部分代表因疾病或其他原因導致的死亡,灰色部分代表因戰爭受傷導致的死亡.右側圖像為1854年4月至1855年3月的數據,左側圖像為1855年4月至1856年3月的數據.下列選項正確的為( )A.由于疾病或其他原因而死的士兵遠少于戰場上因傷死亡的士兵B.1854年4月至1855年3月,冬季(12月至來年2月)死亡人數相較其他季節顯著增加C.1855年12月之后,因疾病或其他原因導致的死亡人數總體上相較之前顯著下降D.此玫瑰圖可以佐證,通過改善軍隊和醫院的衛生狀況,可以大幅度降低不必要的死亡7.(2024·黑龍江·三模)在某市初三年級舉行的一次體育考試中(滿分100分),所有考生成績均在[50,100]內,按照[50,60),[60,70),[70,80),[80,90),[90,100]分成五組,甲、乙兩班考生的成績占比如圖所示,則下列說法錯誤的是( ) A.成績在[70,80)的考生中,甲班人數多于乙班人數B.甲班成績在[80,90)內人數最多C.乙班成績在[70,80)內人數最多D.甲班成績的極差比乙班成績的極差小三、填空題8.(2022·山西臨汾·二模)現從某學校450名同學中用隨機數表法隨機抽取30人參加一項活動.將這450名同學編號為001,002,…,449,450,要求從下表第2行第5列的數字開始向右讀,則第5個被抽到的編號為 .16 22 77 94 39 49 54 43 54 82 17 37 93 23 78 87 35 20 96 43 84 26 34 91 6484 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 7663 01 63 78 59 16 95 55 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 799.(2023·湖南常德·模擬預測)為調查某地區中學生每天睡眠時間,采用樣本量比例分配的分層隨機抽樣,現抽取初中生800人,其每天睡眠時間均值為9小時,方差為0.5,抽取高中生1200人,其每天睡眠時間均值為8小時,方差為1,則估計該地區中學生每天睡眠時間的方差為 .10.(2023·廣西河池·模擬預測)雅言傳承文明,經典浸潤人生,南寧市某校每年舉辦“品經誦典浴書香,提雅增韻享閱讀”中華經典誦讀大賽,比賽內容有三類:“誦讀中國”、“詩教中國”、“筆墨中國”.已知高一、高二、高三報名人數分別為:100人、150人和250人.現采用分層抽樣的方法,從三個年級中抽取25人組成校代表隊參加市級比賽,則應該從高一年級學生中抽取的人數為 .四、解答題11.(2024·陜西渭南·模擬預測)某高中為配合愛國主義教育,開展國防科技知識競賽,預賽后,將成績最好的甲、乙兩個班學生(每班都是40人)的得分情況做成如下的條形圖(20道單項選擇題,每題5分,滿分100分).記甲、乙兩班學生得分的平均數分別為,方差分別為,已求得(1)分別求出甲、乙兩班的學生得分為95分及以上的頻率;(2)試計算,并判斷哪個班的學生的成績波動更小.12.(2024·陜西西安·模擬預測)某高科技公司組織大型招聘會,全部應聘人員的筆試成績統計如圖所示:(1)求m的值,并估計全部應聘人員筆試成績的中位數;(2)該公司2020—2024年每年招聘的新員工人數逐年增加,且這五年招聘的新員工總人數為500,若用這五年的數據求出每年招聘的新員工人數y關于年份代碼x(x=年份-2019)的線性回歸方程為,請根據此回歸模型預測該公司2026年招聘的新員工人數是否會超過250.【能力篇】一、單選題1.(22-23高三上·浙江杭州·期末)給出下列命題,其中不正確的命題為( )①若樣本數據的方差為3,則數據的方差為6;②回歸方程為時,變量x與y具有負的線性相關關系;③隨機變量X服從正態分布,則;④甲同學所在的某校高三共有5003人,先剔除3人,再按簡單隨機抽樣的方法抽取容量為200的一個樣本,則甲被抽到的概率為.A.①③④ B.③④ C.①②③ D.①②③④二、多選題2.(2024·貴州黔東南·二模)某學校為了解學生身高(單位:cm)情況,采用分層隨機抽樣的方法從4000名學生(該校男女生人數之比為)中抽取了一個容量為100的樣本.其中,男生平均身高為175,方差為184,女生平均身高為160,方差為179.則下列說法正確的是參考公式:總體分為2層,各層抽取的樣本量、樣本平均數和樣本方差分別為:,,,,,.記總的樣本平均數為,樣本方差為,則( )參考公式:A.抽取的樣本里男生有60人B.每一位學生被抽中的可能性為C.估計該學校學生身高的平均值為170D.估計該學校學生身高的方差為236三、填空題3.(2022·吉林·模擬預測)中國于2022年2月在北京成功地舉辦了第二十四屆冬季奧林匹克運動會.共赴冰雪之約,共享冬奧機遇,“冰雪經濟”逐漸升溫,“帶動三億人參與冰雪運動”已從愿景變為現實,中國各地滑雪場的數量也由2015年的1255家增加到2021年的3100家.下面是2016年至2021年中國滑雪場新增數量和滑雪場類型統計圖,下列說法中正確的序號是 .①2021年中國滑雪場產業中大眾娛樂型滑雪場占比最高②2016年至2021年中國滑雪場數量逐年上升③2016年至2021年中國滑雪場新增數量逐年增加④2021年業余玩家型滑雪場比2020年大眾娛樂型滑雪場數量多四、解答題4.(2024·陜西安康·模擬預測)首屆中國航協航空大會的一個鮮明的特色是在各個展區中設置了多項互動體驗活動,吸引了很多的中小學生,其中模擬飛行體驗區是讓這些中小學生戴上VR眼鏡模擬從起飛到降落,大大激發了他們的興趣愛好.現從某個有互動體驗的展區中隨機抽取60名中小學生,統計他們的參觀時間(從進入該展區到離開該展區的時長,單位:分鐘,時間取整數),將時間分成六組,并繪制成如圖所示的頻率分布直方圖.(1)由頻率分布直方圖,估計樣本的平均數和方差;(每組數據以區間的中點值為代表)(2)為對比展區是否有體驗區對中小學生的吸引程度,某工作人員給出了一份該展區中沒有體驗區的參觀時間的隨機數據,經計算得到該組數據參觀時長平均值為65分鐘,方差為,試判斷有體驗區的參觀時長均值比沒有體驗區的參觀時長均值是否有顯著提高?(如果,則認為有顯著提高,否則不認為有顯著提高)(3)利用(2)中的結果,你認為展區是否應該設置互動體驗展區?請說明理由21世紀教育網(www.21cnjy.com) 展開更多...... 收起↑ 資源列表 2025年高考數學一輪復習講義專題55隨機抽樣、統計圖表(原卷版).docx 2025年高考數學一輪復習講義專題55隨機抽樣、統計圖表(解析版).docx 縮略圖、資源來源于二一教育資源庫