資源簡介 中小學教育資源及組卷應用平臺第41講 特征數及抽樣方法一.兩種抽樣方法(一)簡單隨機抽樣1.概念:一般地,從元素個數為N的總體中逐個不放回地抽取容量為的樣本,如果每一次抽取時總體中的各個個體有相同的可能性被抽到,這種抽樣方法叫做簡單隨機抽樣.2.最常用的簡單隨機抽樣的方法:抽簽法和隨機數法3.適用范圍是:總體中的個體性質相似,無明顯層次;總體容量較小,尤其是樣本容量較小.(二)分層抽樣1.概念:當總體由有明顯差別的幾部分組成時,為了使抽取的樣本更好地反映總體的情況,常采用分層抽樣,將總體中各個個體按某種特征分成若干個互不交叉的幾部分,每一部分叫做層,在各層中按層在總體中所占比例進行簡單隨機抽樣或系統抽樣,這種抽樣方法叫做分層抽樣.2.應用范圍是:總體由差異明顯的幾部分組成的情況;分層后,在每一層抽樣時可采用簡單隨機抽樣或系統抽樣.3.特征:等比例抽樣二.頻率分布直方圖(表)1.頻率分布直方圖基礎概念①縱軸表示,②頻率:數據落在各小組內的頻率用各長長方形的面積表示③各小長方形的面積總和等于1.④分布折線圖:連接頻率分布直方圖中各小長方形上端的中點,就得到頻率分布折線圖.隨著樣本容量的增加,作圖時所分的組數增加,組距減小,相應的頻率分布折線圖就會越來越接近于一條光滑的曲線,統計中稱之為總體密度曲線,它能夠更加精細的反映出總體的分布規律.2.頻率分布直方圖的步驟如下(ⅰ)求極差;(ⅱ)確定組距和組數;(ⅲ)將數據分組;(ⅳ)列頻率分布表;(ⅴ)畫頻率分布直方圖.頻率分布直方圖能很容易地表示大量數據,非常直觀地表明分布的形狀.三.莖葉圖1.概念:當數據有兩位有效數字時,用中間的數字表示十位數,即第一個有效數字,兩邊的數字表示個位數,即第二個有效數字,它的中間部分像植物的莖,兩邊部分像植物莖上長出來的葉子,因此通常把這樣的圖叫做莖葉圖.當數據有三位有效數字,前兩位相對比較集中時,常以前兩位為莖,第三位(個位)為葉(其余類推).2.兩個突出的優點:其一是統計圖上沒有原始數據的損失,所有信息都可以從這個莖葉圖中得到,其二是在比賽時隨時記錄,方便記錄與表示.四.樣本的數字特征特征數 具體數字算法 頻率分布直方圖(表)眾數 次數出現最多的數字 頻率最大或最高組的中間值中位數 樣本數據中,將數據按大小排列,位于最中間的數據.如果數據的個數為偶數,就取當中兩個數據的平均數作為中位數 頻率等于0.5時的橫坐標平均數 所有數字之和除以總個數 每個小矩形面積乘以小矩形底邊中點的橫坐標之和方差平均數反映了數據取值的平均水平,標準差、方差描述了一組數據波動的大小.標準差、方差越大,數據的離散程度越大,越不穩定;標準差、方差越小,數據的離散程度越小,越穩定題型一:兩種抽樣法1.(石嘴山市第三中學高二月考)下列說法正確的個數是( ).②總體的個體數不多時宜用簡單隨機抽樣法;②在對總體均分后的每一部分進行抽樣時,采用的是簡單隨機抽樣;③西貨商場的抽獎活動是抽簽法;④整個抽樣過程中,每個個體被抽取的機率相等(有剔除時例外).A.1 B.2 C.3 D.4【答案】B【詳解】解:對于①,總體的個體數不多時宜用簡單隨機抽樣法,命題正確;對于②,系統抽樣在總體均分以后的第一部分進行抽樣時,采用的是簡單隨機抽樣,②錯誤;對于③,百貨商場的抽獎活動是抽簽法,也叫抓鬮,命題正確;對于④,系統抽樣的整個抽樣過程中,每個個體被抽取的概率相等(有剔除時概率也相等),④錯誤;綜上,正確的命題有2個.故選:B.2.(全國高一課時練習)關于簡單隨機抽樣,下列說法中正確的是( )①它要求被抽取樣本的總體的個數有限;②它是從總體中逐個地進行抽取;③它是一種不放回抽樣;④它是一種等可能性抽樣.A.①②③④ B.③④ C.①②③ D.①③④【答案】A【詳解】①簡單隨機抽樣中被抽取樣本的總體的個數有限,正確;②簡單隨機抽樣是從總體中逐個地進行抽取,正確;③簡單隨機抽樣是一種不放回抽樣,正確;④簡單隨機抽樣是一種等可能抽樣,即每個個體被抽取的可能性相等,正確.故答案為:①②③④.故選:A.3.(廣州大學附屬中學高二月考)某工廠利用隨機數表對生產的50個零件進行抽樣測試,先將50個零件進行編號,編號分別為01,02,…,50,從中抽取5個樣本,下面提供隨機數表的第1行到第2行:若從表中第1行第9列開始向右依次讀取數據,則得到的第4個樣本編號是( )A.10 B.05 C.09 D.20【答案】C【詳解】依題意,讀取的第一個數為14,向右每兩位讀取數據,依次為:64,05,71,11,05,65,09,其中64,71,65不在編號范圍內,舍去,而后一個05與前一個05重復,應舍去后一個05,讀取符合要求的兩位數據依次為:14,05,11,09,則09剛好是第四個符合要求的編號,所以得到的第4個樣本編號是09.故選:C4.(大同市平城中學校高一月考)我國古代數學名著《九章算術》有一抽樣問題:“今有某地北面若干人,西面有7488人,南面有6912人,這三面要征調300人,而北面共征調108人(用分層簡單抽樣的方法),則北面共有多少人( )A.8000 B.8100 C.8200 D.8300【答案】B【詳解】解:設北面人數為,根據題意知,,解得,所以北面共有8100人.故選:B5.(陜西省黃陵縣中學高一月考)某校高二年級有男生600人,女生500人,為了解該年級學生的體育達標情況,從男生中任意抽取30人,從女生中任意抽取25人進行調查.這種抽樣方法是( )A.系統抽樣法 B.抽簽法C.隨機數法 D.分層抽樣法【答案】D【詳解】∵所要研究的對象是男生和女生,要了解該年級學生的體育達標情況,而男生和女生的體育達標情況有比較大的差異性,∴抽取樣本的時候應該選擇分層抽樣,總體是由男生和女生組成,比例為600∶500=6∶5,故抽取的比例也是6∶5.故選:D6.(渭南市尚德中學高一月考)甲、乙兩套設備生產的同類型產品共4 800件,采用分層抽樣的方法從中抽取一個容量為80的樣本進行質量檢測.若樣本中有50件產品由甲設備生產,則乙設備生產的產品總數為( )件.A.1800 B.1600 C.1900 D.1000【答案】A【詳解】解:樣本容量為80,抽取的比例為,又樣本中有50件產品由甲設備生產,樣本中30件產品由乙設備生產,乙設備生產的產品總數為.故選:A.7.(崇仁縣第二中學(文))某校選修乒乓球課程的學生中,高一年級有50名,高二年級有30名.現用分層抽樣的方法在這80名學生中抽取一個樣本,已知在高一年級的學生中抽取了10名,則在高二年級的學生中應抽取的人數為( )A.6 B.8 C.10 D.12【答案】A【詳解】設樣本容量為N,則,解得N=16,所以高二所抽人數為:.故選:A8.(黑龍江讓胡路·大慶中學)從一個容量為(,)的總體中抽取一個容量為的樣本,當選取簡單隨機抽樣方法抽取樣本時,總體中每個個體被抽中的可能性是,則選取分層隨機抽樣方法抽取樣本時,總體中每個個體被抽中的可能性是( )A. B. C. D.【答案】D【詳解】隨機抽樣每個個體被抽到的概率相等,選取分層抽樣抽取樣本時總體中每個個體被抽中的概率仍為故選:D9.(羅平縣第二中學)某奶制品工廠某天甲、乙、丙、丁四類奶制品的產量分別為2000盒、1250盒、1250盒、500盒.若按產量比例用分層隨機抽樣的方法抽取一個樣本容量為60的樣本,則樣本中甲類奶制品的數量為( )A.6盒 B.15盒 C.20盒 D.24盒【答案】D【詳解】某天奶制品的總產量為,則用分層抽樣抽取容量為60的樣本的抽樣比為:,所以樣本中甲類奶制品的數量為.故選:D題型二:頻率分布直方圖1.(廣西南寧·高三模擬預測(文))北京舞蹈學院為了解大一舞蹈專業新生的體重情況,對報到的1000名舞蹈專業生的數據(單位:)進行統計,得到如圖所示的體重頻率分布直方圖,則體重在以上的人數為( )A.100 B.150 C.200 D.250【答案】D【詳解】,,故選:D.2.(天津市第四十七中學高三月考)天津中學為了調查該校學生對于新冠肺炎防控的了解情況,組織了一次新冠肺炎防控知識競賽,并從該學校1500名參賽學生中隨機抽取了100名學生,并統計了這100名學生成績情況(滿分100分,其中80分及以上為優秀),得到了樣本頻率分布直方圖(如圖),根據頻率分布直方圖推測,這1500名學生中競賽成績為優秀的學生人數大約為( )A.120 B.360 C.420 D.480【答案】C【詳解】由頻率分布直方圖可得樣本中優秀的頻率為,則這1500名學生中競賽成績為優秀的學生人數大約為.故選:C.3.(沙坪壩·重慶南開中學)某部門為了了解一批樹苗的生長情況,在棵樹苗中隨機抽取棵,統計這棵樹苗的高度,將所得個高度數據分為組:,,,,,,,并繪制了頻率分布直方圖(如圖),那么根據該圖可推測,在這棵樹苗中高度小于cm的樹苗棵數是( )A.360 B.600 C.840 D.1320【答案】B【詳解】依題意可得這棵樹苗中高度小于cm的概率為,所以在這棵樹苗中高度小于cm的樹苗棵數是,故選:B4.(江蘇南京·高二月考)為了解學生在課外活動方面的支出情況,抽取了個同學進行調查,結果顯示這些學生的支出金額(單位:元)都在內,其中支出金額在內的學生有234人,頻率分布直方圖如圖所示,則等于( )A.300 B.320 C.340 D.360【答案】D【詳解】解:由頻率分布直方圖知:,∴.故選:D.5.(嘉峪關市第一中學高一期中)在高一(1)班組織的“我愛古詩詞”的調研考試中,全班40名學生的成績數據(均為整數且都在)統計為如下的頻率分布直方圖,則第四小組(成績分布在)的頻率為( )A.0.001 B.0.01 C.0.03 D.0.3【答案】D【詳解】由頻率分布直方圖可得第四小組的頻率為.故選:D.6.(北京牛欄山一中)某工廠對一批元件進行抽樣檢測.經檢測,抽出的元件的長度(單位:mm)全部介于93至105之間.將抽出的元件的長度以2為組距分成6組:[93,95),[95,97),[97,99),[99,101),[101,103),[103,105],得到如圖所示的頻率分布直方圖.若長度在[97,103)內的元件為合格品,根據頻率分布直方圖,估計這批元件的不合格率是( )A.80% B.11% C.20% D.14.5%【答案】C【詳解】解:長度在,內的元件為合格品,根據頻率分布直方圖得不合格的頻率為:,所以估計這批元件的不合格率是.故選:C.7.(陜西韓城·高一期末)抽樣統計某校部分學生的物理測試成績,得到樣本頻率分布直方圖如圖所示,若滿分為100分,規定不低于60分為及格,則及格率是( )A. B.C. D.【答案】D【詳解】解:根據頻率分布直方圖,不低于60分的頻率為,所以及格率是.故選:D.8.(河南商丘·)某校高三年級共有名學生選修地理,某次考試地理成績均在分之間,分數統計后繪成頻率分布直方圖,如圖所示,則成績在分的學生人數為( )A. B. C. D.【答案】C【詳解】成績在分內的頻率為,所以成績在分的學生人數為.故選:C9.(陜西銅川·高一期末)某班50名學生在一次百米測試中,成績全部不小于13秒且小于19秒,將測試結果按如下方式分成六組:第一組,成績大于等于13秒且小于14秒;第二組,成績大于等于14秒且小于15秒;…;第六組,成績大于等于18秒且小于19秒,如圖是按上述分組方法得到的頻率分布直方圖,設成績小于17秒的學生人數占全班總人數的百分比為,成績大于等于15秒且小于17秒的學生人數為,則從頻率分布直方圖中可分析出和的值分別是( )A.,35 B.,45C.,35 D.,45【答案】A【詳解】解:從頻率分布直方圖上可以看出,,故選:.10.(全國高一專題練習)學校為了調查學生在課外讀物方面的支出情況,抽取了一個容量為的樣本,其頻率分布直方圖如圖所示,其中支出在的同學有人,則的值為( )A. B. C. D.【答案】A【詳解】由頻率分布直方圖可知,支出在的同學的頻率為:,故選:題型三:平均數、眾數、中位數1.(全國高一課時練習)下面表格記錄了甲、乙兩組各五名學生在一次英語聽力測試中的成績(單位:分).已知甲組數據的中位數為15,乙組數據的平均數為16.8,則的值分別為( )甲組 9 12 x 24 27乙組 9 15 18 y 24A.15,18 B.14,19 C.16,17 D.13,10【答案】A【詳解】甲組共有5個數,其余4個數分別為9,12,24,27,余下一個數為,將它們按從小到大排列后,第三個數為中位數,故中間數必定為且為15,又,解得,故選:A.2.(全國)陽澄湖大閘蟹在國內外享譽盛名,某超市從批發商那里購得10000只大閘蟹,這批大閘蟹的平均重量是100克.現在某超市員工隨機抽取了一個樣本容量為100的樣本,檢測得這100只大閘蟹的平均重量為克,則以下說法正確的是( )A.大于100 B.等于100 C.小于100 D.以上都有可能【答案】D【詳解】解:由于樣本平均數是一個隨機變量,故選:D.3.(吉林長春外國語學校高二開學考試)甲組數據為:5,12,16,21,25,37,乙組數據為:1,6,14,18,38,39,則甲、乙的平均數、極差及中位數相同的是( )A.極差 B.平均數 C.中位數 D.都不相同【答案】B【詳解】,,故甲、乙的平均數相同,甲、乙的極差分別為,,故不同,甲、乙的中位數分別為,,故不同,故選:.4.(北京101中學高一期中)一組數據的平均數為,方差為,將這組數據的每個數都乘以得到一組新數據,則下列說法正確的是( )A.這組新數據的平均數為 B.這組新數據的平均數為C.這組新數據的方差為 D.這組新數據的標準差為【答案】D.【詳解】由題可知,這組新數據的平均數為,故AB錯誤;這組新數據的方差為,故C錯誤;這組新數據的標準差為,故D正確.故選:D.5.(山西省長治市第二中學校高一月考)在發生某公共衛生事件期間,我國有關機構規定:該事件在一段時間沒有發生規模群體感染的標志為“連續10天每天新增加疑似病例不超過7人”.根據過去10天甲、乙、丙、丁四地新增疑似病例數據,一定符合該標志的是( )A.甲地總體均值為3,中位數為4 B.乙地總體均值為2,總體方差大于0C.丙地總體均值為2,總體方差為3 D.丁地中位數為3,眾數為3【答案】C【詳解】∵平均數和中位數不能限制某一天的病例超過7人,A不正確;當總體方差大于0,不知道總體方差的具體數值,因此不能確定數據的波動大小,B不正確;當總體平均數是2,假設有一個數據超過7,則方差就超過3,不成立,故C正確.中位數和眾數也不能限制某一天的病例超過7人,D不正確;故選:C.6.(全國高三月考(文))某大學共有名學生,為了了解學生課外圖書閱讀量情況,該校隨機地從全校學生中抽取名,統計他們每年閱讀的書籍數量,由此來估計全體學生當年的閱讀書籍數量的情況,下列估計中正確的是( )(注:同一組數據用該組區間的中點值作為代表)A.眾數為 B.平均數為C.中位數為 D.該校讀書不低于本的人數約為人【答案】B【詳解】A:由圖知:眾數在,故眾數為,錯誤;B:平均數為,正確;C:由圖知:中位數在,所以,解得,錯誤;D:由圖知:該校讀書不低于本的頻率之和為,所以該校讀書不低于本的人數約為人.故選:.7.(甘肅張掖市第二中學高三月考(理))聯合國《生物多樣性公約》第十五次締約方大會(COP15)將于2021年10月11日至15日和2022年上半年分兩階段在中國昆明舉行.為了讓廣大市民深入了解COP15,展現春城昆明的城市形象,2021年6月5日全國30個城市聯動舉行了“2021COP15春城之邀——一粒來自昆明的種子”活動,活動特別準備了2萬份“神秘”花種盲盒,其中有一種花種的花卉,其植株高度的一個隨機樣本的頻率分布直方圖如圖所示,根據這個樣本的頻率分布直方圖,下面結論中不正確的是( )A.這種花卉的植株高度超過的估計占25%B.這種花卉的植株高度低于的估計占5%C.這種花卉的植株高度的平均數估計超過D.這種花卉的植株高度的中位數估計不超過【答案】D【詳解】對于A,由頻率分布直方圖可知,這種花卉的植株高度超過的頻率為,所以這種花卉的植株高度超過的估計占25%,所以A正確,對于B,由頻率分布直方圖可知,這種花卉的植株高度低于的頻率為,所以這種花卉的植株高度低于的估計占5%,所以B正確,對于C,這種花卉的植株高度的平均數約為,所以C正確,對于D,因為,,所以中位數在40-50之間,設中位數為,則,解得,所以D錯誤,故選:D8.(邯山區新思路學本文化輔導學校高一月考)跳水比賽共有7名裁判分別給出某選手的原始評分,評定該選手的成績時,從7個原始評分中去掉1個最高分、1個最低分,得到5個有效評分.5個有效評分與7個原始評分相比,一定不會改變的數字特征是( )A.眾數 B.標準差 C.中位數 D.極差【答案】C【詳解】從7個原始評分去掉1個最高分、1個最低分,得到5個有效評分,其平均數、極差、方差都可能會發生改變,不變的數字特征數中位數.故選:C.9.(江蘇通州·高一期中)某機構調査了10種食品的卡路里含量,結果如下:107,135,138,140,146,175,179,182,191,195.則這組數據的第25百分位數和中位數分別是( )A.138,160.5 B.138,146 C.138,175 D.135,160.5【答案】A直接按照百分位數的定義求第25百分位數;按中位數的定義求中位數.【詳解】將10個數按從小到大排列:107,135,138,140,146,175,179,182,191,195,而,為第3項138;中位數為.故選:A10.(寧夏大學附屬中學高二月考(文))某次數學檢測中,某一題目的得分情況如下:得分(分) 0 1 2 3 4百分率(%) 37.0 8.6 6.0 28.2 20.2其中眾數是( )A.37.0% B.20.2% C.0分 D.4分【答案】C【詳解】解:眾數是指一組數據中出現次數最多的數據,根據所給表格的百分率最高的是“0”,可求出眾數是:0.故選:C.11.(四川雅安·高二期末(文))某中學有10個學生社團,每個社團的人數分別是70,60,60,50,60,40,40,30,30,10,則這組數據的平均數,眾數,中位數的和為( )A.165 B.160 C.150 D.170【答案】C【詳解】人數分別是10,30,30,40,40,50,60,60,60,70,則眾數為60,中位數為,平均數為,∴平均數,眾數,中位數的和為:60+45+45=150.故選:C.12.(福建省福州第一中學)福州地鐵二號線“福州大學站”的一個安保員,某日將負責的車箱從中午一點開始的十班下車的人數統計如下:3 6 7 3 10 4 6 7 6 8,則這組數據的眾數為( )A.3 B.6 C.7 D.8【答案】B【詳解】3 6 7 3 10 4 6 7 6 8按從小到大排列3 3 4 6 6 6 7 7 8 10所以眾數為6故選:B題型四:方差、標準差1.(全國高二課時練習)有甲、乙兩種水稻,測得每種水稻各10株的分蘗數據,計算出樣本均值,方差分別為,.由此可以估計( )A.甲種水稻比乙種水稻分蘗整齊B.乙種水稻比甲種水稻分蘗整齊C.甲、乙兩種水稻分蘗整齊程度相同D.甲、乙兩種水稻分蘗整齊程度不能比較【答案】B【詳解】解:已知樣本方差:,由此估計,乙種水稻的方差約為,甲種水稻的方差約為.因為所以乙種水稻比甲種水稻分蘗整齊故選:B.2.(玉林市第十一中學高二月考)對某商店一個月內每天的顧客人數進行了統計,得到樣本的莖葉圖(如圖所示),則該樣本的極差是( )A.56 B.53 C.55 D.51【答案】A【詳解】由題意,莖葉圖中數據最大值為68,最小值為12故極差故選:A3.(全國(文))在五場籃球比賽中,甲、乙兩名運動員得分的莖葉圖如圖所示.下列說法正確的是( )A.甲得分的中位數和極差都比乙大B.甲得分的中位數比乙小,但極差比乙大C.甲得分的中位數和極差都比乙小D.甲得分的中位數比乙大,但極差比乙小【答案】B【詳解】甲得分依次為、、、、,中位數是,極差為,乙得分依次為、、、、,中位數是,極差為,則甲得分的中位數比乙小,極差比乙大,故選:B.4.(咸陽百靈學校高一月考)甲 乙兩個樣本的方差分別為,,由此反映( )A.樣本甲的波動比樣本乙大 B.樣本乙的波動比樣本甲大C.樣本甲和樣本乙的波動一樣大 D.樣本甲和樣本乙的波動大小無法確定【答案】B【詳解】解:樣本方差的大小反應樣本的波動情況,樣本方差越大,則樣本波動越大,反之波動越小,所以此題樣本乙的波動比樣本甲的波動大.故選:B5.(山西懷仁·高二期末(文))有一組樣本數據,,,…,,由這組數據得到新樣本數據,其中,,,…,,為非零常數,則( )A.兩組樣本數據的樣本平均數相同 B.兩組樣本數據的樣本中位數數相同C.兩組樣本數據的樣本標準差相同 D.兩組樣本數據的樣本極差不同【答案】C【詳解】設樣本數據,,,…,的樣本平均數為,樣本中位數為,樣本標準差為,根據平均數和標準差的性質可知,樣本數據,,,…,的樣本平均數為,樣本標準差為,根據中位數的概念可知,樣本數據,,,…,的樣本中位數為,根據極差的概念可知兩組樣本數據的樣本極差相同.故選:C6.(長春市第二十九中學)如果,,,的方差是,則,,,的方差為( )A.9 B.3 C. D.6【答案】B【詳解】如果,,,的方差是,則,,,的方差為,故選:B.7.(廣東惠州·高一期末)已知有樣本數據2、4、5、6、8,則該樣本的方差為( )A.5 B.4 C.2 D.0【答案】B【詳解】解:平均數為.該樣本的方差為.故選:B.8.(浙江臺州·高一期末)若數據的方差為2,則的方差為( )A.1 B.2 C.4 D.8【答案】D【詳解】解:因為數據的方差為2,所以的方差為.故選:D.9.(云南昆明·高二期末(文))設一組樣本數據的方差為1,則數據的方差為( )A.36 B.7 C.6 D.1【答案】D【詳解】解:設的平均數為,即,則數據的平均數,所以數據的方差為,故選:D10.(湖南天心·長郡中學高二期末)已知數據 的方差為 4 , 若 , 則新數據 的方差為( )A.2 B.4 C.8 D.16【答案】D【詳解】解:由題意可得,因為,所以,所以新數據 的方差為,故選:D11.(全國高一期末)已知五個數據3,4,x,6,7的平均數是,則該樣本標準差為( )A.1 B. C. D.2【答案】B【詳解】解:因為五個數據3,4,x,6,7的平均數是x,所以,解得,所以標準差為,故選:B12.(山西)數據,,,的平均數為4,標準差為2,則數據,,,的方差和平均數分別為( )A.36,14 B.14,36 C.12,19 D.4,12【答案】A【詳解】數據,,…,的平均數為4,標準差為2,所以數據,,…,的方差為4,平均數為4.根據方差和平均數的性質可得,,…,的方差為,平均數為.故選:A.13.(廣州大學附屬中學高二開學考試)若數據,,…,的平均數為4,標準差為1,則,,…,的平均數和標準差分別為( )A.4,1 B.17,8 C.17,9 D.17,3【答案】D【詳解】解:∵,,…,的平均數為,方差為,標準差為,∴,,…,的平均數為,即為17.方差,∴標準差.故選:D.中小學教育資源及組卷應用平臺第41講 特征數及抽樣方法兩種抽樣方法(一)簡單隨機抽樣1.概念:一般地,從元素個數為N的總體中逐個不放回地抽取容量為的樣本,如果每一次抽取時總體中的各個個體有相同的可能性被抽到,這種抽樣方法叫做簡單隨機抽樣.2.最常用的簡單隨機抽樣的方法:抽簽法和隨機數法3.適用范圍是:總體中的個體性質相似,無明顯層次;總體容量較小,尤其是樣本容量較小.(二).分層抽樣1.概念:當總體由有明顯差別的幾部分組成時,為了使抽取的樣本更好地反映總體的情況,常采用分層抽樣,將總體中各個個體按某種特征分成若干個互不交叉的幾部分,每一部分叫做層,在各層中按層在總體中所占比例進行簡單隨機抽樣或系統抽樣,這種抽樣方法叫做分層抽樣.2.應用范圍是:總體由差異明顯的幾部分組成的情況;分層后,在每一層抽樣時可采用簡單隨機抽樣或系統抽樣.3.特征:等比例抽樣二.頻率分布直方圖(表)1.頻率分布直方圖基礎概念①縱軸表示,②頻率:數據落在各小組內的頻率用各長長方形的面積表示③各小長方形的面積總和等于1.④分布折線圖:連接頻率分布直方圖中各小長方形上端的中點,就得到頻率分布折線圖.隨著樣本容量的增加,作圖時所分的組數增加,組距減小,相應的頻率分布折線圖就會越來越接近于一條光滑的曲線,統計中稱之為總體密度曲線,它能夠更加精細的反映出總體的分布規律.2.頻率分布直方圖的步驟如下(ⅰ)求極差;(ⅱ)確定組距和組數;(ⅲ)將數據分組;(ⅳ)列頻率分布表;(ⅴ)畫頻率分布直方圖.頻率分布直方圖能很容易地表示大量數據,非常直觀地表明分布的形狀.三.莖葉圖1.概念:當數據有兩位有效數字時,用中間的數字表示十位數,即第一個有效數字,兩邊的數字表示個位數,即第二個有效數字,它的中間部分像植物的莖,兩邊部分像植物莖上長出來的葉子,因此通常把這樣的圖叫做莖葉圖.當數據有三位有效數字,前兩位相對比較集中時,常以前兩位為莖,第三位(個位)為葉(其余類推).2.兩個突出的優點:其一是統計圖上沒有原始數據的損失,所有信息都可以從這個莖葉圖中得到,其二是在比賽時隨時記錄,方便記錄與表示.四.樣本的數字特征特征數 具體數字算法 頻率分布直方圖(表)眾數 次數出現最多的數字 頻率最大或最高組的中間值中位數 樣本數據中,將數據按大小排列,位于最中間的數據.如果數據的個數為偶數,就取當中兩個數據的平均數作為中位數 頻率等于0.5時的橫坐標平均數 所有數字之和除以總個數 每個小矩形面積乘以小矩形底邊中點的橫坐標之和方差平均數反映了數據取值的平均水平,標準差、方差描述了一組數據波動的大小.標準差、方差越大,數據的離散程度越大,越不穩定;標準差、方差越小,數據的離散程度越小,越穩定【題型一:三種抽樣法】1.(石嘴山市第三中學高二月考)下列說法正確的個數是( ).②總體的個體數不多時宜用簡單隨機抽樣法;②在對總體均分后的每一部分進行抽樣時,采用的是簡單隨機抽樣;③西貨商場的抽獎活動是抽簽法;④整個抽樣過程中,每個個體被抽取的機率相等(有剔除時例外).A.1 B.2 C.3 D.42.(全國高一課時練習)關于簡單隨機抽樣,下列說法中正確的是( )①它要求被抽取樣本的總體的個數有限;②它是從總體中逐個地進行抽取;③它是一種不放回抽樣;④它是一種等可能性抽樣.A.①②③④ B.③④ C.①②③ D.①③④3.(廣州大學附屬中學高二月考)某工廠利用隨機數表對生產的50個零件進行抽樣測試,先將50個零件進行編號,編號分別為01,02,…,50,從中抽取5個樣本,下面提供隨機數表的第1行到第2行:若從表中第1行第9列開始向右依次讀取數據,則得到的第4個樣本編號是( )A.10 B.05 C.09 D.204.(全國高三專題練習(文))采用系統抽樣方法從960人中抽取32人做問卷調查,為此將他們隨機編號1,2,……,960,分組后在第一組采用簡單隨機抽樣的方法抽到的號碼為29,則抽到的32人中,編號落入區間的人數為( )A.10 B.14 C.15 D.165.(河南商丘·高一月考)從個體編號為的總體中,用系統抽樣(等距)的方法抽取個個體,若抽取的第一個個體的編號為則抽取的最后一個個體的編號為( )A. B. C. D.6.(內蒙古集寧二中)采用系統抽樣方法,從個體數為1001的總體中抽取一個容量為40的樣本,則在抽取過程中,被剔除的個體數與抽樣間隔分別為( )A.1,25 B.1,20 C.3,20 D.3,257.(廣西梧州·蒙山中學高一月考)某初級中學有學生270人,其中一年級108人,二、三年級各81人,現要抽取10人參加某項調査,考慮選用簡單隨機抽樣、分層抽樣和系統抽樣三種方案,使用簡單隨機抽樣和分層抽樣時,將學生按一、二、三年級依次統一編號為1,2,…,270;使用系統抽樣時,將學生統一隨機編號為1,2,...,270,并將整個編號依次分為10段.如果抽到的號碼有下列四種情況:①7,34,61,88,115,142,169,196,223,250;②5,9,100,107,111,121,180,195,200,265;③11,38,65,92,119,146,173,200,227,254;④30,57,84,111,138,165,192,219,246,270.關于上述樣本的下列結論中,正確的是( )A.②、③都不能為系統抽樣 B.②、④都不能為分層抽樣C.①、④都可能為系統抽樣 D.①、③都可能為分層抽樣8.(大同市平城中學校高一月考)我國古代數學名著《九章算術》有一抽樣問題:“今有某地北面若干人,西面有7488人,南面有6912人,這三面要征調300人,而北面共征調108人(用分層簡單抽樣的方法),則北面共有多少人( )A.8000 B.8100 C.8200 D.83009.(陜西省黃陵縣中學高一月考)某校高二年級有男生600人,女生500人,為了解該年級學生的體育達標情況,從男生中任意抽取30人,從女生中任意抽取25人進行調查.這種抽樣方法是( )A.系統抽樣法 B.抽簽法C.隨機數法 D.分層抽樣法10.(渭南市尚德中學高一月考)甲、乙兩套設備生產的同類型產品共4 800件,采用分層抽樣的方法從中抽取一個容量為80的樣本進行質量檢測.若樣本中有50件產品由甲設備生產,則乙設備生產的產品總數為( )件.A.1800 B.1600 C.1900 D.100011.(崇仁縣第二中學(文))某校選修乒乓球課程的學生中,高一年級有50名,高二年級有30名.現用分層抽樣的方法在這80名學生中抽取一個樣本,已知在高一年級的學生中抽取了10名,則在高二年級的學生中應抽取的人數為( )A.6 B.8 C.10 D.1212.(黑龍江讓胡路·大慶中學)從一個容量為(,)的總體中抽取一個容量為的樣本,當選取簡單隨機抽樣方法抽取樣本時,總體中每個個體被抽中的可能性是,則選取分層隨機抽樣方法抽取樣本時,總體中每個個體被抽中的可能性是( )A. B. C. D.13.(羅平縣第二中學)某奶制品工廠某天甲、乙、丙、丁四類奶制品的產量分別為2000盒、1250盒、1250盒、500盒.若按產量比例用分層隨機抽樣的方法抽取一個樣本容量為60的樣本,則樣本中甲類奶制品的數量為( )A.6盒 B.15盒 C.20盒 D.24盒【題型二:頻率分布直方圖】1.(廣西南寧·高三模擬預測(文))北京舞蹈學院為了解大一舞蹈專業新生的體重情況,對報到的1000名舞蹈專業生的數據(單位:)進行統計,得到如圖所示的體重頻率分布直方圖,則體重在以上的人數為( )A.100 B.150 C.200 D.2502.(天津市第四十七中學高三月考)天津中學為了調查該校學生對于新冠肺炎防控的了解情況,組織了一次新冠肺炎防控知識競賽,并從該學校1500名參賽學生中隨機抽取了100名學生,并統計了這100名學生成績情況(滿分100分,其中80分及以上為優秀),得到了樣本頻率分布直方圖(如圖),根據頻率分布直方圖推測,這1500名學生中競賽成績為優秀的學生人數大約為( )A.120 B.360 C.420 D.4803.(沙坪壩·重慶南開中學)某部門為了了解一批樹苗的生長情況,在棵樹苗中隨機抽取棵,統計這棵樹苗的高度,將所得個高度數據分為組:,,,,,,,并繪制了頻率分布直方圖(如圖),那么根據該圖可推測,在這棵樹苗中高度小于cm的樹苗棵數是( )A.360 B.600 C.840 D.13204.(江蘇南京·高二月考)為了解學生在課外活動方面的支出情況,抽取了個同學進行調查,結果顯示這些學生的支出金額(單位:元)都在內,其中支出金額在內的學生有234人,頻率分布直方圖如圖所示,則等于( )A.300 B.320 C.340 D.3605.(嘉峪關市第一中學高一期中)在高一(1)班組織的“我愛古詩詞”的調研考試中,全班40名學生的成績數據(均為整數且都在)統計為如下的頻率分布直方圖,則第四小組(成績分布在)的頻率為( )A.0.001 B.0.01 C.0.03 D.0.36.(北京牛欄山一中)某工廠對一批元件進行抽樣檢測.經檢測,抽出的元件的長度(單位:mm)全部介于93至105之間.將抽出的元件的長度以2為組距分成6組:[93,95),[95,97),[97,99),[99,101),[101,103),[103,105],得到如圖所示的頻率分布直方圖.若長度在[97,103)內的元件為合格品,根據頻率分布直方圖,估計這批元件的不合格率是( )A.80% B.11% C.20% D.14.5%7.(陜西韓城·高一期末)抽樣統計某校部分學生的物理測試成績,得到樣本頻率分布直方圖如圖所示,若滿分為100分,規定不低于60分為及格,則及格率是( )A. B.C. D.8.(河南商丘·)某校高三年級共有名學生選修地理,某次考試地理成績均在分之間,分數統計后繪成頻率分布直方圖,如圖所示,則成績在分的學生人數為( )A. B. C. D.9.(陜西銅川·高一期末)某班50名學生在一次百米測試中,成績全部不小于13秒且小于19秒,將測試結果按如下方式分成六組:第一組,成績大于等于13秒且小于14秒;第二組,成績大于等于14秒且小于15秒;…;第六組,成績大于等于18秒且小于19秒,如圖是按上述分組方法得到的頻率分布直方圖,設成績小于17秒的學生人數占全班總人數的百分比為,成績大于等于15秒且小于17秒的學生人數為,則從頻率分布直方圖中可分析出和的值分別是( )A.,35 B.,45C.,35 D.,4510.(全國高一專題練習)學校為了調查學生在課外讀物方面的支出情況,抽取了一個容量為的樣本,其頻率分布直方圖如圖所示,其中支出在的同學有人,則的值為( )A. B. C. D.【題型三:平均數、眾數、中位數】1.(全國高一課時練習)下面表格記錄了甲、乙兩組各五名學生在一次英語聽力測試中的成績(單位:分).已知甲組數據的中位數為15,乙組數據的平均數為16.8,則的值分別為( )甲組 9 12 x 24 27乙組 9 15 18 y 24A.15,18 B.14,19 C.16,17 D.13,102.(全國)陽澄湖大閘蟹在國內外享譽盛名,某超市從批發商那里購得10000只大閘蟹,這批大閘蟹的平均重量是100克.現在某超市員工隨機抽取了一個樣本容量為100的樣本,檢測得這100只大閘蟹的平均重量為克,則以下說法正確的是( )A.大于100 B.等于100 C.小于100 D.以上都有可能3.(吉林長春外國語學校高二開學考試)甲組數據為:5,12,16,21,25,37,乙組數據為:1,6,14,18,38,39,則甲、乙的平均數、極差及中位數相同的是( )A.極差 B.平均數 C.中位數 D.都不相同4.(北京101中學高一期中)一組數據的平均數為,方差為,將這組數據的每個數都乘以得到一組新數據,則下列說法正確的是( )A.這組新數據的平均數為 B.這組新數據的平均數為C.這組新數據的方差為 D.這組新數據的標準差為5.(山西省長治市第二中學校高一月考)在發生某公共衛生事件期間,我國有關機構規定:該事件在一段時間沒有發生規模群體感染的標志為“連續10天每天新增加疑似病例不超過7人”.根據過去10天甲、乙、丙、丁四地新增疑似病例數據,一定符合該標志的是( )A.甲地總體均值為3,中位數為4 B.乙地總體均值為2,總體方差大于0C.丙地總體均值為2,總體方差為3 D.丁地中位數為3,眾數為36.(全國高三月考(文))某大學共有名學生,為了了解學生課外圖書閱讀量情況,該校隨機地從全校學生中抽取名,統計他們每年閱讀的書籍數量,由此來估計全體學生當年的閱讀書籍數量的情況,下列估計中正確的是( )(注:同一組數據用該組區間的中點值作為代表)A.眾數為 B.平均數為C.中位數為 D.該校讀書不低于本的人數約為人7.(甘肅張掖市第二中學高三月考(理))聯合國《生物多樣性公約》第十五次締約方大會(COP15)將于2021年10月11日至15日和2022年上半年分兩階段在中國昆明舉行.為了讓廣大市民深入了解COP15,展現春城昆明的城市形象,2021年6月5日全國30個城市聯動舉行了“2021COP15春城之邀——一粒來自昆明的種子”活動,活動特別準備了2萬份“神秘”花種盲盒,其中有一種花種的花卉,其植株高度的一個隨機樣本的頻率分布直方圖如圖所示,根據這個樣本的頻率分布直方圖,下面結論中不正確的是( )A.這種花卉的植株高度超過的估計占25%B.這種花卉的植株高度低于的估計占5%C.這種花卉的植株高度的平均數估計超過D.這種花卉的植株高度的中位數估計不超過8.(邯山區新思路學本文化輔導學校高一月考)跳水比賽共有7名裁判分別給出某選手的原始評分,評定該選手的成績時,從7個原始評分中去掉1個最高分、1個最低分,得到5個有效評分.5個有效評分與7個原始評分相比,一定不會改變的數字特征是( )A.眾數 B.標準差 C.中位數 D.極差9.(江蘇通州·高一期中)某機構調査了10種食品的卡路里含量,結果如下:107,135,138,140,146,175,179,182,191,195.則這組數據的第25百分位數和中位數分別是( )A.138,160.5 B.138,146 C.138,175 D.135,160.510.(寧夏大學附屬中學高二月考(文))某次數學檢測中,某一題目的得分情況如下:得分(分) 0 1 2 3 4百分率(%) 37.0 8.6 6.0 28.2 20.2其中眾數是( )A.37.0% B.20.2% C.0分 D.4分11.(四川雅安·高二期末(文))某中學有10個學生社團,每個社團的人數分別是70,60,60,50,60,40,40,30,30,10,則這組數據的平均數,眾數,中位數的和為( )A.165 B.160 C.150 D.17012.(福建省福州第一中學)福州地鐵二號線“福州大學站”的一個安保員,某日將負責的車箱從中午一點開始的十班下車的人數統計如下:3 6 7 3 10 4 6 7 6 8,則這組數據的眾數為( )A.3 B.6 C.7 D.8【題型四:方差、標準差】1.(全國高二課時練習)有甲、乙兩種水稻,測得每種水稻各10株的分蘗數據,計算出樣本均值,方差分別為,.由此可以估計( )A.甲種水稻比乙種水稻分蘗整齊B.乙種水稻比甲種水稻分蘗整齊C.甲、乙兩種水稻分蘗整齊程度相同D.甲、乙兩種水稻分蘗整齊程度不能比較2.(玉林市第十一中學高二月考)對某商店一個月內每天的顧客人數進行了統計,得到樣本的莖葉圖(如圖所示),則該樣本的極差是( )A.56 B.53 C.55 D.513.(全國(文))在五場籃球比賽中,甲、乙兩名運動員得分的莖葉圖如圖所示.下列說法正確的是( )A.甲得分的中位數和極差都比乙大B.甲得分的中位數比乙小,但極差比乙大C.甲得分的中位數和極差都比乙小D.甲得分的中位數比乙大,但極差比乙小4.(咸陽百靈學校高一月考)甲 乙兩個樣本的方差分別為,,由此反映( )A.樣本甲的波動比樣本乙大 B.樣本乙的波動比樣本甲大C.樣本甲和樣本乙的波動一樣大 D.樣本甲和樣本乙的波動大小無法確定5.(山西懷仁·高二期末(文))有一組樣本數據,,,…,,由這組數據得到新樣本數據,其中,,,…,,為非零常數,則( )A.兩組樣本數據的樣本平均數相同 B.兩組樣本數據的樣本中位數數相同C.兩組樣本數據的樣本標準差相同 D.兩組樣本數據的樣本極差不同6.(長春市第二十九中學)如果,,,的方差是,則,,,的方差為( )A.9 B.3 C. D.67.(廣東惠州·高一期末)已知有樣本數據2、4、5、6、8,則該樣本的方差為( )A.5 B.4 C.2 D.08.(浙江臺州·高一期末)若數據的方差為2,則的方差為( )A.1 B.2 C.4 D.89.(云南昆明·高二期末(文))設一組樣本數據的方差為1,則數據的方差為( )A.36 B.7 C.6 D.110.(湖南天心·長郡中學高二期末)已知數據 的方差為 4 , 若 , 則新數據 的方差為( )A.2 B.4 C.8 D.1611.(全國高一期末)已知五個數據3,4,x,6,7的平均數是,則該樣本標準差為( )A.1 B. C. D.212.(山西)數據,,,的平均數為4,標準差為2,則數據,,,的方差和平均數分別為( )A.36,14 B.14,36 C.12,19 D.4,1213.(廣州大學附屬中學高二開學考試)若數據,,…,的平均數為4,標準差為1,則,,…,的平均數和標準差分別為( )A.4,1 B.17,8 C.17,9 D.17,3 展開更多...... 收起↑ 資源列表 第41講 特征數及抽樣方法(原卷版).docx 第41講 特征數及抽樣方法(解析版).docx 縮略圖、資源來源于二一教育資源庫