資源簡介 9.1 隨機抽樣一、全面調查和抽樣調查調查方式 全面調查 抽樣調查定義 對每一個調查對象都進行調查的方法,稱為全面調查,又稱普查 根據一定目的,從總體中抽取一部分個體進行調查,并以此為依據對總體的情況作出估計和推斷的調查方法相關概念 總體:在一個調查中,把調查對象的全體稱為總體 個體:組成總體的每一個調查對象稱為個體 樣本:把從總體中抽取的那部分個體稱為樣本, 樣本量:樣本中包含的個體數稱為樣本量注意點:(1)全面調查的優點是精確,缺點是不宜操作,需要耗費巨大的人力、物力.(2)抽樣調查的優點是花費少,效率高,易操作,缺點是不夠精確.一般地,如果調查的對象比較少,容易調查,適合普查,如果調查的對象較多或者具有破壞性,適合于抽樣調查.二、簡單隨機抽樣1. 放回簡單隨機抽樣、不放回簡單隨機抽樣一般地,設一個總體含有N(N為正整數)個個體,從中逐個抽取n(1≤n<N)個個體作為樣本,如果抽取是放回的,且每次抽取時總體內的各個個體被抽到的概率都相等,把這樣的抽樣方法叫做放回簡單隨機抽樣;如果抽取是不放回的,且每次抽取時總體內未進入樣本的各個個體被抽到的概率都相等,把這樣的抽樣方法叫做不放回簡單隨機抽樣。2. 簡單隨機抽樣:放回簡單隨機抽樣和不放回簡單隨機抽樣統稱為簡單隨機抽樣.通過簡單隨機抽樣獲得的樣本稱為簡單隨機樣本三、簡單隨機抽樣的方法1.抽簽法具體的操作步驟:(1)確定總體容量N并編號;(2)制簽并放入不透明容器中;(3)充分攪拌均勻;(4)不放回地逐個抽取n次,得到容量為n的樣本.2.隨機數法:把總體的N個個體依次編號,例如按0,1,2,…,N-1編號,然后利用隨機數工具產生0~N-1 范圍內的整數隨機數,產生的隨機數是幾就是選幾號個體,直到抽足樣本所需的數量.注意點:(1)當總體個數較少時采用抽簽法;(2)產生隨機數的方式有多種:①用隨機試驗生成隨機數;②用信息技術生成隨機數:(ⅰ)用計算器生成隨機數,(ⅱ)用電子表格軟件生成隨機數,(ⅲ)用R統計軟件生成隨機數.(3)如果生成的隨機數有重復,可以剔除重復的編號并重新產生隨機數,直到產生的不同編號個數等于樣本所需要的數量.反思感悟 (1)一個抽樣試驗能否用抽簽法,關鍵看兩點:一是制簽是否方便;二是個體之間差異不明顯.一般地,當樣本容量和總體容量較小時,可用抽簽法.(2)當總體容量較大、樣本容量不大時,用隨機數法抽取樣本較好.四、用樣本的平均數估計總體的平均數一般地,總體中有N個個體,它們的變量值分別為Y1,Y2,…,YN,則稱==i為總體均值,又稱總體平均數.如果從總體中抽取一個容量為n的樣本,它們的變量值分別為y1,y2,…,yn,則稱==i為樣本均值,又稱樣本平均數.我們常用樣本平均數去估計總體平均數.樣本均值與總體均值的關系(1)在簡單隨機抽樣中,我們常用樣本均值去估計總體均值;(2)總體均值是一個確定的數,樣本均值具有隨機性;(3)一般情況下,樣本容量越大,估計值越準確.五、分層隨機抽樣的定義分層隨機抽樣:一般地,按一個或多個變量把總體劃分成若干個子總體,每個個體屬于且僅屬于一個子總體,在每個子總體中獨立地進行簡單隨機抽樣,再把所有子總體中抽取的樣本合在一起作為總樣本,這樣的抽樣方法稱為分層隨機抽樣,每一個子總體稱為層.在分層隨機抽樣中,如果每層樣本量都與層的大小成比例,那么稱這種樣本量的分配方式為比例分配.反思感悟 使用分層隨機抽樣的前提分層隨機抽樣的使用前提條件是總體可以分層、層與層之間有明顯區別,而層內個體間差異較小.六、分層隨機抽樣的應用在分層隨機抽樣的過程中,為了保證每個個體被抽到的可能性是相同的,這就要求各層所抽取的個體數與該層所包含的個體數之比等于樣本容量與總體容量之比.七、用分層隨機抽樣樣本的平均數估計總體的平均數如果總體分為2層,兩層包含的個體數分別為M,N,兩層抽取的樣本量分別為m,n,兩層的樣本平均數分別為,,兩層的總體平均數分別為,,總體平均數為,樣本平均數為,則=+,=+.求總體平均數的方法有(1)+;(2)+;(3)+.八、獲取數據的基本途徑獲取數據的基本途徑獲取數據的基本途徑 適用類型 注意問題通過調查獲取數據 對于有限總體問題,一般通過抽樣調查或普查的方法獲取數據 要充分有效地利用背景信息選擇或創建更好的抽樣方法,并有效避免抽樣過程中的人為錯誤通過試驗獲取數據 沒有現存的數據可以查詢 嚴格控制試驗環境,通過精心的設計安排試驗,以提高數據質量通過觀察獲取數據 自然現象 借助專業測量設備通過長久的持續觀察獲取數據通過查詢獲得數據 眾多專家研究過,其收集的數據有所存儲 必須根據問題背景知識“清洗”數據,去偽存真選擇獲取數據的途徑的依據選擇獲取數據的途徑主要是根據所要研究問題的類型,以及獲取數據的難易程度.有的數據可以有多種獲取途徑,有的數據只能通過一種途徑獲取,選擇合適的方法和途徑能夠更好地提高數據的可靠性.九、獲取數據途徑的方法的設計考點一 抽查方法【例1】(2020·安徽高一月考)某市場監管局對所管轄的某超市在售的40種冷凍飲品中抽取了20種冷凍飲品,對其質量進行了抽檢,則( )A.該市場監管局的調查方法是普查 B.樣本的個體是每種冷凍飲品的質量C.樣本的總體是超市在售的40種冷凍飲品 D.樣本容量是該超市的20種冷凍飲品數【答案】B【解析】該市場監管局的調查方法是隨機抽樣,樣本的總體是超市在售的40種冷凍飲品的質量,樣本的個體是每種冷凍飲品的質量,樣本容量是20.故選:B【練1】(2021·陜西商洛市)某校去年有1100名同學參加高考,從中隨機抽取50名同學的總成績進行分析,在這個調查中,下列敘述錯誤的是( )A.總體是:1100名同學的總成績 B.個體是:每一名同學C.樣本是:50名同學的總成績 D.樣本容量是:50【答案】B【解析】據題意:總體是1100名同學的總成績,故A正確個體是每名同學的總成績,故B錯樣本是50名同學的總成績,故C正確樣本容量是:50,故D正確故選:B考點二 簡單隨機抽樣【例2】(2020·江西吉安市·高一期末)在簡單隨機抽樣中,某一個個體被抽中的可能性是( )A.與第幾次抽樣無關,每次抽中的可能性都相等B.與第幾次抽樣無關,每次都是等可能的抽取,但各次抽取的可能性不一樣C.第1次抽中的可能性要大于第2次,第2次抽中的可能性要大于第3次,…,以此類推D.第1次抽中的可能性要小于第2次,第2次抽中的可能性要小于第3次,…,以此類推【答案】A【解析】不論先后,被抽取的概率都是,故選:A.【練2】(2020·天津市新華中學)下列問題中,最適合用簡單隨機抽樣方法抽樣的是( )A.某縣從該縣中、小學生中抽取200人調查他們的視力情況B.從15種疫苗中抽取5種檢測是否合格C.某大學共有學生5600人,其中專科生有1300人、本科生3000人、研究生1300人,現抽取樣本量為280的樣本調查學生利用因特網查找學習資料的情況,D.某學校興趣小組為了了解移動支付在大眾中的熟知度,要對歲的人群進行隨機抽樣調查【答案】B【解析】A. 中學,小學生有群體差異,宜采用分層抽樣;B. 樣本數量較少,宜采用簡單隨機抽樣;C. 中專科生、本科生、研究生有群體差異,宜采用分層抽樣;D. 年齡對于移動支付的了解有較大影響,宜采用分層抽樣;故選:.考點三 分層抽樣【例3】(2021·北京房山區·高一期末)某單位共有職工名,其中高級職稱人,中級職稱人,初級職稱人.現采用分層抽樣方法從中抽取一個容量為的樣本,則從高級職稱中抽取的人數為( )A.6 B.9 C.18 D.36【答案】C【解析】依題意得:高級職稱人數、中級職稱人數、初級職稱人數的比為,高級職稱人數的抽樣比,采用分層抽樣方法從中抽取一個容量為的樣本,則從高級職稱中抽取的人數為人.故選:C.【練3】(2021·北京高一期末)某校高一年級有180名男生,150名女生,學校想了解高一學生對文史類課程的看法,用分層抽樣的方式,從高一年級學生中抽取若干人進行訪談.已知在女生中抽取了30人,則在男生中抽取了( )A.18人 B.36人 C.45人 D.60人【答案】B【解析】女生一共有150名女生抽取了30人,故抽樣比為:,抽取的男生人數為:.故選:B.考點四 獲取數據的途徑【例4】(2020·全國高一課時練習)獲取數據的方法有______、_______.【答案】直接獲取 間接獲取【解析】獲取數據的方法有直接獲取與間接獲取,故答案為:直接獲取;間接獲取.【練4】(2020·全國高一課時練習)為了了解某年級同學每天參加體育鍛煉的時間,比較恰當地收集數據的方法是( )A.查閱資料 B.問卷調查 C.做試驗 D.以上均不對【答案】B【解析】問卷調查能達到目的,比較適合.故選:B課后練習(2021高一下·駐馬店期末)從某小區隨機抽取100戶居民進行月用電量調查,發現其月用電量都在50到350度之間,制作的頻率分布直方圖如圖所示,若由該直方圖得到該小區居民戶用電量的眾數,中位數和平均數(同一組中的數據用該組區間的中點值為代表)分別記為 , , ,則( )A.B.C.D.【答案】 D【考點】頻率分布直方圖,眾數、中位數、平均數【解析】設用電量在200到250度之間之間的頻數為 .則有由頻率分布直方圖可知:估計該小區居民戶用電量的眾數大約為: ,解得: ,估計該小區居民戶用電量的中位數值大約為:183.估計該小區居民戶用電量的平均值大約為:,所以 .故答案為:D.【分析】 根據頻率分布直方圖可分別求出a, b, c即可進行比較.(2021高一下·大慶期末)從某班50名同學中選出5人參加戶外活動,利用隨機數表法抽取樣本時,先將50名同學按01,02,……,50進行編號,然后從隨機數表的第1行第5列和第6列數字開始從左往右依次選取兩個數字,則選出的第5個個體的編號為(注:表為隨機數表的第1行與第2行)A.24 B.36、 C.46 D.47【答案】 A【考點】簡單隨機抽樣【解析】【解答】解:由隨機數表易知抽樣編號依次為43,36,47,36前面出現過去掉,46,24,第5個是24.故答案為:A.【分析】根據隨機數表法求解即可.(2021高一下·臨渭期末)某中學高三年級有學生1200人,高二年級有學生900人,高一年級有學生1500人,現以年級為標準,用分層抽樣的方法從這三個年級中抽取一個容量為108的樣本進行某項研究,則應從高三年級學生中抽取的學生人數為( )A.18 B.36 C.72 D.144【答案】 B【考點】分層抽樣方法【解析】抽樣比為 ,所以高三年級應該抽取: 人.故答案為:B.【分析】 根據分層抽樣的定義建立比例關系即可得到結論.(2021高一下·寧波期末)某小區有500人自愿接種新冠疫苗,其中49~59歲的有140人,18~20歲的有40人,其余為符合接種條件的其他年齡段的居民.在一項接種疫苗的追蹤調查中,要用分層抽樣的方法從該小區500名接種疫苗的人群中抽取50人,則從符合接種條件的其他年齡段的居民中抽取的人數是( )A.14 B.18 C.32 D.50【答案】 C【考點】分層抽樣方法【解析】解:依題意從其余符合接種條件的其它年齡段的居民中抽取的人數為: .故答案為:C.【分析】 利用分層抽樣的性質直接求解即可.(2021高一下·天津期末)某校選修輪滑課程的學生中,一年級有20人,二年級有30人,三年級有20人.現用分層抽樣的方法在這70名學生中抽取一個樣本,已知在一年級的學生中抽取了4人,則這個樣本中共有 人.【答案】 14【考點】分層抽樣方法【解析】設這個樣本中共有 個人,則 ,解得 。故答案為:14。【分析】利用已知條件結合分層抽樣的方法,從而求出這個樣本中共有的人數。(2021高一下·信陽期末)一組數據 , ,…, ,的平均數為7,則數據 , ,…, 的平均數為 .【答案】 17【考點】眾數、中位數、平均數【解析】由題意,一組數據 , ,…, ,的平均數為7,即 ,則數據 , ,…, 的平均數為 .故答案為:17.【分析】利用平均數的性質直接求解。(2021高一下·南開期末)某高校有甲、乙兩個數學建模興趣班.其中甲班有40人,乙班50人.現分析兩個班的一次考試成績,算得甲班的平均成績是90分,乙班的平均成績是81分,則該校數學建模興趣班的平均成績是 分.【答案】 85【考點】眾數、中位數、平均數【解析】甲班有40人,乙班50人.現分析兩個班的一次考試成績,算得甲班的平均成績是90分,乙班的平均成績是81分,該校數學建模興趣班的平均成績是 =85分。【分析】利用已知條件結合平均數公式,從而求出該校數學建模興趣班的平均成績。(2021·普陀模擬)在某次數學測驗中,6位學生的成績如下:78,85,a,82,69,80,他們得平均成績為80,他們成績的中位數為 .【答案】 81【考點】眾數、中位數、平均數【解析】解:因為6位學生的成績如下:78,85,a,82,69,80,他們得平均成績為80,所以78+85+a+82+69+80=6×80,解得a=86,則將6位學生的成績從小到大排列為:69,78,80,82,85,86,所以他們成績的中位數為 。故答案為:81。【分析】利用已知條件結合平均數公式,從而求出a的值,再利用中位數的公式,從而求出6位學生成績的中位數。(2021高三下·陳倉模擬)中國在歐洲的某孔子學院為了讓更多的人了解中國傳統文化,在當地舉辦了一場由當地人參加的中國傳統文化知識大賽,為了了解參加本次大賽參賽人員的成績情況,從參賽的人員中隨機抽取 名人員的成績(滿分100分)作為樣本,將所得數據進行分析整理后畫出頻率分布直方圖如圖所示,已知抽取的人員中成績在[50,60)內的頻數為3.(1)求 的值和估計參賽人員的平均成績(保留小數點后兩位有效數字);(2)已知抽取的 名參賽人員中,成績在[80,90)和[90,100]女士人數都為2人,現從成績在[80,90)和[90,100]的抽取的人員中各隨機抽取2人,記這4人中女士的人數為 ,求 的分布列與數學期望.【答案】 (1)解:由頻率分布直方圖知,成績在 頻率為,成績在[50,60)內頻數為3, 抽取的樣本容量 ,參賽人員平均成績為(2)解:由頻率分布直方圖知,抽取的人員中成績在[80,90)的人數為0.0125×10×40=5,成績在[90,100]的人數為0.0100×10×40=4,的可能取值為0,1,2,3,4,; ,, ,.的分布列為0 1 2 3 4.【考點】眾數、中位數、平均數,離散型隨機變量及其分布列,離散型隨機變量的期望與方差【解析】 (1) 由已知條件的頻率直方圖中的數據以及性質即可得出 成績在 頻率 ,結合樣本容量的定義即可計算出m的值,結合平均值公式代入數值計算出結果即可。(2)根據題意求出X的取值,再由概率公式計算出對應每個X的概率值,由此即可得出 的分布列 并把數值代入到期望值公式計算出結果即可。(2021高一下·桂林期末)長時間使用手機上網,會嚴重影響學生的身體健康.某校為了解A,B兩班學生手機上網的時長,分別從這兩個班中隨機抽取5名同學進行調查,將他們平均每周手機上網的時長(小時)作為樣本,繪制成莖葉圖如圖所示(圖中的莖表示十位數字,葉表示個位數字).(1)分別求出圖中所給兩組樣本數據的平均值,并據此估計,哪個班的學生平均上網時間較長;(2)從A班的樣本數據中隨機抽取一個小于21的數據記為 ,從B班的樣本數據中隨機抽取一個小于21的數據記為 ,求 的概率.【答案】 (1)A班樣本數據的平均值為 ,B班樣本數據的平均值為 ,據此估計B班學生平均每周上網時間較長.(2)依題意,從A班的樣本數據中隨機抽取一個小于21的數據記為 ,從B班的樣本數據中隨機抽取一個小于21的數據記為 ,則共有8種,分別為 , , , , , , , .其中滿足條件“ ”的共有4種,分別為 , , ,設“ ”為事件 ,則 .所以 的概率為 .【考點】莖葉圖,眾數、中位數、平均數,古典概型及其概率計算公式【解析】(1)根據平均數的計算,結合莖葉圖求解即可;(2)根據古典概型,結合列舉法求解即可.(2021高二上·廈門開學考)為了解我市高三學生參加體育活動的情況,市直屬某校高三學生500人參加“體育基本素質技能”比賽活動,按某項比賽結果所在區間分組:第1組:[25,30),第2組:[30,35),第3組:[35,40),第4組:[40,45),第5組:[45,50],得到不完整的人數統計表如下:比賽結果所在區間 [25,30) [30,35) [35,40) [40,45) [45,50].人數 50 50 a 150 b其頻率分布直方圖為:(1)求人數統計表中的a和b的值;(2)根據頻率分布直方圖,估計該項比賽結果的中位數;(3)用分層抽樣的方法從第1,2,3組中共抽取6人,再從這6人中隨機抽取2人參加上一級比賽活動,求參加上一級比賽活動中至少有1人的比賽結果在第3組的概率.【答案】 (1)由頻率分布直方圖得,比賽結果在 內的頻率為: ,則 ,比賽結果在 內的頻率為: ,則 ,所以人數統計表中的a和b的值分別為200,50;(2)由頻率分布直方圖知,比賽結果在 內的頻率為0.2,比賽結果在 內的頻率為0.6,則中位數應在 內,所以估計該項比賽結果的中位數為: ;(3)因第1,2,3組的頻率分別為0.1,0.1,0.4,則利用分層抽樣在第1,2,3組中抽的人數比為 ,于是得抽取的6人中,第1組抽取1人,第2組抽取1人,第3組抽取4人,記第1組抽取的1位同學為A,第2組抽取的1位同學為B,第3組抽取的4位同學為 , , , ,則從6位同學中抽兩位同學有: , , , , , , , , ,, , , , , ,共有15種等可能結果,其中2人比賽結果都不在第3組的有: ,共1種可能,所以至少有1人比賽結果在第3組的概率為 .【考點】頻率分布直方圖,眾數、中位數、平均數,列舉法計算基本事件數及事件發生的概率【解析】 (1)根據題意由頻率分布圖中的數據代入公式計算出結果即可。 (2)根據頻率分布直方圖,能估計該項比賽結果的中位數.(3)第1,2,3組共有300人,利用分層抽樣在300名學生中抽取6名學生,第1組抽取的人數為1人,第2組抽取的人數為1人,第3組抽取的人數為4人,由此能求至少有1人比賽結果在第3組的概率.9.1 隨機抽樣一、全面調查和抽樣調查調查方式 全面調查 抽樣調查定義 對每一個調查對象都進行調查的方法,稱為全面調查,又稱普查 根據一定目的,從總體中抽取一部分個體進行調查,并以此為依據對總體的情況作出估計和推斷的調查方法相關概念 總體:在一個調查中,把調查對象的全體稱為總體 個體:組成總體的每一個調查對象稱為個體 樣本:把從總體中抽取的那部分個體稱為樣本, 樣本量:樣本中包含的個體數稱為樣本量注意點:(1)全面調查的優點是精確,缺點是不宜操作,需要耗費巨大的人力、物力.(2)抽樣調查的優點是花費少,效率高,易操作,缺點是不夠精確.一般地,如果調查的對象比較少,容易調查,適合普查,如果調查的對象較多或者具有破壞性,適合于抽樣調查.二、簡單隨機抽樣1. 放回簡單隨機抽樣、不放回簡單隨機抽樣一般地,設一個總體含有N(N為正整數)個個體,從中逐個抽取n(1≤n<N)個個體作為樣本,如果抽取是放回的,且每次抽取時總體內的各個個體被抽到的概率都相等,把這樣的抽樣方法叫做放回簡單隨機抽樣;如果抽取是不放回的,且每次抽取時總體內未進入樣本的各個個體被抽到的概率都相等,把這樣的抽樣方法叫做不放回簡單隨機抽樣。2. 簡單隨機抽樣:放回簡單隨機抽樣和不放回簡單隨機抽樣統稱為簡單隨機抽樣.通過簡單隨機抽樣獲得的樣本稱為簡單隨機樣本三、簡單隨機抽樣的方法1.抽簽法具體的操作步驟:(1)確定總體容量N并編號;(2)制簽并放入不透明容器中;(3)充分攪拌均勻;(4)不放回地逐個抽取n次,得到容量為n的樣本.2.隨機數法:把總體的N個個體依次編號,例如按0,1,2,…,N-1編號,然后利用隨機數工具產生0~N-1 范圍內的整數隨機數,產生的隨機數是幾就是選幾號個體,直到抽足樣本所需的數量.注意點:(1)當總體個數較少時采用抽簽法;(2)產生隨機數的方式有多種:①用隨機試驗生成隨機數;②用信息技術生成隨機數:(ⅰ)用計算器生成隨機數,(ⅱ)用電子表格軟件生成隨機數,(ⅲ)用R統計軟件生成隨機數.(3)如果生成的隨機數有重復,可以剔除重復的編號并重新產生隨機數,直到產生的不同編號個數等于樣本所需要的數量.反思感悟 (1)一個抽樣試驗能否用抽簽法,關鍵看兩點:一是制簽是否方便;二是個體之間差異不明顯.一般地,當樣本容量和總體容量較小時,可用抽簽法.(2)當總體容量較大、樣本容量不大時,用隨機數法抽取樣本較好.四、用樣本的平均數估計總體的平均數一般地,總體中有N個個體,它們的變量值分別為Y1,Y2,…,YN,則稱==i為總體均值,又稱總體平均數.如果從總體中抽取一個容量為n的樣本,它們的變量值分別為y1,y2,…,yn,則稱==i為樣本均值,又稱樣本平均數.我們常用樣本平均數去估計總體平均數.樣本均值與總體均值的關系(1)在簡單隨機抽樣中,我們常用樣本均值去估計總體均值;(2)總體均值是一個確定的數,樣本均值具有隨機性;(3)一般情況下,樣本容量越大,估計值越準確.五、分層隨機抽樣的定義分層隨機抽樣:一般地,按一個或多個變量把總體劃分成若干個子總體,每個個體屬于且僅屬于一個子總體,在每個子總體中獨立地進行簡單隨機抽樣,再把所有子總體中抽取的樣本合在一起作為總樣本,這樣的抽樣方法稱為分層隨機抽樣,每一個子總體稱為層.在分層隨機抽樣中,如果每層樣本量都與層的大小成比例,那么稱這種樣本量的分配方式為比例分配.反思感悟 使用分層隨機抽樣的前提分層隨機抽樣的使用前提條件是總體可以分層、層與層之間有明顯區別,而層內個體間差異較小.六、分層隨機抽樣的應用在分層隨機抽樣的過程中,為了保證每個個體被抽到的可能性是相同的,這就要求各層所抽取的個體數與該層所包含的個體數之比等于樣本容量與總體容量之比.七、用分層隨機抽樣樣本的平均數估計總體的平均數如果總體分為2層,兩層包含的個體數分別為M,N,兩層抽取的樣本量分別為m,n,兩層的樣本平均數分別為,,兩層的總體平均數分別為,,總體平均數為,樣本平均數為,則=+,=+.求總體平均數的方法有(1)+;(2)+;(3)+.八、獲取數據的基本途徑獲取數據的基本途徑獲取數據的基本途徑 適用類型 注意問題通過調查獲取數據 對于有限總體問題,一般通過抽樣調查或普查的方法獲取數據 要充分有效地利用背景信息選擇或創建更好的抽樣方法,并有效避免抽樣過程中的人為錯誤通過試驗獲取數據 沒有現存的數據可以查詢 嚴格控制試驗環境,通過精心的設計安排試驗,以提高數據質量通過觀察獲取數據 自然現象 借助專業測量設備通過長久的持續觀察獲取數據通過查詢獲得數據 眾多專家研究過,其收集的數據有所存儲 必須根據問題背景知識“清洗”數據,去偽存真選擇獲取數據的途徑的依據選擇獲取數據的途徑主要是根據所要研究問題的類型,以及獲取數據的難易程度.有的數據可以有多種獲取途徑,有的數據只能通過一種途徑獲取,選擇合適的方法和途徑能夠更好地提高數據的可靠性.九、獲取數據途徑的方法的設計考點一 抽查方法【例1】(2020·安徽高一月考)某市場監管局對所管轄的某超市在售的40種冷凍飲品中抽取了20種冷凍飲品,對其質量進行了抽檢,則( )A.該市場監管局的調查方法是普查 B.樣本的個體是每種冷凍飲品的質量C.樣本的總體是超市在售的40種冷凍飲品 D.樣本容量是該超市的20種冷凍飲品數【練1】(2021·陜西商洛市)某校去年有1100名同學參加高考,從中隨機抽取50名同學的總成績進行分析,在這個調查中,下列敘述錯誤的是( )A.總體是:1100名同學的總成績 B.個體是:每一名同學C.樣本是:50名同學的總成績 D.樣本容量是:50考點二 簡單隨機抽樣【例2】(2020·江西吉安市·高一期末)在簡單隨機抽樣中,某一個個體被抽中的可能性是( )A.與第幾次抽樣無關,每次抽中的可能性都相等B.與第幾次抽樣無關,每次都是等可能的抽取,但各次抽取的可能性不一樣C.第1次抽中的可能性要大于第2次,第2次抽中的可能性要大于第3次,…,以此類推D.第1次抽中的可能性要小于第2次,第2次抽中的可能性要小于第3次,…,以此類推【練2】(2020·天津市新華中學)下列問題中,最適合用簡單隨機抽樣方法抽樣的是( )A.某縣從該縣中、小學生中抽取200人調查他們的視力情況B.從15種疫苗中抽取5種檢測是否合格C.某大學共有學生5600人,其中專科生有1300人、本科生3000人、研究生1300人,現抽取樣本量為280的樣本調查學生利用因特網查找學習資料的情況,D.某學校興趣小組為了了解移動支付在大眾中的熟知度,要對歲的人群進行隨機抽樣調查考點三 分層抽樣【例3】(2021·北京房山區·高一期末)某單位共有職工名,其中高級職稱人,中級職稱人,初級職稱人.現采用分層抽樣方法從中抽取一個容量為的樣本,則從高級職稱中抽取的人數為( )A.6 B.9 C.18 D.36【練3】(2021·北京高一期末)某校高一年級有180名男生,150名女生,學校想了解高一學生對文史類課程的看法,用分層抽樣的方式,從高一年級學生中抽取若干人進行訪談.已知在女生中抽取了30人,則在男生中抽取了( )A.18人 B.36人 C.45人 D.60人考點四 獲取數據的途徑【例4】(2020·全國高一課時練習)獲取數據的方法有______、_______.【練4】(2020·全國高一課時練習)為了了解某年級同學每天參加體育鍛煉的時間,比較恰當地收集數據的方法是( )A.查閱資料 B.問卷調查 C.做試驗 D.以上均不對課后練習(2021高一下·駐馬店期末)從某小區隨機抽取100戶居民進行月用電量調查,發現其月用電量都在50到350度之間,制作的頻率分布直方圖如圖所示,若由該直方圖得到該小區居民戶用電量的眾數,中位數和平均數(同一組中的數據用該組區間的中點值為代表)分別記為 , , ,則( )A.B.C.D.(2021高一下·大慶期末)從某班50名同學中選出5人參加戶外活動,利用隨機數表法抽取樣本時,先將50名同學按01,02,……,50進行編號,然后從隨機數表的第1行第5列和第6列數字開始從左往右依次選取兩個數字,則選出的第5個個體的編號為(注:表為隨機數表的第1行與第2行)A.24 B.36、 C.46 D.47(2021高一下·臨渭期末)某中學高三年級有學生1200人,高二年級有學生900人,高一年級有學生1500人,現以年級為標準,用分層抽樣的方法從這三個年級中抽取一個容量為108的樣本進行某項研究,則應從高三年級學生中抽取的學生人數為( )A.18 B.36 C.72 D.144(2021高一下·寧波期末)某小區有500人自愿接種新冠疫苗,其中49~59歲的有140人,18~20歲的有40人,其余為符合接種條件的其他年齡段的居民.在一項接種疫苗的追蹤調查中,要用分層抽樣的方法從該小區500名接種疫苗的人群中抽取50人,則從符合接種條件的其他年齡段的居民中抽取的人數是( )A.14 B.18 C.32 D.50(2021高一下·天津期末)某校選修輪滑課程的學生中,一年級有20人,二年級有30人,三年級有20人.現用分層抽樣的方法在這70名學生中抽取一個樣本,已知在一年級的學生中抽取了4人,則這個樣本中共有 人.(2021高一下·信陽期末)一組數據 , ,…, ,的平均數為7,則數據 , ,…, 的平均數為 .(2021高一下·南開期末)某高校有甲、乙兩個數學建模興趣班.其中甲班有40人,乙班50人.現分析兩個班的一次考試成績,算得甲班的平均成績是90分,乙班的平均成績是81分,則該校數學建模興趣班的平均成績是 分.(2021·普陀模擬)在某次數學測驗中,6位學生的成績如下:78,85,a,82,69,80,他們得平均成績為80,他們成績的中位數為 .(2021高三下·陳倉模擬)中國在歐洲的某孔子學院為了讓更多的人了解中國傳統文化,在當地舉辦了一場由當地人參加的中國傳統文化知識大賽,為了了解參加本次大賽參賽人員的成績情況,從參賽的人員中隨機抽取 名人員的成績(滿分100分)作為樣本,將所得數據進行分析整理后畫出頻率分布直方圖如圖所示,已知抽取的人員中成績在[50,60)內的頻數為3.(1)求 的值和估計參賽人員的平均成績(保留小數點后兩位有效數字);(2)已知抽取的 名參賽人員中,成績在[80,90)和[90,100]女士人數都為2人,現從成績在[80,90)和[90,100]的抽取的人員中各隨機抽取2人,記這4人中女士的人數為 ,求 的分布列與數學期望.(2021高一下·桂林期末)長時間使用手機上網,會嚴重影響學生的身體健康.某校為了解A,B兩班學生手機上網的時長,分別從這兩個班中隨機抽取5名同學進行調查,將他們平均每周手機上網的時長(小時)作為樣本,繪制成莖葉圖如圖所示(圖中的莖表示十位數字,葉表示個位數字).(1)分別求出圖中所給兩組樣本數據的平均值,并據此估計,哪個班的學生平均上網時間較長;(2)從A班的樣本數據中隨機抽取一個小于21的數據記為 ,從B班的樣本數據中隨機抽取一個小于21的數據記為 ,求 的概率.(2021高二上·廈門開學考)為了解我市高三學生參加體育活動的情況,市直屬某校高三學生500人參加“體育基本素質技能”比賽活動,按某項比賽結果所在區間分組:第1組:[25,30),第2組:[30,35),第3組:[35,40),第4組:[40,45),第5組:[45,50],得到不完整的人數統計表如下:比賽結果所在區間 [25,30) [30,35) [35,40) [40,45) [45,50].人數 50 50 a 150 b其頻率分布直方圖為:(1)求人數統計表中的a和b的值;(2)根據頻率分布直方圖,估計該項比賽結果的中位數;(3)用分層抽樣的方法從第1,2,3組中共抽取6人,再從這6人中隨機抽取2人參加上一級比賽活動,求參加上一級比賽活動中至少有1人的比賽結果在第3組的概率.精講答案【例1】【答案】B【解析】該市場監管局的調查方法是隨機抽樣,樣本的總體是超市在售的40種冷凍飲品的質量,樣本的個體是每種冷凍飲品的質量,樣本容量是20.故選:B【練1】【答案】B【解析】據題意:總體是1100名同學的總成績,故A正確個體是每名同學的總成績,故B錯樣本是50名同學的總成績,故C正確樣本容量是:50,故D正確故選:B【例2】【答案】A【解析】不論先后,被抽取的概率都是,故選:A.【練2】【答案】B【解析】A. 中學,小學生有群體差異,宜采用分層抽樣;B. 樣本數量較少,宜采用簡單隨機抽樣;C. 中專科生、本科生、研究生有群體差異,宜采用分層抽樣;D. 年齡對于移動支付的了解有較大影響,宜采用分層抽樣;故選:.【例3】【答案】C【解析】依題意得:高級職稱人數、中級職稱人數、初級職稱人數的比為,高級職稱人數的抽樣比,采用分層抽樣方法從中抽取一個容量為的樣本,則從高級職稱中抽取的人數為人.故選:C.【練3】【答案】B【解析】女生一共有150名女生抽取了30人,故抽樣比為:,抽取的男生人數為:.故選:B.【例4】【答案】直接獲取 間接獲取【解析】獲取數據的方法有直接獲取與間接獲取,故答案為:直接獲取;間接獲取.【練4】【答案】B【解析】問卷調查能達到目的,比較適合.故選:B練習答案【答案】 D【考點】頻率分布直方圖,眾數、中位數、平均數【解析】設用電量在200到250度之間之間的頻數為 .則有由頻率分布直方圖可知:估計該小區居民戶用電量的眾數大約為: ,解得: ,估計該小區居民戶用電量的中位數值大約為:183.估計該小區居民戶用電量的平均值大約為:,所以 .故答案為:D.【分析】 根據頻率分布直方圖可分別求出a, b, c即可進行比較.【答案】 A【考點】簡單隨機抽樣【解析】【解答】解:由隨機數表易知抽樣編號依次為43,36,47,36前面出現過去掉,46,24,第5個是24.故答案為:A.【分析】根據隨機數表法求解即可.【答案】 B【考點】分層抽樣方法【解析】抽樣比為 ,所以高三年級應該抽取: 人.故答案為:B.【分析】 根據分層抽樣的定義建立比例關系即可得到結論.【答案】 C【考點】分層抽樣方法【解析】解:依題意從其余符合接種條件的其它年齡段的居民中抽取的人數為: .故答案為:C.【分析】 利用分層抽樣的性質直接求解即可.【答案】 14【考點】分層抽樣方法【解析】設這個樣本中共有 個人,則 ,解得 。故答案為:14。【分析】利用已知條件結合分層抽樣的方法,從而求出這個樣本中共有的人數。【答案】 17【考點】眾數、中位數、平均數【解析】由題意,一組數據 , ,…, ,的平均數為7,即 ,則數據 , ,…, 的平均數為 .故答案為:17.【分析】利用平均數的性質直接求解。【答案】 85【考點】眾數、中位數、平均數【解析】甲班有40人,乙班50人.現分析兩個班的一次考試成績,算得甲班的平均成績是90分,乙班的平均成績是81分,該校數學建模興趣班的平均成績是 =85分。【分析】利用已知條件結合平均數公式,從而求出該校數學建模興趣班的平均成績。【答案】 81【考點】眾數、中位數、平均數【解析】解:因為6位學生的成績如下:78,85,a,82,69,80,他們得平均成績為80,所以78+85+a+82+69+80=6×80,解得a=86,則將6位學生的成績從小到大排列為:69,78,80,82,85,86,所以他們成績的中位數為 。故答案為:81。【分析】利用已知條件結合平均數公式,從而求出a的值,再利用中位數的公式,從而求出6位學生成績的中位數。【答案】 (1)解:由頻率分布直方圖知,成績在 頻率為,成績在[50,60)內頻數為3, 抽取的樣本容量 ,參賽人員平均成績為(2)解:由頻率分布直方圖知,抽取的人員中成績在[80,90)的人數為0.0125×10×40=5,成績在[90,100]的人數為0.0100×10×40=4,的可能取值為0,1,2,3,4,; ,, ,.的分布列為0 1 2 3 4.【考點】眾數、中位數、平均數,離散型隨機變量及其分布列,離散型隨機變量的期望與方差【解析】 (1) 由已知條件的頻率直方圖中的數據以及性質即可得出 成績在 頻率 ,結合樣本容量的定義即可計算出m的值,結合平均值公式代入數值計算出結果即可。(2)根據題意求出X的取值,再由概率公式計算出對應每個X的概率值,由此即可得出 的分布列 并把數值代入到期望值公式計算出結果即可。【答案】 (1)A班樣本數據的平均值為 ,B班樣本數據的平均值為 ,據此估計B班學生平均每周上網時間較長.(2)依題意,從A班的樣本數據中隨機抽取一個小于21的數據記為 ,從B班的樣本數據中隨機抽取一個小于21的數據記為 ,則共有8種,分別為 , , , , , , , .其中滿足條件“ ”的共有4種,分別為 , , ,設“ ”為事件 ,則 .所以 的概率為 .【考點】莖葉圖,眾數、中位數、平均數,古典概型及其概率計算公式【解析】(1)根據平均數的計算,結合莖葉圖求解即可;(2)根據古典概型,結合列舉法求解即可.【答案】 (1)由頻率分布直方圖得,比賽結果在 內的頻率為: ,則 ,比賽結果在 內的頻率為: ,則 ,所以人數統計表中的a和b的值分別為200,50;(2)由頻率分布直方圖知,比賽結果在 內的頻率為0.2,比賽結果在 內的頻率為0.6,則中位數應在 內,所以估計該項比賽結果的中位數為: ;(3)因第1,2,3組的頻率分別為0.1,0.1,0.4,則利用分層抽樣在第1,2,3組中抽的人數比為 ,于是得抽取的6人中,第1組抽取1人,第2組抽取1人,第3組抽取4人,記第1組抽取的1位同學為A,第2組抽取的1位同學為B,第3組抽取的4位同學為 , , , ,則從6位同學中抽兩位同學有: , , , , , , , , ,, , , , , ,共有15種等可能結果,其中2人比賽結果都不在第3組的有: ,共1種可能,所以至少有1人比賽結果在第3組的概率為 .【考點】頻率分布直方圖,眾數、中位數、平均數,列舉法計算基本事件數及事件發生的概率【解析】 (1)根據題意由頻率分布圖中的數據代入公式計算出結果即可。 (2)根據頻率分布直方圖,能估計該項比賽結果的中位數.(3)第1,2,3組共有300人,利用分層抽樣在300名學生中抽取6名學生,第1組抽取的人數為1人,第2組抽取的人數為1人,第3組抽取的人數為4人,由此能求至少有1人比賽結果在第3組的概率. 展開更多...... 收起↑ 資源列表 人教A版(2019)高一數學必修第二冊 講義 9.1隨機抽樣(學生版).docx 人教A版(2019)高一數學必修第二冊 講義 9.1隨機抽樣(教師版).docx 縮略圖、資源來源于二一教育資源庫