資源簡介 9.2 用樣本估計總體一、頻率分布直方圖制作頻率分布直方圖的步驟(1)求極差;(2)決定組距與組數;(3)將數據分組;(4)列頻率分布表;(5)畫頻率分布直方圖.注意點:(1)組數太多或太少,都會影響我們了解數據的分布情況.組距與組數的確定沒有固定的標準,常常需要一個嘗試和選擇的過程.決定組距與組數:當樣本容量不超過100時,常分成5~12組,為了方便起見,一般取等長組距,并且組距應力求“取整”.(2)分點的確定:若數據為整數,則分點數據減去0.5;若數據是小數點后有一位數字的數,則分點數據減去0.05,以此類推.分組時,通常對組內數值所在的區間取左閉右開區間,最后一組取閉區間.二、頻率分布直方圖的應用(1)頻率分布直方圖的性質①因為小矩形的面積=組距×=頻率,所以各小矩形的面積表示相應各組的頻率.這樣,頻率分布直方圖就以面積的形式反映了數據落在各個小組內的頻率大?。?br/>②在頻率分布直方圖中,各小矩形的面積之和等于1.③=樣本容量.(2)頻率分布直方圖反映了樣本在各個范圍內取值的可能性,由抽樣的代表性利用樣本在某一范圍內的頻率,可近似地估計總體在這一范圍內的可能性.三、幾種不同的統計圖(1)不同的統計圖在表示數據上有不同的特點.如:扇形圖主要用于直觀描述各類數據占總數的比例,條形圖和直方圖主要用于直觀描述不同類別或分組數據的頻數和頻率,折線圖主要用于描述數據隨時間的變化趨勢.(2)不同的統計圖適用的數據類型也不同.例如,條形圖適用于描述離散型的數據,直方圖適用于描述連續型數據等.四、利用各種統計圖表對數據進行分析對于涉及扇形圖、條形圖的性質等問題,要充分考慮到圖形所提供的各類信息,從中提取信息進行計算.(1)條形圖是用一個單位長度表示一定的數量或頻率,根據數量的多少或頻率的大小畫成長短不同的矩形條,條形圖能清楚地表示出每個項目的具體數目或頻率.(2)扇形圖是用整個圓面積表示總數(100%),用圓內的扇形面積表示各個部分所占總數的百分數.(3)在畫折線圖時,要注意明確橫軸、縱軸的實際含義.五、百分位數的定義1.計算一組n個數據的第p百分位數的步驟:第1步,按從小到大排列原始數據.第2步,計算i=n×p%.第3步,若i不是整數,而大于i的比鄰整數為j,則第p百分位數為第j項數據;若i是整數,則第p百分位數為第i項與第(i+1)項數據的平均數.2.一般地,一組數據的第p百分位數是這樣一個值,它使得這組數據中至少有p%的數據小于或等于這個值,且至少有(100-p)%的數據大于或等于這個值.注意點:(1)中位數相當于是第50百分位數.除了中位數外,常用的分位數還有第25百分位數,第75百分位數.(2)第25,50,75百分位數,這三個分位數把一組由小到大排列后的數據分成四等份,因此稱為四分位數.(3)第25百分位數也稱為第一四分位數或下四分位數等,第75百分位數也稱為第三四分位數或上四分位數等.六、由樣本數據求百分位數計算一組n個數據的第p百分位數的一般步驟第1步:按照從小到大排列原始數據.第2步:計算i=n×p%.第3步:若i不是整數,大于i的比鄰整數為j,則第p百分位數為第j項數據;若i是整數,則第p百分位數為第i項和第(i+1)項數據的平均數.七、由頻數(頻率)分布表求百分位數由頻率分布直方圖求百分位數的方法(1)要注意頻率分布直方圖中小矩形的面積,就是數據落在該組的頻率.(2)一般采用方程的思想,設出第p百分位數,根據其意義列出方程并求解即可.八、眾數、中位數、平均數1.眾數:一組數據中出現次數最多的數.2.中位數:把一組數據按從小到大(或從大到小)的順序排列,處在中間位置的數(或中間兩個數的平均數)叫做這組數據的中位數.3.平均數:如果有n個數x1,x2,…,xn,那么=(x1+x2+…+xn)叫做這n個數的平均數.九、總體集中趨勢的估計眾數、中位數、平均數的意義(1)樣本的眾數、中位數和平均數常用來表示樣本數據的“中心值”,其中眾數和中位數容易計算,不受少數幾個極端值的影響,但只能表達樣本數據中的少量信息,平均數代表了數據更多的信息,但受樣本中每個數據的影響,越極端的數據對平均數的影響也越大.(2)當一組數據中有不少數據重復出現時,其眾數往往更能反映問題,當一組數據中個別數據較大時,可用中位數描述其集中趨勢.十、利用頻率分布直方圖估計總體的集中趨勢利用頻率分布直方圖求眾數、中位數以及平均數的方法(1)眾數即為出現次數最多的數,所以它的頻率最大,在最高的小矩形中.中位數即為從小到大中間的數(或中間兩數的平均數).平均數為每個小矩形底邊中點的橫坐標與小矩形面積乘積之和.(2)用頻率分布直方圖求得的眾數、中位數不一定是樣本中的具體數.十一、方差、標準差1.假設一組數據為x1,x2,…,xn,則這組數據的平均數=,方差為s2=(xi-)2,標準差s=.2.如果總體中所有個體的變量值分別為Y1,Y2,…,YN,總體平均數為,則稱S2=(Yi-)2為總體方差,S=為總體標準差.如果總體的N個變量值中,不同的值共有k(k≤N)個,不妨記為Y1,Y2,…,Yk,其中Yi出現的頻數為fi(i=1,2,…,k),則總體方差為S2=i(Yi-)2.十二、方差、標準差與統計圖表的綜合應用反思感悟 折線統計圖中數字特征的求解技巧根據折線統計圖研究樣本數據的數字特征與橫坐標和縱坐標的統計意義有關,但一般情況下,整體分布位置較高的平均數大,數據波動性小的方差?。?br/>十三、分層隨機抽樣的方差假設第一層有m個數,分別為x1,x2,…,xm,平均數為,方差為s2;第二層有n個數,分別為y1,y2,…,yn,平均數為,方差為t2.則=i,s2=(xi-)2,=i,t2=(yi-)2.若記樣本均值為,樣本方差為b2,則可以算出=(i+i)=,b2==.考點一 總體取值規律的估計【例1】(2021·全國高一課時練習)某市2020年4月1日~4月30日對空氣污染指數的監測數據如下(主要污染物為可吸入顆粒物):61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45,(1)完成頻率分布表;(2)作出頻率分布直方圖;(3)根據國家標準,污染指數在0~50之間時,空氣質量為優;在51~100之間時,空間質量為良;在101~150之間時,空間質量為輕微污染;在151~200之間時,空間質量為輕度污染.請你依據所給數據和上述標準,對該市的空氣質量給出一個簡短評價.【答案】(1)頻率分布表見解析;(2)頻率分布直方圖見解析;(3)該市空氣質量有待進一步改善.【解析】(1)頻率分布表分組 頻數 頻率 分組 頻數 頻率[41,51) 2 [81,91) 10[51,61) 1 [91,101) 5[61,71) 4 [101,111) 2[71,81) 6(2)頻率分布直方圖(3)答對下述兩條中的一條即可:①該市一個月中空氣污染指數有2天處于優的水平,占當月天數的;有26天處于良的水平,占當月天數的;處于優或良的天數共有28天,占當月天數的.說明該市空氣質量基本良好.②輕微污染有2天,占當月天數的.污染指數在80以上的接近輕微污染的天數有15天,加上處于輕微污染的天數,共有17天,占當月天數的,超過50%.說明該市空氣質量有待進一步改善.【練1】(2020·江蘇蘇州市·星海實驗中學高一期中)為了解學生課外閱讀的情況,隨機統計了名學生的課外閱讀時間,所得數據都在中,其頻率分布直方圖如圖所示.已知在中的頻數為100,則的值是( )A.500 B.1000 C.10000 D.25000【答案】B【解析】由圖可得在中的頻率為,所以,故選:B.考點二 總體百分數的估計【例2】(2020·天津和平區)已知一組數據為第百分位數是( )A. B. C. D.【答案】C【解析】因為有6位數,所以,所以第百分位數是第三個數6.故選:C【練2】(2020·全國高一課時練習)一組數據12,34,15,24,39,25,31,48,32,36,36,37,42,50的第25,75百分位數分別是______、________.【答案】25 39【解析】把數據從小到大排序為12,15,24,25,31,32,34,36,36,37,39,42,48,50共14個數,14×25%=3.5, 14×75%=10.5, 所以第25,75百分位數分別是第4,11項數據,即是25,39.故答案為:25,39.考點三 總體集中趨勢的估計【例3】(2021·湖北荊州市)因受新冠疫情的影響,某企業的產品銷售面臨困難.為了改變現狀,該企業欲借助電商和“網紅”直播帶貨擴大銷售.受網紅效應的影響,產品銷售取得了較好的效果.現將該企業一段時間內網上銷售的日銷售額統計整理后繪制成如下圖所示的頻率分布直方圖:請根據圖中所給數據,求:(1)實數a的值;(2)該企業網上銷售日銷售額的眾數和中位數;(3)該企業在統計時間段內網上銷售日銷售額的平均數.【答案】(1)0.012;(2)55萬元,57萬元;(3)57.4萬元.【解析】(1)由頻率分布直方圖知:,解得:;(2)用頻率分布直方圖中最高矩形所在區間的中點值作為眾數的近似值,得眾數為55萬元;因為第一個小矩形的面積為0.08,第二個小矩形的面積為0.12,第三個小矩形的面積為0.16,,設第四個小矩形中底邊的一部分長為x,則,解得,所以中位數為萬元;(3)依題意,日銷售額的平均值為:所以該企業在統計時間段內網上銷售日銷售額的平均數為57.4萬元.【練3】(2020·全國高一課時練習)名工人某天生產同一零件,生產的件數是、、、、、、、、、.設其平均數為,中位數為,眾數為,則有( )A. B. C. D.【答案】B【解析】將生產的件數由小到大排列為:、、、、、、、、、,,中位數為,眾數為.因此,.故選:B.考點四 總體離散程度的估計【例4】(2020·全國高一)已知數據的平均數為,方差為,則,,…,的平均數和方差分別為( )A.和 B.和C.和 D.和【答案】B【解析】因為數據的平均數為,方差為,所以,,…,的平均數和方差分別為和故選:B【練4】(2020·甘肅白銀市·高一期末)已知數據的中位數為,眾數為,平均數為,方差為,則下列說法中,錯誤的是( )A.數據的中位數為B.數據的眾數為C.數據的平均數為D.數據的方差為【答案】D【解析】若數據的中位數為,眾數為,平均數為,則由性質知數據的中位數,眾數,平均數均變為原來的2倍,故正確;則由方差的性質知數據的方差為4p,故D錯誤;故選D.課后練習(2021高二上·湖南月考)某校1000名學生參加數學競賽,隨機抽取了20名學生的考試成績(單位:分),成績的頻率分布直方圖如圖所示,則下列說法正確的是( )A. 頻率分布直方圖中 的值為0.004 B. 估計這20名學生數學考試成績的第60百分位數為80C. 估計這20名學生數學考試成績的眾數為80 D. 估計總體中成績落在 內的學生人數為160【答案】 B【考點】頻率分布直方圖,眾數、中位數、平均數【解析】由 可得 ,A不符合題意前三個矩形的面積和為 ,所以這20名學生數學考試成績的第60百分位數為80,B符合題意這20名學生數學考試成績的眾數為75,C不符合題意總體中成績落在 內的學生人數為 ,D不符合題意故答案為:B【分析】 對于A,由頻率分布直方圖的性質列方程能求出a;對于B,求出[50, 80)的頻率為0.6,由此能估計這20名學生數學考試成績的第60百分位數為80;對于C, [70, 80)對應的小矩形最高,由此能估計這20名學生數學考試成績的眾數;對于D,求出總體在[60, 70)的頻率,由此能估計總體中成績落在[60, 70)內的學生人數.(2017高二下·普寧開學考)在“世界讀書日”前夕,為了了解某地5000名居民某天的閱讀時間,從中抽取了200名居民的閱讀時間進行統計分析,在這個問題中,5000名居民的閱讀時間的全體是( )A. 總體 B. 個體 C. 樣本的容量 D. 從總體中抽取的一個樣本【答案】 A【考點】用樣本的頻率分布估計總體分布【解析】解:根據題意,結合總體、個體、樣本、樣本容量的定義可得,5000名居民的閱讀時間的全體是總體,故選:A.【分析】根據題意,結合總體、個體、樣本、樣本容量的定義可得結論.(2018高一下·西華期末)在中秋的促銷活動中,某商場對9月14日9時到14時的銷售額進行統計,其頻率分布直方圖如圖所示,已知12時到14時的銷售額為 萬元,則10時到11時的銷售額為( )A. 萬元 B. 萬元 C. 萬元 D. 萬元【答案】 C【考點】頻率分布直方圖【解析】解:設總的銷售額為x,則 .10時到11時的銷售額的頻率為1-0.1-0.4-0.25-0.1=0.15.所以10時到11時的銷售額為 .故答案為:C.【分析】求出總的銷售額,計算10時到11時的銷售額的頻率,可得10時到11時的銷售額。(2020·淮北模擬)國慶70周年慶典磅礴而又歡快的場景,仍歷歷在目.已知慶典中某省的游行花車需要用到某類花卉,而該類花卉有甲、乙兩個品種,花車的設計團隊對這兩個品種進行了檢測.現從兩個品種中各抽測了10株的高度,得到如下莖葉圖.下列描述正確的是( )A. 甲品種的平均高度大于乙品種的平均高度,且甲品種比乙品種長的整齊B. 甲品種的平均高度大于乙品種的平均高度,但乙品種比甲品種長的整齊C. 乙品種的平均高度大于甲品種的平均高度,且乙品種比甲品種長的整齊D. 乙品種的平均高度大于甲品種的平均高度,但甲品種比乙品種長的整齊【答案】 D【考點】莖葉圖,眾數、中位數、平均數,極差、方差與標準差【解析】通過莖葉圖數據可知:甲品種的平均高度為: ;乙品種的平均高度為: ,所以乙品種的平均高度大于甲品種的平均高度,但是乙品種的10株高度在分散,沒有甲品種10株的高度集中,都集中在25左右,故乙品種的平均高度大于甲品種的平均高度,但甲品種比乙品種長的整齊.故答案為:D【分析】根據莖葉圖所反映出數據的分布情況進行判斷即可.(2018·新疆模擬)一個社會調查機構就某地居民的月收入調查了10000人,并根據所得數據畫了樣本的頻率分布直方圖.為了分析居民的收入與年齡、學歷、職業等方面的關系,要從這10000人中再用分層抽樣方法抽出100人作進一步調查,則在 (元)月收入段應抽出 人.【答案】 25【考點】頻率分布直方圖【解析】由頻率分布直方圖可知在 (元)/月收入段的頻率為 ,則從 人中在 (元)/月收入段應抽取 人,故答案為 .【分析】計算該區間的概率,乘以總人數,即可得出答案。(2020高一下·蘇州期末)為抗擊新型冠狀病毒,普及防護知識,某校開展了“疫情防護”網絡知識競賽活動,現從參加該活動的學生中隨機抽取了100名學生,將他們的比賽成績(滿分為100分)分為5組: , , , , ,得到如圖所示的頻率分布直方圖,則該100名學生中成績在80分(含80分)以上的人數為________.【答案】 40【考點】頻率分布直方圖【解析】由題可得 ,解得: ;該100名學生中成績在80分(含80分)以上的人數為 人,故答案為:40.【分析】根據各小矩形面積之和為1,即可解方程求出a的值,再求出在80分(含80分)以上的頻率,可得答案.(2018高二上·滄州期中)已知一組數據 的方差為2,若數據 的方差為8,則 的值為________.【答案】 2【考點】眾數、中位數、平均數,極差、方差與標準差【解析】設數據 的平均數為 ,則 ,且數據 的平均數 .所以數據 的方差為,由題意得 ,解得 或 (舍去),故 .故答案為:2.【分析】利用平均數方差公式把數值代入公式計算出結果即可得關于a的方程求解出其值即可得到答案。(2021·漳州模擬)根據下面的數據:1 2 3 432 48 72 88求得 關于 的回歸直線方程為 ,則這組數據相對于所求的回歸直線方程的4個殘差的方差為 .(注:殘差是指實際觀察值與估計值之間的差.)【答案】 3.2【考點】極差、方差與標準差,線性回歸方程【解析】把x=1,2,3,4依次代入回歸直線方程為 ,所得估計值依次為: , ,對應的殘差依次為:0.8,-2.4,2.4,-0.8,它們的平均數為0,所以4個殘差的方差為 .故答案為:3.2【分析】把x=1,2,3,4依次代入回歸直線方程為 ,所得估計值依次為: , ,根據方差的公式進行計算即可。(2018高一下·蕪湖期末)已知一組數據4.7,4.8,5.1,5.4,5.5,則該組數據的方差是 .【答案】 0.1【考點】極差、方差與標準差【解析】這組數據的平均數為 , .故答案應填:0.1【分析】利用平均數公式、方差公式,可得結論。(2021·浦東模擬)若從總體中隨機抽取的樣本為:-2 -2 -1 1 1 3 2 2 4 2,則該總體標準差的點估計值是 .(精確到0.1)【答案】 1.9【考點】眾數、中位數、平均數,極差、方差與標準差【解析】解:由已知,樣本的平均值為 ,所以樣本標準差的點估計值為,所以總體標準差的點估計值是1.9,故答案為:1.9.【分析】 先求出偶樣本數據的平均數,然后總體標準差的點估計值的求解公式計算即可.(2018高二上·思南月考)某健康協會從某地區睡前看手機的居民中隨機選取了 人進行調查,得到如右圖所示的頻率分布直方圖,則可以估計睡前看手機在 分鐘的人數為________. 【答案】 81【考點】頻率分布直方圖【解析】根據頻率分布直方圖知,睡前看手機在 分鐘的頻率為,所以,估計睡前看手機在 分鐘的人數為,故答案為81 .【分析】根據頻率分布直方圖可得睡前看手機在 分鐘的頻率,依此可估計睡前看手機在 分鐘的人數 .(2020高一下·東莞期末)2020年5月28日,十三屆全國人大三次會議表決通過了《中華人民共和國民法典》,此法典被稱為“社會生活的百科全書”,是新中國第一部以法典命名的法律,在法律體系中居于基礎性地位,也是市場經濟的基本法.民法典與百姓生活密切相關,某大學為了解學生對民法典的認識程度,選取了120人進行測試,測試得分情況如圖所示.(1)試求出圖中實數a的值,并求出成績落在 的人數;(2)如果抽查的測試平均分超過75分,就表示該學校通過測試.試判斷該校能否通過測試;(3)如果在 中抽取3人,在 中抽取2人,再從抽取的5人中選取2人進行民法典的宣傳,那么選取的2人中恰好1人成績落在 的概率是多少?【答案】 (1)解:根據直方圖知組距 ,由 ,解得 .則 的頻率為 ,故成績落在 的人數 (人)(2)解:依題意可得故能夠通過測試(3)解:記成績落在 中的2人為 , ,成績落在 中的3人為 , , ,則從中任選2人的基本事件有 , , , , , , , , , 共10個,其中恰好1人成績落在 中的基本事件有 , , , , , 共6個,故所求概率為【考點】頻率分布直方圖,列舉法計算基本事件數及事件發生的概率【解析】 (1)由頻率分布直方圖的性質列出方程,能求出a的值.(2)由頻率分布直方圖的性質求出平均分,從而得以該校能通過測試。(3)基本事件總數n=10,選取的2人中恰好1人成績落在[90,100]內包含的基本事件個數m=6,由此能求出選取的2人中恰好1人成績落在[90,100]的概率.(2021高二下·威寧縣期末)2020年初,湖北出現由新型冠狀病毒引發的肺炎.為防止病毒蔓延,各級政府相繼啟動重大突發公共衛生事件一級響應,全國人民團結一心抗擊疫情.某社區組織^80名社區居民參加防疫知識競賽,他們的成績全部在40分至100分之間,現將成績按如下方式分成6組:第一組,成績大于等于40分且小于50分;第二組,成績大于等于50分且小于60分;……第六組,成績大于等于90分且小于等于100分,據此繪制了如圖所示的頻率分布直方圖.(1)求社區居民成績的眾數及 的值;(2)我們將成績大于等于80分稱為優秀,成績小于60分稱為不合格.用分層抽樣的方法從這80個成績中抽取20個成績繼續分析,成績不合格和優秀各抽了多少個?再從抽取的不合格成績和優秀成績中任選3個成績,記優秀成績的個數為 個,求 的分布列和數學期望.【答案】 (1)由頻率分布直方圖得眾數為 ,由于所有矩形的面積和為1,則 ,得 ;(2)成績不合格有 個,優秀有 個, 可能取值為0、1、2、3,, , , ,的分布列為0 1 2 3.【考點】頻率分布直方圖,眾數、中位數、平均數,離散型隨機變量及其分布列,離散型隨機變量的期望與方差【解析】(1)由頻率分布直方圖中最高小長方形求得眾數,利用頻率和為1求出a的值;(2)由題意知隨機變量x的可能取值,計算對應的概率值,寫出分布列,計算數學期望值.(2021高二上·廈門開學考)為了解我市高三學生參加體育活動的情況,市直屬某校高三學生500人參加“體育基本素質技能”比賽活動,按某項比賽結果所在區間分組:第1組:[25,30),第2組:[30,35),第3組:[35,40),第4組:[40,45),第5組:[45,50],得到不完整的人數統計表如下:比賽結果所在區間 [25,30) [30,35) [35,40) [40,45) [45,50].人數 50 50 a 150 b其頻率分布直方圖為:(1)求人數統計表中的a和b的值;(2)根據頻率分布直方圖,估計該項比賽結果的中位數;(3)用分層抽樣的方法從第1,2,3組中共抽取6人,再從這6人中隨機抽取2人參加上一級比賽活動,求參加上一級比賽活動中至少有1人的比賽結果在第3組的概率.【答案】 (1)由頻率分布直方圖得,比賽結果在 內的頻率為: ,則 ,比賽結果在 內的頻率為: ,則 ,所以人數統計表中的a和b的值分別為200,50;(2)由頻率分布直方圖知,比賽結果在 內的頻率為0.2,比賽結果在 內的頻率為0.6,則中位數應在 內,所以估計該項比賽結果的中位數為: ;(3)因第1,2,3組的頻率分別為0.1,0.1,0.4,則利用分層抽樣在第1,2,3組中抽的人數比為 ,于是得抽取的6人中,第1組抽取1人,第2組抽取1人,第3組抽取4人,記第1組抽取的1位同學為A,第2組抽取的1位同學為B,第3組抽取的4位同學為 , , , ,則從6位同學中抽兩位同學有: , , , , , , , , ,, , , , , ,共有15種等可能結果,其中2人比賽結果都不在第3組的有: ,共1種可能,所以至少有1人比賽結果在第3組的概率為 .【考點】頻率分布直方圖,眾數、中位數、平均數,列舉法計算基本事件數及事件發生的概率【解析】 (1)根據題意由頻率分布圖中的數據代入公式計算出結果即可。 (2)根據頻率分布直方圖,能估計該項比賽結果的中位數.(3)第1,2,3組共有300人,利用分層抽樣在300名學生中抽取6名學生,第1組抽取的人數為1人,第2組抽取的人數為1人,第3組抽取的人數為4人,由此能求至少有1人比賽結果在第3組的概率.9.2 用樣本估計總體一、頻率分布直方圖制作頻率分布直方圖的步驟(1)求極差;(2)決定組距與組數;(3)將數據分組;(4)列頻率分布表;(5)畫頻率分布直方圖.注意點:(1)組數太多或太少,都會影響我們了解數據的分布情況.組距與組數的確定沒有固定的標準,常常需要一個嘗試和選擇的過程.決定組距與組數:當樣本容量不超過100時,常分成5~12組,為了方便起見,一般取等長組距,并且組距應力求“取整”.(2)分點的確定:若數據為整數,則分點數據減去0.5;若數據是小數點后有一位數字的數,則分點數據減去0.05,以此類推.分組時,通常對組內數值所在的區間取左閉右開區間,最后一組取閉區間.二、頻率分布直方圖的應用(1)頻率分布直方圖的性質①因為小矩形的面積=組距×=頻率,所以各小矩形的面積表示相應各組的頻率.這樣,頻率分布直方圖就以面積的形式反映了數據落在各個小組內的頻率大?。?br/>②在頻率分布直方圖中,各小矩形的面積之和等于1.③=樣本容量.(2)頻率分布直方圖反映了樣本在各個范圍內取值的可能性,由抽樣的代表性利用樣本在某一范圍內的頻率,可近似地估計總體在這一范圍內的可能性.三、幾種不同的統計圖(1)不同的統計圖在表示數據上有不同的特點.如:扇形圖主要用于直觀描述各類數據占總數的比例,條形圖和直方圖主要用于直觀描述不同類別或分組數據的頻數和頻率,折線圖主要用于描述數據隨時間的變化趨勢.(2)不同的統計圖適用的數據類型也不同.例如,條形圖適用于描述離散型的數據,直方圖適用于描述連續型數據等.四、利用各種統計圖表對數據進行分析對于涉及扇形圖、條形圖的性質等問題,要充分考慮到圖形所提供的各類信息,從中提取信息進行計算.(1)條形圖是用一個單位長度表示一定的數量或頻率,根據數量的多少或頻率的大小畫成長短不同的矩形條,條形圖能清楚地表示出每個項目的具體數目或頻率.(2)扇形圖是用整個圓面積表示總數(100%),用圓內的扇形面積表示各個部分所占總數的百分數.(3)在畫折線圖時,要注意明確橫軸、縱軸的實際含義.五、百分位數的定義1.計算一組n個數據的第p百分位數的步驟:第1步,按從小到大排列原始數據.第2步,計算i=n×p%.第3步,若i不是整數,而大于i的比鄰整數為j,則第p百分位數為第j項數據;若i是整數,則第p百分位數為第i項與第(i+1)項數據的平均數.2.一般地,一組數據的第p百分位數是這樣一個值,它使得這組數據中至少有p%的數據小于或等于這個值,且至少有(100-p)%的數據大于或等于這個值.注意點:(1)中位數相當于是第50百分位數.除了中位數外,常用的分位數還有第25百分位數,第75百分位數.(2)第25,50,75百分位數,這三個分位數把一組由小到大排列后的數據分成四等份,因此稱為四分位數.(3)第25百分位數也稱為第一四分位數或下四分位數等,第75百分位數也稱為第三四分位數或上四分位數等.六、由樣本數據求百分位數計算一組n個數據的第p百分位數的一般步驟第1步:按照從小到大排列原始數據.第2步:計算i=n×p%.第3步:若i不是整數,大于i的比鄰整數為j,則第p百分位數為第j項數據;若i是整數,則第p百分位數為第i項和第(i+1)項數據的平均數.七、由頻數(頻率)分布表求百分位數由頻率分布直方圖求百分位數的方法(1)要注意頻率分布直方圖中小矩形的面積,就是數據落在該組的頻率.(2)一般采用方程的思想,設出第p百分位數,根據其意義列出方程并求解即可.八、眾數、中位數、平均數1.眾數:一組數據中出現次數最多的數.2.中位數:把一組數據按從小到大(或從大到小)的順序排列,處在中間位置的數(或中間兩個數的平均數)叫做這組數據的中位數.3.平均數:如果有n個數x1,x2,…,xn,那么=(x1+x2+…+xn)叫做這n個數的平均數.九、總體集中趨勢的估計眾數、中位數、平均數的意義(1)樣本的眾數、中位數和平均數常用來表示樣本數據的“中心值”,其中眾數和中位數容易計算,不受少數幾個極端值的影響,但只能表達樣本數據中的少量信息,平均數代表了數據更多的信息,但受樣本中每個數據的影響,越極端的數據對平均數的影響也越大.(2)當一組數據中有不少數據重復出現時,其眾數往往更能反映問題,當一組數據中個別數據較大時,可用中位數描述其集中趨勢.十、利用頻率分布直方圖估計總體的集中趨勢利用頻率分布直方圖求眾數、中位數以及平均數的方法(1)眾數即為出現次數最多的數,所以它的頻率最大,在最高的小矩形中.中位數即為從小到大中間的數(或中間兩數的平均數).平均數為每個小矩形底邊中點的橫坐標與小矩形面積乘積之和.(2)用頻率分布直方圖求得的眾數、中位數不一定是樣本中的具體數.十一、方差、標準差1.假設一組數據為x1,x2,…,xn,則這組數據的平均數=,方差為s2=(xi-)2,標準差s=.2.如果總體中所有個體的變量值分別為Y1,Y2,…,YN,總體平均數為,則稱S2=(Yi-)2為總體方差,S=為總體標準差.如果總體的N個變量值中,不同的值共有k(k≤N)個,不妨記為Y1,Y2,…,Yk,其中Yi出現的頻數為fi(i=1,2,…,k),則總體方差為S2=i(Yi-)2.十二、方差、標準差與統計圖表的綜合應用反思感悟 折線統計圖中數字特征的求解技巧根據折線統計圖研究樣本數據的數字特征與橫坐標和縱坐標的統計意義有關,但一般情況下,整體分布位置較高的平均數大,數據波動性小的方差?。?br/>十三、分層隨機抽樣的方差假設第一層有m個數,分別為x1,x2,…,xm,平均數為,方差為s2;第二層有n個數,分別為y1,y2,…,yn,平均數為,方差為t2.則=i,s2=(xi-)2,=i,t2=(yi-)2.若記樣本均值為,樣本方差為b2,則可以算出=(i+i)=,b2==.考點一 總體取值規律的估計【例1】(2021·全國高一課時練習)某市2020年4月1日~4月30日對空氣污染指數的監測數據如下(主要污染物為可吸入顆粒物):61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45,(1)完成頻率分布表;(2)作出頻率分布直方圖;(3)根據國家標準,污染指數在0~50之間時,空氣質量為優;在51~100之間時,空間質量為良;在101~150之間時,空間質量為輕微污染;在151~200之間時,空間質量為輕度污染.請你依據所給數據和上述標準,對該市的空氣質量給出一個簡短評價.【練1】(2020·江蘇蘇州市·星海實驗中學高一期中)為了解學生課外閱讀的情況,隨機統計了名學生的課外閱讀時間,所得數據都在中,其頻率分布直方圖如圖所示.已知在中的頻數為100,則的值是( )A.500 B.1000 C.10000 D.25000考點二 總體百分數的估計【例2】(2020·天津和平區)已知一組數據為第百分位數是( )A. B. C. D.【練2】(2020·全國高一課時練習)一組數據12,34,15,24,39,25,31,48,32,36,36,37,42,50的第25,75百分位數分別是______、________.考點三 總體集中趨勢的估計【例3】(2021·湖北荊州市)因受新冠疫情的影響,某企業的產品銷售面臨困難.為了改變現狀,該企業欲借助電商和“網紅”直播帶貨擴大銷售.受網紅效應的影響,產品銷售取得了較好的效果.現將該企業一段時間內網上銷售的日銷售額統計整理后繪制成如下圖所示的頻率分布直方圖:請根據圖中所給數據,求:(1)實數a的值;(2)該企業網上銷售日銷售額的眾數和中位數;(3)該企業在統計時間段內網上銷售日銷售額的平均數.【練3】(2020·全國高一課時練習)名工人某天生產同一零件,生產的件數是、、、、、、、、、.設其平均數為,中位數為,眾數為,則有( )A. B. C. D.考點四 總體離散程度的估計【例4】(2020·全國高一)已知數據的平均數為,方差為,則,,…,的平均數和方差分別為( )A.和 B.和C.和 D.和【練4】(2020·甘肅白銀市·高一期末)已知數據的中位數為,眾數為,平均數為,方差為,則下列說法中,錯誤的是( )A.數據的中位數為B.數據的眾數為C.數據的平均數為D.數據的方差為課后練習(2021高二上·湖南月考)某校1000名學生參加數學競賽,隨機抽取了20名學生的考試成績(單位:分),成績的頻率分布直方圖如圖所示,則下列說法正確的是( )A. 頻率分布直方圖中 的值為0.004 B. 估計這20名學生數學考試成績的第60百分位數為80C. 估計這20名學生數學考試成績的眾數為80 D. 估計總體中成績落在 內的學生人數為160(2017高二下·普寧開學考)在“世界讀書日”前夕,為了了解某地5000名居民某天的閱讀時間,從中抽取了200名居民的閱讀時間進行統計分析,在這個問題中,5000名居民的閱讀時間的全體是( )A. 總體 B. 個體 C. 樣本的容量 D. 從總體中抽取的一個樣本(2018高一下·西華期末)在中秋的促銷活動中,某商場對9月14日9時到14時的銷售額進行統計,其頻率分布直方圖如圖所示,已知12時到14時的銷售額為 萬元,則10時到11時的銷售額為( )A. 萬元 B. 萬元 C. 萬元 D. 萬元(2020·淮北模擬)國慶70周年慶典磅礴而又歡快的場景,仍歷歷在目.已知慶典中某省的游行花車需要用到某類花卉,而該類花卉有甲、乙兩個品種,花車的設計團隊對這兩個品種進行了檢測.現從兩個品種中各抽測了10株的高度,得到如下莖葉圖.下列描述正確的是( )A. 甲品種的平均高度大于乙品種的平均高度,且甲品種比乙品種長的整齊B. 甲品種的平均高度大于乙品種的平均高度,但乙品種比甲品種長的整齊C. 乙品種的平均高度大于甲品種的平均高度,且乙品種比甲品種長的整齊D. 乙品種的平均高度大于甲品種的平均高度,但甲品種比乙品種長的整齊(2018·新疆模擬)一個社會調查機構就某地居民的月收入調查了10000人,并根據所得數據畫了樣本的頻率分布直方圖.為了分析居民的收入與年齡、學歷、職業等方面的關系,要從這10000人中再用分層抽樣方法抽出100人作進一步調查,則在 (元)月收入段應抽出 人.(2020高一下·蘇州期末)為抗擊新型冠狀病毒,普及防護知識,某校開展了“疫情防護”網絡知識競賽活動,現從參加該活動的學生中隨機抽取了100名學生,將他們的比賽成績(滿分為100分)分為5組: , , , , ,得到如圖所示的頻率分布直方圖,則該100名學生中成績在80分(含80分)以上的人數為________.(2018高二上·滄州期中)已知一組數據 的方差為2,若數據 的方差為8,則 的值為________.(2021·漳州模擬)根據下面的數據:1 2 3 432 48 72 88求得 關于 的回歸直線方程為 ,則這組數據相對于所求的回歸直線方程的4個殘差的方差為 .(注:殘差是指實際觀察值與估計值之間的差.)(2018高一下·蕪湖期末)已知一組數據4.7,4.8,5.1,5.4,5.5,則該組數據的方差是 .(2021·浦東模擬)若從總體中隨機抽取的樣本為:-2 -2 -1 1 1 3 2 2 4 2,則該總體標準差的點估計值是 .(精確到0.1)(2018高二上·思南月考)某健康協會從某地區睡前看手機的居民中隨機選取了 人進行調查,得到如右圖所示的頻率分布直方圖,則可以估計睡前看手機在 分鐘的人數為________. (2020高一下·東莞期末)2020年5月28日,十三屆全國人大三次會議表決通過了《中華人民共和國民法典》,此法典被稱為“社會生活的百科全書”,是新中國第一部以法典命名的法律,在法律體系中居于基礎性地位,也是市場經濟的基本法.民法典與百姓生活密切相關,某大學為了解學生對民法典的認識程度,選取了120人進行測試,測試得分情況如圖所示.(1)試求出圖中實數a的值,并求出成績落在 的人數;(2)如果抽查的測試平均分超過75分,就表示該學校通過測試.試判斷該校能否通過測試;(3)如果在 中抽取3人,在 中抽取2人,再從抽取的5人中選取2人進行民法典的宣傳,那么選取的2人中恰好1人成績落在 的概率是多少?(2021高二下·威寧縣期末)2020年初,湖北出現由新型冠狀病毒引發的肺炎.為防止病毒蔓延,各級政府相繼啟動重大突發公共衛生事件一級響應,全國人民團結一心抗擊疫情.某社區組織^80名社區居民參加防疫知識競賽,他們的成績全部在40分至100分之間,現將成績按如下方式分成6組:第一組,成績大于等于40分且小于50分;第二組,成績大于等于50分且小于60分;……第六組,成績大于等于90分且小于等于100分,據此繪制了如圖所示的頻率分布直方圖.(1)求社區居民成績的眾數及 的值;(2)我們將成績大于等于80分稱為優秀,成績小于60分稱為不合格.用分層抽樣的方法從這80個成績中抽取20個成績繼續分析,成績不合格和優秀各抽了多少個?再從抽取的不合格成績和優秀成績中任選3個成績,記優秀成績的個數為 個,求 的分布列和數學期望.(2021高二上·廈門開學考)為了解我市高三學生參加體育活動的情況,市直屬某校高三學生500人參加“體育基本素質技能”比賽活動,按某項比賽結果所在區間分組:第1組:[25,30),第2組:[30,35),第3組:[35,40),第4組:[40,45),第5組:[45,50],得到不完整的人數統計表如下:比賽結果所在區間 [25,30) [30,35) [35,40) [40,45) [45,50].人數 50 50 a 150 b其頻率分布直方圖為:(1)求人數統計表中的a和b的值;(2)根據頻率分布直方圖,估計該項比賽結果的中位數;(3)用分層抽樣的方法從第1,2,3組中共抽取6人,再從這6人中隨機抽取2人參加上一級比賽活動,求參加上一級比賽活動中至少有1人的比賽結果在第3組的概率.精講答案【例1】【答案】(1)頻率分布表見解析;(2)頻率分布直方圖見解析;(3)該市空氣質量有待進一步改善.【解析】(1)頻率分布表分組 頻數 頻率 分組 頻數 頻率[41,51) 2 [81,91) 10[51,61) 1 [91,101) 5[61,71) 4 [101,111) 2[71,81) 6(2)頻率分布直方圖(3)答對下述兩條中的一條即可:①該市一個月中空氣污染指數有2天處于優的水平,占當月天數的;有26天處于良的水平,占當月天數的;處于優或良的天數共有28天,占當月天數的.說明該市空氣質量基本良好.②輕微污染有2天,占當月天數的.污染指數在80以上的接近輕微污染的天數有15天,加上處于輕微污染的天數,共有17天,占當月天數的,超過50%.說明該市空氣質量有待進一步改善.【練1】【答案】B【解析】由圖可得在中的頻率為,所以,故選:B.【例2】【答案】C【解析】因為有6位數,所以,所以第百分位數是第三個數6.故選:C【練2】【解析】把數據從小到大排序為12,15,24,25,31,32,34,36,36,37,39,42,48,50共14個數,14×25%=3.5, 14×75%=10.5, 所以第25,75百分位數分別是第4,11項數據,即是25,39.故答案為:25,39.【例3】【答案】(1)0.012;(2)55萬元,57萬元;(3)57.4萬元.【解析】(1)由頻率分布直方圖知:,解得:;(2)用頻率分布直方圖中最高矩形所在區間的中點值作為眾數的近似值,得眾數為55萬元;因為第一個小矩形的面積為0.08,第二個小矩形的面積為0.12,第三個小矩形的面積為0.16,,設第四個小矩形中底邊的一部分長為x,則,解得,所以中位數為萬元;(3)依題意,日銷售額的平均值為:所以該企業在統計時間段內網上銷售日銷售額的平均數為57.4萬元.【練3】【答案】B【解析】將生產的件數由小到大排列為:、、、、、、、、、,,中位數為,眾數為.因此,.故選:B.【例4】【答案】B【解析】因為數據的平均數為,方差為,所以,,…,的平均數和方差分別為和故選:B【練4】【答案】D【解析】若數據的中位數為,眾數為,平均數為,則由性質知數據的中位數,眾數,平均數均變為原來的2倍,故正確;則由方差的性質知數據的方差為4p,故D錯誤;故選D.練習答案【答案】B【考點】頻率分布直方圖,眾數、中位數、平均數【解析】由 可得 ,A不符合題意前三個矩形的面積和為 ,所以這20名學生數學考試成績的第60百分位數為80,B符合題意這20名學生數學考試成績的眾數為75,C不符合題意總體中成績落在 內的學生人數為 ,D不符合題意故答案為:B【分析】 對于A,由頻率分布直方圖的性質列方程能求出a;對于B,求出[50, 80)的頻率為0.6,由此能估計這20名學生數學考試成績的第60百分位數為80;對于C, [70, 80)對應的小矩形最高,由此能估計這20名學生數學考試成績的眾數;對于D,求出總體在[60, 70)的頻率,由此能估計總體中成績落在[60, 70)內的學生人數.【答案】 A【考點】用樣本的頻率分布估計總體分布【解析】解:根據題意,結合總體、個體、樣本、樣本容量的定義可得,5000名居民的閱讀時間的全體是總體,故選:A.【分析】根據題意,結合總體、個體、樣本、樣本容量的定義可得結論.【答案】 C【考點】頻率分布直方圖【解析】解:設總的銷售額為x,則 .10時到11時的銷售額的頻率為1-0.1-0.4-0.25-0.1=0.15.所以10時到11時的銷售額為 .故答案為:C.【分析】求出總的銷售額,計算10時到11時的銷售額的頻率,可得10時到11時的銷售額。【答案】 D【考點】莖葉圖,眾數、中位數、平均數,極差、方差與標準差【解析】通過莖葉圖數據可知:甲品種的平均高度為: ;乙品種的平均高度為: ,所以乙品種的平均高度大于甲品種的平均高度,但是乙品種的10株高度在分散,沒有甲品種10株的高度集中,都集中在25左右,故乙品種的平均高度大于甲品種的平均高度,但甲品種比乙品種長的整齊.故答案為:D【分析】根據莖葉圖所反映出數據的分布情況進行判斷即可.【答案】 25【考點】頻率分布直方圖【解析】由頻率分布直方圖可知在 (元)/月收入段的頻率為 ,則從 人中在 (元)/月收入段應抽取 人,故答案為 .【分析】計算該區間的概率,乘以總人數,即可得出答案。【答案】 40【考點】頻率分布直方圖【解析】由題可得 ,解得: ;該100名學生中成績在80分(含80分)以上的人數為 人,故答案為:40.【分析】根據各小矩形面積之和為1,即可解方程求出a的值,再求出在80分(含80分)以上的頻率,可得答案.【答案】 2【考點】眾數、中位數、平均數,極差、方差與標準差【解析】設數據 的平均數為 ,則 ,且數據 的平均數 .所以數據 的方差為,由題意得 ,解得 或 (舍去),故 .故答案為:2.【分析】利用平均數方差公式把數值代入公式計算出結果即可得關于a的方程求解出其值即可得到答案。【答案】 3.2【考點】極差、方差與標準差,線性回歸方程【解析】把x=1,2,3,4依次代入回歸直線方程為 ,所得估計值依次為: , ,對應的殘差依次為:0.8,-2.4,2.4,-0.8,它們的平均數為0,所以4個殘差的方差為 .故答案為:3.2【分析】把x=1,2,3,4依次代入回歸直線方程為 ,所得估計值依次為: , ,根據方差的公式進行計算即可。【答案】 0.1【考點】極差、方差與標準差【解析】這組數據的平均數為 , .故答案應填:0.1【分析】利用平均數公式、方差公式,可得結論。【答案】 1.9【考點】眾數、中位數、平均數,極差、方差與標準差【解析】解:由已知,樣本的平均值為 ,所以樣本標準差的點估計值為,所以總體標準差的點估計值是1.9,故答案為:1.9.【分析】 先求出偶樣本數據的平均數,然后總體標準差的點估計值的求解公式計算即可.【答案】 81【考點】頻率分布直方圖【解析】根據頻率分布直方圖知,睡前看手機在 分鐘的頻率為,所以,估計睡前看手機在 分鐘的人數為,故答案為81 .【分析】根據頻率分布直方圖可得睡前看手機在 分鐘的頻率,依此可估計睡前看手機在 分鐘的人數 .【答案】 (1)解:根據直方圖知組距 ,由 ,解得 .則 的頻率為 ,故成績落在 的人數 (人)(2)解:依題意可得故能夠通過測試(3)解:記成績落在 中的2人為 , ,成績落在 中的3人為 , , ,則從中任選2人的基本事件有 , , , , , , , , , 共10個,其中恰好1人成績落在 中的基本事件有 , , , , , 共6個,故所求概率為【考點】頻率分布直方圖,列舉法計算基本事件數及事件發生的概率【解析】 (1)由頻率分布直方圖的性質列出方程,能求出a的值.(2)由頻率分布直方圖的性質求出平均分,從而得以該校能通過測試。(3)基本事件總數n=10,選取的2人中恰好1人成績落在[90,100]內包含的基本事件個數m=6,由此能求出選取的2人中恰好1人成績落在[90,100]的概率.【答案】 (1)由頻率分布直方圖得眾數為 ,由于所有矩形的面積和為1,則 ,得 ;(2)成績不合格有 個,優秀有 個, 可能取值為0、1、2、3,, , , ,的分布列為0 1 2 3.【考點】頻率分布直方圖,眾數、中位數、平均數,離散型隨機變量及其分布列,離散型隨機變量的期望與方差【解析】(1)由頻率分布直方圖中最高小長方形求得眾數,利用頻率和為1求出a的值;(2)由題意知隨機變量x的可能取值,計算對應的概率值,寫出分布列,計算數學期望值.【答案】 (1)由頻率分布直方圖得,比賽結果在 內的頻率為: ,則 ,比賽結果在 內的頻率為: ,則 ,所以人數統計表中的a和b的值分別為200,50;(2)由頻率分布直方圖知,比賽結果在 內的頻率為0.2,比賽結果在 內的頻率為0.6,則中位數應在 內,所以估計該項比賽結果的中位數為: ;(3)因第1,2,3組的頻率分別為0.1,0.1,0.4,則利用分層抽樣在第1,2,3組中抽的人數比為 ,于是得抽取的6人中,第1組抽取1人,第2組抽取1人,第3組抽取4人,記第1組抽取的1位同學為A,第2組抽取的1位同學為B,第3組抽取的4位同學為 , , , ,則從6位同學中抽兩位同學有: , , , , , , , , ,, , , , , ,共有15種等可能結果,其中2人比賽結果都不在第3組的有: ,共1種可能,所以至少有1人比賽結果在第3組的概率為 .【考點】頻率分布直方圖,眾數、中位數、平均數,列舉法計算基本事件數及事件發生的概率【解析】 (1)根據題意由頻率分布圖中的數據代入公式計算出結果即可。 (2)根據頻率分布直方圖,能估計該項比賽結果的中位數.(3)第1,2,3組共有300人,利用分層抽樣在300名學生中抽取6名學生,第1組抽取的人數為1人,第2組抽取的人數為1人,第3組抽取的人數為4人,由此能求至少有1人比賽結果在第3組的概率. 展開更多...... 收起↑ 資源列表 人教A版(2019)高一數學必修第二冊 講義 9.2用樣本估計總體(學生版).docx 人教A版(2019)高一數學必修第二冊 講義 9.2用樣本估計總體(教師版).docx 縮略圖、資源來源于二一教育資源庫