資源簡介 5.1.4 用樣本估計總體[學習目標] 1.正確理解樣本數據標準差的意義和作用,學會計算數據的標準差.2.能根據實際問題的需要合理地選取樣本,從樣本數據中提取基本的數字特征(如平均數、標準差),并做出合理的解釋.3.會用樣本的基本數字特征估計總體的基本數字特征.導語同學們,你們想擁有一個健康的體魄嗎 擁有健康的體魄是我們學習和生活的基礎,為了提高大家的體質健康水平,教育部決定,在全國范圍內開展“全國億萬青少年學生陽光體育運動”,使大部分學生能做到每天鍛煉一小時,我們在座的同學達到目標了嗎 我校的同學達到這個標準了嗎 一、用樣本的數字特征估計總體的數字特征知識梳理1.用樣本的數字特征估計總體的數字特征(1)一般情況下,如果樣本的容量恰當,抽樣方法又合理的話,樣本的特征能夠反映總體的特征.特別地,樣本平均數(也稱為樣本均值)、方差(也稱為樣本方差)與總體對應的值相差不會太大.(2)在容許一定誤差存在的前提下,可以用樣本的數字特征去估計總體的數字特征,這樣就能節省人力和物力等.另外,有時候總體的數字特征不可能獲得,此時只能用樣本的數字特征去估計總體的數字特征.2.眾數、中位數、平均數眾數 在頻率分布直方圖中,眾數是最高小矩形的中點所對應的數據中位數 (1)在頻率分布直方圖中,中位數左邊和右邊的直方圖面積相等,由此可以估計中位數的值,但是有偏差 (2)表示樣本數據所占頻率的等分線平均數 (1)在頻率分布直方圖中,平均數等于每個小矩形的面積乘以小矩形底邊中點的橫坐標之和 (2)平均數是頻率分布直方圖的重心,是頻率分布直方圖的平衡點注意點:(1)利用隨機抽樣得到樣本,從樣本數據得到的分布、平均數和標準差(通常稱之為樣本分布、樣本平均數和樣本標準差)并不是總體真正的分布、平均數和標準差,而只是總體的一個估計,但這個估計是合理的,特別是當樣本容量很大時,它們確實反映了總體的信息.(2)一般地,平均數反映的是樣本個體的平均水平,眾數和中位數則反映樣本中個體的“重心”,而標準差則反映了樣本的波動程度、離散程度,即均衡性、穩定性、差異性等.因此,我們可以根據問題的需要選擇用樣本的不同數字特征來分析問題.一般來說,在估計總體的數字特征時,只需直接算出樣本對應的數字特征即可.例1 甲、乙兩人在相同條件下各打靶10次,每次打靶的成績情況如圖所示.(1)填寫下表;平均數 方差 中位數 命中9環及以上甲 7 1.2 1乙 5.4 3(2)請從四個不同的角度對這次測試進行分析:①從平均數和方差結合分析偏離程度;②從平均數和中位數結合分析誰的成績好些;③從平均數和命中9環及以上的次數相結合看誰的成績好些;④從折線圖上兩人射擊命中環數及走勢分析誰更有潛力.解 (1)乙的射靶環數依次為2,4,6,8,7,7,8,9,9,10,所以=×(2+4+6+8+7+7+8+9+9+10)=7;乙的射靶環數從小到大排列為2,4,6,7,7,8,8,9,9,10,所以中位數是=7.5;甲的射靶環數從小到大排列為5,6,6,7,7,7,7,8,8,9,所以中位數為7.于是填充后的表格如下表所示.平均數 方差 中位數 命中9環及以上甲 7 1.2 7 1乙 7 5.4 7.5 3(2)①甲、乙的平均數相同,均為7,但<,說明甲偏離平均數的程度小,而乙偏離平均數的程度大.②甲、乙的平均數相同,而乙的中位數比甲大,說明乙射靶成績比甲好.③甲、乙的平均數相同,而乙命中9環及以上的次數比甲多2次,可知乙的射靶成績比甲好.④從折線圖上看,乙的成績呈上升趨勢,而甲的成績在平均線上波動不大,說明乙的狀態在提升,更有潛力.反思感悟 在日常生活中,當面對一組數據時,相比每一個觀測值,有時我們更關心的是能反映這組數據特征的一些值,例如上述數據,我們可以從平均數、中位數、百分位數、眾數、極差、方差、標準差等角度進行比較.跟蹤訓練1 某西餐廳推出了以下線上促銷活動.A套餐(在下列食品中6選2)西式面點:蔓越莓核桃包、南瓜芝士包、黑列巴、全麥吐司.中式面點:豆包、桂花糕.B套餐:醬牛肉、老味燒雞熟食類組合.某一周兩種套餐的日銷售量(單位:份)如表所示.星期一 星期二 星期三 星期四 星期五 星期六 星期日A套餐 11 12 14 18 22 19 23B套餐 6 13 15 15 37 20 41根據上面一周的銷量,分別計算A套餐和B套餐銷量的平均數和方差,并根據所得數據評價兩種套餐的銷售情況.解 A套餐銷量的平均數=×(11+12+14+18+22+19+23)=17,方差=×(62+52+32+12+52+22+62)=.B套餐銷量的平均數=×(6+13+15+15+37+20+41)=21,方差=×(152+82+62+62+162+12+202)=.因為<<,所以該周銷量中A套餐比B套餐平均銷量低,但A套餐的銷量比B套餐相對穩定.二、分層抽樣的平均數、方差知識梳理假設第一層有m個數,分別為x1,x2,…,xm,平均數為,方差為s2;第二層有n個數,分別為y1,y2,…,yn,平均數為,方差為t2.如果記樣本均值為,樣本方差為b2,則==,b2==.注意點:在分層抽樣時,如果總體分為k層,而且第j層抽取的樣本量為nj,樣本均值為,樣本方差為,j=1,2,…,k.記n=,則所有數據的樣本均值和方差分別為=,s2=例2 (多選)某分層抽樣中,有關數據如表所示.樣本量 平均數 方差第1層 45 4 2第2層 35 8 1第3層 10 6 3則下列敘述正確的是(結果保留兩位小數) ( )A.第1,2層所有數據的均值為5.75B.第1,2層所有數據的方差為1.50C.第1,2,3層所有數據的均值約為7.68D.第1,2,3層所有數據的方差約為5.23答案 AD解析 第1,2層所有數據的均值為=×4+×8=5.75,A正確;第1,2層所有數據的方差為=×+×=5.5,B不正確;第1,2,3層所有數據的均值為=×4+×8+×6≈5.78,C不正確;第1,2,3層所有數據的方差約為s2=×+×+×≈5.23,D正確.反思感悟 運用公式求分層抽樣的均值與方差時要注意(1)清楚公式中各個符號的含義,避免代入數據混亂.(2)運算要格外仔細,并按要求保留有效小數.跟蹤訓練2 某培訓機構在假期招收了A,B兩個數學補習班,A班10人,B班30人,經過一周的補習后進行了一次測試,在該測試中,A班的平均成績為130分,方差為115,B班的平均成績為110分,方差為215.求在這次測試中全體學生的平均成績和方差.解 依題意=130,=115,=110,=215,∴=×130+×110=115,∴全體學生的平均分為115分.全體學生成績的方差為s2=[+(-)2]+[+(-)2]=×(115+225)+×(215+25)=85+180=265.三、用樣本的分布來估計總體的分布知識梳理1.同數字特征的估計一樣,分布的估計一般也有誤差.如果總體在每一個分組的頻率記為π1,π2,…,πn,樣本在每一組對應的頻率記為p1,p2,…,pn,一般來說,=[(π1-p1)2+(π2-p2)2+…+(πn-pn)2]不等于零.同樣,大數定律可以保證,當樣本的容量越來越大時,上式很小的可能性將越來越大.2.用樣本的分布來估計總體的分布如果樣本的容量恰當,抽樣方法又合理的話,樣本的分布與總體分布會差不多,特別地,每一組的頻率與總體對應的頻率相差不會太大.例3 某校從參加高一年級期末考試的學生中抽出60名,將其物理成績(均為整數)分成六段[40,50),[50,60),…,[90,100]后畫出如圖所示的頻率分布直方圖.觀察圖中的信息,回答下列問題:(1)估計這次考試的物理成績的眾數m與中位數n(結果保留一位小數);(2)估計這次考試的物理成績的及格率(60分及以上為及格)和平均分.解 (1)眾數是頻率分布直方圖中最高小矩形底邊中點的橫坐標,所以眾數m=75.0.前3個小矩形面積之和為0.01×10+0.015×10+0.015×10=0.4<0.5,前4個小矩形面積之和為0.4+0.03×10=0.7>0.5,所以中位數n=70+≈73.3.(2)依題意得,60及60以上的分數在第三、四、五、六組,頻率和為(0.015+0.03+0.025+0.005)×10=0.75,所以估計這次考試的物理成績的及格率是75%.利用組中值估算抽樣學生的平均分為45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71.則估計這次考試物理成績的平均分是71分.反思感悟 利用直方圖求眾數、中位數、平均數均為近似值,往往與實際數據得出的不一致,但它們能比較準確地估計其眾數、中位數和平均數.跟蹤訓練3 某城市一入城交通路段限速60公里/小時,現對某時段通過該交通路段的n輛小汽車車速進行統計,并繪制成頻率分布直方圖(如圖).若這n輛小汽車中,速度在50~60公里/小時之間的車輛有200輛.(1)求n的值;(2)估計這n輛小汽車車速的平均數、中位數.解 (1)由直方圖可知,速度在50~60公里/小時之間的頻率為0.040×10=0.4,所以=500,即n=500.(2)這n輛小汽車車速的平均數的估計值為25×0.06+35×0.1+45×0.3+55×0.4+65×0.1+75×0.04=50.設這n輛小汽車車速的中位數為x,則0.006×10+0.010×10+0.030×10+0.040×(x-50)=0.5,解得x=51.所以這n輛小汽車車速的平均數為50公里/小時,中位數為51公里/小時.1.知識清單:(1)樣本的數字特征.(2)用樣本的數字特征估計總體的數字特征.(3)用樣本的分布來估計總體的分布.2.方法歸納:數據處理.3.常見誤區:樣本的數字特征只能估計總體的數字特征,不能替代總體.1.某校學生的男女人數之比為2∶3,按照男女比例通過分層抽樣的方法抽到一個樣本,樣本中男生每天運動時間的平均數為100分鐘、女生為80分鐘.結合此數據,估計該校全體學生每天運動時間的平均數為 ( )A.98分鐘 B.88分鐘C.90分鐘 D.85分鐘答案 B解析 由題設,若該校男生人數為2n,則女生人數為3n,∴該校全體學生每天運動時間的平均數為==88(分鐘).2.如圖是某學校的教研處根據調查結果繪制的本校學生每天放學后的自學時間情況的頻率分布直方圖.根據頻率分布直方圖,則自學時間的中位數和眾數的估計值分別是(精確到0.01) ( )A.2.20,2.25 B.2.29,2.20C.2.29,2.25 D.2.25,2.25答案 C解析 由頻率分布直方圖得,自學時間在[0.5,2)的頻率為(0.16+0.2+0.34)×0.5=0.35,自學時間在[2,2.5)的頻率為0.52×0.5=0.26,所以自學時間的中位數為2+×0.5≈2.29,眾數為=2.25.3.某校甲、乙兩個班共70人(甲班40人,乙班30人)參加了某知識競賽,甲班的平均成績為77分,方差為123,乙班的平均成績為70分,方差為130,則甲、乙兩班全部同學的成績的方差為 ( )A.74 B.128 C.138 D.136答案 C解析 由總樣本方差公式s2=[m+n+(-)2],可得甲、乙兩班全部同學的成績的方差為×=138.4.某中學為了解學生數學課程的學習情況,在2 200名學生中隨機抽取200名,并統計這200名學生的某次數學考試成績,得到了樣本的頻率分布直方圖(如圖).根據頻率分布直方圖推測這2 200名學生在該次數學考試中成績不低于80分的學生有 人.答案 616解析 2 200×(0.020+0.008)×10=616.課時對點練 [分值:100分]單選題每小題5分,共40分;多選題每小題6分,共12分1.在用樣本分布估計總體分布的過程中,下列說法中正確的是 ( )A.樣本容量一定時總體容量越大,估計越精確B.總體容量與估計的精確度無關C.總體容量一定時樣本容量越大,估計越精確D.總體容量一定時樣本容量越小,估計越精確答案 C解析 當樣本容量越大時,估計總體越精確.2.為了解我國13歲男孩的平均身高,從北方抽取了300個男孩,平均身高為1.60 m;從南方抽取了200個男孩,平均身高為1.50 m.由此可估計我國13歲男孩的平均身高為 ( )A.1.57 m B.1.56 m C.1.55 m D.1.54 m答案 B解析 從北方抽取了300個男孩,平均身高為1.60 m,從南方抽取了200個男孩,平均身高為1.50 m,則這500個13歲男孩的平均身高是=1.56(m),據此可估計我國13歲男孩的平均身高為1.56 m.3.(多選)甲、乙兩名同學六次數學測驗成績(百分制)如圖所示,下面說法正確的是 ( )A.甲同學成績的中位數大于乙同學成績的中位數B.甲同學成績的平均分比乙同學的高C.甲同學成績的平均分比乙同學的低D.甲同學成績的方差小于乙同學成績的方差答案 CD解析 甲的中位數為81,乙的中位數為87.5,故A錯誤;甲的平均分=×(76+72+80+82+86+90)=81,乙的平均分'=×(69+78+87+88+92+96)=85,故B錯誤,C正確;甲的極差為18,乙的極差為27,且甲的成績比較均衡,故甲的成績的方差小于乙成績的方差,D正確.4.某校從參加高二年級學業水平測試的學生中抽出80名學生,其數學成績(均為整數)的頻率分布直方圖如圖所示.估計這次測試數學成績的平均分為 ( )A.50 B.60 C.72 D.80答案 C解析 學生的平均分約為45×0.05+55×0.15+65×0.2+75×0.3+85×0.25+95×0.05=72.5.為了普及環保知識,增強環保意識,某大學隨機抽取30名學生參加環保知識測試,得分(十分制)的統計圖如圖所示,假設得分分值的中位數為me,眾數為mo,平均數為,則 ( )A.me=mo= B.me=mo<C.me答案 D解析 由柱形圖可知,30名學生的得分依次為2個3分,3個4分,10個5分,6個6分,3個7分,2個8分,2個9分,2個10分.中位數為第15,16個數(分別為5,6)的平均數,即me=5.5,5出現次數最多,故mo=5.=≈5.97.于是得mo6.某中學為了解高三男生的體能情況,通過隨機抽樣,獲得了200名男生的100米體能測試成績(單位:秒),將數據按照[11.5,12),[12,12.5),…,[15.5,16)分成9組,制成了如圖所示的頻率分布直方圖.規定成績低于13秒為優,成績高于14.8秒為不達標.由頻率分布直方圖推斷,下列選項錯誤的是 ( )A.頻率分布直方圖中a的值為0.40B.由頻率分布直方圖估計本校高三男生100米體能測試成績的眾數為13.75秒C.由頻率分布直方圖估計本校高三男生100米體能測試成績為優的人數為54D.由頻率分布直方圖估計本校高三男生100米體能測試成績不達標的人數為18答案 D解析 0.5×(0.08+0.16+0.30+a+0.52+0.30+0.12+0.08+0.04)=1,解得a=0.40,A選項正確;眾數為=13.75,B選項正確;成績低于13秒的頻率為0.5×(0.08+0.16+0.30)=0.5×0.54=0.27,人數為200×0.27=54,C選項正確;成績高于14.8秒的頻率為(15-14.8)×0.12+0.5×(0.08+0.04)=0.084,人數為200×0.084≈17,D選項錯誤.7.(5分)抽樣調查某地區120名教師的年齡和學歷狀況,情況如圖所示,則估計該地區35歲以下具有研究生學歷的教師所占的百分比為 . 答案 25%解析 由題可知,35歲以下教師的總人數為50÷62.5%=80,∴35歲以下具有研究生學歷的教師人數為80-50=30,故估計該地區35歲以下具有研究生學歷的教師所占的百分比為×100%=25%.8.(5分)某校從參加高一年級期中考試的學生中隨機抽取60名學生,將其數學成績(均為整數)分成六段[40,50),[50,60),…,[90,100]后得到如圖所示的部分頻率分布直方圖.在統計方法中,同一組數據常用該組區間的中點值作為代表,觀察圖形的信息,據此估計本次考試數學成績的平均分為 . 答案 71解析 在頻率分布直方圖中,所有小長方形的面積和為1,設[70,80)的小長方形面積為x,則(0.01+0.015×2+0.025+0.005)×10+x=1,解得x=0.3,即該組頻率為0.3,所以本次考試數學成績的平均分為45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71.9.(10分)甲、乙兩臺機床在相同的技術條件下,同時生產一種零件,現在從甲、乙生產的零件中分別抽取40件、60件,甲的平均尺寸為10,方差為20,乙的平均尺寸為12,方差為40.那么全部100件產品的平均尺寸和方差分別是多少 解 甲機床生產的零件的平均尺寸、方差分別為=10,=20,乙機床生產的零件的平均尺寸、方差分別為=12,=40,所以100件產品的平均尺寸===11.2,所以100件產品的方差s2=×[40+60+×(10-12)2]=×[(40×20+60×40)+24×4]=32.96.10.(11分)某網站從春節期間參與收發網絡紅包的手機用戶中隨機抽取2 000名進行調查,將受訪用戶按年齡分成5組[10,20),[20,30),…,[50,60],并整理得到如圖所示的頻率分布直方圖.(1)求a的值;(3分)(2)從春節期間參與收發網絡紅包的手機用戶中隨機抽取一人,估計其年齡低于40歲的頻率;(4分)(3)估計春節期間參與收發網絡紅包的手機用戶的平均年齡.(4分)解 (1)根據頻率分布直方圖可知10×(a+0.005+0.01+0.02+0.03)=1,解得a=0.035.(2)根據題意,得樣本中年齡低于40歲的頻率為10×(0.01+0.035+0.03)=0.75,所以從春節期間參與收發網絡紅包的手機用戶中隨機抽取一人,估計其年齡低于40歲的頻率為0.75.(3)根據題意,得春節期間參與收發網絡紅包的手機用戶的平均年齡約為15×0.1+25×0.35+35×0.3+45×0.2+55×0.05=32.5(歲).11.設矩形的長為a,寬為b,其比滿足b∶a=≈0.618,這種矩形給人以美感,稱為黃金矩形.黃金矩形常應用于工藝品設計中.下面是某工藝品廠隨機抽取兩個批次的初加工矩形寬度與長度的比值樣本:甲批次:0.598 0.625 0.628 0.595 0.639乙批次:0.618 0.613 0.592 0.622 0.620根據上述兩個樣本來估計兩個批次的總體平均數,與標準值0.618比較,正確的結論是 ( )A.甲批次的總體平均數與標準值更接近B.乙批次的總體平均數與標準值更接近C.兩個批次的總體平均數與標準值接近程度相同D.兩個批次的總體平均數與標準值接近程度不能確定答案 A解析 計算可得甲批次樣本的平均數為0.617,乙批次樣本的平均數為0.613,由此估計兩個批次的總體平均數分別為0.617,0.613,則甲批次的總體平均數與標準值更接近.12.(多選)為比較甲、乙兩地某月14時的氣溫狀況,隨機選取該月中的5天,將這5天中14時的氣溫數據(單位:℃)制成如圖所示的柱形圖,下列結論正確的是 ( )A.甲地該月14時的平均氣溫低于乙地該月14時的平均氣溫B.甲地該月14時的平均氣溫高于乙地該月14時的平均氣溫C.甲地該月14時的氣溫的極差大于乙地該月14時的氣溫的極差D.甲地該月14時的氣溫的標準差小于乙地該月14時的氣溫的標準差答案 AC解析 甲地數據為26,28,29,31,31;乙地數據為28,29,30,31,32.所以==29,==30,甲地氣溫的極差為31-26=5,乙地氣溫的極差為32-28=4.因為=×[(26-29)2+(28-29)2+(29-29)2+(31-29)2+(31-29)2]=3.6,=×[(28-30)2+(29-30)2+(30-30)2+(31-30)2+(32-30)2]=2,所以s甲=,s乙=,所以s甲>s乙.13.為了了解某校學生的視力情況,隨機抽查了該校100名學生的視力,得到如圖所示的頻率分布直方圖.由于不慎將部分數據丟失,但知道前4組的頻數和為40,后6組的頻數和為87.設最大頻率為a,視力在4.5到5.2之間的學生人數為b,則a,b的值分別為 ( )A.0.27,0.96 B.0.27,96C.27,0.96 D.27,96答案 B解析 由頻率分布直方圖知組距為0.1,由前4組的頻數和為40,后6組的頻數和為87,知第4組的頻數為40+87-100=27,即視力在4.6到4.7之間的頻數最大,為27,故最大頻率a=0.27.視力在4.5到5.2之間的頻率為1-0.01-0.03=0.96,故視力在4.5到5.2之間的學生人數b=0.96×100=96.14.(5分)為了調查某廠工人生產某種產品的能力,隨機抽查了20位工人某天生產該產品的數量得到頻率分布直方圖如圖,則(1)這20名工人中一天生產該產品的數量在[55,75)內的人數是 ; (2)這20名工人一天生產該產品的數量的平均數為 . 答案 (1)13 (2)64解析 (1)一天生產該產品的數量在[55,75)內的人數為(0.040×10+0.025×10)×20=13.(2)0.2×50+0.4×60+0.25×70+0.1×80+0.05×90=64.15.某公司為了解用戶對其產品的滿意度,從甲、乙兩地區分別隨機調查了100名用戶,根據用戶對產品的滿意度評分,分別得到甲地區和乙地區用戶滿意度評分的頻率分布直方圖如圖所示.若甲地區和乙地區用戶滿意度評分的中位數分別為m1,m2,平均數分別為,則下列結論正確的是 ( )A.m1>m2,> B.m1>m2,<C.m1答案 C解析 由頻率分布直方圖得,甲地區用戶滿意度評分在[40,60)內的頻率為(0.015+0.020)×10=0.35,在[60,70)內的頻率為0.025×10=0.25,所以甲地區用戶滿意度評分的中位數m1=60+×10=66,平均數=45×0.015×10+55×0.020×10+65×0.025×10+75×0.020×10+85×0.010×10+95×0.010×10=67.乙地區用戶滿意度評分在[50,70)內的頻率為(0.005+0.020)×10=0.25,在[70,80)內的頻率為0.035×10=0.35,所以乙地區用戶滿意度評分的中位數m2=70+×10≈77.1,平均數=55×0.005×10+65×0.020×10+75×0.035×10+85×0.025×10+95×0.015×10=77.5.所以m116.(12分)對某校高三年級學生參加社區服務的次數進行統計,隨機抽取M名學生,得到這M名學生參加社區服務的次數,根據此數據作出頻率分布表和頻率分布直方圖如圖所示:分組 頻數 頻率[10,15) 10 0.25[15,20) 24 n[20,25) m p[25,30] 2 0.05合計 M 1(1)求出表中M,p及圖中a的值;(4分)(2)若該校有高三學生240人,試估計該校高三學生參加社區服務的次數在區間[10,15)內的人數;(4分)(3)估計該校高三年級學生參加社區服務次數的平均數.(4分)解 (1)由分組[10,15)內的頻數是10,頻率是0.25,知=0.25,所以M=40.所以10+24+m+2=40,解得m=4,所以p===0.10,a==0.12.(2)估計該校高三學生參加社區服務的次數在區間[10,15)內的人數為0.25×240=60.(3)因為n==0.60,又12.5×0.25+17.5×0.60+22.5×0.10+27.5×0.05=17.25.所以估計該校高三年級學生參加社區服務次數的平均數是17.25.5.1.4 用樣本估計總體[學習目標] 1.正確理解樣本數據標準差的意義和作用,學會計算數據的標準差.2.能根據實際問題的需要合理地選取樣本,從樣本數據中提取基本的數字特征(如平均數、標準差),并做出合理的解釋.3.會用樣本的基本數字特征估計總體的基本數字特征.一、用樣本的數字特征估計總體的數字特征知識梳理1.用樣本的數字特征估計總體的數字特征(1)一般情況下,如果樣本的容量 ,抽樣方法又 的話,樣本的特征能夠反映總體的特征.特別地,樣本平均數(也稱為樣本均值)、方差(也稱為樣本方差)與總體對應的值相差不會太大. (2)在容許一定誤差存在的前提下,可以用 的數字特征去估計總體的數字特征,這樣就能節省人力和物力等. 另外,有時候總體的數字特征不可能獲得,此時只能用樣本的數字特征去估計總體的數字特征.2.眾數、中位數、平均數眾數 在頻率分布直方圖中,眾數是最高小矩形的中點所對應的數據中位數 (1)在頻率分布直方圖中,中位數左邊和右邊的直方圖面積相等,由此可以估計中位數的值,但是有偏差 (2)表示樣本數據所占頻率的等分線平均數 (1)在頻率分布直方圖中,平均數等于每個小矩形的面積乘以小矩形底邊中點的橫坐標之和 (2)平均數是頻率分布直方圖的重心,是頻率分布直方圖的平衡點例1 甲、乙兩人在相同條件下各打靶10次,每次打靶的成績情況如圖所示.(1)填寫下表;平均數 方差 中位數 命中9環及以上甲 7 1.2 1乙 5.4 3(2)請從四個不同的角度對這次測試進行分析:①從平均數和方差結合分析偏離程度;②從平均數和中位數結合分析誰的成績好些;③從平均數和命中9環及以上的次數相結合看誰的成績好些;④從折線圖上兩人射擊命中環數及走勢分析誰更有潛力.跟蹤訓練1 某西餐廳推出了以下線上促銷活動.A套餐(在下列食品中6選2)西式面點:蔓越莓核桃包、南瓜芝士包、黑列巴、全麥吐司.中式面點:豆包、桂花糕.B套餐:醬牛肉、老味燒雞熟食類組合.某一周兩種套餐的日銷售量(單位:份)如表所示.星期一 星期二 星期三 星期四 星期五 星期六 星期日A套餐 11 12 14 18 22 19 23B套餐 6 13 15 15 37 20 41根據上面一周的銷量,分別計算A套餐和B套餐銷量的平均數和方差,并根據所得數據評價兩種套餐的銷售情況.二、分層抽樣的平均數、方差知識梳理假設第一層有m個數,分別為x1,x2,…,xm,平均數為,方差為s2;第二層有n個數,分別為y1,y2,…,yn,平均數為,方差為t2.如果記樣本均值為,樣本方差為b2,則==,b2==.例2 (多選)某分層抽樣中,有關數據如表所示.樣本量 平均數 方差第1層 45 4 2第2層 35 8 1第3層 10 6 3則下列敘述正確的是(結果保留兩位小數) ( )A.第1,2層所有數據的均值為5.75B.第1,2層所有數據的方差為1.50C.第1,2,3層所有數據的均值約為7.68D.第1,2,3層所有數據的方差約為5.23反思感悟 運用公式求分層抽樣的均值與方差時要注意(1)清楚公式中各個符號的含義,避免代入數據混亂.(2)運算要格外仔細,并按要求保留有效小數.跟蹤訓練2 某培訓機構在假期招收了A,B兩個數學補習班,A班10人,B班30人,經過一周的補習后進行了一次測試,在該測試中,A班的平均成績為130分,方差為115,B班的平均成績為110分,方差為215.求在這次測試中全體學生的平均成績和方差.三、用樣本的分布來估計總體的分布知識梳理1.同數字特征的估計一樣,分布的估計一般也有誤差.如果總體在每一個分組的頻率記為π1,π2,…,πn,樣本在每一組對應的頻率記為p1,p2,…,pn,一般來說,= 不等于零.同樣,大數定律可以保證,當樣本的容量越來越大時,上式很小的可能性將越來 . 2.用樣本的分布來估計總體的分布如果樣本的容量恰當,抽樣方法又合理的話,樣本的分布與總體分布會差不多,特別地,每一組的頻率與總體對應的頻率相差不會太大.例3 某校從參加高一年級期末考試的學生中抽出60名,將其物理成績(均為整數)分成六段[40,50),[50,60),…,[90,100]后畫出如圖所示的頻率分布直方圖.觀察圖中的信息,回答下列問題:(1)估計這次考試的物理成績的眾數m與中位數n(結果保留一位小數);(2)估計這次考試的物理成績的及格率(60分及以上為及格)和平均分.反思感悟 利用直方圖求眾數、中位數、平均數均為近似值,往往與實際數據得出的不一致,但它們能比較準確地估計其眾數、中位數和平均數.跟蹤訓練3 某城市一入城交通路段限速60公里/小時,現對某時段通過該交通路段的n輛小汽車車速進行統計,并繪制成頻率分布直方圖(如圖).若這n輛小汽車中,速度在50~60公里/小時之間的車輛有200輛.(1)求n的值;(2)估計這n輛小汽車車速的平均數、中位數.1.知識清單:(1)樣本的數字特征.(2)用樣本的數字特征估計總體的數字特征.(3)用樣本的分布來估計總體的分布.2.方法歸納:數據處理.3.常見誤區:樣本的數字特征只能估計總體的數字特征,不能替代總體.1.某校學生的男女人數之比為2∶3,按照男女比例通過分層抽樣的方法抽到一個樣本,樣本中男生每天運動時間的平均數為100分鐘、女生為80分鐘.結合此數據,估計該校全體學生每天運動時間的平均數為 ( )A.98分鐘 B.88分鐘C.90分鐘 D.85分鐘2.如圖是某學校的教研處根據調查結果繪制的本校學生每天放學后的自學時間情況的頻率分布直方圖.根據頻率分布直方圖,則自學時間的中位數和眾數的估計值分別是(精確到0.01) ( )A.2.20,2.25 B.2.29,2.20C.2.29,2.25 D.2.25,2.253.某校甲、乙兩個班共70人(甲班40人,乙班30人)參加了某知識競賽,甲班的平均成績為77分,方差為123,乙班的平均成績為70分,方差為130,則甲、乙兩班全部同學的成績的方差為 ( )A.74 B.128C.138 D.1364.某中學為了解學生數學課程的學習情況,在2 200名學生中隨機抽取200名,并統計這200名學生的某次數學考試成績,得到了樣本的頻率分布直方圖(如圖).根據頻率分布直方圖推測這2 200名學生在該次數學考試中成績不低于80分的學生有 人. 答案精析知識梳理1.(1)恰當 合理 (2)樣本例1 解 (1)乙的射靶環數依次為2,4,6,8,7,7,8,9,9,10,所以=×(2+4+6+8+7+7+8+9+9+10)=7;乙的射靶環數從小到大排列為2,4,6,7,7,8,8,9,9,10,所以中位數是=7.5;甲的射靶環數從小到大排列為5,6,6,7,7,7,7,8,8,9,所以中位數為7.于是填充后的表格如下表所示.平均數 方差 中位數 命中9環及以上甲 7 1.2 7 1乙 7 5.4 7.5 3(2)①甲、乙的平均數相同,均為7,但<,說明甲偏離平均數的程度小,而乙偏離平均數的程度大.②甲、乙的平均數相同,而乙的中位數比甲大,說明乙射靶成績比甲好.③甲、乙的平均數相同,而乙命中9環及以上的次數比甲多2次,可知乙的射靶成績比甲好.④從折線圖上看,乙的成績呈上升趨勢,而甲的成績在平均線上波動不大,說明乙的狀態在提升,更有潛力.跟蹤訓練1 解 A套餐銷量的平均數=×(11+12+14+18+22+19+23)=17,方差=×(62+52+32+12+52+22+62)=.B套餐銷量的平均數=×(6+13+15+15+37+20+41)=21,方差=×(152+82+62+62+162+12+202)=.因為<<,所以該周銷量中A套餐比B套餐平均銷量低,但A套餐的銷量比B套餐相對穩定.例2 AD [第1,2層所有數據的均值為=×4+×8=5.75,A正確;第1,2層所有數據的方差為=×+×=5.5,B不正確;第1,2,3層所有數據的均值為=×4+×8+×6≈5.78,C不正確;第1,2,3層所有數據的方差約為s2=×+×+×≈5.23,D正確.]跟蹤訓練2 解 依題意=130,=115,=110,=215,∴=×130+×110=115,∴全體學生的平均分為115分.全體學生成績的方差為s2=[+(-)2]+[+(-)2]=×(115+225)+×(215+25)=85+180=265.知識梳理1.[(π1-p1)2+(π2-p2)2+…+(πn-pn)2] 越大例3 解 (1)眾數是頻率分布直方圖中最高小矩形底邊中點的橫坐標,所以眾數m=75.0.前3個小矩形面積之和為0.01×10+0.015×10+0.015×10=0.4<0.5,前4個小矩形面積之和為0.4+0.03×10=0.7>0.5,所以中位數n=70+≈73.3.(2)依題意得,60及60以上的分數在第三、四、五、六組,頻率和為(0.015+0.03+0.025+0.005)×10=0.75,所以估計這次考試的物理成績的及格率是75%.利用組中值估算抽樣學生的平均分為45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71.則估計這次考試物理成績的平均分是71分.跟蹤訓練3 解 (1)由直方圖可知,速度在50~60公里/小時之間的頻率為0.040×10=0.4,所以=500,即n=500.(2)這n輛小汽車車速的平均數的估計值為25×0.06+35×0.1+45×0.3+55×0.4+65×0.1+75×0.04=50.設這n輛小汽車車速的中位數為x,則0.006×10+0.010×10+0.030×10+0.040×(x-50)=0.5,解得x=51.所以這n輛小汽車車速的平均數為50公里/小時,中位數為51公里/小時.隨堂演練1.B 2.C 3.C 4.616 展開更多...... 收起↑ 資源列表 5.1.4 用樣本估計總體 學案 高中數學 人教B版 必修第二冊.docx 5.1.4 用樣本估計總體 教案 高中數學 人教B版 必修第二冊.docx 縮略圖、資源來源于二一教育資源庫