資源簡介 中小學教育資源及組卷應用平臺專題四十二 統計知識歸納一、抽樣1、抽樣調查(1)總體:統計中所考察對象的某一數值指標的全體構成的集合稱為總體.(2)個體:構成總體的每一個元素叫做個體.(3)樣本:從總體中抽取若干個個體進行考察,這若干個個體所構成的集合叫做總體的一個樣本,樣本中個體的數目叫做樣本容量.2、簡單隨機抽樣(1)定義一般地,設一個總體含有個個體,從中逐個不放回地抽取個個體作為樣本(),如果每次抽取時總體內的各個個體被抽到的機會都相等,就把這種抽樣方法叫做簡單隨機抽樣.這樣抽取的樣本,叫做簡單隨機樣本.(2)兩種常用的簡單隨機抽樣方法①抽簽法:一般地,抽簽法就是把總體中的個個體編號,把號碼寫在號簽上,將號簽放在一個容器中,攪拌均勻后,每次從中抽取一個號簽,連續抽取次,就得到一個容量為的樣本.②隨機數法:即利用隨機數表、隨機數骰子或計算機產生的隨機數進行抽樣.這里僅介紹隨機數表法.隨機數表由數字,,,…,組成,并且每個數字在表中各個位置出現的機會都是一樣的.注意:為了保證所選數字的隨機性,需在查看隨機數表前就指出開始數字的橫、縱位置.(3)抽簽法與隨機數法的適用情況抽簽法適用于總體中個體數較少的情況,隨機數法適用于總體中個體數較多的情況,但是當總體容量很大時,需要的樣本容量也很大時,利用隨機數法抽取樣本仍不方便.(4)簡單隨機抽樣的特征①有限性:簡單隨機抽樣要求被抽取的樣本的總體個數是有限的,便于通過樣本對總體進行分析.②逐一性:簡單隨機抽樣是從總體中逐個地進行抽取,便于實踐中操作.③不放回性:簡單隨機抽樣是一種不放回抽樣,便于進行有關的分析和計算.④等可能性:簡單單隨機抽樣中各個個體被抽到的機會都相等,從而保證了抽樣方法的公平.只有四個特點都滿足的抽樣才是簡單隨機抽樣.3、分層抽樣(1)定義一般地,在抽樣時,將總體分成互不交叉的層,然后按照一定的比例,從各層獨立地抽取一定數量的個體,將各層取出的個體合在一起作為樣本,這種抽樣方法叫做分層抽樣.分層抽樣適用于已知總體是由差異明顯的幾部分組成的.(2)分層抽樣問題類型及解題思路①求某層應抽個體數量:按該層所占總體的比例計算.②已知某層個體數量,求總體容量或反之求解:根據分層抽樣就是按比例抽樣,列比例式進行計算.③分層抽樣的計算應根據抽樣比構造方程求解,其中“抽樣比==”注意:分層抽樣時,每層抽取的個體可以不一樣多,但必須滿足抽取()個個體(其中是層數,是抽取的樣本容量,是第層中個體的個數,是總體容量).(3)分層隨機抽樣的方差設樣本容量為,平均數為,其中兩層的個體數量分別為,兩層的平均數分別為,,方差分別為,則這個樣本的方差為二、用樣本估計總體1、頻率分布直方圖(1)頻率、頻數、樣本容量的計算方法①×組距=頻率.②=頻率,=樣本容量,樣本容量×頻率=頻數.③頻率分布直方圖中各個小方形的面積總和等于.2、頻率分布直方圖中數字特征的計算(1)最高的小長方形底邊中點的橫坐標即是眾數.(2)中位數左邊和右邊的小長方形的面積和是相等的.設中位數為,利用左(右)側矩形面積之和等于,即可求出.(3)平均數是頻率分布直方圖的“重心”,等于頻率分布直方圖中每個小長方形的面積乘以小長方形底邊中點的橫坐標之和,即有,其中為每個小長方形底邊的中點,為每個小長方形的面積.3、百分位數(1)定義一組數據的第百分位數是這樣一個值,它使得這組數據中至少有的數據小于或等于這個值,且至少有的數據大于或等于這個值.(2)計算一組個數據的的第百分位數的步驟①按從小到大排列原始數據.②計算.③若不是整數而大于的比鄰整數,則第百分位數為第項數據;若是整數,則第百分位數為第項與第項數據的平均數.(3)四分位數我們之前學過的中位數,相當于是第百分位數.在實際應用中,除了中位數外,常用的分位數還有第百分位數,第百分位數.這三個分位數把一組由小到大排列后的數據分成四等份,因此稱為四分位數.4、樣本的數字特征(1)眾數、中位數、平均數①眾數:一組數據中出現次數最多的數叫眾數,眾數反應一組數據的多數水平.②中位數:將一組數據按大小順序依次排列,把處在最中間位置的一個數據(或最中間兩個數據的平均數)叫做這組數據的中位數,中位數反應一組數據的中間水平.③平均數:個樣本數據的平均數為,反應一組數據的平均水平,公式變形:.5、標準差和方差(1)定義①標準差:標準差是樣本數據到平均數的一種平均距離,一般用表示.假設樣本數據是,表示這組數據的平均數,則標準差.②方差:方差就是標準差的平方,即.顯然,在刻畫樣本數據的分散程度上,方差與標準差是一樣的.在解決實際問題時,多采用標準差.(2)數據特征標準差、方差描述了一組數據圍繞平均數波動程度的大小.標準差、方差越大,則數據的離散程度越大;標準差、方差越小,數據的離散程度越小.反之亦可由離散程度的大小推算標準差、方差的大小.(3)平均數、方差的性質如果數據的平均數為,方差為,那么①一組新數據的平均數為,方差是.②一組新數據的平均數為,方差是.③一組新數據的平均數為,方差是.典例分析題型一、隨機抽樣、分層抽樣【例1-1】現要完成下列2項抽樣調查:①從10盒酸奶中抽取3盒進行食品衛生檢查;②東方中學共有160名教職工,其中教師120名,行政人員16名,后勤人員24名.為了了解教職工對學校在校務公開方面的意見,擬抽取一個容量為20的樣本.較為合理的抽樣方法是( )A.①抽簽法,②分層隨機抽樣 B.①隨機數法,②分層隨機抽樣C.①隨機數法,②抽簽法 D.①抽簽法, ②隨機數法【答案】A【解析】①總體較少,宜用抽簽法;②各層間差異明顯,宜用分層隨機抽樣.【例1-2】某工廠為了對產品質量進行嚴格把關,從500件產品中隨機抽出50件進行檢驗,對這500件產品進行編號001,002,…,500,從下列隨機數表的第二行第三組第一個數字開始,每次從左往右選取三個數字,則抽到第四件產品的編號為( )2839 3125 8395 9524 7232 89957216 2884 3660 1073 4366 75759436 6118 4479 5140 9694 95926017 4951 4068 7516 3241 4782A.447 B.366 C.140 D.118【答案】A【解析】從第二行第三組第一個數字開始,每次從左往右選取三個數字,依次可得: 366,010,118,447,….【例1-3】為了慶祝中國共產黨第二十次全國代表大會,學校采用按比例分配的分層隨機抽樣的方法從高一1002人,高二1002人,高三1503人中抽取126人觀看“中國共產黨第二十次全國代表大會”直播,那么高三年級被抽取的人數為( )A.36 B.42 C.50 D.54【答案】D【解析】根據分層抽樣的方法,抽樣比為,高三年級被抽取的人數為人.故選:D.【例1-4】某校共2017名學生,其中每名學生至少要選A,B兩門課中的一門,也有些學生選了兩門課.已知選A的人數占全校人數的百分比在到之間,選B的人數占全校人數的百分比在到之間.則下列結論中正確的是( )A.同時選A,B的可能有200人 B.同時選A,B的可能有300人C.同時選A,B的可能有400人 D.同時選A,B的可能有500人【答案】BC【解析】根據題意,同時選A,B的人數在到之間,換算成人數為202到403之間,因此符合題意的選項有B,C.【例1-5】在二戰期間,技術先進的德國坦克使德軍占據了戰場主動權,了解德軍坦克的生產能力對盟軍具有非常重要的戰略意義,盟軍請統計學家參與情報的收集和分析工作.在繳獲的德軍坦克上發現每輛坦克都有獨一無二的發動機序列號,前6位表示生產的年月,最后4位是按生產順序開始的連續編號.統計學家將繳獲的德軍坦克序列號作為樣本,用樣本估計總體的方法推斷德軍每月生產的坦克數.假設德軍某月生產的坦克總數為N,繳獲的該月生產的n輛坦克編號從小到大為,,,,繳獲的坦克是從所生產的坦克中隨機獲取的,繳獲坦克的編號,,,,相當于從中隨機抽取的n個整數,這個數將區間分成個小區間(如圖).可以用前個區間的平均長度估計所有個區間的平均長度,進而得到的估計.如果繳獲的坦克編號為:35,67,90,127,185,245,287.則可以估計德軍每月生產的坦克數為( ) A.288 B.308 C.328 D.348【答案】C【解析】,解得.可以估計德軍每月生產的坦克數大約是328.題型二、統計圖表【例2-1】(多選題)恩格爾系數是食品支出總額占個人消費支出總額的比重,它在一定程度上可以用來反映人民生活水平.恩格爾系數的一般規律:收入越低的家庭,恩格爾系數就越大;收入越高的家庭,恩格爾系數就越小.國際上一般認為,當恩格爾系數大于0.6時,居民生活處于貧困狀態;在0.5-0.6之間,居民生活水平處于溫飽狀態;在0.4-0.5之間,居民生活水平達到小康;在0.3-0.4之間,居民生活水平處于富裕狀態;當小于0.3時,居民生活達到富有.下面是某地區2022年兩個統計圖,它們分別為城鄉居民恩格爾系數統計圖和城鄉居民家庭人均可支配收入統計圖,請你依據統計圖進行分析判斷,下列結論錯誤的是( ) A.農村居民自2017年到2021年,居民生活均達到富有B.近五年城鄉居民家庭人均可支配收入差異最大的年份是2020年C.城鄉居民恩格爾系數差異最小的年份是2019年D.2022年該地區城鎮居民和農村居民的生活水平已經全部處于富有狀態【答案】ABD【解析】對于A項,由圖1可知2021年農村居民的恩格爾系數為0.316,居民生活水平處于富裕狀態,故A項錯誤;對于B項,根據圖2計算出的2017至2021年近五年城鄉居民家庭人均可支配收入差分別為37270元,38344元,39285元,40360元,40915元,差異最大的年份是2021年,故B項錯誤;對于C項,根據圖1計算出的2017至2021年近五年城鄉居民恩格爾系數差(%)分別為5.6,4.3,3.9,4.3,5.5,差異最小的年份是2019年,故C項正確;對于D項,根據給出的數據不足以判斷是否正確,故D項錯誤.【例2-2】(多選題)2022年的夏季,全國多地迎來罕見極端高溫天氣.某課外小組通過當地氣象部門統計了當地七月份前20天每天的最高氣溫與最低氣溫,得到如下圖表,則根據圖表,下列判斷正確的是( ) A.七月份前20天最低氣溫的中位數低于25℃B.七月份前20天中最高氣溫的極差大于最低氣溫的極差C.七月份前20天最高氣溫的平均數高于40℃D.七月份前10天(1—10日)最高氣溫的方差大于最低氣溫的方差【答案】BD【解析】七月份前20天中,最低氣溫低于℃的天數不超過9天,故中位數不可能低于℃,故 A錯誤;最高氣溫的最大值大于℃,最小值低于℃,而最低氣溫的最大值小于℃,最小值接近℃,故最高氣溫的極差大于最低氣溫的極差,故B正確;最高氣溫超過℃的天數不超過5天,且最大值不超過℃,故平均數不可能高于℃,故C錯誤;前10天中,最低氣溫的分布更集中,故最高氣溫的方差大于最低氣溫的方差,故D正確.【例2-3】某市教育局為得到高三年級學生身高的數據,對高三年級學生進行抽樣調查,隨機抽取了名學生,他們的身高都在,,,,五個層次內,分男、女生統計得到以下樣本分布統計圖,則( )A.樣本中層次的女生比相應層次的男生人數多B.估計樣本中男生身高的中位數比女生身高的中位數大C.層次的女生和層次的男生在整個樣本中頻率相等D.樣本中層次的學生數和層次的學生數一樣多【答案】B【解析】設樣本中女生有人,則男生有人,設女生身高頻率分布直方圖中的組距為由頻率分布直方圖的性質可得,所以,所以女生身高頻率分布直方圖中層次頻率為20%,層次頻率為30%,層次頻率為25%,層次頻率為15%,層次頻率為10%所以樣本中層次的女生人數為,男生人數為,由于的取值未知,所以無法比較層次中男,女生人數,A錯誤;層次女生在女生樣本數中頻率為15%,所以在整個樣本中頻率為,層次男生在男生樣本數中頻率為15%,所以在整個樣本中頻率為,由于的取值未知,所以無法比較層次的女生和層次的男生在整個樣本中頻率,C錯誤;樣本中層次的學生數為,樣本中層次的學生數為,由于的取值未知,所以無法比較樣本中層次的學生數和層次的學生數的大小,D錯,女生中,兩個層次的頻率之和為50%,所以女生的樣本身高中位數為,層次的分界點,而男生,兩個層次的頻率之和為35%,,,兩個層次的頻率之和為65%,顯然中位數落在C層次內,所以樣本中男生身高的中位數比女生身高的中位數大,B正確.【例2-4】如圖1為某省2019年1~4月份快遞業務量統計圖,圖2為該省2019年1~4月份快遞業務收入統計圖,對統計圖理解不正確的是( )A.2019年1~4月份快遞業務量3月份最高,2月份最低,差值接近2000萬件B.從1~4月份來看,業務量與業務收入有波動,但整體保持高速增長C.從兩圖中看,增量與增長速度并不完全一致,但業務量與業務收入變化高度一致D.2019年1~4月份快遞業務量同比增長率均超過50%,在3月份最高,和春節后網購迎來噴漲有關【答案】B【解析】從圖(1)的柱形圖可得2019年1~4月份快遞業務量3月份最高,2月份最低,3月份比2月份高4397-2411=1986,差值接近2000萬件,故A正確.從1~4月份來看,業務量與業務收入有波動,結合圖(1)(2)中的柱形圖可得業務量與業務收入在2月份和4月份均下降,故B錯誤.從兩圖中柱狀圖可得業務量與業務收入變化高度一致,但業務量2月份同比增長,而業務收入2月份同比增長,因此增量與增長速度并不完全一致,故C正確.從圖(1)中可得2019年1~4月份快遞業務量同比增長率均超過50%,在3月份最高,這的確和春節后網購迎來噴漲有關,故D正確.故選:B.【例2-4】(多選題)某公司統計了2023年1月至6月的月銷售額(單位:萬元),并與2022年比較,得到同比增長率數據,繪制了如圖所示的統計圖,則下列說法正確的是( )注:同比增長率=(今年月銷售額一去年同期月銷售額)÷去年同期月銷售額. A.2023年1月至6月的月銷售額的極差為8B.2023年1月至6月的月銷售額的第60百分位數為8C.2023年1月至6月的月銷售額的中位數為9.5D.2022年5月的月銷售額為10萬元【答案】ACD【解析】對于A,2023年1月至6月的月銷售額的最大值是14,最小值是6,極差為8,故A正確;對于B,六個數從小到大排列為,因為,所以2023年1月至6月的月銷售額的第60百分位數為第四個數11,故B錯誤;對于C,2023年1月至6月的月銷售額的中位數為9.5,故C正確;對于D,設2022年5月的月銷售額為萬元,則,解得,故D正確.【例2-5】(多選題)某公司經營五種產業,為應對市場變化,在五年前進行了產業結構調整,優化后的產業結構使公司總利潤不斷增長,今年總利潤比五年前增加了一倍,調整前后的各產業利潤與總利潤的占比如圖所示,則下列結論錯誤的是( ) A.調整后傳媒的利潤增量小于雜志B.調整后房地產的利潤有所下降C.調整后試卷的利潤增加不到一倍D.調整后圖書的利潤增長了一倍以上【答案】ABC【解析】設調整前的各產業利潤的總和為,則調整后的各產業利潤的總和為.對于選項A,調整前傳媒的利潤為,雜志的利潤為,調整后傳媒的利潤為,雜志的利潤為,則調整后傳媒的利潤增量為,雜志的利潤增量為,故選項A不正確;對于選項B,調整前房地產的利潤為,調整后房地產的利潤為,故選項B不正確;對于選項C,調整前試卷的利潤為,調整后試卷的利潤為,且,故選項C不正確;對于選項D,調整前圖書的利潤為,調整后圖書的利潤為,且,故選項D正確.故選:ABC.【例2-6】(多選題)某調查機構對我國若干大型科技公司進行調查統計,得到了從事芯片、軟件兩個行業從業者的年齡分布的餅形圖和“90后”從事這兩個行業的崗位分布雷達圖,則下列說法中一定正確的是( ) A.芯片、軟件行業從業者中,“90后”占總人數的比例超過B.芯片、軟件行業中從事技術、設計崗位的“90后”人數超過總人數的C.芯片、軟件行業從事技術崗位的人中,“90后”比“80后”多D.芯片、軟件行業中,“90后”從事市場崗位的人數比“80前”的總人數多【答案】ABD【解析】A選項,從餅形圖可看出芯片、軟件行業從業者中,“90后”占總人數的比例為,超過,A正確;B選項,芯片、軟件行業中從事技術、設計崗位的“90后”人數比例為,超過總人數的,B正確;C選項,芯片、軟件行業從事技術崗位的人中,“90后”人數占比為,芯片、軟件行業從業者中“80后”占總人數的,但不知道從事技術崗位的比例,故無法確定兩者人數的多少,C錯誤;D選項,芯片、軟件行業中,“90后”從事市場崗位的人數占比為,“80前”占總人數的,故D正確.【例2-7】(多選題)某地環保部門公布了該地兩個景區2016年至2022年各年的全年空氣質量優良天數的數據.現根據這組數據繪制了如圖所示的散點圖,則由該圖得出的下列結論中正確的是( ) A.景區A這7年的空氣質量優良天數的中位數為254B.景區這7年的空氣質量優良天數的第80百分位數為280C.這7年景區A的空氣質量優良天數的標準差比景區的空氣質量優良天數的標準差大D.這7年景區A的空氣質量優良天數的平均數比景區的空氣質量優良天數的平均數大【答案】AC【解析】由圖可得:景區A這7年的空氣質量優良天數排序得:203,217,254,254,293,301,313;景區B這7年的空氣質量優良天數排序得:255,262,262,266,280,283,293;對于選項A:景區A這7年的空氣質量優良天數的中位數為254,故A正確;對于選項B:因為,則第80百分位數為第6個數,為283,故B錯誤;對于選項C:由圖可知:景區A的空氣質量優良天數的數據波動比景區的空氣質量優良天數的數據波動大,所以景區A的空氣質量優良天數的標準差比景區的空氣質量優良天數的標準差大,故C正確;對于選項D:景區A的空氣質量優良天數的平均值,景區B的空氣質量優良天數的平均值,因為,即,所以這7年景區A的空氣質量優良天數的平均數比景區的空氣質量優良天數的平均數小,故D錯誤.【例2-8】某中學在2021年高考分數公布后對高三年級各班的成績進行分析.經統計,某班有50名同學,總分都在區間內,將得分區間平均分成5組,統計頻數、頻率后,得到了如圖所示的“頻率分布”折線圖.(1)請根據頻率分布折線圖,畫出頻率分布直方圖,并根據頻率分布直方圖估計該班級的平均分;(2)經相關部門統計,高考分數以上的考生獲得高校T“強基計劃”入圍資格,并制作高校T錄取政策和考生錄取預測統計表(如表所示).第一輪筆試有2科,學生通過考試獲得相應等級的事件相互獨立且概率相同.高考分數第一輪筆試 學科測試等級 A B C A B C學生通過考試獲得相應等級概率第二輪面試 入圍條件 至少有1科,且2科均不低于B錄取條件 全 在第一輪筆試中2科均獲得通過第二輪面試 考生通過概率為 考生通過概率為若該班級考分前10名都已經報考了高校T的“強基計劃”,且恰有2人成績高于690分.求:①總分高于690分的某位同學沒有進入第二輪的概率;②該班恰有兩名同學通過“強基計劃”被高校T錄取的概率.【解析】(1)畫出頻率分布直方圖如下圖所示:平均分為:.(2)總分大于等于分的同學有人,其中有人小于等于分,人大于分.①.②設高于分的同學被高校錄取為事件,不超過分的同學被高校錄取為事件,則,.題型三、頻率分布直方圖【例3-1】某區為了解全區名高二學生的體能素質情況,在全區高二學生中隨機抽取了名學生進行體能測試,并將這名的體能測試成績整理成如下頻率分布直方圖.根據此頻率分布直方圖,這名學生平均成績的估計值為 . 【答案】【解析】由于頻率分布直方圖中所有矩形面積之和為,可得,解得,由頻率分布直方圖可知,這名學生平均成績的估計值為分.【例3-2】某大學有男生名.為了解該校男生的身體體重情況,隨機抽查了該校名男生的體重,并將這名男生的體重(單位:)分成以下六組:、、、、、,繪制成如下的頻率分布直方圖:該校體重(單位:)在區間上的男生大約有 人.【答案】【解析】由頻率分布直方圖可知,在區間上的男生的人數為.【例3-3】2022年12月4日是第九個國家憲法日,主題為“學習宣傳貫徹黨的二十大精神,推動全面貫徹實施憲法”,某校由學生會同學制作了憲法學習問卷,收獲了有效答卷2000份,先對其得分情況進行了統計,按照、、…、分成5組,并繪制了如圖所示的頻率分布直方圖,則圖中 .【答案】0.020【解析】由頻率分布直方圖的性質可得,.【例3-4】從某小學所有學生中隨機抽取100名學生,將他們的身高(單位:cm)數據繪制成頻率分布直方圖(如圖),其中樣本數據分組,,,,,若要從身高在,,三組內的學生中,用分層抽樣的方法抽取12人參加一項活動,則從身高在內的學生中抽取的人數應為 .【答案】【解析】依題意,解得,所以,,三組的頻率分別為,所以從身高在內的學生中抽取的人數應為人.題型四、百分位數【例4-1】以下數據為參加數學競賽決賽的15人的成績(單位:分),分數從低到高依次:,則這15人成績的第80百分位數是 .【答案】90.5【解析】因為,故這15人成績的第80百分位數為.【例4-2】某校為了了解高三年級學生的身體素質狀況,在開學初舉行了一場身體素質體能測試,以便對體能不達標的學生進行有針對性的訓練,促進他們體能的提升,現從整個年級測試成績中抽取100名學生的測試成績,并把測試成績分成六組,繪制成頻率分布直方圖(如圖所示).其中分數在這一組中的縱坐標為,則該次體能測試成績的分位數約為 分.【答案】92【解析】由頻率分布直方圖知,由得:.因為,所以該次體能測試成績的分位數落在內,設其為,則由,解得.【例4-3】為了養成良好的運動習慣,某人記錄了自己一周內每天的運動時長(單位:分鐘),分別為53,57,45,61,79,49,x,若這組數據的第80百分位數與第60百分位數的差為3,則( )A.58或64 B.59或64 C.58 D.59【答案】A【解析】將已知的6個數從小到大排序為45,49,53,57,61,79.若,則這組數據的第80百分位數與第60百分位數分別為61和57,他們的差為4,不符合條件;若,則這組數據的第80百分位數與第60百分位數分別為79和61,它們的差為18,不符合條件;若,則這組數據的第80百分位數與第60百分位數分別為x和61(或61和x),則,解得或.【例4-4】洞庭濕地保護區于長江中游的湖南省,面積168000公頃,為了保護該濕地保護區內的漁業資源和生物多樣性,從2003年起全面實施禁漁期制度.該濕地保護區的漁業資源科學研究培殖了一批珍稀類銀魚魚苗,從中隨機抽取100尾測量魚苗的體長(單位:毫米),所得的數據如下表:分組(單位:毫米)頻數 10 10 m 35 15 n若依上述6組數據繪制的頻率分布直方圖中,分組對應小矩形的高為0.01,則該樣本中的分位數的銀魚魚苗的體長為(保留一位小數)( )A.87毫米 B.88毫米 C.90.5毫米 D.93.3毫米【答案】D【解析】由題意可知, 內的頻率為0.05 ,所以, ,魚苗體長在 內的頻率為0.80 ,在 內的頻率為0.95,所以 90%分位數在區間 內,大小為 .故選:D【解題方法總結】計算一組個數據的的第百分位數的步驟①按從小到大排列原始數據.②計算.③若不是整數而大于的比鄰整數,則第百分位數為第項數據;若是整數,則第百分位數為第項與第項數據的平均數.題型五、樣本的數字特征【例5-1】(多選題)有一組樣本數據:,其平均數為2,由這組樣本數據得到新樣本數據:,那么這兩組樣本數據一定有相同的( )A.平均數 B.中位數 C.方差 D.極差【答案】AD【解析】對A,由題意得,則新的平均數,故A與原本相同;對B,舉例一組數據:1,1,1,1,2.4,2.6,3,4.滿足平均數為2,原中位數為,增加一個數據2后中位數變成了,故B錯誤;對C,舉例一組數據為1,2,2,2,2,2,2,3,其方差為,增加一個數據2后根據A中結論知平均數不變,則方差變為,故C錯誤;對D,根據平均數的概念知,當所有數據均相等時,取等;則增加一個數據2,極差不變,故D正確.【例5-2】(多選題)已知數據1:,,,,數據2:,,,,則下列統計量中,數據2不是數據1的兩倍的有( )A.平均數 B.極差 C.中位數 D.標準差【答案】AC【解析】設數據1:,,,,的均值為,標準差為s,中位數為,極差為則數據2:,,,,的均值為,故A錯誤,數據2:,,,,的標準差為,故B正確;數據2:,,,,的中位數為,故C錯誤;極差為,故D正確.【例5-3】“說文明話、辦文明事、做文明人,樹立城市新風尚!創建文明城市,你我共同參與!”為宣傳創文精神,華強實驗中學高一(2)班組織了甲乙兩名志愿者,利用一周的時間在街道對市民進行宣傳,將每天宣傳的次數繪制成如下頻數分布折線圖,則以下說法不正確的為( ) A.甲的眾數小于乙的眾數 B.乙的極差小于甲的極差C.甲的方差大于乙的方差 D.乙的平均數大于甲的平均數【答案】D【解析】由圖可知,甲志愿者的宣傳次數分別為:4,5,6,3,4,3,3,乙志愿者的宣傳次數分別為:5,4,4,5,4,3,3,甲的平均數為,乙的平均數為,故D錯誤,甲的眾數為3,乙的眾數為4,故甲的眾數小于乙的眾數,故A正確;甲的極差為3,乙的極差為2,則乙的極差小于甲的極差,故B正確;甲的方差為,乙的方差為,故甲的方差大于乙的方差,故C正確.【例5-4】某學校對班級管理實行量化打分,每周一總結,若一個班連續5周的量化打分不低于80分,則為優秀班級.下列能斷定該班為優秀班級的是( )A.某班連續5周量化打分的平均數為83,中位數為81B.某班連續5周量化打分的平均數為83,方差大于0C.某班連續5周量化打分的中位數為81,眾數為83D.某班連續5周量化打分的平均數為83,方差為1【答案】D【解析】若連續5周的量化打分數據為,滿足的條件,但第5周的打分低于80分,故A,B錯誤;若連續5周的量化打分數據為,滿足C的條件,但第5周的打分低于80分,C錯誤;根據方差公式,因為方差為,所以若存在一周的量化打分低于80分,則方差一定大于1,故能斷定該班為優秀班級,D正確.【例5-5】橙子輔導中學的高一 二 三這三個年級學生的平均身高分別為,若按年級采用分層抽樣的方法抽取了一個600人的樣本,抽到高一 高二 高三的學生人數分別為100 200 300,則估計該高中學生的平均身高為( )A. B. C. D.【答案】A【解析】設橙子輔導中學的總人數為,由題意知,高一 高二 高三的學生總人數分別為:,所以估計該高中學生的平均身高為:.【例5-6】根據氣象學上的標準,連續5天的日平均氣溫低于即為入冬,將連續5天的日平均溫度的記錄數據(記錄數據都是自然數)作為一組樣本,現有4組樣本①、②、③、④,依次計算得到結果如下:①平均數;②平均數且極差小于或等于3;③平均數且標準差;④眾數等于5且極差小于或等于4.則4組樣本中一定符合入冬指標的共有( )A.1組 B.2組 C.3組 D.4組【答案】B【解析】①舉反例:,,,,,其平均數.但不符合入冬指標;②假設有數據大于或等于10,由極差小于或等于3可知,則此組數據中的最小值為,此時數據的平均數必然大于7,與矛盾,故假設錯誤.則此組數據全部小于10. 符合入冬指標;③舉反例:1,1,1,1,11,平均數,且標準差.但不符合入冬指標;④在眾數等于5且極差小于等于4時,則最大數不超過9.符合入冬指標.【例5-7】數學興趣小組的四名同學各自拋擲骰子5次,分別記錄每次骰子出現的點數,四名同學的部分統計結果如下:甲同學:中位數為3,方差為2.8; 乙同學:平均數為3.4,方差為1.04;丙同學:中位數為3,眾數為3; 丁同學:平均數為3,中位數為2.根據統計結果,數據中肯定沒有出現點數6的是 同學.【答案】乙【解析】對于甲同學,當投擲骰子出現結果為1,2,3,3,6時,滿足中位數為3,平均數為:,方差為,可以出現點數6;對于乙同學,若平均數為3.4,且出現點數6,則方差,所以當平均數為3.4,方差為1.04時,一定不會出現點數6;對于丙同學,當擲骰子出現的結果為1,2,3,3,6時,滿足中位數為3,眾數為3,可以出現點數6;對于丁同學,當投擲骰子出現的結果為時,滿足平均數為,中位數為,可以出現點數.綜上,根據統計結果,數據中肯定沒有出現點數6的是乙同學.【例5-8】氣象意義上的春季進入夏季的標志為連續5天的日平均溫度不低于.現有甲、乙、丙三地連續5天的日平均氣溫的記錄數據(記錄數據都是正整數):①甲地:5個數據是中位數為24,眾數為22;②乙地:5個數據是中位數為27,總體均值為24;③丙地:5個數據中有一個數據是32,總體均值為26,總體方差為10.8則肯定進入夏季的地區有A.①②③ B.①③ C.②③ D.①【答案】B【解析】由統計知識①甲地:個數據的中位數為,眾數為可知①符合題意;而②乙地:個數據的中位數為,總體均值為中有可能某一天的氣溫低于,故不符合題意,③丙地:個數據中有一個數據是,總體均值為,總體方差為.若由有某一天的氣溫低于則總體方差就大于,故滿足題意,選C.【例5-9】已知一組數據的平均數是3,方差是2,則由這5個數據組成的新的一組數據的方差是( )A.4 B.6 C. D.【答案】C【解析】因為一組數據的平均數是3,方差是2,所以,,所以,,所以的平均數為,所以的方差為.【例5-10】(多選題)某環保局對轄區內甲、乙、丙、丁四個地區的環境治理情況進行檢查督導,若連續10天,每天空氣質量指數(單位:)不超過100,則認為該地區環境治理達標,否則認為該地區環境治理不達標.根據連續10天檢查所得數據的數字特征推斷,環境治理一定達標的地區是( )A.甲地區:平均數為80,方差為40 B.乙地區:平均數為50,眾數為40C.丙地區:中位數為50,極差為60 D.丁地區:極差為10,80%分位數為90【答案】AD【解析】設每天的空氣質量指數為,則方差.對于A選項,由,得,如果這10天中有1天的空氣質量指數超過100,則必有矛盾,所以這10天每天的空氣質量指數都不超過100,A正確.對于B選項,有天為40,有天為,有天為,此時:平均數為50,眾數為40,但該地區環境治理不達標,所以B選項錯誤.對于C選項,第天為,后面天為,此時中位數為50,極差為60,但該地區環境治理不達標,所以C選項錯誤.對于D選項,如果最大值超過100,根據極差為10,則最小值超過90,這與80%分位數為90矛盾,故最大值不超過100,D正確.【例5-11】現有甲、乙兩組數據,每組數據均由六個數組成,其中甲組數據的平均數為,方差為,乙組數據的平均數為,方差為.若將這兩組數據混合成一組,則新的一組數據的方差為( )A. B. C. D.【答案】D【解析】設甲組數據分別為、、、,乙組數據分別為、、、,甲組數據的平均數為,可得,方差為,可得,乙組數據的平均數為,可得,方差為,可得,混合后,新數據的平均數為,方差為.故選:D.【解題方法總結】(1)平均數、中位數、眾數描述其集中趨勢,方差和標準差描述波動大小.(2)方差的簡化計算公式:或寫成,即方差等于原數據平方的平均數減去平均數的平方.題型六、分層方差問題【例6-1】某車間有甲、乙兩臺機床同時加工直徑為的零件,為檢驗質量,從中各抽取6件,測得甲、乙兩組數據的均值為,兩組數據的方差分別為,,則估計該車間這批零件的直徑的方差 .【答案】/【解析】依題意,抽取的12件零件直徑的平均數,所以該車間這批零件的直徑的方差.故答案為:【例6-2】某校高二年級有男生400人和女生600人,為分析期末物理調研測試成績,按照男女比例通過分層隨機抽樣的方法取到一個樣本,樣本中男生的平均成績為80分,方差為10,女生的平均成績為60分,方差為20,由此可以估計該校高二年級期末物理調研測試成績的方差為 .【答案】【解析】由,不妨設樣本由男生2人和女生3人組成.由題設:,,解得,;,解得,;所以樣本的平均分,樣本的方差.【例6-3】為調查某地區中學生每天睡眠時間,采用樣本量比例分配的分層隨機抽樣,現抽取初中生800人,其每天睡眠時間均值為9小時,方差為0.5,抽取高中生1200人,其每天睡眠時間均值為8小時,方差為1,則估計該地區中學生每天睡眠時間的方差為 .【答案】【解析】該地區中學生每天睡眠時間的平均數為:(小時),該地區中學生每天睡眠時間的方差為:.故答案為:【例6-4】某校教師男女人數之比為5:4,該校所有教師進行1分鐘限時投籃比賽.現記錄了每個教師1分鐘命中次數,已知男教師命中次數的平均數為17,方差為16,女教師命中次數的平均數為8,方差為16,那么全體教師1分鐘限時投籃次數的方差為 .【答案】【解析】設男女人數分別為,則男女教師總命中次數分別為、,所以全體教師平均命中次數為,若男教師命中次數為,女教師命中次數為,所以,,全體教師1分鐘限時投籃次數的方差為,則,所以.故答案為:【例6-5】湖州地區甲、乙、丙三所學科基地學校的數學強基小組人數之比為,三所學校共有數學強基學生48人,在一次統一考試中,所有學生的成績平均分為117,方差為21.5.已知甲、乙兩所學校的數學強基小組學生的平均分分別為118和114,方差分別為15和21,則丙學校的學生成績的方差是 .【答案】12【解析】甲、乙、丙三所學科基地學校的數學強基小組人數之比為,三所學校共有數學強基學生48人,則甲校的數學強基小組人數24;乙校的數學強基小組人數為16;丙校的數學強基小組人數8,把甲校的數學強基小組學生的平均分記為,方差記為;把乙校的數學強基小組學生的平均分記為,方差記為;把丙校的數學強基小組學生的平均分記為,方差記為;把所有學生的平均分記為,方差記為.根據按比例分配分層隨機抽樣總樣本平均數與各層樣本平均數的關系,可得,即,解得,因此,,即,解得.【例6-6】已知一組數據,,,的平均值為,,刪去一個數之后,平均值沒有改變,方差比原來大4,則這組數據的個數 .【答案】9【解析】由題意刪去一個數之后,平均值沒有改變,所以刪除的數為5,由題意,得,刪除一個數后的方差為:得,即,故答案為:9【解題方法總結】分層隨機抽樣的方差設樣本容量為,平均數為,其中兩層的個體數量分別為,兩層的平均數分別為,,方差分別為,則這個樣本的方差為題型七、總體集中趨勢的估計【例7-1】某學校食堂為了解學生對食堂的滿意度,從高一、高二兩個年級分別隨機調查了100名學生,根據學生對食堂的滿意度評分,分別得到高一和高二學生滿意度評分的頻率分布直方圖.若高一和高二學生的滿意度評分中位數分別為,平均數分別為,則( )A. B.C. D.【答案】C【解析】由頻率分布直方圖,進行數據分析可得:,.所以滿意度評分中位數..所以滿意度評分平均數.【例7-2】年入冬以來,為進一步做好疫情防控工作,避免疫情的再度爆發,地區規定居民出行或者出席公共場合均需佩戴口罩,現將地區個居民一周的口罩使用個數統計如下表所示,其中每周的口罩使用個數在以上(含)的有人.口罩使用數量頻率 (1)求的值,根據表中數據,完善上面的頻率分布直方圖;(只畫圖,不要過程)(2)根據頻率分布直方圖估計地區居民一周口罩使用個數的分位數和中位數;(四舍五入,精確到)(3)根據頻率分布直方圖估計地區居民一周口罩使用個數的平均數以及方差.(每組數據用每組中點值代替)【解析】(1)由每周的口罩使用個數在以上(含)的有人得:,解得:,,則頻率分布直方圖如下:(2),,分位數位于,設其為,則,解得:,即估計分位數為個;,,中位數位于,設其為,則,解得:,即估計中位數為個.(3)由頻率分布直方圖得一周內使用口罩的平均數為:(個),方差為,則所求平均數估計為個,方差估計為.【例7-3】某學校為了了解老師對“民法典”知識的認知程度,針對不同年齡的老師舉辦了一次“民法典”知識競答,滿分100分(95分及以上為認知程度高),結果認知程度高的有人,按年齡分成5組,其中第一組:,第二組:,第三組:,第四組:,第五組:,得到如圖所示的頻率分布直方圖,已知第一組有10人. (1)根據頻率分布直方圖,估計這人年齡的第75百分位數;(2)現從以上各組中用分層隨機抽樣的方法抽取40人,擔任“民法典”知識的宣傳使者.①若有甲(年齡23),乙(年齡43)兩人已確定入選宣傳使者,現計劃從第一組和第五組被抽到的使者中,再隨機抽取2名作為組長,求甲 乙兩人恰有一人被選上的概率;②若第四組宣傳使者的年齡的平均數與方差分別為36和1,第五組宣傳使者的年齡的平均數與方差分別為42和2,據此估計這人中35~45歲所有人的年齡的方差.【解析】(1)設這人年齡的第75百分位數為,根據百分位數定義可得,解得.(2)①由題意得,第一組應抽取2人,記為,甲,第五組抽取4人,記為,,,乙.對應的樣本空間為:,共15個樣本點.設事件“甲 乙兩人恰有一人被選上”,則,共有8個樣本點.所以,.②設第四組 第五組的宣傳使者的年齡的平均數分別為,,方差分別為,,則,,,.設第四組和第五組所有宣傳使者的年齡平均數為,方差為.則,,因此,第四組和第五組所有宣傳使者的年齡方差為.據此,可估計這人中年齡在35~45歲的所有人的年齡方差約為.【解題方法總結】頻率分布直方圖的數字特征(1)眾數:最高矩形的底邊中點的橫坐標.(2)中位數:中位數左邊和右邊的矩形的面積和應該相等.(3)平均數:平均數在頻率分布直方圖中等于各組區間的中點值與對應頻率之積的和.題型八、總體離散程度的估計【例8-1】年月日,神舟十三號載人飛船返回艙成功著陸,航天員翟志剛、王亞平、葉光富完成在軌駐留半年的太空飛行任務,標志著中國空間站關鍵技術驗證階段圓滿完成.并將進入建造階段某地區為了激發人們對天文學的興趣,開展了天文知識比賽,滿分分(分及以上為認知程度高),結果認知程度高的有人,這人按年齡分成組,其中第一組:,第二組:,第三組:,第四組:,第五組:,得到如圖所示的頻率分布直方圖,已知第一組有人. (1)根據頻率分布直方圖,估計這人的第百分位數(中位數第百分位數);(2)現從以上各組中用分層隨機抽樣的方法抽取人,擔任“黨章黨史”的宣傳使者.①若有甲(年齡),乙(年齡)兩人已確定入選宣傳使者,現計劃從第四組和第五組被抽到的使者中,再隨機抽取名作為組長,求甲、乙兩人至少有一人被選上的概率;②若第四組宣傳使者的年齡的平均數與方差分別為和,第五組宣傳使者的年齡的平均數與方差分別為和,據此估計這人中歲所有人的年齡的平均數和方差.【解析】(1)設第百分位數為,,,位于第四組:內;方法一:由得:.方法二:由得:.(2)①由題意得,第四組應抽取人,記為,,,甲;第五組抽取人,記為,乙,對應的樣本空間為:,,甲,,乙,,甲,,乙,甲,,乙,甲,甲乙,乙,共個樣本點.設事件為“甲、乙兩人至少一人被選上”,則有甲,乙,甲,乙,甲,乙,甲,甲乙,乙,共有個樣本點.;②設第四組的宣傳使者的年齡分別為,平均數分別為,方差分別為,設第五組的宣傳使者的年齡分別為,,平均數分別為,方差分別為,則,,,,可得,,,,設第四組和第五組所有宣傳使者的年齡平均數為,方差為.則,即第四組和第五組所有宣傳使者的年齡平均數為,則.即第四組和第五組所有宣傳使者的年齡方差為;據此估計這人中年齡在歲的所有人的年齡的平均數為,方差約為.【例8-2】某學校為了解學生的體質健康狀況,對高一、高二兩個年級的學生進行體質健康測試.現從兩個年級學生中各隨機抽取20人,將他們的測試數據用莖葉圖表示如下:高一 高二6 4 3 9 0 5 89 6 2 3 8 1 4 5 89 8 5 2 1 7 2 3 3 99 7 7 6 4 6 4 5 7 88 3 0 5 0 2 64 0 2《國家學生體質健康標準》的等級標準如下表.規定:測試數據≥60,體質健康為合格.等級 優秀 良好 及格 不及格測試數據 [90,100] [80,89] [60,79] [0,59](1)從該校高二年級學生中隨機抽取一名學生,試估計這名學生體質健康合格的概率;(2)從兩個年級等級為優秀的樣本中各隨機選取一名學生,求選取的兩名學生的測試數據平均數大于95的概率;(3)設該校高一學生測試數據的平均數和方差分別為,高二學生測試數據的平均數和方差分別為,試比較與、與的大小.(只需寫出結論)【解析】(1)由莖葉圖可知高二學生樣本中體質健康合格的人數為,故樣本中學生體質健康合格的頻率為,故從該校高二年級學生中隨機抽取一名學生,估計這名學生體質健康合格的概率為.(2)設高一年級樣本中測試數據為的三名學生分別為,高一年級樣本中測試數據為的三名學生分別為,學區的2名學生構成的基本事件共有,共9個,其中兩名學生的測試數據平均數大于95的有,共4個,故選取的兩名學生的測試數據平均數大于95的概率為.(3)由莖葉圖中相應分數段內數據可看出高一學生測試數據的平均數要大于高二學生測試數據的平均數,高一學生的測試數據比高二學生的測試數據更為集中,因此高一學生測試數據的方差要小于高二學生測試數據的方差,故.【例8-3】某學校為了了解高二年級學生數學運算能力,對高二年級的300名學生進行了一次測試.已知參加此次測試的學生的分數全部介于45分到95分之間,該校將所有分數分成5組:,整理得到如下頻率分布直方圖(同組數據以這組數據的中間值作為代表). (1)求的值,并估計此次校內測試分數的平均值;(2)學校要求按照分數從高到低選拔前30名的學生進行培訓,試估計這30名學生的最低分數;(3)試估計這300名學生的分數的方差,并判斷此次得分為52分和94分的兩名同學的成績是否進入到了范圍內?(參考公式:,其中為各組頻數;參考數據:)【解析】(1),所以,所以該次校內考試測試分數的平均數的估計值為:分.(2)因為,所以這30名學生的最低分數就是該次校內測試分數的分位數.該次校內考試測試分數的分位數為這30名學生的最低分數的估計值為90分.(3),,得分為52分的同學的成績沒有進入到內,得分為94分的同學的成績進入到了內.即:得分為52分的同學的成績沒有進入到范圍,得分為94分的同學的成績進入到范圍了.【例8-4】為了監控某種裝件的一條生產線的生產過程,檢驗員每天從該生產線上隨機抽取16個零件,并測量其尺寸(單位:).其中元近似為樣本平均數,近似為樣本的標準差,用樣本平均數和標準差能夠反映數據取值的信息.根據長期生產經驗,一天內抽檢零件中,如果出現了尺寸在之外的零件,就認為這條生產線在這一天的生產過程可能出現了異常情況,需對當天的生產過程進行檢查.下面是檢驗員在一天內抽取的16個零件的尺寸:9.9 10.1 10.2 10.2 9.9 9.8 10.1 1010.2 10.3 9.1 10.1 9.9 9.9 10.1 10.2經計算得,其中為抽取的第個零件的尺寸,.(1)利用估計值判斷是否需對當天的生產過程進行檢查?(2)剔除之外的數據,用剩下的數據估計樣本平均數和樣本標準差(精確到0.01).【解析】(1)由,得,由樣本數據可以看出有一個零件的尺寸9.1在之外,因此需對當天的生產過程進行檢查.(2)剔除之外的數據9.1,剩下數據的平均數為,因此的估計值為10.06.,剔除之外的數據9.1,剩下數據的樣本方差為,因此的估計值為.【解題方法總結】總體離散程度的估計標準差(方差)反映了數據的離散與集中、波動與穩定的程度.標準差(方差)越大,數據的離散程度越大;標準差(方差)越小,數據的離散程度越小.21世紀教育網 www.21cnjy.com 精品試卷·第 2 頁 (共 2 頁)HYPERLINK "http://21世紀教育網(www.21cnjy.com)" 21世紀教育網(www.21cnjy.com)中小學教育資源及組卷應用平臺專題四十二 統計知識歸納一、抽樣1、抽樣調查(1)總體:統計中所考察對象的某一數值指標的全體構成的集合稱為總體.(2)個體:構成總體的每一個元素叫做個體.(3)樣本:從總體中抽取若干個個體進行考察,這若干個個體所構成的集合叫做總體的一個樣本,樣本中個體的數目叫做樣本容量.2、簡單隨機抽樣(1)定義一般地,設一個總體含有個個體,從中逐個不放回地抽取個個體作為樣本(),如果每次抽取時總體內的各個個體被抽到的機會都相等,就把這種抽樣方法叫做簡單隨機抽樣.這樣抽取的樣本,叫做簡單隨機樣本.(2)兩種常用的簡單隨機抽樣方法①抽簽法:一般地,抽簽法就是把總體中的個個體編號,把號碼寫在號簽上,將號簽放在一個容器中,攪拌均勻后,每次從中抽取一個號簽,連續抽取次,就得到一個容量為的樣本.②隨機數法:即利用隨機數表、隨機數骰子或計算機產生的隨機數進行抽樣.這里僅介紹隨機數表法.隨機數表由數字,,,…,組成,并且每個數字在表中各個位置出現的機會都是一樣的.注意:為了保證所選數字的隨機性,需在查看隨機數表前就指出開始數字的橫、縱位置.(3)抽簽法與隨機數法的適用情況抽簽法適用于總體中個體數較少的情況,隨機數法適用于總體中個體數較多的情況,但是當總體容量很大時,需要的樣本容量也很大時,利用隨機數法抽取樣本仍不方便.(4)簡單隨機抽樣的特征①有限性:簡單隨機抽樣要求被抽取的樣本的總體個數是有限的,便于通過樣本對總體進行分析.②逐一性:簡單隨機抽樣是從總體中逐個地進行抽取,便于實踐中操作.③不放回性:簡單隨機抽樣是一種不放回抽樣,便于進行有關的分析和計算.④等可能性:簡單單隨機抽樣中各個個體被抽到的機會都相等,從而保證了抽樣方法的公平.只有四個特點都滿足的抽樣才是簡單隨機抽樣.3、分層抽樣(1)定義一般地,在抽樣時,將總體分成互不交叉的層,然后按照一定的比例,從各層獨立地抽取一定數量的個體,將各層取出的個體合在一起作為樣本,這種抽樣方法叫做分層抽樣.分層抽樣適用于已知總體是由差異明顯的幾部分組成的.(2)分層抽樣問題類型及解題思路①求某層應抽個體數量:按該層所占總體的比例計算.②已知某層個體數量,求總體容量或反之求解:根據分層抽樣就是按比例抽樣,列比例式進行計算.③分層抽樣的計算應根據抽樣比構造方程求解,其中“抽樣比==”注意:分層抽樣時,每層抽取的個體可以不一樣多,但必須滿足抽取()個個體(其中是層數,是抽取的樣本容量,是第層中個體的個數,是總體容量).(3)分層隨機抽樣的方差設樣本容量為,平均數為,其中兩層的個體數量分別為,兩層的平均數分別為,,方差分別為,則這個樣本的方差為二、用樣本估計總體1、頻率分布直方圖(1)頻率、頻數、樣本容量的計算方法①×組距=頻率.②=頻率,=樣本容量,樣本容量×頻率=頻數.③頻率分布直方圖中各個小方形的面積總和等于.2、頻率分布直方圖中數字特征的計算(1)最高的小長方形底邊中點的橫坐標即是眾數.(2)中位數左邊和右邊的小長方形的面積和是相等的.設中位數為,利用左(右)側矩形面積之和等于,即可求出.(3)平均數是頻率分布直方圖的“重心”,等于頻率分布直方圖中每個小長方形的面積乘以小長方形底邊中點的橫坐標之和,即有,其中為每個小長方形底邊的中點,為每個小長方形的面積.3、百分位數(1)定義一組數據的第百分位數是這樣一個值,它使得這組數據中至少有的數據小于或等于這個值,且至少有的數據大于或等于這個值.(2)計算一組個數據的的第百分位數的步驟①按從小到大排列原始數據.②計算.③若不是整數而大于的比鄰整數,則第百分位數為第項數據;若是整數,則第百分位數為第項與第項數據的平均數.(3)四分位數中位數,相當于是第百分位數.在實際應用中,除了中位數外,常用的分位數還有第百分位數,第百分位數.這三個分位數把一組由小到大排列后的數據分成四等份,因此稱為四分位數.4、樣本的數字特征(1)眾數、中位數、平均數①眾數:一組數據中出現次數最多的數叫眾數,眾數反應一組數據的多數水平.②中位數:將一組數據按大小順序依次排列,把處在最中間位置的一個數據(或最中間兩個數據的平均數)叫做這組數據的中位數,中位數反應一組數據的中間水平.③平均數:個樣本數據的平均數為,反應一組數據的平均水平,公式變形:.5、標準差和方差(1)定義①標準差:標準差是樣本數據到平均數的一種平均距離,一般用表示.假設樣本數據是,表示這組數據的平均數,則標準差.②方差:方差就是標準差的平方,即.顯然,在刻畫樣本數據的分散程度上,方差與標準差是一樣的.在解決實際問題時,多采用標準差.(2)數據特征標準差、方差描述了一組數據圍繞平均數波動程度的大小.標準差、方差越大,則數據的離散程度越大;標準差、方差越小,數據的離散程度越小.反之亦可由離散程度的大小推算標準差、方差的大小.(3)平均數、方差的性質如果數據的平均數為,方差為,那么①一組新數據的平均數為,方差是.②一組新數據的平均數為,方差是.③一組新數據的平均數為,方差是.典例分析題型一、隨機抽樣、分層抽樣【例1-1】現要完成下列2項抽樣調查:①從10盒酸奶中抽取3盒進行食品衛生檢查;②東方中學共有160名教職工,其中教師120名,行政人員16名,后勤人員24名.為了了解教職工對學校在校務公開方面的意見,擬抽取一個容量為20的樣本.較為合理的抽樣方法是( )A.①抽簽法,②分層隨機抽樣 B.①隨機數法,②分層隨機抽樣C.①隨機數法,②抽簽法 D.①抽簽法, ②隨機數法【例1-2】某工廠為了對產品質量進行嚴格把關,從500件產品中隨機抽出50件進行檢驗,對這500件產品進行編號001,002,…,500,從下列隨機數表的第二行第三組第一個數字開始,每次從左往右選取三個數字,則抽到第四件產品的編號為( )2839 3125 8395 9524 7232 89957216 2884 3660 1073 4366 75759436 6118 4479 5140 9694 95926017 4951 4068 7516 3241 4782A.447 B.366 C.140 D.118【例1-3】為了慶祝中國共產黨第二十次全國代表大會,學校采用按比例分配的分層隨機抽樣的方法從高一1002人,高二1002人,高三1503人中抽取126人觀看“中國共產黨第二十次全國代表大會”直播,那么高三年級被抽取的人數為( )A.36 B.42 C.50 D.54【例1-4】某校共2017名學生,其中每名學生至少要選A,B兩門課中的一門,也有些學生選了兩門課.已知選A的人數占全校人數的百分比在到之間,選B的人數占全校人數的百分比在到之間.則下列結論中正確的是( )A.同時選A,B的可能有200人 B.同時選A,B的可能有300人C.同時選A,B的可能有400人 D.同時選A,B的可能有500人【例1-5】在二戰期間,技術先進的德國坦克使德軍占據了戰場主動權,了解德軍坦克的生產能力對盟軍具有非常重要的戰略意義,盟軍請統計學家參與情報的收集和分析工作.在繳獲的德軍坦克上發現每輛坦克都有獨一無二的發動機序列號,前6位表示生產的年月,最后4位是按生產順序開始的連續編號.統計學家將繳獲的德軍坦克序列號作為樣本,用樣本估計總體的方法推斷德軍每月生產的坦克數.假設德軍某月生產的坦克總數為N,繳獲的該月生產的n輛坦克編號從小到大為,,,,繳獲的坦克是從所生產的坦克中隨機獲取的,繳獲坦克的編號,,,,相當于從中隨機抽取的n個整數,這個數將區間分成個小區間(如圖).可以用前個區間的平均長度估計所有個區間的平均長度,進而得到的估計.如果繳獲的坦克編號為:35,67,90,127,185,245,287.則可以估計德軍每月生產的坦克數為( ) A.288 B.308 C.328 D.348【解題方法總結】不論哪種抽樣方法,總體中的每一個個體入樣的概率都是相同的.題型二、統計圖表【例2-1】(多選題)恩格爾系數是食品支出總額占個人消費支出總額的比重,它在一定程度上可以用來反映人民生活水平.恩格爾系數的一般規律:收入越低的家庭,恩格爾系數就越大;收入越高的家庭,恩格爾系數就越小.國際上一般認為,當恩格爾系數大于0.6時,居民生活處于貧困狀態;在0.5-0.6之間,居民生活水平處于溫飽狀態;在0.4-0.5之間,居民生活水平達到小康;在0.3-0.4之間,居民生活水平處于富裕狀態;當小于0.3時,居民生活達到富有.下面是某地區2022年兩個統計圖,它們分別為城鄉居民恩格爾系數統計圖和城鄉居民家庭人均可支配收入統計圖,請你依據統計圖進行分析判斷,下列結論錯誤的是( ) A.農村居民自2017年到2021年,居民生活均達到富有B.近五年城鄉居民家庭人均可支配收入差異最大的年份是2020年C.城鄉居民恩格爾系數差異最小的年份是2019年D.2022年該地區城鎮居民和農村居民的生活水平已經全部處于富有狀態【例2-2】(多選題)2022年的夏季,全國多地迎來罕見極端高溫天氣.某課外小組通過當地氣象部門統計了當地七月份前20天每天的最高氣溫與最低氣溫,得到如下圖表,則根據圖表,下列判斷正確的是( ) A.七月份前20天最低氣溫的中位數低于25℃B.七月份前20天中最高氣溫的極差大于最低氣溫的極差C.七月份前20天最高氣溫的平均數高于40℃D.七月份前10天(1—10日)最高氣溫的方差大于最低氣溫的方差【例2-3】某市教育局為得到高三年級學生身高的數據,對高三年級學生進行抽樣調查,隨機抽取了名學生,他們的身高都在,,,,五個層次內,分男、女生統計得到以下樣本分布統計圖,則( )A.樣本中層次的女生比相應層次的男生人數多B.估計樣本中男生身高的中位數比女生身高的中位數大C.層次的女生和層次的男生在整個樣本中頻率相等D.樣本中層次的學生數和層次的學生數一樣多【例2-4】如圖1為某省2019年1~4月份快遞業務量統計圖,圖2為該省2019年1~4月份快遞業務收入統計圖,對統計圖理解不正確的是( )A.2019年1~4月份快遞業務量3月份最高,2月份最低,差值接近2000萬件B.從1~4月份來看,業務量與業務收入有波動,但整體保持高速增長C.從兩圖中看,增量與增長速度并不完全一致,但業務量與業務收入變化高度一致D.2019年1~4月份快遞業務量同比增長率均超過50%,在3月份最高,和春節后網購迎來噴漲有關【例2-4】(多選題)某公司統計了2023年1月至6月的月銷售額(單位:萬元),并與2022年比較,得到同比增長率數據,繪制了如圖所示的統計圖,則下列說法正確的是( )注:同比增長率=(今年月銷售額一去年同期月銷售額)÷去年同期月銷售額. A.2023年1月至6月的月銷售額的極差為8B.2023年1月至6月的月銷售額的第60百分位數為8C.2023年1月至6月的月銷售額的中位數為9.5D.2022年5月的月銷售額為10萬元【例2-5】(多選題)某公司經營五種產業,為應對市場變化,在五年前進行了產業結構調整,優化后的產業結構使公司總利潤不斷增長,今年總利潤比五年前增加了一倍,調整前后的各產業利潤與總利潤的占比如圖所示,則下列結論錯誤的是( ) A.調整后傳媒的利潤增量小于雜志B.調整后房地產的利潤有所下降C.調整后試卷的利潤增加不到一倍D.調整后圖書的利潤增長了一倍以上【例2-6】(多選題)某調查機構對我國若干大型科技公司進行調查統計,得到了從事芯片、軟件兩個行業從業者的年齡分布的餅形圖和“90后”從事這兩個行業的崗位分布雷達圖,則下列說法中一定正確的是( ) A.芯片、軟件行業從業者中,“90后”占總人數的比例超過B.芯片、軟件行業中從事技術、設計崗位的“90后”人數超過總人數的C.芯片、軟件行業從事技術崗位的人中,“90后”比“80后”多D.芯片、軟件行業中,“90后”從事市場崗位的人數比“80前”的總人數多【例2-7】(多選題)某地環保部門公布了該地兩個景區2016年至2022年各年的全年空氣質量優良天數的數據.現根據這組數據繪制了如圖所示的散點圖,則由該圖得出的下列結論中正確的是( ) A.景區A這7年的空氣質量優良天數的中位數為254B.景區這7年的空氣質量優良天數的第80百分位數為280C.這7年景區A的空氣質量優良天數的標準差比景區的空氣質量優良天數的標準差大D.這7年景區A的空氣質量優良天數的平均數比景區的空氣質量優良天數的平均數大【例2-8】某中學在2021年高考分數公布后對高三年級各班的成績進行分析.經統計,某班有50名同學,總分都在區間內,將得分區間平均分成5組,統計頻數、頻率后,得到了如圖所示的“頻率分布”折線圖.(1)請根據頻率分布折線圖,畫出頻率分布直方圖,并根據頻率分布直方圖估計該班級的平均分;(2)經相關部門統計,高考分數以上的考生獲得高校T“強基計劃”入圍資格,并制作高校T錄取政策和考生錄取預測統計表(如表所示).第一輪筆試有2科,學生通過考試獲得相應等級的事件相互獨立且概率相同.高考分數第一輪筆試 學科測試等級 A B C A B C學生通過考試獲得相應等級概率第二輪面試 入圍條件 至少有1科,且2科均不低于B錄取條件 全 在第一輪筆試中2科均獲得通過第二輪面試 考生通過概率為 考生通過概率為若該班級考分前10名都已經報考了高校T的“強基計劃”,且恰有2人成績高于690分.求:①總分高于690分的某位同學沒有進入第二輪的概率;②該班恰有兩名同學通過“強基計劃”被高校T錄取的概率.題型三、頻率分布直方圖【例3-1】某區為了解全區名高二學生的體能素質情況,在全區高二學生中隨機抽取了名學生進行體能測試,并將這名的體能測試成績整理成如下頻率分布直方圖.根據此頻率分布直方圖,這名學生平均成績的估計值為 . 【例3-2】某大學有男生名.為了解該校男生的身體體重情況,隨機抽查了該校名男生的體重,并將這名男生的體重(單位:)分成以下六組:、、、、、,繪制成如下的頻率分布直方圖:該校體重(單位:)在區間上的男生大約有 人.【例3-3】2022年12月4日是第九個國家憲法日,主題為“學習宣傳貫徹黨的二十大精神,推動全面貫徹實施憲法”,某校由學生會同學制作了憲法學習問卷,收獲了有效答卷2000份,先對其得分情況進行了統計,按照、、…、分成5組,并繪制了如圖所示的頻率分布直方圖,則圖中 .【例3-4】從某小學所有學生中隨機抽取100名學生,將他們的身高(單位:cm)數據繪制成頻率分布直方圖(如圖),其中樣本數據分組,,,,,若要從身高在,,三組內的學生中,用分層抽樣的方法抽取12人參加一項活動,則從身高在內的學生中抽取的人數應為 .題型四、百分位數【例4-1】以下數據為參加數學競賽決賽的15人的成績(單位:分),分數從低到高依次:,則這15人成績的第80百分位數是 .【例4-2】某校為了了解高三年級學生的身體素質狀況,在開學初舉行了一場身體素質體能測試,以便對體能不達標的學生進行有針對性的訓練,促進他們體能的提升,現從整個年級測試成績中抽取100名學生的測試成績,并把測試成績分成六組,繪制成頻率分布直方圖(如圖所示).其中分數在這一組中的縱坐標為,則該次體能測試成績的分位數約為 分.【例4-3】為了養成良好的運動習慣,某人記錄了自己一周內每天的運動時長(單位:分鐘),分別為53,57,45,61,79,49,x,若這組數據的第80百分位數與第60百分位數的差為3,則( )A.58或64 B.59或64 C.58 D.59【例4-4】洞庭濕地保護區于長江中游的湖南省,面積168000公頃,為了保護該濕地保護區內的漁業資源和生物多樣性,從2003年起全面實施禁漁期制度.該濕地保護區的漁業資源科學研究培殖了一批珍稀類銀魚魚苗,從中隨機抽取100尾測量魚苗的體長(單位:毫米),所得的數據如下表:分組(單位:毫米)頻數 10 10 m 35 15 n若依上述6組數據繪制的頻率分布直方圖中,分組對應小矩形的高為0.01,則該樣本中的分位數的銀魚魚苗的體長為(保留一位小數)( )A.87毫米 B.88毫米 C.90.5毫米 D.93.3毫米【解題方法總結】計算一組個數據的的第百分位數的步驟①按從小到大排列原始數據.②計算.③若不是整數而大于的比鄰整數,則第百分位數為第項數據;若是整數,則第百分位數為第項與第項數據的平均數.題型五、樣本的數字特征【例5-1】(多選題)有一組樣本數據:,其平均數為2,由這組樣本數據得到新樣本數據:,那么這兩組樣本數據一定有相同的( )A.平均數 B.中位數 C.方差 D.極差【例5-2】(多選題)已知數據1:,,,,數據2:,,,,則下列統計量中,數據2不是數據1的兩倍的有( )A.平均數 B.極差 C.中位數 D.標準差【例5-3】“說文明話、辦文明事、做文明人,樹立城市新風尚!創建文明城市,你我共同參與!”為宣傳創文精神,華強實驗中學高一(2)班組織了甲乙兩名志愿者,利用一周的時間在街道對市民進行宣傳,將每天宣傳的次數繪制成如下頻數分布折線圖,則以下說法不正確的為( ) A.甲的眾數小于乙的眾數 B.乙的極差小于甲的極差C.甲的方差大于乙的方差 D.乙的平均數大于甲的平均數【例5-4】某學校對班級管理實行量化打分,每周一總結,若一個班連續5周的量化打分不低于80分,則為優秀班級.下列能斷定該班為優秀班級的是( )A.某班連續5周量化打分的平均數為83,中位數為81B.某班連續5周量化打分的平均數為83,方差大于0C.某班連續5周量化打分的中位數為81,眾數為83D.某班連續5周量化打分的平均數為83,方差為1【例5-5】橙子輔導中學的高一 二 三這三個年級學生的平均身高分別為,若按年級采用分層抽樣的方法抽取了一個600人的樣本,抽到高一 高二 高三的學生人數分別為100 200 300,則估計該高中學生的平均身高為( )A. B. C. D.【例5-6】根據氣象學上的標準,連續5天的日平均氣溫低于即為入冬,將連續5天的日平均溫度的記錄數據(記錄數據都是自然數)作為一組樣本,現有4組樣本①、②、③、④,依次計算得到結果如下:①平均數;②平均數且極差小于或等于3;③平均數且標準差;④眾數等于5且極差小于或等于4.則4組樣本中一定符合入冬指標的共有( )A.1組 B.2組 C.3組 D.4組【例5-7】數學興趣小組的四名同學各自拋擲骰子5次,分別記錄每次骰子出現的點數,四名同學的部分統計結果如下:甲同學:中位數為3,方差為2.8; 乙同學:平均數為3.4,方差為1.04;丙同學:中位數為3,眾數為3; 丁同學:平均數為3,中位數為2.根據統計結果,數據中肯定沒有出現點數6的是 同學.【例5-8】氣象意義上的春季進入夏季的標志為連續5天的日平均溫度不低于.現有甲、乙、丙三地連續5天的日平均氣溫的記錄數據(記錄數據都是正整數):①甲地:5個數據是中位數為24,眾數為22;②乙地:5個數據是中位數為27,總體均值為24;③丙地:5個數據中有一個數據是32,總體均值為26,總體方差為10.8則肯定進入夏季的地區有A.①②③ B.①③ C.②③ D.①【例5-9】已知一組數據的平均數是3,方差是2,則由這5個數據組成的新的一組數據的方差是( )A.4B.6 C. D.【例5-10】(多選題)某環保局對轄區內甲、乙、丙、丁四個地區的環境治理情況進行檢查督導,若連續10天,每天空氣質量指數(單位:)不超過100,則認為該地區環境治理達標,否則認為該地區環境治理不達標.根據連續10天檢查所得數據的數字特征推斷,環境治理一定達標的地區是( )A.甲地區:平均數為80,方差為40 B.乙地區:平均數為50,眾數為40C.丙地區:中位數為50,極差為60 D.丁地區:極差為10,80%分位數為90【例5-11】現有甲、乙兩組數據,每組數據均由六個數組成,其中甲組數據的平均數為,方差為,乙組數據的平均數為,方差為.若將這兩組數據混合成一組,則新的一組數據的方差為( )A. B. C. D.【解題方法總結】(1)平均數、中位數、眾數描述其集中趨勢,方差和標準差描述波動大小.(2)方差的簡化計算公式:或寫成,即方差等于原數據平方的平均數減去平均數的平方.題型六、分層方差問題【例6-1】某車間有甲、乙兩臺機床同時加工直徑為的零件,為檢驗質量,從中各抽取6件,測得甲、乙兩組數據的均值為,兩組數據的方差分別為,,則估計該車間這批零件的直徑的方差 .【例6-2】某校高二年級有男生400人和女生600人,為分析期末物理調研測試成績,按照男女比例通過分層隨機抽樣的方法取到一個樣本,樣本中男生的平均成績為80分,方差為10,女生的平均成績為60分,方差為20,由此可以估計該校高二年級期末物理調研測試成績的方差為 .【例6-3】為調查某地區中學生每天睡眠時間,采用樣本量比例分配的分層隨機抽樣,現抽取初中生800人,其每天睡眠時間均值為9小時,方差為0.5,抽取高中生1200人,其每天睡眠時間均值為8小時,方差為1,則估計該地區中學生每天睡眠時間的方差為 .【例6-4】某校教師男女人數之比為5:4,該校所有教師進行1分鐘限時投籃比賽.現記錄了每個教師1分鐘命中次數,已知男教師命中次數的平均數為17,方差為16,女教師命中次數的平均數為8,方差為16,那么全體教師1分鐘限時投籃次數的方差為 .【例6-5】湖州地區甲、乙、丙三所學科基地學校的數學強基小組人數之比為,三所學校共有數學強基學生48人,在一次統一考試中,所有學生的成績平均分為117,方差為21.5.已知甲、乙兩所學校的數學強基小組學生的平均分分別為118和114,方差分別為15和21,則丙學校的學生成績的方差是 .【例6-6】已知一組數據,,,的平均值為,,刪去一個數之后,平均值沒有改變,方差比原來大4,則這組數據的個數 .【解題方法總結】分層隨機抽樣的方差設樣本容量為,平均數為,其中兩層的個體數量分別為,兩層的平均數分別為,,方差分別為,則這個樣本的方差為題型七、總體集中趨勢的估計【例7-1】某學校食堂為了解學生對食堂的滿意度,從高一、高二兩個年級分別隨機調查了100名學生,根據學生對食堂的滿意度評分,分別得到高一和高二學生滿意度評分的頻率分布直方圖.若高一和高二學生的滿意度評分中位數分別為,平均數分別為,則( )A. B.C. D.【例7-2】年入冬以來,為進一步做好疫情防控工作,避免疫情的再度爆發,地區規定居民出行或者出席公共場合均需佩戴口罩,現將地區個居民一周的口罩使用個數統計如下表所示,其中每周的口罩使用個數在以上(含)的有人.口罩使用數量頻率 (1)求的值,根據表中數據,完善上面的頻率分布直方圖;(只畫圖,不要過程)(2)根據頻率分布直方圖估計地區居民一周口罩使用個數的分位數和中位數;(四舍五入,精確到)(3)根據頻率分布直方圖估計地區居民一周口罩使用個數的平均數以及方差.(每組數據用每組中點值代替)【例7-3】某學校為了了解老師對“民法典”知識的認知程度,針對不同年齡的老師舉辦了一次“民法典”知識競答,滿分100分(95分及以上為認知程度高),結果認知程度高的有人,按年齡分成5組,其中第一組:,第二組:,第三組:,第四組:,第五組:,得到如圖所示的頻率分布直方圖,已知第一組有10人. (1)根據頻率分布直方圖,估計這人年齡的第75百分位數;(2)現從以上各組中用分層隨機抽樣的方法抽取40人,擔任“民法典”知識的宣傳使者.①若有甲(年齡23),乙(年齡43)兩人已確定入選宣傳使者,現計劃從第一組和第五組被抽到的使者中,再隨機抽取2名作為組長,求甲 乙兩人恰有一人被選上的概率;②若第四組宣傳使者的年齡的平均數與方差分別為36和1,第五組宣傳使者的年齡的平均數與方差分別為42和2,據此估計這人中35~45歲所有人的年齡的方差.【解題方法總結】頻率分布直方圖的數字特征(1)眾數:最高矩形的底邊中點的橫坐標.(2)中位數:中位數左邊和右邊的矩形的面積和應該相等.(3)平均數:平均數在頻率分布直方圖中等于各組區間的中點值與對應頻率之積的和.題型八、總體離散程度的估計【例8-1】年月日,神舟十三號載人飛船返回艙成功著陸,航天員翟志剛、王亞平、葉光富完成在軌駐留半年的太空飛行任務,標志著中國空間站關鍵技術驗證階段圓滿完成.并將進入建造階段某地區為了激發人們對天文學的興趣,開展了天文知識比賽,滿分分(分及以上為認知程度高),結果認知程度高的有人,這人按年齡分成組,其中第一組:,第二組:,第三組:,第四組:,第五組:,得到如圖所示的頻率分布直方圖,已知第一組有人. (1)根據頻率分布直方圖,估計這人的第百分位數(中位數第百分位數);(2)現從以上各組中用分層隨機抽樣的方法抽取人,擔任“黨章黨史”的宣傳使者.①若有甲(年齡),乙(年齡)兩人已確定入選宣傳使者,現計劃從第四組和第五組被抽到的使者中,再隨機抽取名作為組長,求甲、乙兩人至少有一人被選上的概率;②若第四組宣傳使者的年齡的平均數與方差分別為和,第五組宣傳使者的年齡的平均數與方差分別為和,據此估計這人中歲所有人的年齡的平均數和方差.【例8-2】某學校為了解學生的體質健康狀況,對高一、高二兩個年級的學生進行體質健康測試.現從兩個年級學生中各隨機抽取20人,將他們的測試數據用莖葉圖表示如下:高一 高二6 4 3 9 0 5 89 6 2 3 8 1 4 5 89 8 5 2 1 7 2 3 3 99 7 7 6 4 6 4 5 7 88 3 0 5 0 2 64 0 2《國家學生體質健康標準》的等級標準如下表.規定:測試數據≥60,體質健康為合格.等級 優秀 良好 及格 不及格測試數據 [90,100] [80,89] [60,79] [0,59](1)從該校高二年級學生中隨機抽取一名學生,試估計這名學生體質健康合格的概率;(2)從兩個年級等級為優秀的樣本中各隨機選取一名學生,求選取的兩名學生的測試數據平均數大于95的概率;(3)設該校高一學生測試數據的平均數和方差分別為,高二學生測試數據的平均數和方差分別為,試比較與、與的大小.(只需寫出結論)【例8-3】某學校為了了解高二年級學生數學運算能力,對高二年級的300名學生進行了一次測試.已知參加此次測試的學生的分數全部介于45分到95分之間,該校將所有分數分成5組:,整理得到如下頻率分布直方圖(同組數據以這組數據的中間值作為代表). (1)求的值,并估計此次校內測試分數的平均值;(2)學校要求按照分數從高到低選拔前30名的學生進行培訓,試估計這30名學生的最低分數;(3)試估計這300名學生的分數的方差,并判斷此次得分為52分和94分的兩名同學的成績是否進入到了范圍內?(參考公式:,其中為各組頻數;參考數據:)【例8-4】為了監控某種裝件的一條生產線的生產過程,檢驗員每天從該生產線上隨機抽取16個零件,并測量其尺寸(單位:).其中元近似為樣本平均數,近似為樣本的標準差,用樣本平均數和標準差能夠反映數據取值的信息.根據長期生產經驗,一天內抽檢零件中,如果出現了尺寸在之外的零件,就認為這條生產線在這一天的生產過程可能出現了異常情況,需對當天的生產過程進行檢查.下面是檢驗員在一天內抽取的16個零件的尺寸:9.9 10.1 10.2 10.2 9.9 9.8 10.1 1010.2 10.3 9.1 10.1 9.9 9.9 10.1 10.2經計算得,其中為抽取的第個零件的尺寸,.(1)利用估計值判斷是否需對當天的生產過程進行檢查?(2)剔除之外的數據,用剩下的數據估計樣本平均數和樣本標準差(精確到0.01).【解題方法總結】總體離散程度的估計標準差(方差)反映了數據的離散與集中、波動與穩定的程度.標準差(方差)越大,數據的離散程度越大;標準差(方差)越小,數據的離散程度越小.21世紀教育網 www.21cnjy.com 精品試卷·第 2 頁 (共 2 頁)HYPERLINK "http://21世紀教育網(www.21cnjy.com)" 21世紀教育網(www.21cnjy.com) 展開更多...... 收起↑ 資源列表 專題42 統計(原卷版).doc 專題42 統計(解析版).doc 縮略圖、資源來源于二一教育資源庫