資源簡介 第09講 統計與統計案例(13類核心考點精講精練)1. 5年真題考點分布5年考情考題示例 考點分析 關聯考點2024年新Ⅱ卷,第4題,5分 計算幾個數的中位數 計算幾個數的平均數 計算幾個數據的極差 /2023年新I卷,第9題,5分 計算幾個數的中位數 計算幾個數的平均數 計算幾個數據的極差、方差 標準差 /2023年新Ⅱ卷,第19題,12分 頻率分布直方圖的實際應用 總體百分位數的估計 /2023年全國甲卷(理), 第19題,12分 獨立性檢驗解決實際問題 計算幾個數的中位數 超幾何分布的均值 超幾何分布的分布列2023年全國乙卷(理), 第17題,12分 計算幾個數的平均數 計算幾個數據的極差、方差、標準差 統計新定義2022年新I卷,第20題,12分 獨立性檢驗解決實際問題 計算條件概率2022年新Ⅱ卷,第19題,12分 頻率分布直方圖的實際應用 由頻率分布直方圖估計平均數 利用對立事件的概率公式求概率 計算條件概率2022年全國甲卷(理), 第2題,5分 眾數、平均數、中位數的比較 計算幾個數據的極差、方差、標準差 /2022年全國乙卷(理), 第19題,12分 相關系數的計算 根據樣本中心點求參數 計算幾個數的平均數2021年新I卷,第9題,5分 眾數、平均數、中位數的比較 計算幾個數據的極差、方差、標準差 /2021年新Ⅱ卷,第9題,5分 計算幾個數的眾數 計算幾個數的中位數 計算幾個數的平均數 計算幾個數據的極差、方差、標準差 /2021年全國乙卷(理), 第17題,10分 獨立性檢驗解決實際問題 /2021年全國甲卷(理), 第2題,5分 由頻率分布直方圖計算頻率、頻數、樣本容量、總體容量 由頻率分布直方圖估計平均數 /2021年全國甲卷(理), 第17題,10分 計算幾個數的平均數 計算幾個數據的極差、方差、標準差 /2020年新I卷,第19題,12分 完善列聯表 獨立性檢驗 /2020年新Ⅱ卷,第19題,12分 完善列聯表 獨立性檢驗 /2020年全國甲卷(理), 第5題,5分 由散點圖畫求近似回歸直線 /2020年全國乙卷(理), 第18題,12分 相關系數的計算 /2020年全國丙卷(理), 第18題,12分 獨立性檢驗解決實際問題 /2020年新Ⅱ卷,第9題,5分 根據折線統計圖解決實際問題 /2. 命題規律及備考策略【命題規律】本節內容是新高考卷的常考內容,設題不定,難度中等或偏難,分值為5-15分【備考策略】1.理解、掌握簡單隨機抽樣、分層抽樣定義及計算2.理解、掌握總體樣本估計的定義及計算3.理解、掌握線性回歸的定義及計算4.理解、掌握獨立性檢驗的定義及計算【命題預測】本節內容是新高考卷的常考內容,一般給在大題中結合前面的的概率及分布列一起考查,需重點強化復習知識講解1.簡單隨機抽樣(1)定義:一般地,設一個總體含有N個個體,從中逐個不放回地抽取n個個體作為樣本(n≤N),如果每次抽取時總體內的各個個體被抽到的機會都相等,就把這種抽樣方法叫做簡單隨機抽樣.這樣抽取的樣本,叫做簡單隨機樣本.(2)常用方法:抽簽法和隨機數法.2.分層抽樣(1)在抽樣時,將總體分成互不交叉的層,然后按照一定的比例,從各層獨立地抽取一定數量的個體,將各層取出的個體合在一起作為樣本,這種抽樣方法是一種分層抽樣.(2)分層抽樣的應用范圍當總體是由差異明顯的幾個部分組成時,往往選用分層抽樣.3.頻率分布直方圖(1)縱軸表示,即小長方形的高=;(2)小長方形的面積=組距×=頻率;(3)各個小方形的面積總和等于1.頻率分布直方圖中的常見結論(1)眾數的估計值為最高矩形的中點對應的橫坐標.(2)平均數的估計值等于頻率分布直方圖中每個小矩形的面積乘以小矩形底邊中點的橫坐標之和.(3)中位數的估計值的左邊和右邊的小矩形的面積和是相等的.4.頻率分布表的畫法第一步:求極差,決定組數和組距,組距=;第二步:分組,通常對組內數值所在區間取左閉右開區間,最后一組取閉區間;第三步:登記頻數,計算頻率,列出頻率分布表.5.條形圖、折線圖及扇形圖(1)條形圖:建立直角坐標系,用橫軸(橫軸上的數字)表示樣本數據類型,用縱軸上的單位長度表示一定的數量,根據每個樣本(或某個范圍內的樣本)的數量多少畫出長短不同的等寬矩形,然后把這些矩形按照一定的順序排列起來,這樣一種表達和分析數據的統計圖稱為條形圖.(2)折線圖:建立直角坐標系,用橫軸上的數字表示樣本值,用縱軸上的單位長度表示一定的數量,根據樣本值和數量的多少描出相應各點,然后把各點用線段順次連接,得到一條折線,用這種折線表示出樣本數據的情況,這樣的一種表示和分析數據的統計圖稱為折線圖.(3)扇形圖:用一個圓表示總體,圓中各扇形分別代表總體中的不同部分,每個扇形的大小反映所表示的那部分占總體的百分比的大小,這樣的一種表示和分析數據的統計圖稱為扇形圖.6.百分位數、眾數、平均數的定義(1)如果將一組數據從小到大排序,并計算相應的累計百分位,則某一百分位所對應數據的值就稱為這一百分位的百分位數.一般地,一組數據的第p百分位數是這樣一個值,它使得這組數據中至少有p%的數據小于或等于這個值,且至少有(100-p)%的數據大于或等于這個值.(2)第25百分位數又稱第一四分位數或下四分位數;第75百分位數又稱第三四分位數或上四分位數.(3)眾數一組數據中出現次數最多的數據叫做這組數據的眾數.(4)平均數一組數據的算術平均數即為這組數據的平均數,n個數據x1,x2,…,xn的平均數=(x1+x2+…+xn).7.樣本的數字特征之方差如果有n個數據x1,x2,…,xn,那么這n個數的(1)標準差s= .(2)方差s2=[(x1-)2+(x2-)2+…+(xn-)2].8. 平均數、方差的公式推廣(1)若數據x1,x2,…,xn的平均數為,則mx1+a,mx2+a,mx3+a,…,mxn+a的平均數是m+a.(2)若數據x1,x2,…,xn的方差為s2,則數據ax1+b,ax2+b,…,axn+b的方差為a2s2.兩個變量的線性相關(1)正相關在散點圖中,點散布在從左下角到右上角的區域,對于兩個變量的這種相關關系,我們將它稱為正相關.(2)負相關在散點圖中,點散布在從左上角到右下角的區域,兩個變量的這種相關關系稱為負相關.(3)線性相關關系、回歸直線如果散點圖中點的分布從整體上看大致在一條直線附近,就稱這兩個變量之間具有線性相關關系,這條直線叫做回歸直線.回歸方程(1)最小二乘法求回歸直線,使得樣本數據的點到它的距離的平方和最小的方法叫做最小二乘法.(2)回歸方程方程=x+是兩個具有線性相關關系的變量的一組數據(x1,y1),(x2,y2),…,(xn,yn)的回歸方程,其中,是待定參數.回歸分析(1)定義:對具有相關關系的兩個變量進行統計分析的一種常用方法.(2)樣本點的中心對于一組具有線性相關關系的數據(x1,y1),(x2,y2),…,(xn,yn),其中(,)稱為樣本點的中心.(3)相關系數當r>0時,表明兩個變量正相關;當r<0時,表明兩個變量負相關.r的絕對值越接近于1,表明兩個變量的線性相關性越強.r的絕對值越接近于0,表明兩個變量之間幾乎不存在線性相關關系.通常|r|大于0.75時,認為兩個變量有很強的線性相關性.獨立性檢驗(1)分類變量:變量的不同“值”表示個體所屬的不同類別,像這樣的變量稱為分類變量.(2)列聯表:列出的兩個分類變量的頻數表,稱為列聯表.假設有兩個分類變量X和Y,它們的可能取值分別為{x1,x2}和{y1,y2},其樣本頻數列聯表(稱為2×2列聯表)為2×2列聯表y1 y2 總計x1 a b a+bx2 c d c+d總計 a+c b+d a+b+c+d構造一個隨機變量K2=,其中n=a+b+c+d為樣本容量.(3)獨立性檢驗利用隨機變量K2來判斷“兩個分類變量有關系”的方法稱為獨立性檢驗.當χ2≤2.706時,沒有充分的證據判定變量A,B有關聯;當χ2>2.706時,有90%的把握判定變量A,B有關聯;當χ>3.841時,有95%的把握判定變量A,B有關聯;當χ>6.635時,有99%的把握判定變量A,B有關聯.考點一、簡單隨機抽樣1.(2024·福建泉州·模擬預測)從一個含有個個體的總體中抽取一容量為的樣本,當選取抽簽法、隨機數法和分層隨機抽樣三種不同方法時,總體中每個個體被抽中的概率分別為,三者關系可能是( )A. B. C. D.【答案】B【分析】根據抽樣的概念,每個個體被抽中的概率是均等的,進而即可選擇答案.【詳解】因為在抽簽法抽樣、隨機數法抽樣和分層隨機抽樣中,每個個體被抽中的概率均為,所以.故選:B.2.(2024高一下·全國·專題練習)某中學高一年級有400人,高二年級有320人,高三年級有280人,若用隨機數法在該中學抽取容量為n的樣本,每人被抽到的可能性都為0.2,則n等于( )A.80 B.160 C.200 D.280【答案】C【分析】根據簡單隨機抽樣概率的求解方法,列出方程計算即可.【詳解】由題意可知,,解得.故選:C3.(2024·陜西西安·一模)某高校對中文系新生進行體測,利用隨機數表對650名學生進行抽樣,先將650名學生進行編號,001,002,…,649,650.從中抽取50個樣本,下圖提供隨機數表的第4行到第6行,若從表中第5行第6列開始向右讀取數據,則得到的第6個樣本編號是( )32 21 18 34 29 78 64 54 07 32 52 42 06 44 38 12 23 43 56 77 35 78 90 56 4284 42 12 53 31 34 57 86 07 36 25 30 07 32 86 23 45 78 89 07 23 68 96 08 0432 56 78 08 43 67 89 53 55 77 34 89 94 83 75 22 53 55 78 32 45 77 89 23 45A.623 B.328 C.072 D.457【答案】A【分析】按照隨機數表提供的數據,三位一組的讀數,并取001到650內的數,重復的只取一次即可【詳解】從第5行第6列開始向右讀取數據,第一個數為253,第二個數是313,第三個數是457,下一個數是860,不符合要求,下一個數是736,不符合要求,下一個是253,重復,第四個是007,第五個是328,第六個數是623,,故A正確.故選:A.1.(2024·四川成都·模擬預測)用簡單隨機抽樣的方法從含有10個個體的總體中抽取一個容量為3的樣本,其中某一個體a“第一次被抽到”的可能性與“第二次被抽到”的可能性分別是( )A., B.,C., D.,【答案】A【分析】根據簡單隨機抽樣的等可能性,即可判斷和選擇.【詳解】總體有10個個體,從中抽取第一個,若為,則其可能性為,若不為,則其可能性為;抽取第二個,若其為,則第一次一定不是,再從9個個體中抽取1個,且為,則其可能性為.綜上所述,某一個體a“第一次被抽到”的可能性與“第二次被抽到”的可能性分別是.故選:A.2.(2024·云南貴州·二模)本次月考分答題卡的任務由高三16班完成,現從全班55位學生中利用下面的隨機數表抽取10位同學參加,將這55位學生按01、02、、55進行編號,假設從隨機數表第1行第2個數字開始由左向右依次選取兩個數字,重復的跳過,讀到行末則從下一行行首繼續,則選出來的第6個號碼所對應的學生編號為( )0627 4313 2432 5327 0941 2512 6317 6323 2616 8045 60111410 9577 7424 6762 4281 1457 2042 5332 3732 2707 36070140 0523 2617 3726 3890 5124 5179 3014 2310 2118 2191A.51 B.25 C.32 D.12【答案】A【分析】根據隨機數表按照規則讀數即可得解.【詳解】根據隨機數表讀取,分別抽到的編號為31,32,43,25,12,51,26,04,01,11,所以選出來的第6個號碼所對應的學生編號為51,故選:A考點二、分層隨機抽樣1.(2024·江西南昌·模擬預測)已知三種不同型號的產品數量之比依次為,現用分層抽樣的方法抽取容量為的樣本,若樣本中型號產品有件,則為( )A.60 B.70 C.80 D.90【答案】B【分析】由條件確定型號產品的抽樣比,再根據頻數,頻率,樣本容量的關系求.【詳解】因為三種不同型號的產品數量之比依次為,且用分層抽樣的方法抽取一個容量為的樣本,所以型號產品被抽的抽樣比為:,因為型號產品有件,所以,解得.故選:B.2.(2023·全國·高考真題)某學校為了解學生參加體育運動的情況,用比例分配的分層隨機抽樣方法作抽樣調查,擬從初中部和高中部兩層共抽取60名學生,已知該校初中部和高中部分別有400名和200名學生,則不同的抽樣結果共有( ).A.種 B.種C.種 D.種【答案】D【分析】利用分層抽樣的原理和組合公式即可得到答案.【詳解】根據分層抽樣的定義知初中部共抽取人,高中部共抽取,根據組合公式和分步計數原理則不同的抽樣結果共有種.故選:D.3.(2024·上海·高考真題)水果分為一級果和二級果,共136箱,其中一級果102箱,二級果34箱.(1)隨機挑選兩箱水果,求恰好一級果和二級果各一箱的概率;(2)進行分層抽樣,共抽8箱水果,求一級果和二級果各幾箱;(3)抽取若干箱水果,其中一級果共120個,單果質量平均數為303.45克,方差為603.46;二級果48個,單果質量平均數為240.41克,方差為648.21;求168個水果的方差和平均數,并預估果園中單果的質量.【答案】(1)(2)一級果抽取6箱,二級果抽取2箱(3)方差克,平均數克,預估平均質量為克【分析】(1)利用組合知識和超幾何分布求概率公式求出答案;(2)利用分層抽樣的定義進行求解;(3)根據公式計算出總體樣本平均質量和方差,并預估平均質量.【詳解】(1)設A事件為恰好選到一級果和二級果各一箱,樣本空間的樣本點的個數,A事件的樣本點的公式,所以;(2)因為一級果箱數:二級果箱數,所以8箱水果中有一級果抽取箱,二級果抽取箱;(3)設一級果平均質量為,方差為,二級果質量為,方差為,總體樣本平均質量為,方差為,因為,,,,所以克,克.預估平均質量為克.1.(2024·河南·三模)國內某優秀新能源電池制造企業在鋰電池單位能量密度技術上取得了重大突破,該制造企業內的某車間有兩條生產線,分別生產高能量密度鋰電池和低能量密度鋰電池,總產量為400個鋰電池.質檢人員采用分層隨機抽樣的方法隨機抽取了一個容量為80的樣本進行質量檢測,已知樣本中高能量密度鋰電池有35個,則估計低能量密度鋰電池的總產量為( ).A.325個 B.300個 C.225個 D.175個【答案】C【分析】根據分層抽樣計算規則計算可得.【詳解】根據分層隨機抽樣可知低能量密度鋰電池的產量為(個).故選:C2.(2024·黑龍江雙鴨山·模擬預測)為了解某校初中學生的近視情況,按年級用分層抽樣的方法隨機抽取100名學生進行視力檢測,已知初一、初二、初三年級分別有800名,600名,600名學生,則不同的抽樣結果共有( )A. B. C. D.【答案】A【分析】根據分層抽樣可知抽取初一學生40名,初二、初三學生各30名,由分步乘法計數原理即可求解.【詳解】由初一、初二、初三年級分別有800名,600名,600名學生可知,抽樣比為,按年級用分層抽樣的方法隨機抽取初一學生40名,初二、初三學生各30名,根據分步乘法計數原理可知,不同的抽樣結果共有.故選:.考點三、條形統計圖1.(2024·江西·二模)下圖是我國年純電動汽車銷量統計情況,則下列說法錯誤的是( ) A.我國純電動汽車銷量呈現逐年增長趨勢B.這六年銷量的第60百分位數為536.5萬輛C.2020年銷量高于這六年銷量的平均值D.這六年增長率最大的為2019年至2020年【答案】C【分析】根據條形圖數據一一分析即可.【詳解】對于A,從條形圖中看出,純電動汽車銷量逐年遞增,故A正確;對于B,因為,將所有汽車銷量數據從小到大排序,所以銷量的第60百分位數為第4個數據,即536.5,故B正確;對于C,這六年銷量的平均數為,故C錯誤;對于D,因為2019年至2020年的增長率為,超過其他年份的增長率,故D正確.故選:C.2.(2024·全國·模擬預測)如圖為某中型綜合超市年的年總營業額(單位:萬元)的統計圖,則下列說法錯誤的是( ) A.年的年總營業額的極差為2200萬元B.年的年總營業額波動性比年的年總營業額波動性小C.年的年總營業額逐年上升,2021年跌落低谷,之后每年又呈上升趨勢D.年的年總營業額的中位數是2019年和2020年的年總營業額的平均數【答案】D【分析】根據統計圖表數據一一分析即可.【詳解】對于A:年的年總營業額的最大值為3400萬元,最小值為1200萬元,所以極差為(萬元),故A正確;對于B:年的年總營業額波動性比年的年總營業額波動性小,故B正確;對于C:年的年總營業額逐年上升,2021年跌落低谷,之后每年又呈上升趨勢,故C正確;對于D:年的年總營業額按從小到大的順序排列為:1200萬元、2000萬元、2100萬元、2200萬元、2400萬元、2800萬元、3200萬元、3400萬元,所以年年總營業額的中位數是2200萬元和2400萬元的平均數,即2017年和2018年的年總營業額的平均數,故D錯誤.故選:D1.(2024·四川達州·二模)下圖是某地區2016-2023年旅游收入(單位:億元)的條形圖,則下列說法錯誤的是( ) A.該地區2016-2019年旅游收入逐年遞增B.該地區2016-2023年旅游收入的中位數是4.30C.經歷了疫情之后,該地區2023年旅游收入恢復到接近2018年水平D.該地區2016-2023年旅游收入的極差是3.69【答案】B【分析】根據中位數、極差的定義即可判斷BD;結合圖形,分析數據即可判斷AC.【詳解】A:由圖可知該地區2016-2019年旅游收入逐年遞增,故A正確;B:由圖可知,2016-2023年旅游收入的中位數為億元,故B錯誤;C:從圖表可知2023年旅游收入為4.91億元,接近2018年的5.13億元,故C正確;D:2016-2023年旅游收入的極差是億元,故D正確.故選:B.2.(2024·陜西西安·模擬預測)國家統計局發布的2018年至2022年我國居民消費水平情況如圖所示,則下列說法正確的是(居民消費水平)( ) A.2018年至2022年我國居民消費水平逐年提高B.2018年至2022年我國城鎮居民消費水平逐年提高C.2018年至2022年我國居民消費水平數據的極差為6463元D.2022年我國城鎮人口數比農村人口數的1.5倍還要多【答案】D【分析】對于AB選項,由統計圖可得答案;對于C選項,結合題目數據可得答案;對于D選項,由統計圖數據結合居民消費水平計算公式可得答案.【詳解】對于A,2019年的居民消費水平比2020年的居民消費水平高,故A錯誤;對于B, 2018年至2022年我國城鎮居民消費水平不是逐年提高,故B錯誤;對于C,2018年至2022年我國居民消費水平數據的極差為6473元,故C錯誤;對于D,設我國農村人口數為,城鎮人口數為,則,化簡得,所以2022年我國城鎮人口數比農村人口數的1.5倍還要多,故D正確.故選:D考點四、折線統計圖1.(2024·遼寧撫順·三模)(多選)年月日國家統計局發布了制造業采購經理指數(),如下圖所示:下列說法正確的是( )A.從年月到年月,這個月的制造業采購經理指數()的第百分位數為B.從年月到年月,這個月的制造業采購經理指數()的極差為C.從年月到年月制造業采購經理指數()呈下降趨勢D.大于表示經濟處于擴張活躍的狀態;小于表示經濟處于低迷萎縮的狀態,則年月到年月,經濟處于擴張活躍的狀態【答案】ABD【分析】根據折線圖中的數據,結合極差、平均數、百分位數定義與計算方法逐一判斷即可.【詳解】由圖知,從年月到年月,這個月的制造業采購經理指數()從小到大的順序為,因為,所以第百分位數為第個數,即為,故A正確;從年月到年月,這個月的制造業采購經理指數()的最大值為,最小值為,所以極差為,故B正確;由圖易知制造業采購經理指數()有升有降,故C錯誤;由圖知年月到年月PMI均大于,所以經濟處于擴張活躍的狀態,故D正確.故選:ABD.2.(2024·全國·二模)(多選)人均可支配收入和人均消費支出是兩個非常重要的經濟和民生指標,常被用于衡量一個地區經濟發展水平和群眾生活水平.下圖為2018~2023年前三季度全國城鎮居民人均可支配收入及人均消費支出統計圖,據此進行分析,則( )A.2018~2023年前三季度全國城鎮居民人均消費支出逐年遞增B.2018~2023年前三季度全國城鎮居民人均可支配收入逐年遞增C.2018~2023年前三季度全國城鎮居民人均可支配收入的極差比人均消費支出的極差小D.2018~2023年前三季度全國城鎮居民人均消費支出的中位數為21180元【答案】BD【分析】根據給定的折線圖,結合統計知識逐項分析判斷得解.【詳解】對于A,由題中折線圖知,20182023年前三季度全國城鎮居民人均消費支出先增后減再增,A錯誤;對于B,由題中折線圖知人均可支配收入逐年遞增,B正確;對于C,20182023年前三季度全國城鎮居民人均可支配收入的極差為元,人均消費支出的極差為元,C錯誤;對于D,20182023年前三季度全國城鎮居民人均消費支出的中位數為元,D正確.故選:BD1.(2024·黑龍江·三模)(多選)在某市初三年級舉行的一次體育考試中(滿分100分),所有考生成績均在[50,100]內,按照[50,60),[60,70),[70,80),[80,90),[90,100]分成五組,甲、乙兩班考生的成績占比如圖所示,則下列說法錯誤的是( ) A.成績在[70,80)的考生中,甲班人數多于乙班人數B.甲班成績在[80,90)內人數最多C.乙班成績在[70,80)內人數最多D.甲班成績的極差比乙班成績的極差小【答案】ACD【分析】根據折線統計圖逐個分析判斷即可.【詳解】對于A,由圖知,每一組中的成績占比都是以各自班級的總人數為基數的,所以每一組中的甲班、乙班人數不能從所占的百分比來判斷,故A錯誤;對于BC,由圖可知甲班成績主要集中在[80,90),乙班成績主要集中在[60,70),B正確,C錯誤;對于D,由圖可知甲班成績的極差和乙班成績的極差的大小無法確定,故D錯誤.故選:ACD2.(23-24高三下·山東·開學考試)(多選)進入冬季哈爾濱旅游火爆全網,下圖是2024年1月1.日到1月7日哈爾濱冰雪大世界和中央大街日旅游人數的折線圖,則( )A.中央大街日旅游人數的極差是1.2 B.冰雪大世界日旅游人數的中位數是2.3C.冰雪大世界日旅游人數的平均數比中央大街大 D.冰雪大世界日旅游人數的方差比中央大街大【答案】BC【分析】根據折線圖可求中央大街日旅游人數的極差、冰雪大世界日旅游人數的中位數,故可判斷AB的正誤.同樣根據折線圖可求兩者的均值和方差,故可判斷CD的正誤.【詳解】對于A,中央大街日旅游人數的最大值為萬,最小值為萬,極差為萬,故A錯誤.對于B,冰雪大世界日旅游人數由小到大依次為:,其中位數為,故B正確.對于C,冰雪大世界日旅游人數的平均值為,中央大街日旅游人數的平均值為,因,故C正確.對于D,冰雪大世界日旅游人數的方差為:,中央大街日旅游人數的方差為:,故冰雪大世界日旅游人數的方差比中央大街小,故D錯誤,故選:BC.考點五、扇形統計圖1.(2024·山東菏澤·模擬預測)南丁格爾玫瑰圖是由近代護理學和護士教育創始人南丁格爾設計的,圖中每個扇形圓心角都是相等的,半徑長短表示數量大小.某機構統計了近幾年某國知識付費用戶數量(單位:億人次),并繪制成南丁格爾玫瑰圖(如圖所示),根據此圖,以下說法錯誤的是( )A.2016年至2023年,知識付費用戶數量逐年增加B.2016年至2023年,知識付費用戶數量逐年增加量2019年最多C.2016年至2023年,知識付費用戶數量的逐年增加量逐年遞增D.2023年知識付費用戶數量超過2016年知識付費用戶數量的10倍【答案】C【分析】利用題中所給的南丁格爾玫瑰圖逐一考查所給選項,即可得解.【詳解】對于A:由圖可知,2016年至2023年,知識付費用戶數量逐年增加,故A正確;對于B和C:知識付費用戶數量的逐年增加量分別為:2017年,;2018年,;2019年,;2020年,;2021年,;2022年,;2023年,;則知識付費用戶數量逐年增加量2019年最多,知識付費用戶數量的逐年增加量不是逐年遞增,故B正確,C錯誤;對于D:由,則2023年知識付費用戶數量超過2016年知識付費用戶數量的倍,故D正確;綜上,說法錯誤的選項為C.故選:C2.(2024·湖南邵陽·模擬預測)(多選)有關數據顯示,年輕一代的父母更加重視親子陪伴,以往“以孩子為中心”的觀念正逐步向與孩子玩在一起、學在一起的方向轉變.如圖為2023年中國父母參與過的各類親子活動人數在參與調查總人數中的占比,根據該圖,下列說法正確的是( )A.在參與調查的總人數中父母參與過的親子活動最多的是親子閱讀B.在參與調查的總人數中同時參與過親子閱讀與親子運動會的父母不少于C.圖中各類親子活動占比的中位數為D.圖中10類親子活動占比的極差為【答案】AB【分析】根據給定的扇形圖,結合中位數、極差的意義逐項分析判斷即得.【詳解】對于A,親子閱讀閱讀占比,為最大,A正確;對于B,由于,B正確;對于C,圖中各類親子活動占比的中位數為,C錯誤;對于D,圖中10類親子活動占比的極差為,D錯誤.故選:AB1.(2024·遼寧·模擬預測)某高中2023年的高考考生人數是2022年高考考生人數的1.5倍.為了更好地對比該校考生的升學情況,統計了該校2022年和2023年高考分數達線情況,得到如圖所示扇形統計圖: 下列結論正確的是( )A.該校2023年與2022年的本科達線人數比為6:5B.該校2023年與2022年的專科達線人數比為6:7C.2023年該校本科達線人數比2022年該校本科達線人數增加了80%D.2023年該校不上線的人數有所減少【答案】C【分析】設2022年的高考人數為100,則2023年的高考人數為150,再根據扇形統計圖中各個種類的人數所占的比例,逐個選項判斷即可.【詳解】不妨設2022年的高考人數為100,則2023年的高考人數為150,2022年本科達線人數為50,2023年本科達線人數為90,2023年與2022年的本科達線人數比為9:5,本科達線人數增加了,故A錯誤,C正確;2022年專科達線人數為35,2023年專科達線人數為45,2023年與2022年的專科達線人數比為9:7,故B錯誤;2022年不上線人數為15,2023年不上線人數也是15,不上線的人數無變化,故D錯誤.故選:C.2.(2024·遼寧·二模)(多選)下圖為某市2023年第一季度全市居民人均消費支出構成圖.已知城鎮居民人均消費支出7924元,與上一年同比增長4.4%;農村居民人均消費支出4388元,與上一年同比增長7.8%,則關于2023年第一季度該市居民人均消費支出,下列說法正確的是( )A.2023年第一季度該市居民人均消費支出6393元B.居住及食品煙酒兩項的人均消費支出總和超過了總人均消費支出的50%C.城鄉居民人均消費支出的差額與上一年同比在縮小D.醫療保健與教育文化娛樂兩項人均消費支出總和約占總人均消費支出的20.6%【答案】ABD【分析】根據消費支出構成圖及已知條件分析數據一一判定選項即可.【詳解】2023年第一季度全市居民人均消費支出為(元),故A正確;易知居住及食品煙酒兩項的人均消費支出總和為(元),占總人均消費支出的,故B正確:依題意可得2022年第一季度城鄉居民人均消費支出的差額為(元),2023年第一季度城鄉居民人均消費支出的差額為(元),由于,故C錯誤;醫療保健與教育文化娛樂兩項人均消費支出總和占總人均消費支出的,故D正確.故選:ABD.考點六、頻率分布表1.現有一個容量為50的樣本,其數據的頻數分布表如下表所示:組號 1 2 3 4 5頻數 8 11 10 9則第4組的頻數和頻率分別是( )A.12,0.06 B.12,0.24 C.18,0.09 D.18,0.36【答案】B【分析】根據表格中數據,先計算出頻數,再計算頻率.【詳解】第4組的頻數,頻率為.故選:B1.某單位招聘員工,有名應聘者參加筆試,隨機抽查了其中名應聘者筆試試卷,統計他們的成績如下表:分數段人數 1 3 6 6 2 1 1若按筆試成績擇優錄取名參加面試,由此可預測參加面試的分數線為A.分 B.分 C.分 D.分【答案】C【詳解】分析:根據從名應聘者,按筆試成績擇優錄取名參加面試,可以求出錄取的比例為.進而求出隨機抽查的名應聘者能錄取的人數為.再由名應聘者的成績表可知,能錄取的4人都在80分之上.可預測參加面試的分數線為80分.詳解:因為有名應聘者參加筆試,按筆試成績擇優錄取名參加面試,所以錄取的比例為.隨機抽查的名應聘者能錄取的人數為.由名應聘者的成績表可知,能錄取的4人都在80分之上.故可預測參加面試的分數線為80分.故選C.點睛:分層抽樣應先確定抽樣的比例,再根據須抽取的個體數和抽樣比例可得各段抽取的個體數.本題考查分層抽樣及學生的轉化能力.考點七、頻率分布直方圖1.(2022·天津·高考真題)將1916到2015年的全球年平均氣溫(單位:),共100個數據,分成6組:,并整理得到如下的頻率分布直方圖,則全球年平均氣溫在區間內的有( )A.22年 B.23年 C.25年 D.35年【答案】B【分析】由頻率分布直方圖可得所求區間的頻率,進而可以求得結果.【詳解】全球年平均氣溫在區間內的頻率為,則全球年平均氣溫在區間內的有年.故選:B.2.(2021·天津·高考真題)從某網絡平臺推薦的影視作品中抽取部,統計其評分數據,將所得個評分數據分為組:、、、,并整理得到如下的頻率分布直方圖,則評分在區間內的影視作品數量是( )A. B. C. D.【答案】D【分析】利用頻率分布直方圖可計算出評分在區間內的影視作品數量.【詳解】由頻率分布直方圖可知,評分在區間內的影視作品數量為.故選:D.3.(2021·全國·高考真題)為了解某地農村經濟情況,對該地農戶家庭年收入進行抽樣調查,將農戶家庭年收入的調查數據整理得到如下頻率分布直方圖:根據此頻率分布直方圖,下面結論中不正確的是( )A.該地農戶家庭年收入低于4.5萬元的農戶比率估計為6%B.該地農戶家庭年收入不低于10.5萬元的農戶比率估計為10%C.估計該地農戶家庭年收入的平均值不超過6.5萬元D.估計該地有一半以上的農戶,其家庭年收入介于4.5萬元至8.5萬元之間【答案】C【分析】根據直方圖的意義直接計算相應范圍內的頻率,即可判定ABD,以各組的中間值作為代表乘以相應的頻率,然后求和即得到樣本的平均數的估計值,也就是總體平均值的估計值,計算后即可判定C.【詳解】因為頻率直方圖中的組距為1,所以各組的直方圖的高度等于頻率.樣本頻率直方圖中的頻率即可作為總體的相應比率的估計值.該地農戶家庭年收入低于4.5萬元的農戶的比率估計值為,故A正確;該地農戶家庭年收入不低于10.5萬元的農戶比率估計值為,故B正確;該地農戶家庭年收入介于4.5萬元至8.5萬元之間的比例估計值為,故D正確;該地農戶家庭年收入的平均值的估計值為(萬元),超過6.5萬元,故C錯誤.綜上,給出結論中不正確的是C.故選:C.【點睛】本題考查利用樣本頻率直方圖估計總體頻率和平均值,屬基礎題,樣本的頻率可作為總體的頻率的估計值,樣本的平均值的估計值是各組的中間值乘以其相應頻率然后求和所得值,可以作為總體的平均值的估計值.注意各組的頻率等于.4.(2022·全國·高考真題)在某地區進行流行病學調查,隨機調查了100位某種疾病患者的年齡,得到如下的樣本數據的頻率分布直方圖: (1)估計該地區這種疾病患者的平均年齡(同一組中的數據用該組區間的中點值為代表);(2)估計該地區一位這種疾病患者的年齡位于區間的概率;(3)已知該地區這種疾病的患病率為,該地區年齡位于區間的人口占該地區總人口的.從該地區中任選一人,若此人的年齡位于區間,求此人患這種疾病的概率.(以樣本數據中患者的年齡位于各區間的頻率作為患者的年齡位于該區間的概率,精確到0.0001).【答案】(1)歲;(2);(3).【分析】(1)根據平均值等于各矩形的面積乘以對應區間的中點值的和即可求出;(2)設{一人患這種疾病的年齡在區間},根據對立事件的概率公式即可解出;(3)根據條件概率公式即可求出.【詳解】(1)平均年齡 (歲).(2)設{一人患這種疾病的年齡在區間},所以.(3)設“任選一人年齡位于區間[40,50)”,“從該地區中任選一人患這種疾病”,則由已知得:,則由條件概率公式可得從該地區中任選一人,若此人的年齡位于區間,此人患這種疾病的概率為.1.(2024·湖北黃岡·模擬預測)為了解高中學生每天的體育活動時間,某市教育部門隨機抽取高中學生進行調查,把每天進行體育活動的時間按照時長(單位:分鐘)分成組:,,,,,.然后對統計數據整理得到如圖所示的頻率分布直方圖,則可估計這名學生每天體育活動時間的第百分位數為( )A. B. C. D.【答案】A【分析】根據第百分位數的概念,知道它在第二組里.運用概率之和為,構造方程,解出即可.【詳解】第百分位數設為,而,則所求百分位數在第二組,則可列方程解得.故選:A.2.(2024·廣西桂林·模擬預測)(多選)某次數學考試后,為分析學生的學習情況,某校從某年級中隨機抽取了100名學生的成績,整理得到如圖所示的頻率分布直方圖.為進一步分析高分學生的成績分布情況,計算得到這100名學生中,成績位于內的學生成績方差為12,成績位于內的同學成績方差為10.則( )A.B.估計該年級學生成績的中位數約為77.14C.估計該年級成績在80分及以上的學生成績的平均數為87.50D.估計該年級成績在80分及以上的學生成績的方差為32【答案】BC【分析】利用小長方形面積和為1得項錯誤;面積等于0.5的值即為中位數,可知正確;利用直方圖中平均數和方差公式可得正確,錯誤.【詳解】項,,,項錯誤;項,,內頻率為:,,內頻率為:,則中位數在,內,設中位數為,則,則,正確;成績在80分及以上的同學的成績的平均數為分,方差為,正確,錯誤.故選:.3.(2024·福建泉州·模擬預測)(多選)某校在開展“弘揚中華傳統文化,深植文化自信之根”主題教育的系列活動中,舉辦了“誦讀國學經典,傳承中華文明”知識競賽.賽前為了解學生的備賽情況,組織對高一年和高二年學生的抽樣測試,測試成績數據處理后,得到如下頻率分布直方圖,則下面說法正確的是( )A.高一年抽測成績的眾數為75B.高二年抽測成績低于60分的比率為C.估計高一年學生成績的平均分低于高二年學生成績的平均分D.估計高一年學生成績的中位數低于高二年學生成績的中位數【答案】ACD【詳解】根據頻率分步直方圖 樣本的數字特征等基礎知識判斷即可.【試題解析】選項A:高一年學生成績的眾數為區間的中點橫坐標,故A正確;選項B:高二年學生成績得分在區間的學生人數頻率為,所以低于60分的比率為,故B錯誤;選項C:高一年學生成績的平均數約為分;高二年學生成績的平均數約為分,因為,故C正確;選項D:高一年學生成績的中位數位于,高二年學生成績的中位數位于,故D正確;故選:ACD.4.(2024·江蘇南京·二模)(多選)2023年10月31日,神舟十六號載人飛船返回艙在東風著陸場成功著陸,激發了學生對航天的熱愛.某校組織高中學生參加航天知識競賽,現從中隨機抽取100名學生成績分為四組,分別為,得到頻率分布直方圖如圖所示,則( ) A.B.這組樣本數據的分位數為88C.若從這100名學生成績不低于80分的學生中,隨機抽取3人,則此3人的分數都不低于90分的概率為D.若用樣本的頻率估計總體,從該校高中學生中隨機抽199人,記“抽取199人中成績不低于90的人數為”的事件為,則最大時,.【答案】AB【分析】對于A,由頻率之和為1結合頻率分布直方圖數據即可求解;對于B,先求出成績在和內的頻率,進而判斷分位數的范圍即可根據百分位數的定義直接進行求解;對于C,分別求出成績不低于80分和不低于90分的人數,即可求解概率;對于D,先由頻率分布直方圖得成績不低于90分的概率,接著由二項分布概率公式求出,再令即可求解.【詳解】對于A,由頻率分布直方圖得,故A對;對于B,由頻率分布直方圖結合選項A可知:成績在內的頻率為,成績在內的頻率為,所以分位數在80到90分之間,故分位數為,故B對;對于C,成績不低于80分的共有人,不低于90分的共有人,則隨機抽取3人,則此3人的分數都不低于90分的概率,故C錯;對于D,由頻率分布直方圖可知,成績不低于90分的概率,由題意,由題意,令即,所以即,解得,故為29或30,故D錯.故選:AB.考點八、總體百分位數的估計1.(2024·江西·一模)從1984年第23屆洛杉磯夏季奧運會到2024年第33屆巴黎夏季奧運會,我國獲得的夏季奧運會金牌數依次為15、5、16、16、28、32、51、38、26、38、40,這11個數據的分位數是( )A.16 B.30 C.32 D.51【答案】C【分析】將數據按照從小到大的順序排列,根據百分位數的計算方法即可求解.【詳解】把11個數據按照從小到大排列得5、15、16、16、26、28、32、38、38、40、51,因為,這11個數據按照從小到大排列第7個是32.故選:.2.(2024·安徽·模擬預測)一組數據按從小到大的順序排列為2,4,m,12,16,17,若該組數據的中位數是極差的,則該組數據的第40百分位數是 .【答案】6【分析】先依據題意列等量關系式求出m,再依據百分位數的定義以及求解步驟直接求解即可得解.【詳解】由題該組數據的極差為,中位數為,所以,又,所以該組數據的第40百分位數是該組數據的第三位數為6.故答案為:6.3.(2024·廣東廣州·模擬預測)(多選)已知,,,,,為依次增大的一組數據,則去掉和后,這組數據的( )一定減小.A.極差 B.下四分位數 C.上四分位數 D.中位數【答案】AC【分析】利用極差、百分位數、中位的定義,逐一對各個選項分析判斷,即可求出結果.【詳解】對于選項A,原先極差為,去掉后極差為,由于數據依次增大,則極差減小,所以選項A正確,對于選項B,原先6個數據,因為不是整數,所以向上取整,下四分位數為第二個數,去掉后4個數據,是整數,所以取與上一個數的平均值,下四分位數增大,所以選項B錯誤,對于選項C,原先6個數據,因為不是整數,所以向上取整,上四分位數為第個數,去掉后4個數據,是整數,所以取與上一個數的平均值,上四分位數減小,所以選項C正確,選項D,因為中位數始終為,中位數保持不變,所以選項D錯誤,故選:AC.1.(2024·安徽六安·模擬預測)樣本數據16,20,24,21,22,18,14,28的分位數為( )A.16 B.17 C.23 D.24【答案】C【分析】根據已知條件,結合百分位數的定義,即可求解.【詳解】解:樣本數據由小到大排列為,共8個數據,,所以分位數為.故選:C.2.(2024·河南周口·模擬預測)已知一組從小到大排列的數據:a,2,2,4,4,5,6,b,8,8,若其第70百分位數等于其極差,則 .【答案】10【分析】由百分位數、極差的定義求解即可.【詳解】因為,所以a,2,2,4,4,5,6,b,8,8的第70百分位數為,其極差為,所以,解得.故答案為:10.考點九、總體集中趨勢的估計1.(2023·全國·高考真題)(多選)有一組樣本數據,其中是最小值,是最大值,則( )A.的平均數等于的平均數B.的中位數等于的中位數C.的標準差不小于的標準差D.的極差不大于的極差【答案】BD【分析】根據題意結合平均數、中位數、標準差以及極差的概念逐項分析判斷.【詳解】對于選項A:設的平均數為,的平均數為,則,因為沒有確定的大小關系,所以無法判斷的大小,例如:,可得;例如,可得;例如,可得;故A錯誤;對于選項B:不妨設,可知的中位數等于的中位數均為,故B正確;對于選項C:因為是最小值,是最大值,則的波動性不大于的波動性,即的標準差不大于的標準差,例如:,則平均數,標準差,,則平均數,標準差,顯然,即;故C錯誤;對于選項D:不妨設,則,當且僅當時,等號成立,故D正確;故選:BD.2.(2024·黑龍江哈爾濱·三模)如圖所示,下列頻率分布直方圖顯示了三種不同的形態.圖(1)形成對稱形態,圖(2)形成“右拖尾”形態,圖(3)形成“左拖尾”形態,根據所給圖作出以下判斷,正確的是( )A.圖(1)的平均數=中位數>眾數 B.圖(2)的眾數<中位數<平均數C.圖(2)的平均數<眾數<中位數 D.圖(3)的中位數<平均數<眾數【答案】B【分析】根據平均數,中位數,眾數的概念結合圖形分析判斷.【詳解】圖(1)的分布直方圖是對稱的,所以平均數=中位數=眾數,故A錯誤;圖(2)頻率直方圖可得,單峰不對稱且“右拖尾”,最高峰偏左,眾數最小,平均數易受極端值的影響,與中位數相比,平均數總是在“拖尾”那邊,平均數大于中位數,故B正確,C錯誤;同理圖(3)“左拖尾”,眾數最大,平均數小于中位數,故D錯誤.故選:B.3.(2024·重慶九龍坡·三模)(多選)已知樣本數據的平均數為2,方差為1,則下列說法正確的是( )A.數據,的平均數為6B.數據,的方差為9C.數據的方差為1D.數據的平均數為5【答案】BD【分析】對于AB:根據平均數、方差的性質分析求解;對于CD:根據平均數、方差公式運算求解.【詳解】因為樣本數據的平均數為2,方差為1,對于選項A:所以數據,的平均數為,故A錯誤;對于選項B:數據,的方差為,故B正確;對于選項C:因為,,則數據的平均數為,所以方差為,故C錯誤;對于選項D:由,,得,可得,所以數據的平均數為,故D正確;故選:BD.1.(23-24高三下·北京·開學考試)設一組數據,則數據的平均值為 ,30%分位數為 .【答案】 11 5【分析】先求得數據的平均數,進一步計算可得到數據的平均值;根據百分位數的計算公式進行計算即可.【詳解】數據,則的平均數為,故數據的平均值為;因為,故從小到大進行排列的第三個數5為所求.故答案為:11;5.2.(2024·廣東廣州·模擬預測)已知數據,且滿足,若去掉,后組成一組新數據,則新數據與原數據相比,有可能變大的是( )A.平均數 B.中位數 C.極差 D.方差【答案】A【分析】根據極差,中位數以及方差的定義即可排除BCD,舉反例即可求解A.【詳解】由于,所以原來的極差為,新數據的極差為,故極差變小,原來和新數據的中位數均為,故中位數不變,去掉,后,數據波動性變小,故方差變小,因此可能變大的是平均數,比如,原數據的平均數為6.6,去掉1和12后,新數據的平均數為,但,故A正確.故選:A3.(2024·浙江·三模)(多選)已知a,,有一組樣本數據為,3,,,8,10,,12,13,若在這組數據中再插入一個數8,則( )A.平均數不變 B.中位數不變 C.方差不變 D.極差不變【答案】AD【分析】求出樣本數據的平均數,判斷A的真假;令取特殊值,驗證B的真假;利用方差的計算公式求方差判斷C的真假;因為8不是最值,所以插入8不影響極差,可判斷D的真假.【詳解】對于A選項,原數據的平均數為8,插入一個數8,平均數不變,正確;對于B選項,取,,原數據的中位數為9,新數據的中位數為8.5,錯誤;對于C選項,新數據的方差為,錯誤;對于D選項,因為,所以8不是最值,故新數據的極差不變,正確.故選:AD考點十、總體離散程度的估計1.(2024·陜西商洛·模擬預測)設一組樣本數據的平均值是1,且的平均值是3,則數據的方差是( )A.1 B.2 C.3 D.4【答案】B【分析】根據已知條件結合方差公式直接求解即可.【詳解】由題意得,所以數據的方差.故選:B2.(2024·黑龍江哈爾濱·模擬預測)已知有4個數據的平均值為5,方差為4,現加入數據6和10,則這6個數據的新方差為( )A. B. C.6 D.10【答案】C【分析】設原來的 4 個數依次為 , , , , 再利用平均數和方差的計算公式結合整體法即可.【詳解】設原來的4個數依次為,,,,原來4個數據的平均值為5,方差為4,,,,,現加入數據6和10,則這6個數據的平均數為,則這6個數據的方差為:.故選:C.3.(2021·全國·高考真題)(多選)下列統計量中,能度量樣本的離散程度的是( )A.樣本的標準差 B.樣本的中位數C.樣本的極差 D.樣本的平均數【答案】AC【分析】考查所給的選項哪些是考查數據的離散程度,哪些是考查數據的集中趨勢即可確定正確選項.【詳解】由標準差的定義可知,標準差考查的是數據的離散程度;由中位數的定義可知,中位數考查的是數據的集中趨勢;由極差的定義可知,極差考查的是數據的離散程度;由平均數的定義可知,平均數考查的是數據的集中趨勢;故選:AC.4.(2021·全國·高考真題)(多選)有一組樣本數據,,…,,由這組數據得到新樣本數據,,…,,其中(為非零常數,則( )A.兩組樣本數據的樣本平均數相同B.兩組樣本數據的樣本中位數相同C.兩組樣本數據的樣本標準差相同D.兩組樣本數據的樣本極差相同【答案】CD【分析】A、C利用兩組數據的線性關系有、,即可判斷正誤;根據中位數、極差的定義,結合已知線性關系可判斷B、D的正誤.【詳解】A:且,故平均數不相同,錯誤;B:若第一組中位數為,則第二組的中位數為,顯然不相同,錯誤;C:,故方差相同,正確;D:由極差的定義知:若第一組的極差為,則第二組的極差為,故極差相同,正確;故選:CD5.(2023·全國·高考真題)某廠為比較甲乙兩種工藝對橡膠產品伸縮率的處理效應,進行10次配對試驗,每次配對試驗選用材質相同的兩個橡膠產品,隨機地選其中一個用甲工藝處理,另一個用乙工藝處理,測量處理后的橡膠產品的伸縮率.甲、乙兩種工藝處理后的橡膠產品的伸縮率分別記為,.試驗結果如下:試驗序號 1 2 3 4 5 6 7 8 9 10伸縮率 545 533 551 522 575 544 541 568 596 548伸縮率 536 527 543 530 560 533 522 550 576 536記,記的樣本平均數為,樣本方差為.(1)求,;(2)判斷甲工藝處理后的橡膠產品的伸縮率較乙工藝處理后的橡膠產品的伸縮率是否有顯著提高(如果,則認為甲工藝處理后的橡膠產品的伸縮率較乙工藝處理后的橡膠產品的伸縮率有顯著提高,否則不認為有顯著提高)【答案】(1),;(2)認為甲工藝處理后的橡膠產品的伸縮率較乙工藝處理后的橡膠產品的伸縮率有顯著提高.【分析】(1)直接利用平均數公式即可計算出,再得到所有的值,最后計算出方差即可;(2)根據公式計算出的值,和比較大小即可.【詳解】(1),,,的值分別為: ,故(2)由(1)知:,,故有,所以認為甲工藝處理后的橡膠產品的伸縮率較乙工藝處理后的橡膠產品的伸縮率有顯著提高.6.(2021·全國·高考真題)某廠研制了一種生產高精產品的設備,為檢驗新設備生產產品的某項指標有無提高,用一臺舊設備和一臺新設備各生產了10件產品,得到各件產品該項指標數據如下:舊設備 9.8 10.3 10.0 10.2 9.9 9.8 10.0 10.1 10.2 9.7新設備 10.1 10.4 10.1 10.0 10.1 10.3 10.6 10.5 10.4 10.5舊設備和新設備生產產品的該項指標的樣本平均數分別記為和,樣本方差分別記為和.(1)求,,,;(2)判斷新設備生產產品的該項指標的均值較舊設備是否有顯著提高(如果,則認為新設備生產產品的該項指標的均值較舊設備有顯著提高,否則不認為有顯著提高).【答案】(1);(2)新設備生產產品的該項指標的均值較舊設備有顯著提高.【分析】(1)根據平均數和方差的計算方法,計算出平均數和方差.(2)根據題目所給判斷依據,結合(1)的結論進行判斷.【詳解】(1),,,.(2)依題意,,,,所以新設備生產產品的該項指標的均值較舊設備有顯著提高.1.(2024·新疆·二模)若數據的平均數為,方差為,則數據的方差為( )A. B. C. D.【答案】C【分析】根據平均數和方差的計算公式計算即可.【詳解】因為數據的平均數為,方差為,所以,,所以數據的平均數為,方差為.故選:C.2.(2024·江蘇泰州·模擬預測)(多選)已知,有一組數據為,3,,,8,10,,12,13,若在這組數據中去除第5個數8,則( )A.平均數不變 B.中位數不變 C.方差不變 D.極差不變【答案】AD【分析】根據平均數,中位數,方差,極差的定義及計算公式逐一判斷即可.【詳解】原數據的平均數為,去除第5個數8后的平均數為,所以平均數不變,故A正確;當時,原數據的中位數為,去除第5個數8后的中位數為,此時中位數改變,故B錯誤;對于C,原數據的方差,去除第5個數8后的方差,所以,即方差改變,故C錯誤;對于D,因為,所以這個數對于極差沒有影響,即極差不變,故D正確.故選:AD.3.(2024·云南·模擬預測)某學校高三年級男生共有個,女生共有個,為調查該年級學生的年齡情況,通過分層抽樣,得到男生和女生樣本數據的平均數和方差分別為和,已知,則該校高三年級全體學生年齡的方差為( )A. B.C. D.【答案】C【分析】結合分層隨機抽樣的方差公式可得答案【詳解】學校高三年級男生共有個,所占比例為,女生個,所占比例為,故該校高三年級全體學生的年齡方差為:,當時,,,故選:C14.(2024·遼寧·模擬預測)某工廠為了提高精度,采購了一批新型機器,現對這批機器的生產效能進行測試,對其生產的第一批零件的內徑進行測量,統計繪制了如下圖所示的頻率分布直方圖. (1)求a的值以及這批零件內徑的平均值和方差(同一組中的數據用該組區間的中點值作代表);(2)以頻率估計概率,若在這批零件中隨機抽取4個,記內徑在區間內的零件個數為,求的分布列以及數學期望;(3)已知這批零件的內徑(單位:mm)服從正態分布,現以頻率分布直方圖中的平均數作為的估計值,頻率分布直方圖中的標準差作為的估計值,則在這批零件中隨機抽取200個,記內徑在區間上的零件個數為,求的方差.參考數據:,若,則,,.【答案】(1),,(2)的分布列見解析,(3)【分析】(1)根據頻率分布直方圖中所有小矩形的面積之和為1,及頻率分布直方圖中均值和方差的計算公式,求出相應的值即可;(2)確定的可能取值,求出不同的值對應的概率,得到的分布列,再根據離散型隨機變量數學期望的計算公式求出的數學期望即可;(3)由根據正態分布的概率求法,求出的概率,再根據二項分布的定義判定,最后根據二項分布方差的計算公式求出的方差.【詳解】(1)由,則,這批零件內徑的平均值:,,這批零件內徑的方差:,(2)由題意知,的可能取值為0,1,2,3,4,則,,,,,因此可得的分布列:0 1 2 3 40.4096 0.4096 0.1536 0.0256 0.0016則的數學期望.(3)由題意知,,,又,,則,由二項分布的定義知,由二項分布的方差公式知,.5.(2024·湖北武漢·模擬預測)四月的武漢被百萬株薔薇花覆蓋,形成了全城的花海景觀。薔薇花一般扦插繁殖,園林局為了更好的了解扦插枝條的長度對繁殖狀況的影響,選擇甲乙兩區按比例分層抽樣來抽取樣本.已知甲區的樣本容量,樣本平均數,樣本方差;乙區的樣本容量,樣本平均數,樣本方差.(1)求由兩區樣本組成的總樣本的平均數及其方差;(結果保留一位小數)(2)為了營造“花在風中笑,人在畫中游”的美景,甲乙兩區決定在各自最大的薔薇花海公園進行一次書畫比賽,兩區各派一支代表隊參加,經抽簽確定第一場在甲區舉行.比賽規則如下:每場比賽分出勝負,沒有平局,勝方得1分,負方得0分,下一場在負方舉行,先得2分的代表隊獲勝,比賽結束.當比賽在甲區舉行時,甲區代表隊獲勝的概率為,當比賽在乙區舉行時,甲區代表隊獲勝的概率為.假設每場比賽結果相互獨立.甲區代表隊的最終得分記為X,求X的分布列及的值.參考數據:.【答案】(1),(2)分布列見解析,【分析】(1)利用平均數的計算公式求得,再利用方差的計算公式進行轉化求解即可得解;(2)先根據題意得到的所有可能取值,再利用獨立事件的概率公式分別求得各個取值的概率,從而利用數學期望的計算公式即可得解.【詳解】(1)根據題意,得,因為,同理,所以所以總樣本的平均數為,方差.(2)依題意可知,的所有可能取值為,設“第場比賽在甲鎮舉行,甲鎮代表隊獲勝”為事件,“第場比賽在乙鎮舉行,甲鎮代表隊獲勝”為事件,且,則,,所以,,,則的分布列為:X 0 1 2P數學期望.考點十一、成對數據的統計相關性1.(2024·上海·高考真題)已知氣候溫度和海水表層溫度相關,且相關系數為正數,對此描述正確的是( )A.氣候溫度高,海水表層溫度就高B.氣候溫度高,海水表層溫度就低C.隨著氣候溫度由低到高,海水表層溫度呈上升趨勢D.隨著氣候溫度由低到高,海水表層溫度呈下降趨勢【答案】C【分析】根據相關系數的性質可得正確的選項.【詳解】對于AB,當氣候溫度高,海水表層溫度變高變低不確定,故AB錯誤.對于CD,因為相關系數為正,故隨著氣候溫度由低到高時,海水表層溫度呈上升趨勢,故C正確,D錯誤.故選:C.2.(2023·天津·高考真題)鳶是鷹科的一種鳥,《詩經·大雅·旱麓》曰:“鳶飛戾天,魚躍余淵”. 鳶尾花因花瓣形如鳶尾而得名,寓意鵬程萬里、前途無量.通過隨機抽樣,收集了若干朵某品種鳶尾花的花萼長度和花瓣長度(單位:cm),繪制散點圖如圖所示,計算得樣本相關系數為,利用最小二乘法求得相應的經驗回歸方程為,根據以上信息,如下判斷正確的為( )A.花瓣長度和花萼長度不存在相關關系B.花瓣長度和花萼長度負相關C.花萼長度為7cm的該品種鳶尾花的花瓣長度的平均值為D.若從樣本中抽取一部分,則這部分的相關系數一定是【答案】C【分析】根據散點圖的特點及經驗回歸方程可判斷ABC選項,根據相關系數的定義可以判斷D選項.【詳解】根據散點的集中程度可知,花瓣長度和花萼長度有相關性,A選項錯誤散點的分布是從左下到右上,從而花瓣長度和花萼長度呈現正相關性,B選項錯誤,把代入可得,C選項正確;由于是全部數據的相關系數,取出來一部分數據,相關性可能變強,可能變弱,即取出的數據的相關系數不一定是,D選項錯誤故選:C3.(2022·全國·高考真題)某地經過多年的環境治理,已將荒山改造成了綠水青山.為估計一林區某種樹木的總材積量,隨機選取了10棵這種樹木,測量每棵樹的根部橫截面積(單位:)和材積量(單位:),得到如下數據:樣本號i 1 2 3 4 5 6 7 8 9 10 總和根部橫截面積 0.04 0.06 0.04 0.08 0.08 0.05 0.05 0.07 0.07 0.06 0.6材積量 0.25 0.40 0.22 0.54 0.51 0.34 0.36 0.46 0.42 0.40 3.9并計算得.(1)估計該林區這種樹木平均一棵的根部橫截面積與平均一棵的材積量;(2)求該林區這種樹木的根部橫截面積與材積量的樣本相關系數(精確到0.01);(3)現測量了該林區所有這種樹木的根部橫截面積,并得到所有這種樹木的根部橫截面積總和為.已知樹木的材積量與其根部橫截面積近似成正比.利用以上數據給出該林區這種樹木的總材積量的估計值.附:相關系數.【答案】(1);(2)(3)【分析】(1)計算出樣本的一棵根部橫截面積的平均值及一棵材積量平均值,即可估計該林區這種樹木平均一棵的根部橫截面積與平均一棵的材積量;(2)代入題給相關系數公式去計算即可求得樣本的相關系數值;(3)依據樹木的材積量與其根部橫截面積近似成正比,列方程即可求得該林區這種樹木的總材積量的估計值.【詳解】(1)樣本中10棵這種樹木的根部橫截面積的平均值樣本中10棵這種樹木的材積量的平均值據此可估計該林區這種樹木平均一棵的根部橫截面積為,平均一棵的材積量為(2)則(3)設該林區這種樹木的總材積量的估計值為,又已知樹木的材積量與其根部橫截面積近似成正比,可得,解之得.則該林區這種樹木的總材積量估計為4.(2020·全國·高考真題)某沙漠地區經過治理,生態系統得到很大改善,野生動物數量有所增加.為調查該地區某種野生動物的數量,將其分成面積相近的200個地塊,從這些地塊中用簡單隨機抽樣的方法抽取20個作為樣區,調查得到樣本數據(xi,yi)(i=1,2,…,20),其中xi和yi分別表示第i個樣區的植物覆蓋面積(單位:公頃)和這種野生動物的數量,并計算得,,,,.(1)求該地區這種野生動物數量的估計值(這種野生動物數量的估計值等于樣區這種野生動物數量的平均數乘以地塊數);(2)求樣本(xi,yi)(i=1,2,…,20)的相關系數(精確到0.01);(3)根據現有統計資料,各地塊間植物覆蓋面積差異很大.為提高樣本的代表性以獲得該地區這種野生動物數量更準確的估計,請給出一種你認為更合理的抽樣方法,并說明理由.附:相關系數r=,≈1.414.【答案】(1);(2);(3)詳見解析【分析】(1)利用野生動物數量的估計值等于樣區野生動物平均數乘以地塊數,代入數據即可;(2)利用公式計算即可;(3)各地塊間植物覆蓋面積差異較大,為提高樣本數據的代表性,應采用分層抽樣.【詳解】(1)樣區野生動物平均數為,地塊數為200,該地區這種野生動物的估計值為(2)樣本(i=1,2,…,20)的相關系數為(3)由(2)知各樣區的這種野生動物的數量與植物覆蓋面積有很強的正相關性,由于各地塊間植物覆蓋面積差異很大,從而各地塊間這種野生動物的數量差異很大,采用分層抽樣的方法較好地保持了樣本結構與總體結構的一致性,提高了樣本的代表性,從而可以獲得該地區這種野生動物數量更準確的估計.【點晴】本題主要考查平均數的估計值、相關系數的計算以及抽樣方法的選取,考查學生數學運算能力,是一道容易題.1.(23-24高三下·云南昆明·階段練習)兩個變量y與x的回歸模型中,分別選擇了4個不同模型,它們的決定系數如下,其中擬合效果最好的模型是( )A.模型1(決定系數為0.97) B.模型2(決定系數為0.85)C.模型3(決定系數為0.40) D.模型4(決定系數為0.25)【答案】A【分析】根據回歸模型中決定系數越接近,模型擬合效果越好求解.【詳解】在兩個變量與x的回歸模型中,它們的決定系數越接近,模型擬合效果越好,在四個選項中A的決定系數最大,所以擬合效果最好的是模型,故選:A.2.(2024·貴州貴陽·模擬預測)(多選)某廠近幾年陸續購買了幾臺 A 型機床,該型機床已投入生產的時間x(單位:年)與當年所需要支出的維修費用y(單位:萬元)有如下統計資料:x 2 3 4 5 6y 2.2 3.8 5.5 6.5 7根據表中的數據可得到經驗回歸方程為. ,則( )A.y與x的樣本相關系數B.C.表中維修費用的第60百分位數為6D.該型機床已投入生產的時間為 10年時,當年所需要支出的維修費用一定是12.38萬元【答案】BC【分析】對A,根據相關系數的概念可判斷,對B,計算出樣本中心,代入方程計算出,對C,根據百分位數的定義求解,對D,根據回歸分析概念判斷.【詳解】根據題意可得,,,所以樣本中心點為,對于A,由表中數據可得隨著增大而增大,與正相關,所以相關系數,,與不相關,故A錯誤;對于B,將樣本中心點代入回歸方程,可得,故B正確;對于C,維修費用從小到大依次為,第60百分位數為,故C正確;對于D,根據回歸分析的概念,機床投入生產的時間為 10年時,所需要支出的維修費用大概是12.38萬元,故D錯誤.故選:BC.3.(2024·江蘇宿遷·三模)(多選)為了研究y關于x的線性相關關系,收集了5對樣本數據(見表格),若已求得一元線性回歸方程為,則下列選項中正確的是( )1 2 3 4 51A.B.當時的殘差為C.樣本數據y的40百分位數為1D.去掉樣本點后,y與x的相關系數不會改變【答案】BD【分析】對A,由表格數據求出樣本點的中心坐標,代入可得的值由此即可判斷;對B,由回歸方程求得得值,根據殘差的定義運算;對C,由百分位數的概念即可判斷,對D,由相關系數公式即可判斷.【詳解】由,,所以樣本中心點為,對于A,將它代入,得,解得,故A錯誤;對于B,當時,,所以殘差為,故B正確;對于C,樣本數據的第40百分位數為,故C錯誤;對于D,由相關系數公式可知,,所以5組樣本數據的相關系數為:,去掉樣本中心點后相關系數為:,所以去掉樣本點后,與的樣本相關系數不會改變,故D正確.故選:BD.4.(2024·河南新鄉·模擬預測)氮氧化物是一種常見的大氣污染物,下圖為我國2015年至2023年氮氧化物排放量(單位:萬噸)的折線圖,其中年份代碼1~9分別對應年份2015~2023.已知,,,.(1)可否用線性回歸模型擬合與的關系?請分別根據折線圖和相關系數加以說明.(2)若根據所給數據建立回歸模型,可否用此模型來預測2024年和2034年我國的氮氧化物排放量?請說明理由.附:相關系數.【答案】(1)可以用線性回歸模型擬合與的關系,說明見解析(2)可以預測2024年的氮氧化物排放量,但不可以預測2034年的氮氧化物排放量,理由見解析【分析】(1)根據題意,由相關系數的計算公式代入計算,即可判斷;(2)根據題意,由線性回歸方程的意義,即可判斷.【詳解】(1)從折線圖看,各點落在一條直線附近,因而可以用線性回歸模型擬合與的關系,由題意知,相關系數.故可以用線性回歸模型擬合與的關系.(2)可以預測2024年的氮氧化物排放量,但不可以預測2034年的氮氧化物排放量.理由如下:①2024年與所給數據的年份較接近,因而可以認為短期內氮氧化物排放量將延續該趨勢,故可以用此模型進行預測;②2034年與所給數據的年份相距過遠,而影響氮氧化物排放量的因素有很多,這些因素在短期內可能保持不變,但從長期看很有可能會變化,因而用此模型預測可能是不準確的.考點十二、一元線性回歸模型及其應用1.(2024·上海·三模)設一組成對數據的相關系數為r,線性回歸方程為,則下列說法正確的為( ).A.越大,則r越大 B.越大,則r越小C.若r大于零,則一定大于零 D.若r大于零,則一定小于零【答案】C【分析】利用與r的含義判斷AB,根據r大于零時兩變量正相關即可得一定大于零判斷CD.【詳解】影響的是回歸直線的斜率,r影響是兩個變量之間的相關性,所以與r之間數值大小沒有關系,但符號有影響,故選項AB錯誤;若r大于零,則說明兩個變量之間成正相關,故一定大于零,故選項C正確,D錯誤.故選:C2.(2024·天津·二模)有人通過調查統計發現,兒子成年時的身高與父親的身高呈線性相關,且兒子成年時的身高(單位:)與父親的身高(單位:)的經驗回歸方程為,根據以上信息,下列判斷正確的為( ).A.兒子成年時的身高與父親的身高的樣本相關系數B.父親的身高為,兒子成年時的身高一定在到之間C.父親的身高每增加,兒子成年時的身高平均增加D.兒子在成年時的身高一般會比父親高【答案】C【分析】根據題意,由線性回歸方程的性質,對選項逐一判斷,即可得到結果.【詳解】因為,且,即與不一定相等,故A錯誤;當父親身高為時,孩子身高可能在到之間,而不是一定,故B錯誤;因為,即父親的身高每增加,兒子成年時的身高平均增加,故C正確;由回歸方程可知,是否比父親高還得取決于父親身高,因此判斷不了兒子成年時一般比父親高,故D錯誤;故選:C3.(2024·山東棗莊·模擬預測)(多選)已知兩個變量y與x對應關系如下表:x 1 2 3 4 5y 5 m 8 9 10.5若y與x滿足一元線性回歸模型,且經驗回歸方程為,則( )A.y與x正相關 B.C.樣本數據y的第60百分位數為8 D.各組數據的殘差和為0【答案】AD【分析】利用相關性的定義及線性回歸直線可判定A,根據樣本中心點在回歸方程上可判定B,利用百分位數的計算可判定C,利用回歸方程計算預測值可得殘差即可判定D.【詳解】由回歸直線方程知:,所以y與x正相關,即A正確;由表格數據及回歸方程易知,即B錯誤;易知,所以樣本數據y的第60百分位數為,即C錯誤;由回歸直線方程知時對應的預測值分別為,對應殘差分別為,顯然殘差之和為0,即D正確.故選:AD4.(2024·陜西西安·二模)近年來我國新能源汽車行業蓬勃發展,新能源汽車不僅對環境保護具有重大的意義,而且還能夠減少對不可再生資源的開發,是全球汽車發展的重要方向.“保護環境,人人有責”,在政府和有關企業的努力下,某地區近幾年新能源汽車的購買情況如下表所示:年份x 2019 2020 2021 2022 2023新能源汽車購買數量>(萬輛) 0.40 0.70 1.10 1.50 1.80(1)計算與的相關系數(保留三位小數);(2)求關于的線性回歸方程,并預測該地區2025年新能源汽車購買數量.參考公式,,.參考數值:,.【答案】(1)(2)萬輛【分析】(1)利用所提供數據求,代入參考公式求即可;(2)結合公式求,由此可得回歸方程,再利用回歸方程進行預測.【詳解】(1),,所以;(2)由(1)知,,,所以關于的線性回歸方程是,當時,(萬輛),該地區年新能源汽車購買數量約為萬輛.5.(2024·河北滄州·模擬預測)“南澳牡蠣”是我國地理標志產品,產量高、肉質肥、營養好,素有“海洋牛奶精品”的美譽.2024年該基地考慮增加人工投入,現有以往的人工投入增量x(人)與年收益增量y(萬元)的數據如下:人工投入增量x(人) 2 3 4 6 8 10 13年收益增量y(萬元) 13 22 31 42 50 56 58該基地為了預測人工投入增量為16人時的年收益增量,建立了y與x的兩個回歸模型:模型①:由最小二乘公式可求得y與x的線性回歸方程:;模型②:由散點圖的樣本點分布,可以認為樣本點集中在曲線:的附近,對人工投入增量x做變換,令,則,且有,,,.(1)(i)根據所給的統計量,求模型②中y關于x的回歸方程(精確到0.1);(ii)根據下列表格中的數據,比較兩種模型的決定系數,并選擇擬合精度更高、更可靠的模型,預測人工投入增量為16人時的年收益增量.回歸模型 模型① 模型②回歸方程182.4 79.2(2)根據養殖規模與以往的養殖經驗,產自某南澳牡蠣養殖基地的單個“南澳牡蠣”質量(克)在正常環境下服從正態分布.購買10只該基地的“南澳牡蠣”,會買到質量小于20g的牡蠣的可能性有多大 附:若隨機變量,則,;樣本的最小二乘估計公式為:,,.【答案】(1)(i);(ii)答案見解析(2)【分析】(1)(i)根據公式計算得到回歸直線方程;(ii)通過比較的大小可得到擬合效果的差異,將代入回歸方程可得到預測值.(2)根據正態分布的對稱性得到,購買10只該基地的“南澳牡蠣”,其中質量小于20g的牡蠣為只,故,由間接法列式得到結果即可;【詳解】(1)(i)由,有,且,所以模型②中關于的回歸方程為.(ii)由表格中的數據,有,即,模型①的小于模型②,說明回歸模型②刻畫的擬合效果更好.當時,模型②的收益增量的預測值為(萬元),這個結果比模型①的預測精度更高、更可靠.(2)由已知單個“南澳牡蠣”質量,則,由正態分布的對稱性可知,,設購買10只該基地的“南澳牡蠣”,其中質量小于的牡蠣為只,故,所以,所以這10只“南澳牡蠣”中,會買到質量小于的牡蠣的可能性僅為.1.(2024·上海徐匯·二模)為了研究y關于x的線性相關關系,收集了5組樣本數據(見下表):x 1 2 3 4 5y 0.5 0.9 1 1.1 1.5若已求得一元線性回歸方程為,則下列選項中正確的是( )A.B.當時,y的預測值為2.2C.樣本數據y的第40百分位數為1D.去掉樣本點后,x與y的樣本相關系數r不會改變【答案】D【分析】由表格數據求出樣本點的中心坐標,代入可得的值由此即可判斷A,進一步可得回歸方程,由此即可驗算B選項,由百分位數的概念即可判斷C,由相關系數公式即可判斷D.【詳解】,所以樣本點的中心坐標為,將它代入得,,解得,故A錯誤;對于B,當時,y的預測值為,故B錯誤;對于C,樣本數據y的第40百分位數為,故C錯誤;對于D,由相關系數公式可知,去掉樣本點后,x與y的樣本相關系數r不會改變,故D正確.故選:D.2.(2024·河北·一模)某校為了解本校高一男生身高和體重的相關關系,在該校高一年級隨機抽取了7名男生,測量了他們的身高和體重得下表:身高(單位: 167 173 175 177 178 180 181體重(單位: 90 54 59 64 67 72 76由表格制作成如圖所示的散點圖: 由最小二乘法計算得到經驗回歸直線的方程為,其相關系數為;經過殘差分析,點對應殘差過大,把它去掉后,再用剩下的6組數據計算得到經驗回歸直線的方程為,相關系數為.則下列選項正確的是( )A.B.C.D.【答案】A【分析】根據的特點判斷斜率和截距;由于去掉,其它點的線性關系更強,從而可判斷相關系數.【詳解】身高的平均數為,因為離群點的橫坐標167小于平均值176,縱坐標90相對過大,所以去掉后經驗回歸直線的截距變小而斜率變大,故去掉后相關性更強,擬合效果也更好,且還是正相關,,故選:A.3.(2024·甘肅隴南·一模)(多選)某廠近幾年陸續購買了幾臺 A 型機床,該型機床已投入生產的時間x(單位:年)與當年所需要支出的維修費用y(單位:萬元)有如下統計資料:x 2 3 4 5 6y 2.2 3.8 5.5 6.5 7根據表中的數據可得到經驗回歸方程為. 則( )A.B.y與x的樣本相關系數C.表中維修費用的第60百分位數為6D.該型機床已投入生產的時間為 10年時,當年所需要支出的維修費用一定是12.38萬元【答案】ABC【分析】對A,計算出樣本中心,代入方程計算出,對B,根據相關系數的概念可判斷,對C,根據百分位數的定義求解,對D,根據回歸分析概念判斷.【詳解】根據題意可得,,,所以樣本中心點為,對于A,將樣本中心點代入回歸方程,可得,故A正確;對于B,由表中數據可得隨著增大而增大,與正相關,所以相關系數,故B正確;對于C,維修費用從小到大依次為,第60百分位數為,故C正確;對于D,根據回歸分析的概念,機床投入生產的時間為 10年時,所需要支出的維修費用大概是12.38萬元,故D錯誤.故選:ABC.4.(2024·全國·模擬預測)腦機接口,即指在人或動物大腦與外部設備之間創建的直接連接,實現腦與設備的信息交換.近日埃隆.馬斯克宣布,腦機接口公司Neuralink正在接收第二位植入者申請,該試驗可以實現意念控制手機和電腦.未來10到20年,我國腦機接口產業將產生數百億元的經濟價值.為了適應市場需求,同時兼顧企業盈利的預期,某科技公司決定增加一定數量的研發人員,經過調研,得到年收益增量(單位:億元)與研發人員增量(人)的10組數據.現用模型①,②分別進行擬合,由此得到相應的經驗回歸方程,并進行殘差分析,得到如圖所示的殘差圖.根據收集到的數據,計算得到下表數據,其中.7.5 2.25 82.50 4.50 12.14 2.88(1)根據殘差圖,判斷應選擇哪個模型;(無需說明理由)(2)根據(1)中所選模型,求出關于的經驗回歸方程;并用該模型預測,要使年收益增量超過8億元,研發人員增量至少多少人?(精確到1)附:對于一組具有線性相關關系的數據,其經驗回歸直線的斜率和截距的最小二乘估計分別為【答案】(1)選擇模型②(2),10人【分析】(1)根據殘差圖分析判斷;(2)令與可用線性回歸來擬合,有,然后根據公式結合已知的數據求出,從而可求出關于的經驗回歸方程,進而可求出關于的經驗回歸方程,再由可求出研發人員增量.【詳解】(1)選擇模型②,理由如下:由于模型②殘差點比較均勻在落在水平的帶狀區域中,且帶狀區域的寬度比模型①帶狀寬度窄,所以模型②的擬合精度更高,回歸方程的預報精度相應就會越高,所以模型②比較合適.(2)根據模型②,令與可用線性回歸來擬合,有.則,所以則關于的經驗回歸方程為,所以關于的經驗回歸方程為.由題意,,解得,又為整數,所以.所以,要使年收益增量超過8億元,研發人員增量至少為10人.5.(2024·江西九江·三模)車胎凹槽深度是影響汽車剎車的因素,汽車行駛會導致輪胎胎面磨損.某實驗室通過實驗測得轎車行駛里程與某品牌輪胎凹槽深度的數據,如下表所示:行駛里程萬 0.0 0.4 1.0 1.6 2.4 2.8 3.4 4.4輪胎凹槽深度 8.0 7.8 7.2 6.2 5.6 4.8 4.4 4.0(1)求該品牌輪胎凹槽深度與行駛里程的相關系數,并判斷二者之間是否具有很強的線性相關性;(結果保留兩位有效數字)(2)根據我國國家標準規定:轎車輪胎凹槽安全深度為(當凹槽深度低于時剎車距離增大,駕駛風險增加,必須更換新輪胎).某人在保養汽車時將小轎車的輪胎全部更換成了該品牌的新輪胎,請問在正常行駛情況下,更換新輪胎后繼續行駛約多少公里需對輪胎再次更換?附:變量與的樣本相關系數;對于一組數據,,其線性回歸方程的斜率和截距的最小二乘估計分別為:.【答案】(1),具有很強的線性關系(2)6.4萬公里【分析】(1)根據題意,由相關系數的公式代入計算,即可判斷;(2)根據題意,由最小二乘法公式代入計算,分別求得,即可得到線性回歸方程,即可得到結果.【詳解】(1)計算得,,由公式知,二者之間具有很強的線性關系.(2)設輪胎凹槽深度與行駛里程的線性回歸方程為,則==線性回歸方程為令,得即更換新輪胎后繼續行駛約6.4萬公里需要對輪胎再次更換.考點十三、列聯表與獨立性檢驗1.(2024·江蘇鹽城·模擬預測)根據分類變量Ⅰ與Ⅱ的統計數據,計算得到,則( )0.1 0.05 0.01 0.005 0.0012.706 3.841 6.635 7.879 10.828A.變量Ⅰ與Ⅱ相關B.變量Ⅰ與Ⅱ相關,這個結論犯錯誤的概率不超過0.1C.變量Ⅰ與Ⅱ不相關D.變量Ⅰ與Ⅱ不相關,這個結論犯錯誤的概率不超過0.1【答案】B【分析】根據獨立性檢驗的原理,將與臨界值表比較,即可得結論.【詳解】零假設為:變量Ⅰ與Ⅱ不相關,因為,依據得獨立性檢驗可知,推斷不成立,即認為變量Ⅰ與Ⅱ相關,這個結論犯錯誤的概率不超過0.1,故選:B2.(2024·廣東江門·模擬預測)(多選)某中學為更好的開展素質教育,現對外出研學課程是否和性別有關做了一項調查,其中被調查的男生和女生人數相同,且男生中選修外出研學課程的人數占男生總人數的,女生中選修外出研學課程的人數占女生總人數的.若依據的獨立性檢驗,可以認為“選修外出研學課程與性別有關”.則調查人數中男生可能有( )男生 女生 合計選修外出研學課程未選修外出研學課程合計附:,其中A.150人 B.225人 C.300人 D.375人【答案】BCD【分析】設男生人數為,根據題意用表示出女生人數、男生中“選修外出研學課程”人數、女生中“選修外出研學課程”人數,進而表示出表格中其它人數,利用公式計算出,由得到的范圍,進而得到男生人數的范圍,選出符合題意的選項.【詳解】設男生人數為,根據題意可得列聯表如下:男生 女生 合計選修外出研學課程不選修外出研學課程合計則,若有的把握認為喜歡選修外出研學課程與性別有關,則,解得,則.故選:BCD.3.(2024·湖南益陽·一模)某公園為了提升公園形象,提高游客旅游的體驗感,他們更新了部分設施,調整了部分旅游線路.為了解游客對新措施是否滿意,隨機抽取了100名游客進行調查,男游客與女游客的人數之比為2:3,其中男游客有35名滿意,女游客有15名不滿意.滿意 不滿意 總計男游客 35女游客 15合計 100(1)完成列聯表,依據表中數據,以及小概率值的獨立性檢驗,能否認為游客對公園新措施滿意與否與性別有關 (2)從被調查的游客中按男、女分層抽樣抽取5名游客.再隨機從這5名游客中抽取3名游客征求他們對公園進一步提高服務質量的建議,其中抽取男游客的人數為.求出的分布列及數學期望.參考公式:,其中.參考數據:0.10 0.05 0.010 0.0052.706 3.841 6.635 7.879【答案】(1)聯表見詳解,不能.(2)分布列見詳解,【分析】(1)根據男游客與女游客的人數的比值,結合卡方計算公式進行計算求解即可;(2)根據超幾何分布的性質,結合數學期望公式進行求解即可.【詳解】(1)因為調查的男游客人數為:,所以,調查的女游客人數為,于是可完成列聯表如下:滿意 不滿意 總計男游客 35 5 40女游客 45 15 60合計 80 20 100零假設為:游客對公園新措施滿意與否與性別無關.根據列聯表中的數據,可得:,根據小概率值的獨立性檢驗,沒有充分證據推斷不成立,因此可以認為成立,即游客對公園新措施滿意與否與性別無關;(2)由(1)可知男游客抽2人,女游客抽3人,依題意可知的可能取值為0,1,2,并且服從超幾何分布,即,,.所以的分布列為:0 1 2.1.(2024·四川成都·三模)有甲、乙兩個班級進行數學考試,按照大于等于85分為優秀,85分以下為非優秀統計成績,得到如下所示的列聯表:優秀 非優秀甲班 10乙班 30附:(),0.05 0.025 0.010 0.0053.841 5.024 6.635 7.879已知在全部105人中隨機抽取1人,成績優秀的概率為,則下列說法正確的是( )A.甲班人數少于乙班人數B.甲班的優秀率高于乙班的優秀率C.表中的值為15,的值為50D.根據表中的數據,若按的可靠性要求,能認為“成績與班級有關系”【答案】D【分析】根據條件解出,,然后直接計算即可判斷A,B,C錯誤,使用的計算公式計算,并將其與比較,即可得到D正確.【詳解】對于C,由條件知,,故,.所以,,故C錯誤;對于A,由于甲班人數為,乙班人數為,故A錯誤;對于B,由于甲班優秀率為,乙班優秀率為,故B錯誤;對于D,由于,故D正確.故選:D.2.(2024·福建南平·模擬預測)(多選)2023年10月全國多地醫院出現較多的支原體肺炎感染患者,患者多以兒童為主.某研究所在某小學隨機抽取了46名兒童,得到他們是否接種流感疫苗和是否感染支原體肺炎的情況的相關數據,如下表所示,則( )感染情況接種情況 感染支原體肺炎 未感染支原體肺炎 合計接種流感疫苗未接種流感疫苗合計 46附:.0.1 0.05 0.01 0.005 0.0012.706 3.841 6.635 7.879 10.828A.B.C.認為是否接種流感疫苗與是否感染支原體肺炎有關聯,此推斷犯錯的概率不大于0.1D.沒有充分的證據推斷是否接種流感疫苗與是否感染支原體肺炎有關聯【答案】AD【分析】根據表格信息得出相應數值,通過計算和獨立性檢驗判斷各個選項;【詳解】由表中數據易得,對于A,.故A正確;對于B,,故B錯誤;對于C,D,依據的獨立性檢驗,沒有充分的證據推斷是否接種流感疫苗與是否感染支原體肺炎有關聯,故C錯誤,D正確.故選:AD.3.(2024·廣東佛山·模擬預測)某區中考體育科目有必選項目和選考項目,其中籃球為一個選考項目.該區體育老師為了了解初中學生的性別和喜歡籃球是否有關,隨機調查了該區1000名初中學生,得到成對樣本數據的分類統計結果,如下表所示:性別 是否喜歡籃球 合計喜歡 不喜歡男生 450 150 600女生 150 250 400合計 600 400 1000(1)依據的獨立性檢驗,能否認為該區初中學生的性別與喜歡籃球有關聯;(2)用按性別比例分配的分層隨機抽樣的方法從參與調查的喜歡籃球的600名初中學生中抽取8名學生做進一步調查,將這8名學生作為一個樣本,從中隨機抽取3人,用X表示隨機抽取的3人中女生的人數,求X的分布列和數學期望.附:參考數據,其中.0.1 0.05 0.01 0.005 0.0012.706 3.841 6.635 7.879 10.828【答案】(1)該區初中學生的性別與喜歡籃球有關聯;(2)【分析】(1)根據題意補全列聯表,再計算出卡方值并與邊界值比較即可;(2)利用分層抽樣可得抽取的男生與女生人數,利用超幾何分布計算隨機變的分布列,利用期望計算公式可求期望.【詳解】(1)零假設:該區初中學生的性別與喜歡籃球無關聯,,根據小概率值的獨立性檢驗,推斷不成立,即認為該區初中學生的性別與喜歡籃球有關聯;(2)根據喜歡籃球的學生中男生與女生的比例可得抽取的8人中男生有6人,女生有2人,所以的為0,1,2,,,,所以的分布列為.一、單選題1.(2024·四川南充·一模)甲同學近10次數學考試成績情況如下:103,106,113,119,123,118,134,118,125,121,則甲同學數學考試成績的第75百分位數是( )A.118 B.121 C.122 D.123【答案】D【分析】根據百分位數的定義計算.【詳解】已知數據按從小到大排列為:,,因此第75百分位數是第8個數123.故選:D.2.(2024·廣東珠海·模擬預測)下列說法正確的是( )A.一組數據的標準差為0,則這組數據中的數均相等B.兩組數據的標準差相等,則這兩組數據的平均數相等C.若兩個變量的相關系數越接近于0,則這兩個變量的相關性越強D.已知變量,由它們的樣本數據計算得到的觀測值的部分臨界值如下表:0.1 0.05 0.025 0.012.706 3.841 5.024 6.635則在犯錯誤的概率不超過0.025的前提下認為變量沒有關系【答案】A【分析】應用標準差公式判斷A,特殊值法判斷B,根據相關系數性質判斷C,應用獨立性檢驗判斷D.【詳解】A選項,根據標準差定義,一組數據的標準差時,顯然A正確;B選項,兩組數據的標準差相等,這兩組數據的平均數未必相等,如均為1和均為2的兩組數據,它們的標準差均為0,但它們的平均數分別為1和,B錯誤;C選項,兩個變量的相關系數越接近于0,兩個變量的相關性越弱,C錯誤;D選項,,根據獨立性檢驗原理,在犯錯誤的概率不超過0.025的前提下認為變量有關系,D錯誤.故選:A3.(2024·江蘇蘇州·模擬預測)設研究某兩個屬性變量時,作出零假設并得到2×2列聯表,計算得,則下列說法正確的是( )A.有99.5%的把握認為不成立 B.有5%的把握認為的反面正確C.有95%的把握判斷正確 D.有95%的把握能反駁【答案】D【分析】根據獨立性檢驗的概念以及計算步驟,可得答案.【詳解】依題意,,因此有95%的把握反駁,故選:D.4.(2024·安徽蕪湖·模擬預測)下列說法正確的是( )A.若隨機變量,則當較小時,對應的正態曲線“矮胖”,隨機變量X的分布比較分散B.在做回歸分析時,可以用決定系數刻畫模型回歸效果,越小,說明模型擬合的效果越好C.一元線性回歸模型中,如果相關系數,表明兩個變量的相關程度很強D.在列聯表中,若所有數據均變成原來的2倍,則不變(,其中)【答案】C【分析】根據正態分布曲線的性質,可得判定A錯誤;根據決定系數和相關系數的性質,可得判定B錯誤,C正確;根據獨立性檢驗的計算公式,可判定D錯誤.【詳解】對于A中,若隨機變量,則當較小時,對應的正態曲線“瘦高”,隨機變量X的分布比較集中,所以A錯誤;對于B中,在做回歸分析時,可以用決定系數刻畫模型回歸效果,越大,說明模型擬合的效果越好,所以B錯誤;對于C中,一元線性回歸模型中,相關系數的絕對值越接近1,表明兩個變量的相關性越強,所以如果相關系數,表明兩個變量的相關程度很強,所以C正確;對于D中,在列聯表中,若所有數據均變成原來的2倍,則,此時是原來的2倍,所以D錯誤.故選:C.二、多選題5.(2024·海南海口·模擬預測)某校為了解學生的身體狀況,隨機抽取了50名學生測量體重,經統計,這些學生的體重數據(單位:千克)全部介于45至70之間,將數據整理得到如圖所示的頻率分布直方圖,則( )A.頻率分布直方圖中的值為0.04B.這50名學生體重的眾數約為52.5C.該校學生體重的上四分位數約為61.25D.這50名學生中體重不低于65千克的人數約為10【答案】ABC【分析】利用頻率之和為1可判斷選項A,利用頻率分布直方圖中眾數的計算方法求解眾數,即可判斷選項B,由分位第09講 統計與統計案例(13類核心考點精講精練)1. 5年真題考點分布5年考情考題示例 考點分析 關聯考點2024年新Ⅱ卷,第4題,5分 計算幾個數的中位數 計算幾個數的平均數 計算幾個數據的極差 /2023年新I卷,第9題,5分 計算幾個數的中位數 計算幾個數的平均數 計算幾個數據的極差、方差 標準差 /2023年新Ⅱ卷,第19題,12分 頻率分布直方圖的實際應用 總體百分位數的估計 /2023年全國甲卷(理), 第19題,12分 獨立性檢驗解決實際問題 計算幾個數的中位數 超幾何分布的均值 超幾何分布的分布列2023年全國乙卷(理), 第17題,12分 計算幾個數的平均數 計算幾個數據的極差、方差、標準差 統計新定義2022年新I卷,第20題,12分 獨立性檢驗解決實際問題 計算條件概率2022年新Ⅱ卷,第19題,12分 頻率分布直方圖的實際應用 由頻率分布直方圖估計平均數 利用對立事件的概率公式求概率 計算條件概率2022年全國甲卷(理), 第2題,5分 眾數、平均數、中位數的比較 計算幾個數據的極差、方差、標準差 /2022年全國乙卷(理), 第19題,12分 相關系數的計算 根據樣本中心點求參數 計算幾個數的平均數2021年新I卷,第9題,5分 眾數、平均數、中位數的比較 計算幾個數據的極差、方差、標準差 /2021年新Ⅱ卷,第9題,5分 計算幾個數的眾數 計算幾個數的中位數 計算幾個數的平均數 計算幾個數據的極差、方差、標準差 /2021年全國乙卷(理), 第17題,10分 獨立性檢驗解決實際問題 /2021年全國甲卷(理), 第2題,5分 由頻率分布直方圖計算頻率、頻數、樣本容量、總體容量 由頻率分布直方圖估計平均數 /2021年全國甲卷(理), 第17題,10分 計算幾個數的平均數 計算幾個數據的極差、方差、標準差 /2020年新I卷,第19題,12分 完善列聯表 獨立性檢驗 /2020年新Ⅱ卷,第19題,12分 完善列聯表 獨立性檢驗 /2020年全國甲卷(理), 第5題,5分 由散點圖畫求近似回歸直線 /2020年全國乙卷(理), 第18題,12分 相關系數的計算 /2020年全國丙卷(理), 第18題,12分 獨立性檢驗解決實際問題 /2020年新Ⅱ卷,第9題,5分 根據折線統計圖解決實際問題 /2. 命題規律及備考策略【命題規律】本節內容是新高考卷的常考內容,設題不定,難度中等或偏難,分值為5-15分【備考策略】1.理解、掌握簡單隨機抽樣、分層抽樣定義及計算2.理解、掌握總體樣本估計的定義及計算3.理解、掌握線性回歸的定義及計算4.理解、掌握獨立性檢驗的定義及計算【命題預測】本節內容是新高考卷的常考內容,一般給在大題中結合前面的的概率及分布列一起考查,需重點強化復習知識講解1.簡單隨機抽樣(1)定義:一般地,設一個總體含有N個個體,從中逐個不放回地抽取n個個體作為樣本(n≤N),如果每次抽取時總體內的各個個體被抽到的機會都相等,就把這種抽樣方法叫做簡單隨機抽樣.這樣抽取的樣本,叫做簡單隨機樣本.(2)常用方法:抽簽法和隨機數法.2.分層抽樣(1)在抽樣時,將總體分成互不交叉的層,然后按照一定的比例,從各層獨立地抽取一定數量的個體,將各層取出的個體合在一起作為樣本,這種抽樣方法是一種分層抽樣.(2)分層抽樣的應用范圍當總體是由差異明顯的幾個部分組成時,往往選用分層抽樣.3.頻率分布直方圖(1)縱軸表示,即小長方形的高=;(2)小長方形的面積=組距×=頻率;(3)各個小方形的面積總和等于1.頻率分布直方圖中的常見結論(1)眾數的估計值為最高矩形的中點對應的橫坐標.(2)平均數的估計值等于頻率分布直方圖中每個小矩形的面積乘以小矩形底邊中點的橫坐標之和.(3)中位數的估計值的左邊和右邊的小矩形的面積和是相等的.4.頻率分布表的畫法第一步:求極差,決定組數和組距,組距=;第二步:分組,通常對組內數值所在區間取左閉右開區間,最后一組取閉區間;第三步:登記頻數,計算頻率,列出頻率分布表.5.條形圖、折線圖及扇形圖(1)條形圖:建立直角坐標系,用橫軸(橫軸上的數字)表示樣本數據類型,用縱軸上的單位長度表示一定的數量,根據每個樣本(或某個范圍內的樣本)的數量多少畫出長短不同的等寬矩形,然后把這些矩形按照一定的順序排列起來,這樣一種表達和分析數據的統計圖稱為條形圖.(2)折線圖:建立直角坐標系,用橫軸上的數字表示樣本值,用縱軸上的單位長度表示一定的數量,根據樣本值和數量的多少描出相應各點,然后把各點用線段順次連接,得到一條折線,用這種折線表示出樣本數據的情況,這樣的一種表示和分析數據的統計圖稱為折線圖.(3)扇形圖:用一個圓表示總體,圓中各扇形分別代表總體中的不同部分,每個扇形的大小反映所表示的那部分占總體的百分比的大小,這樣的一種表示和分析數據的統計圖稱為扇形圖.6.百分位數、眾數、平均數的定義(1)如果將一組數據從小到大排序,并計算相應的累計百分位,則某一百分位所對應數據的值就稱為這一百分位的百分位數.一般地,一組數據的第p百分位數是這樣一個值,它使得這組數據中至少有p%的數據小于或等于這個值,且至少有(100-p)%的數據大于或等于這個值.(2)第25百分位數又稱第一四分位數或下四分位數;第75百分位數又稱第三四分位數或上四分位數.(3)眾數一組數據中出現次數最多的數據叫做這組數據的眾數.(4)平均數一組數據的算術平均數即為這組數據的平均數,n個數據x1,x2,…,xn的平均數=(x1+x2+…+xn).7.樣本的數字特征之方差如果有n個數據x1,x2,…,xn,那么這n個數的(1)標準差s= .(2)方差s2=[(x1-)2+(x2-)2+…+(xn-)2].8. 平均數、方差的公式推廣(1)若數據x1,x2,…,xn的平均數為,則mx1+a,mx2+a,mx3+a,…,mxn+a的平均數是m+a.(2)若數據x1,x2,…,xn的方差為s2,則數據ax1+b,ax2+b,…,axn+b的方差為a2s2.兩個變量的線性相關(1)正相關在散點圖中,點散布在從左下角到右上角的區域,對于兩個變量的這種相關關系,我們將它稱為正相關.(2)負相關在散點圖中,點散布在從左上角到右下角的區域,兩個變量的這種相關關系稱為負相關.(3)線性相關關系、回歸直線如果散點圖中點的分布從整體上看大致在一條直線附近,就稱這兩個變量之間具有線性相關關系,這條直線叫做回歸直線.回歸方程(1)最小二乘法求回歸直線,使得樣本數據的點到它的距離的平方和最小的方法叫做最小二乘法.(2)回歸方程方程=x+是兩個具有線性相關關系的變量的一組數據(x1,y1),(x2,y2),…,(xn,yn)的回歸方程,其中,是待定參數.回歸分析(1)定義:對具有相關關系的兩個變量進行統計分析的一種常用方法.(2)樣本點的中心對于一組具有線性相關關系的數據(x1,y1),(x2,y2),…,(xn,yn),其中(,)稱為樣本點的中心.(3)相關系數當r>0時,表明兩個變量正相關;當r<0時,表明兩個變量負相關.r的絕對值越接近于1,表明兩個變量的線性相關性越強.r的絕對值越接近于0,表明兩個變量之間幾乎不存在線性相關關系.通常|r|大于0.75時,認為兩個變量有很強的線性相關性.獨立性檢驗(1)分類變量:變量的不同“值”表示個體所屬的不同類別,像這樣的變量稱為分類變量.(2)列聯表:列出的兩個分類變量的頻數表,稱為列聯表.假設有兩個分類變量X和Y,它們的可能取值分別為{x1,x2}和{y1,y2},其樣本頻數列聯表(稱為2×2列聯表)為2×2列聯表y1 y2 總計x1 a b a+bx2 c d c+d總計 a+c b+d a+b+c+d構造一個隨機變量K2=,其中n=a+b+c+d為樣本容量.(3)獨立性檢驗利用隨機變量K2來判斷“兩個分類變量有關系”的方法稱為獨立性檢驗.當χ2≤2.706時,沒有充分的證據判定變量A,B有關聯;當χ2>2.706時,有90%的把握判定變量A,B有關聯;當χ>3.841時,有95%的把握判定變量A,B有關聯;當χ>6.635時,有99%的把握判定變量A,B有關聯.考點一、簡單隨機抽樣1.(2024·福建泉州·模擬預測)從一個含有個個體的總體中抽取一容量為的樣本,當選取抽簽法、隨機數法和分層隨機抽樣三種不同方法時,總體中每個個體被抽中的概率分別為,三者關系可能是( )A. B. C. D.2.(2024高一下·全國·專題練習)某中學高一年級有400人,高二年級有320人,高三年級有280人,若用隨機數法在該中學抽取容量為n的樣本,每人被抽到的可能性都為0.2,則n等于( )A.80 B.160 C.200 D.2803.(2024·陜西西安·一模)某高校對中文系新生進行體測,利用隨機數表對650名學生進行抽樣,先將650名學生進行編號,001,002,…,649,650.從中抽取50個樣本,下圖提供隨機數表的第4行到第6行,若從表中第5行第6列開始向右讀取數據,則得到的第6個樣本編號是( )32 21 18 34 29 78 64 54 07 32 52 42 06 44 38 12 23 43 56 77 35 78 90 56 4284 42 12 53 31 34 57 86 07 36 25 30 07 32 86 23 45 78 89 07 23 68 96 08 0432 56 78 08 43 67 89 53 55 77 34 89 94 83 75 22 53 55 78 32 45 77 89 23 45A.623 B.328 C.072 D.4571.(2024·四川成都·模擬預測)用簡單隨機抽樣的方法從含有10個個體的總體中抽取一個容量為3的樣本,其中某一個體a“第一次被抽到”的可能性與“第二次被抽到”的可能性分別是( )A., B.,C., D.,2.(2024·云南貴州·二模)本次月考分答題卡的任務由高三16班完成,現從全班55位學生中利用下面的隨機數表抽取10位同學參加,將這55位學生按01、02、、55進行編號,假設從隨機數表第1行第2個數字開始由左向右依次選取兩個數字,重復的跳過,讀到行末則從下一行行首繼續,則選出來的第6個號碼所對應的學生編號為( )0627 4313 2432 5327 0941 2512 6317 6323 2616 8045 60111410 9577 7424 6762 4281 1457 2042 5332 3732 2707 36070140 0523 2617 3726 3890 5124 5179 3014 2310 2118 2191A.51 B.25 C.32 D.12考點二、分層隨機抽樣1.(2024·江西南昌·模擬預測)已知三種不同型號的產品數量之比依次為,現用分層抽樣的方法抽取容量為的樣本,若樣本中型號產品有件,則為( )A.60 B.70 C.80 D.902.(2023·全國·高考真題)某學校為了解學生參加體育運動的情況,用比例分配的分層隨機抽樣方法作抽樣調查,擬從初中部和高中部兩層共抽取60名學生,已知該校初中部和高中部分別有400名和200名學生,則不同的抽樣結果共有( ).A.種 B.種C.種 D.種3.(2024·上海·高考真題)水果分為一級果和二級果,共136箱,其中一級果102箱,二級果34箱.(1)隨機挑選兩箱水果,求恰好一級果和二級果各一箱的概率;(2)進行分層抽樣,共抽8箱水果,求一級果和二級果各幾箱;(3)抽取若干箱水果,其中一級果共120個,單果質量平均數為303.45克,方差為603.46;二級果48個,單果質量平均數為240.41克,方差為648.21;求168個水果的方差和平均數,并預估果園中單果的質量.1.(2024·河南·三模)國內某優秀新能源電池制造企業在鋰電池單位能量密度技術上取得了重大突破,該制造企業內的某車間有兩條生產線,分別生產高能量密度鋰電池和低能量密度鋰電池,總產量為400個鋰電池.質檢人員采用分層隨機抽樣的方法隨機抽取了一個容量為80的樣本進行質量檢測,已知樣本中高能量密度鋰電池有35個,則估計低能量密度鋰電池的總產量為( ).A.325個 B.300個 C.225個 D.175個2.(2024·黑龍江雙鴨山·模擬預測)為了解某校初中學生的近視情況,按年級用分層抽樣的方法隨機抽取100名學生進行視力檢測,已知初一、初二、初三年級分別有800名,600名,600名學生,則不同的抽樣結果共有( )A. B. C. D.考點三、條形統計圖1.(2024·江西·二模)下圖是我國年純電動汽車銷量統計情況,則下列說法錯誤的是( ) A.我國純電動汽車銷量呈現逐年增長趨勢B.這六年銷量的第60百分位數為536.5萬輛C.2020年銷量高于這六年銷量的平均值D.這六年增長率最大的為2019年至2020年2.(2024·全國·模擬預測)如圖為某中型綜合超市年的年總營業額(單位:萬元)的統計圖,則下列說法錯誤的是( ) A.年的年總營業額的極差為2200萬元B.年的年總營業額波動性比年的年總營業額波動性小C.年的年總營業額逐年上升,2021年跌落低谷,之后每年又呈上升趨勢D.年的年總營業額的中位數是2019年和2020年的年總營業額的平均數1.(2024·四川達州·二模)下圖是某地區2016-2023年旅游收入(單位:億元)的條形圖,則下列說法錯誤的是( ) A.該地區2016-2019年旅游收入逐年遞增B.該地區2016-2023年旅游收入的中位數是4.30C.經歷了疫情之后,該地區2023年旅游收入恢復到接近2018年水平D.該地區2016-2023年旅游收入的極差是3.692.(2024·陜西西安·模擬預測)國家統計局發布的2018年至2022年我國居民消費水平情況如圖所示,則下列說法正確的是(居民消費水平)( ) A.2018年至2022年我國居民消費水平逐年提高B.2018年至2022年我國城鎮居民消費水平逐年提高C.2018年至2022年我國居民消費水平數據的極差為6463元D.2022年我國城鎮人口數比農村人口數的1.5倍還要多考點四、折線統計圖1.(2024·遼寧撫順·三模)(多選)年月日國家統計局發布了制造業采購經理指數(),如下圖所示:下列說法正確的是( )A.從年月到年月,這個月的制造業采購經理指數()的第百分位數為B.從年月到年月,這個月的制造業采購經理指數()的極差為C.從年月到年月制造業采購經理指數()呈下降趨勢D.大于表示經濟處于擴張活躍的狀態;小于表示經濟處于低迷萎縮的狀態,則年月到年月,經濟處于擴張活躍的狀態2.(2024·全國·二模)(多選)人均可支配收入和人均消費支出是兩個非常重要的經濟和民生指標,常被用于衡量一個地區經濟發展水平和群眾生活水平.下圖為2018~2023年前三季度全國城鎮居民人均可支配收入及人均消費支出統計圖,據此進行分析,則( )A.2018~2023年前三季度全國城鎮居民人均消費支出逐年遞增B.2018~2023年前三季度全國城鎮居民人均可支配收入逐年遞增C.2018~2023年前三季度全國城鎮居民人均可支配收入的極差比人均消費支出的極差小D.2018~2023年前三季度全國城鎮居民人均消費支出的中位數為21180元1.(2024·黑龍江·三模)(多選)在某市初三年級舉行的一次體育考試中(滿分100分),所有考生成績均在[50,100]內,按照[50,60),[60,70),[70,80),[80,90),[90,100]分成五組,甲、乙兩班考生的成績占比如圖所示,則下列說法錯誤的是( ) A.成績在[70,80)的考生中,甲班人數多于乙班人數B.甲班成績在[80,90)內人數最多C.乙班成績在[70,80)內人數最多D.甲班成績的極差比乙班成績的極差小2.(23-24高三下·山東·開學考試)(多選)進入冬季哈爾濱旅游火爆全網,下圖是2024年1月1.日到1月7日哈爾濱冰雪大世界和中央大街日旅游人數的折線圖,則( )A.中央大街日旅游人數的極差是1.2 B.冰雪大世界日旅游人數的中位數是2.3C.冰雪大世界日旅游人數的平均數比中央大街大 D.冰雪大世界日旅游人數的方差比中央大街大考點五、扇形統計圖1.(2024·山東菏澤·模擬預測)南丁格爾玫瑰圖是由近代護理學和護士教育創始人南丁格爾設計的,圖中每個扇形圓心角都是相等的,半徑長短表示數量大小.某機構統計了近幾年某國知識付費用戶數量(單位:億人次),并繪制成南丁格爾玫瑰圖(如圖所示),根據此圖,以下說法錯誤的是( )A.2016年至2023年,知識付費用戶數量逐年增加B.2016年至2023年,知識付費用戶數量逐年增加量2019年最多C.2016年至2023年,知識付費用戶數量的逐年增加量逐年遞增D.2023年知識付費用戶數量超過2016年知識付費用戶數量的10倍2.(2024·湖南邵陽·模擬預測)(多選)有關數據顯示,年輕一代的父母更加重視親子陪伴,以往“以孩子為中心”的觀念正逐步向與孩子玩在一起、學在一起的方向轉變.如圖為2023年中國父母參與過的各類親子活動人數在參與調查總人數中的占比,根據該圖,下列說法正確的是( )A.在參與調查的總人數中父母參與過的親子活動最多的是親子閱讀B.在參與調查的總人數中同時參與過親子閱讀與親子運動會的父母不少于C.圖中各類親子活動占比的中位數為D.圖中10類親子活動占比的極差為1.(2024·遼寧·模擬預測)某高中2023年的高考考生人數是2022年高考考生人數的1.5倍.為了更好地對比該校考生的升學情況,統計了該校2022年和2023年高考分數達線情況,得到如圖所示扇形統計圖: 下列結論正確的是( )A.該校2023年與2022年的本科達線人數比為6:5B.該校2023年與2022年的專科達線人數比為6:7C.2023年該校本科達線人數比2022年該校本科達線人數增加了80%D.2023年該校不上線的人數有所減少2.(2024·遼寧·二模)(多選)下圖為某市2023年第一季度全市居民人均消費支出構成圖.已知城鎮居民人均消費支出7924元,與上一年同比增長4.4%;農村居民人均消費支出4388元,與上一年同比增長7.8%,則關于2023年第一季度該市居民人均消費支出,下列說法正確的是( )A.2023年第一季度該市居民人均消費支出6393元B.居住及食品煙酒兩項的人均消費支出總和超過了總人均消費支出的50%C.城鄉居民人均消費支出的差額與上一年同比在縮小D.醫療保健與教育文化娛樂兩項人均消費支出總和約占總人均消費支出的20.6%考點六、頻率分布表1.現有一個容量為50的樣本,其數據的頻數分布表如下表所示:組號 1 2 3 4 5頻數 8 11 10 9則第4組的頻數和頻率分別是( )A.12,0.06 B.12,0.24 C.18,0.09 D.18,0.361.某單位招聘員工,有名應聘者參加筆試,隨機抽查了其中名應聘者筆試試卷,統計他們的成績如下表:分數段人數 1 3 6 6 2 1 1若按筆試成績擇優錄取名參加面試,由此可預測參加面試的分數線為A.分 B.分 C.分 D.分考點七、頻率分布直方圖1.(2022·天津·高考真題)將1916到2015年的全球年平均氣溫(單位:),共100個數據,分成6組:,并整理得到如下的頻率分布直方圖,則全球年平均氣溫在區間內的有( )A.22年 B.23年 C.25年 D.35年2.(2021·天津·高考真題)從某網絡平臺推薦的影視作品中抽取部,統計其評分數據,將所得個評分數據分為組:、、、,并整理得到如下的頻率分布直方圖,則評分在區間內的影視作品數量是( )A. B. C. D.3.(2021·全國·高考真題)為了解某地農村經濟情況,對該地農戶家庭年收入進行抽樣調查,將農戶家庭年收入的調查數據整理得到如下頻率分布直方圖:根據此頻率分布直方圖,下面結論中不正確的是( )A.該地農戶家庭年收入低于4.5萬元的農戶比率估計為6%B.該地農戶家庭年收入不低于10.5萬元的農戶比率估計為10%C.估計該地農戶家庭年收入的平均值不超過6.5萬元D.估計該地有一半以上的農戶,其家庭年收入介于4.5萬元至8.5萬元之間4.(2022·全國·高考真題)在某地區進行流行病學調查,隨機調查了100位某種疾病患者的年齡,得到如下的樣本數據的頻率分布直方圖: (1)估計該地區這種疾病患者的平均年齡(同一組中的數據用該組區間的中點值為代表);(2)估計該地區一位這種疾病患者的年齡位于區間的概率;(3)已知該地區這種疾病的患病率為,該地區年齡位于區間的人口占該地區總人口的.從該地區中任選一人,若此人的年齡位于區間,求此人患這種疾病的概率.(以樣本數據中患者的年齡位于各區間的頻率作為患者的年齡位于該區間的概率,精確到0.0001).1.(2024·湖北黃岡·模擬預測)為了解高中學生每天的體育活動時間,某市教育部門隨機抽取高中學生進行調查,把每天進行體育活動的時間按照時長(單位:分鐘)分成組:,,,,,.然后對統計數據整理得到如圖所示的頻率分布直方圖,則可估計這名學生每天體育活動時間的第百分位數為( )A. B. C. D.2.(2024·廣西桂林·模擬預測)(多選)某次數學考試后,為分析學生的學習情況,某校從某年級中隨機抽取了100名學生的成績,整理得到如圖所示的頻率分布直方圖.為進一步分析高分學生的成績分布情況,計算得到這100名學生中,成績位于內的學生成績方差為12,成績位于內的同學成績方差為10.則( )A.B.估計該年級學生成績的中位數約為77.14C.估計該年級成績在80分及以上的學生成績的平均數為87.50D.估計該年級成績在80分及以上的學生成績的方差為323.(2024·福建泉州·模擬預測)(多選)某校在開展“弘揚中華傳統文化,深植文化自信之根”主題教育的系列活動中,舉辦了“誦讀國學經典,傳承中華文明”知識競賽.賽前為了解學生的備賽情況,組織對高一年和高二年學生的抽樣測試,測試成績數據處理后,得到如下頻率分布直方圖,則下面說法正確的是( )A.高一年抽測成績的眾數為75B.高二年抽測成績低于60分的比率為C.估計高一年學生成績的平均分低于高二年學生成績的平均分D.估計高一年學生成績的中位數低于高二年學生成績的中位數4.(2024·江蘇南京·二模)(多選)2023年10月31日,神舟十六號載人飛船返回艙在東風著陸場成功著陸,激發了學生對航天的熱愛.某校組織高中學生參加航天知識競賽,現從中隨機抽取100名學生成績分為四組,分別為,得到頻率分布直方圖如圖所示,則( ) A.B.這組樣本數據的分位數為88C.若從這100名學生成績不低于80分的學生中,隨機抽取3人,則此3人的分數都不低于90分的概率為D.若用樣本的頻率估計總體,從該校高中學生中隨機抽199人,記“抽取199人中成績不低于90的人數為”的事件為,則最大時,.考點八、總體百分位數的估計1.(2024·江西·一模)從1984年第23屆洛杉磯夏季奧運會到2024年第33屆巴黎夏季奧運會,我國獲得的夏季奧運會金牌數依次為15、5、16、16、28、32、51、38、26、38、40,這11個數據的分位數是( )A.16 B.30 C.32 D.512.(2024·安徽·模擬預測)一組數據按從小到大的順序排列為2,4,m,12,16,17,若該組數據的中位數是極差的,則該組數據的第40百分位數是 .3.(2024·廣東廣州·模擬預測)(多選)已知,,,,,為依次增大的一組數據,則去掉和后,這組數據的( )一定減小.A.極差 B.下四分位數 C.上四分位數 D.中位數1.(2024·安徽六安·模擬預測)樣本數據16,20,24,21,22,18,14,28的分位數為( )A.16 B.17 C.23 D.242.(2024·河南周口·模擬預測)已知一組從小到大排列的數據:a,2,2,4,4,5,6,b,8,8,若其第70百分位數等于其極差,則 .考點九、總體集中趨勢的估計1.(2023·全國·高考真題)(多選)有一組樣本數據,其中是最小值,是最大值,則( )A.的平均數等于的平均數B.的中位數等于的中位數C.的標準差不小于的標準差D.的極差不大于的極差2.(2024·黑龍江哈爾濱·三模)如圖所示,下列頻率分布直方圖顯示了三種不同的形態.圖(1)形成對稱形態,圖(2)形成“右拖尾”形態,圖(3)形成“左拖尾”形態,根據所給圖作出以下判斷,正確的是( )A.圖(1)的平均數=中位數>眾數 B.圖(2)的眾數<中位數<平均數C.圖(2)的平均數<眾數<中位數 D.圖(3)的中位數<平均數<眾數3.(2024·重慶九龍坡·三模)(多選)已知樣本數據的平均數為2,方差為1,則下列說法正確的是( )A.數據,的平均數為6B.數據,的方差為9C.數據的方差為1D.數據的平均數為51.(23-24高三下·北京·開學考試)設一組數據,則數據的平均值為 ,30%分位數為 .2.(2024·廣東廣州·模擬預測)已知數據,且滿足,若去掉,后組成一組新數據,則新數據與原數據相比,有可能變大的是( )A.平均數 B.中位數 C.極差 D.方差3.(2024·浙江·三模)(多選)已知a,,有一組樣本數據為,3,,,8,10,,12,13,若在這組數據中再插入一個數8,則( )A.平均數不變 B.中位數不變 C.方差不變 D.極差不變考點十、總體離散程度的估計1.(2024·陜西商洛·模擬預測)設一組樣本數據的平均值是1,且的平均值是3,則數據的方差是( )A.1 B.2 C.3 D.42.(2024·黑龍江哈爾濱·模擬預測)已知有4個數據的平均值為5,方差為4,現加入數據6和10,則這6個數據的新方差為( )A. B. C.6 D.103.(2021·全國·高考真題)(多選)下列統計量中,能度量樣本的離散程度的是( )A.樣本的標準差 B.樣本的中位數C.樣本的極差 D.樣本的平均數4.(2021·全國·高考真題)(多選)有一組樣本數據,,…,,由這組數據得到新樣本數據,,…,,其中(為非零常數,則( )A.兩組樣本數據的樣本平均數相同B.兩組樣本數據的樣本中位數相同C.兩組樣本數據的樣本標準差相同D.兩組樣本數據的樣本極差相同5.(2023·全國·高考真題)某廠為比較甲乙兩種工藝對橡膠產品伸縮率的處理效應,進行10次配對試驗,每次配對試驗選用材質相同的兩個橡膠產品,隨機地選其中一個用甲工藝處理,另一個用乙工藝處理,測量處理后的橡膠產品的伸縮率.甲、乙兩種工藝處理后的橡膠產品的伸縮率分別記為,.試驗結果如下:試驗序號 1 2 3 4 5 6 7 8 9 10伸縮率 545 533 551 522 575 544 541 568 596 548伸縮率 536 527 543 530 560 533 522 550 576 536記,記的樣本平均數為,樣本方差為.(1)求,;(2)判斷甲工藝處理后的橡膠產品的伸縮率較乙工藝處理后的橡膠產品的伸縮率是否有顯著提高(如果,則認為甲工藝處理后的橡膠產品的伸縮率較乙工藝處理后的橡膠產品的伸縮率有顯著提高,否則不認為有顯著提高)6.(2021·全國·高考真題)某廠研制了一種生產高精產品的設備,為檢驗新設備生產產品的某項指標有無提高,用一臺舊設備和一臺新設備各生產了10件產品,得到各件產品該項指標數據如下:舊設備 9.8 10.3 10.0 10.2 9.9 9.8 10.0 10.1 10.2 9.7新設備 10.1 10.4 10.1 10.0 10.1 10.3 10.6 10.5 10.4 10.5舊設備和新設備生產產品的該項指標的樣本平均數分別記為和,樣本方差分別記為和.(1)求,,,;(2)判斷新設備生產產品的該項指標的均值較舊設備是否有顯著提高(如果,則認為新設備生產產品的該項指標的均值較舊設備有顯著提高,否則不認為有顯著提高).1.(2024·新疆·二模)若數據的平均數為,方差為,則數據的方差為( )A. B. C. D.2.(2024·江蘇泰州·模擬預測)(多選)已知,有一組數據為,3,,,8,10,,12,13,若在這組數據中去除第5個數8,則( )A.平均數不變 B.中位數不變 C.方差不變 D.極差不變3.(2024·云南·模擬預測)某學校高三年級男生共有個,女生共有個,為調查該年級學生的年齡情況,通過分層抽樣,得到男生和女生樣本數據的平均數和方差分別為和,已知,則該校高三年級全體學生年齡的方差為( )A. B.C. D.14.(2024·遼寧·模擬預測)某工廠為了提高精度,采購了一批新型機器,現對這批機器的生產效能進行測試,對其生產的第一批零件的內徑進行測量,統計繪制了如下圖所示的頻率分布直方圖. (1)求a的值以及這批零件內徑的平均值和方差(同一組中的數據用該組區間的中點值作代表);(2)以頻率估計概率,若在這批零件中隨機抽取4個,記內徑在區間內的零件個數為,求的分布列以及數學期望;(3)已知這批零件的內徑(單位:mm)服從正態分布,現以頻率分布直方圖中的平均數作為的估計值,頻率分布直方圖中的標準差作為的估計值,則在這批零件中隨機抽取200個,記內徑在區間上的零件個數為,求的方差.參考數據:,若,則,,.5.(2024·湖北武漢·模擬預測)四月的武漢被百萬株薔薇花覆蓋,形成了全城的花海景觀。薔薇花一般扦插繁殖,園林局為了更好的了解扦插枝條的長度對繁殖狀況的影響,選擇甲乙兩區按比例分層抽樣來抽取樣本.已知甲區的樣本容量,樣本平均數,樣本方差;乙區的樣本容量,樣本平均數,樣本方差.(1)求由兩區樣本組成的總樣本的平均數及其方差;(結果保留一位小數)(2)為了營造“花在風中笑,人在畫中游”的美景,甲乙兩區決定在各自最大的薔薇花海公園進行一次書畫比賽,兩區各派一支代表隊參加,經抽簽確定第一場在甲區舉行.比賽規則如下:每場比賽分出勝負,沒有平局,勝方得1分,負方得0分,下一場在負方舉行,先得2分的代表隊獲勝,比賽結束.當比賽在甲區舉行時,甲區代表隊獲勝的概率為,當比賽在乙區舉行時,甲區代表隊獲勝的概率為.假設每場比賽結果相互獨立.甲區代表隊的最終得分記為X,求X的分布列及的值.參考數據:.考點十一、成對數據的統計相關性1.(2024·上海·高考真題)已知氣候溫度和海水表層溫度相關,且相關系數為正數,對此描述正確的是( )A.氣候溫度高,海水表層溫度就高B.氣候溫度高,海水表層溫度就低C.隨著氣候溫度由低到高,海水表層溫度呈上升趨勢D.隨著氣候溫度由低到高,海水表層溫度呈下降趨勢2.(2023·天津·高考真題)鳶是鷹科的一種鳥,《詩經·大雅·旱麓》曰:“鳶飛戾天,魚躍余淵”. 鳶尾花因花瓣形如鳶尾而得名,寓意鵬程萬里、前途無量.通過隨機抽樣,收集了若干朵某品種鳶尾花的花萼長度和花瓣長度(單位:cm),繪制散點圖如圖所示,計算得樣本相關系數為,利用最小二乘法求得相應的經驗回歸方程為,根據以上信息,如下判斷正確的為( )A.花瓣長度和花萼長度不存在相關關系B.花瓣長度和花萼長度負相關C.花萼長度為7cm的該品種鳶尾花的花瓣長度的平均值為D.若從樣本中抽取一部分,則這部分的相關系數一定是3.(2022·全國·高考真題)某地經過多年的環境治理,已將荒山改造成了綠水青山.為估計一林區某種樹木的總材積量,隨機選取了10棵這種樹木,測量每棵樹的根部橫截面積(單位:)和材積量(單位:),得到如下數據:樣本號i 1 2 3 4 5 6 7 8 9 10 總和根部橫截面積 0.04 0.06 0.04 0.08 0.08 0.05 0.05 0.07 0.07 0.06 0.6材積量 0.25 0.40 0.22 0.54 0.51 0.34 0.36 0.46 0.42 0.40 3.9并計算得.(1)估計該林區這種樹木平均一棵的根部橫截面積與平均一棵的材積量;(2)求該林區這種樹木的根部橫截面積與材積量的樣本相關系數(精確到0.01);(3)現測量了該林區所有這種樹木的根部橫截面積,并得到所有這種樹木的根部橫截面積總和為.已知樹木的材積量與其根部橫截面積近似成正比.利用以上數據給出該林區這種樹木的總材積量的估計值.附:相關系數.4.(2020·全國·高考真題)某沙漠地區經過治理,生態系統得到很大改善,野生動物數量有所增加.為調查該地區某種野生動物的數量,將其分成面積相近的200個地塊,從這些地塊中用簡單隨機抽樣的方法抽取20個作為樣區,調查得到樣本數據(xi,yi)(i=1,2,…,20),其中xi和yi分別表示第i個樣區的植物覆蓋面積(單位:公頃)和這種野生動物的數量,并計算得,,,,.(1)求該地區這種野生動物數量的估計值(這種野生動物數量的估計值等于樣區這種野生動物數量的平均數乘以地塊數);(2)求樣本(xi,yi)(i=1,2,…,20)的相關系數(精確到0.01);(3)根據現有統計資料,各地塊間植物覆蓋面積差異很大.為提高樣本的代表性以獲得該地區這種野生動物數量更準確的估計,請給出一種你認為更合理的抽樣方法,并說明理由.附:相關系數r=,≈1.414.1.(23-24高三下·云南昆明·階段練習)兩個變量y與x的回歸模型中,分別選擇了4個不同模型,它們的決定系數如下,其中擬合效果最好的模型是( )A.模型1(決定系數為0.97) B.模型2(決定系數為0.85)C.模型3(決定系數為0.40) D.模型4(決定系數為0.25)2.(2024·貴州貴陽·模擬預測)(多選)某廠近幾年陸續購買了幾臺 A 型機床,該型機床已投入生產的時間x(單位:年)與當年所需要支出的維修費用y(單位:萬元)有如下統計資料:x 2 3 4 5 6y 2.2 3.8 5.5 6.5 7根據表中的數據可得到經驗回歸方程為. ,則( )A.y與x的樣本相關系數B.C.表中維修費用的第60百分位數為6D.該型機床已投入生產的時間為 10年時,當年所需要支出的維修費用一定是12.38萬元3.(2024·江蘇宿遷·三模)(多選)為了研究y關于x的線性相關關系,收集了5對樣本數據(見表格),若已求得一元線性回歸方程為,則下列選項中正確的是( )1 2 3 4 51A.B.當時的殘差為C.樣本數據y的40百分位數為1D.去掉樣本點后,y與x的相關系數不會改變4.(2024·河南新鄉·模擬預測)氮氧化物是一種常見的大氣污染物,下圖為我國2015年至2023年氮氧化物排放量(單位:萬噸)的折線圖,其中年份代碼1~9分別對應年份2015~2023.已知,,,.(1)可否用線性回歸模型擬合與的關系?請分別根據折線圖和相關系數加以說明.(2)若根據所給數據建立回歸模型,可否用此模型來預測2024年和2034年我國的氮氧化物排放量?請說明理由.附:相關系數.考點十二、一元線性回歸模型及其應用1.(2024·上海·三模)設一組成對數據的相關系數為r,線性回歸方程為,則下列說法正確的為( ).A.越大,則r越大 B.越大,則r越小C.若r大于零,則一定大于零 D.若r大于零,則一定小于零2.(2024·天津·二模)有人通過調查統計發現,兒子成年時的身高與父親的身高呈線性相關,且兒子成年時的身高(單位:)與父親的身高(單位:)的經驗回歸方程為,根據以上信息,下列判斷正確的為( ).A.兒子成年時的身高與父親的身高的樣本相關系數B.父親的身高為,兒子成年時的身高一定在到之間C.父親的身高每增加,兒子成年時的身高平均增加D.兒子在成年時的身高一般會比父親高3.(2024·山東棗莊·模擬預測)(多選)已知兩個變量y與x對應關系如下表:x 1 2 3 4 5y 5 m 8 9 10.5若y與x滿足一元線性回歸模型,且經驗回歸方程為,則( )A.y與x正相關 B.C.樣本數據y的第60百分位數為8 D.各組數據的殘差和為04.(2024·陜西西安·二模)近年來我國新能源汽車行業蓬勃發展,新能源汽車不僅對環境保護具有重大的意義,而且還能夠減少對不可再生資源的開發,是全球汽車發展的重要方向.“保護環境,人人有責”,在政府和有關企業的努力下,某地區近幾年新能源汽車的購買情況如下表所示:年份x 2019 2020 2021 2022 2023新能源汽車購買數量>(萬輛) 0.40 0.70 1.10 1.50 1.80(1)計算與的相關系數(保留三位小數);(2)求關于的線性回歸方程,并預測該地區2025年新能源汽車購買數量.參考公式,,.參考數值:,.5.(2024·河北滄州·模擬預測)“南澳牡蠣”是我國地理標志產品,產量高、肉質肥、營養好,素有“海洋牛奶精品”的美譽.2024年該基地考慮增加人工投入,現有以往的人工投入增量x(人)與年收益增量y(萬元)的數據如下:人工投入增量x(人) 2 3 4 6 8 10 13年收益增量y(萬元) 13 22 31 42 50 56 58該基地為了預測人工投入增量為16人時的年收益增量,建立了y與x的兩個回歸模型:模型①:由最小二乘公式可求得y與x的線性回歸方程:;模型②:由散點圖的樣本點分布,可以認為樣本點集中在曲線:的附近,對人工投入增量x做變換,令,則,且有,,,.(1)(i)根據所給的統計量,求模型②中y關于x的回歸方程(精確到0.1);(ii)根據下列表格中的數據,比較兩種模型的決定系數,并選擇擬合精度更高、更可靠的模型,預測人工投入增量為16人時的年收益增量.回歸模型 模型① 模型②回歸方程182.4 79.2(2)根據養殖規模與以往的養殖經驗,產自某南澳牡蠣養殖基地的單個“南澳牡蠣”質量(克)在正常環境下服從正態分布.購買10只該基地的“南澳牡蠣”,會買到質量小于20g的牡蠣的可能性有多大 附:若隨機變量,則,;樣本的最小二乘估計公式為:,,.1.(2024·上海徐匯·二模)為了研究y關于x的線性相關關系,收集了5組樣本數據(見下表):x 1 2 3 4 5y 0.5 0.9 1 1.1 1.5若已求得一元線性回歸方程為,則下列選項中正確的是( )A.B.當時,y的預測值為2.2C.樣本數據y的第40百分位數為1D.去掉樣本點后,x與y的樣本相關系數r不會改變2.(2024·河北·一模)某校為了解本校高一男生身高和體重的相關關系,在該校高一年級隨機抽取了7名男生,測量了他們的身高和體重得下表:身高(單位: 167 173 175 177 178 180 181體重(單位: 90 54 59 64 67 72 76由表格制作成如圖所示的散點圖: 由最小二乘法計算得到經驗回歸直線的方程為,其相關系數為;經過殘差分析,點對應殘差過大,把它去掉后,再用剩下的6組數據計算得到經驗回歸直線的方程為,相關系數為.則下列選項正確的是( )A.B.C.D.3.(2024·甘肅隴南·一模)(多選)某廠近幾年陸續購買了幾臺 A 型機床,該型機床已投入生產的時間x(單位:年)與當年所需要支出的維修費用y(單位:萬元)有如下統計資料:x 2 3 4 5 6y 2.2 3.8 5.5 6.5 7根據表中的數據可得到經驗回歸方程為. 則( )A.B.y與x的樣本相關系數C.表中維修費用的第60百分位數為6D.該型機床已投入生產的時間為 10年時,當年所需要支出的維修費用一定是12.38萬元4.(2024·全國·模擬預測)腦機接口,即指在人或動物大腦與外部設備之間創建的直接連接,實現腦與設備的信息交換.近日埃隆.馬斯克宣布,腦機接口公司Neuralink正在接收第二位植入者申請,該試驗可以實現意念控制手機和電腦.未來10到20年,我國腦機接口產業將產生數百億元的經濟價值.為了適應市場需求,同時兼顧企業盈利的預期,某科技公司決定增加一定數量的研發人員,經過調研,得到年收益增量(單位:億元)與研發人員增量(人)的10組數據.現用模型①,②分別進行擬合,由此得到相應的經驗回歸方程,并進行殘差分析,得到如圖所示的殘差圖.根據收集到的數據,計算得到下表數據,其中.7.5 2.25 82.50 4.50 12.14 2.88(1)根據殘差圖,判斷應選擇哪個模型;(無需說明理由)(2)根據(1)中所選模型,求出關于的經驗回歸方程;并用該模型預測,要使年收益增量超過8億元,研發人員增量至少多少人?(精確到1)附:對于一組具有線性相關關系的數據,其經驗回歸直線的斜率和截距的最小二乘估計分別為5.(2024·江西九江·三模)車胎凹槽深度是影響汽車剎車的因素,汽車行駛會導致輪胎胎面磨損.某實驗室通過實驗測得轎車行駛里程與某品牌輪胎凹槽深度的數據,如下表所示:行駛里程萬 0.0 0.4 1.0 1.6 2.4 2.8 3.4 4.4輪胎凹槽深度 8.0 7.8 7.2 6.2 5.6 4.8 4.4 4.0(1)求該品牌輪胎凹槽深度與行駛里程的相關系數,并判斷二者之間是否具有很強的線性相關性;(結果保留兩位有效數字)(2)根據我國國家標準規定:轎車輪胎凹槽安全深度為(當凹槽深度低于時剎車距離增大,駕駛風險增加,必須更換新輪胎).某人在保養汽車時將小轎車的輪胎全部更換成了該品牌的新輪胎,請問在正常行駛情況下,更換新輪胎后繼續行駛約多少公里需對輪胎再次更換?附:變量與的樣本相關系數;對于一組數據,,其線性回歸方程的斜率和截距的最小二乘估計分別為:.考點十三、列聯表與獨立性檢驗1.(2024·江蘇鹽城·模擬預測)根據分類變量Ⅰ與Ⅱ的統計數據,計算得到,則( )0.1 0.05 0.01 0.005 0.0012.706 3.841 6.635 7.879 10.828A.變量Ⅰ與Ⅱ相關B.變量Ⅰ與Ⅱ相關,這個結論犯錯誤的概率不超過0.1C.變量Ⅰ與Ⅱ不相關D.變量Ⅰ與Ⅱ不相關,這個結論犯錯誤的概率不超過0.12.(2024·廣東江門·模擬預測)(多選)某中學為更好的開展素質教育,現對外出研學課程是否和性別有關做了一項調查,其中被調查的男生和女生人數相同,且男生中選修外出研學課程的人數占男生總人數的,女生中選修外出研學課程的人數占女生總人數的.若依據的獨立性檢驗,可以認為“選修外出研學課程與性別有關”.則調查人數中男生可能有( )男生 女生 合計選修外出研學課程未選修外出研學課程合計附:,其中A.150人 B.225人 C.300人 D.375人3.(2024·湖南益陽·一模)某公園為了提升公園形象,提高游客旅游的體驗感,他們更新了部分設施,調整了部分旅游線路.為了解游客對新措施是否滿意,隨機抽取了100名游客進行調查,男游客與女游客的人數之比為2:3,其中男游客有35名滿意,女游客有15名不滿意.滿意 不滿意 總計男游客 35女游客 15合計 100(1)完成列聯表,依據表中數據,以及小概率值的獨立性檢驗,能否認為游客對公園新措施滿意與否與性別有關 (2)從被調查的游客中按男、女分層抽樣抽取5名游客.再隨機從這5名游客中抽取3名游客征求他們對公園進一步提高服務質量的建議,其中抽取男游客的人數為.求出的分布列及數學期望.參考公式:,其中.參考數據:0.10 0.05 0.010 0.0052.706 3.841 6.635 7.8791.(2024·四川成都·三模)有甲、乙兩個班級進行數學考試,按照大于等于85分為優秀,85分以下為非優秀統計成績,得到如下所示的列聯表:優秀 非優秀甲班 10乙班 30附:(),0.05 0.025 0.010 0.0053.841 5.024 6.635 7.879已知在全部105人中隨機抽取1人,成績優秀的概率為,則下列說法正確的是( )A.甲班人數少于乙班人數B.甲班的優秀率高于乙班的優秀率C.表中的值為15,的值為50D.根據表中的數據,若按的可靠性要求,能認為“成績與班級有關系”2.(2024·福建南平·模擬預測)(多選)2023年10月全國多地醫院出現較多的支原體肺炎感染患者,患者多以兒童為主.某研究所在某小學隨機抽取了46名兒童,得到他們是否接種流感疫苗和是否感染支原體肺炎的情況的相關數據,如下表所示,則( )感染情況接種情況 感染支原體肺炎 未感染支原體肺炎 合計接種流感疫苗未接種流感疫苗合計 46附:.0.1 0.05 0.01 0.005 0.0012.706 3.841 6.635 7.879 10.828A.B.C.認為是否接種流感疫苗與是否感染支原體肺炎有關聯,此推斷犯錯的概率不大于0.1D.沒有充分的證據推斷是否接種流感疫苗與是否感染支原體肺炎有關聯3.(2024·廣東佛山·模擬預測)某區中考體育科目有必選項目和選考項目,其中籃球為一個選考項目.該區體育老師為了了解初中學生的性別和喜歡籃球是否有關,隨機調查了該區1000名初中學生,得到成對樣本數據的分類統計結果,如下表所示:性別 是否喜歡籃球 合計喜歡 不喜歡男生 450 150 600女生 150 250 400合計 600 400 1000(1)依據的獨立性檢驗,能否認為該區初中學生的性別與喜歡籃球有關聯;(2)用按性別比例分配的分層隨機抽樣的方法從參與調查的喜歡籃球的600名初中學生中抽取8名學生做進一步調查,將這8名學生作為一個樣本,從中隨機抽取3人,用X表示隨機抽取的3人中女生的人數,求X的分布列和數學期望.附:參考數據,其中.0.1 0.05 0.01 0.005 0.0012.706 3.841 6.635 7.879 10.828一、單選題1.(2024·四川南充·一模)甲同學近10次數學考試成績情況如下:103,106,113,119,123,118,134,118,125,121,則甲同學數學考試成績的第75百分位數是( )A.118 B.121 C.122 D.1232.(2024·廣東珠海·模擬預測)下列說法正確的是( )A.一組數據的標準差為0,則這組數據中的數均相等B.兩組數據的標準差相等,則這兩組數據的平均數相等C.若兩個變量的相關系數越接近于0,則這兩個變量的相關性越強D.已知變量,由它們的樣本數據計算得到的觀測值的部分臨界值如下表:0.1 0.05 0.025 0.012.706 3.841 5.024 6.635則在犯錯誤的概率不超過0.025的前提下認為變量沒有關系3.(2024·江蘇蘇州·模擬預測)設研究某兩個屬性變量時,作出零假設并得到2×2列聯表,計算得,則下列說法正確的是( )A.有99.5%的把握認為不成立 B.有5%的把握認為的反面正確C.有95%的把握判斷正確 D.有95%的把握能反駁4.(2024·安徽蕪湖·模擬預測)下列說法正確的是( )A.若隨機變量,則當較小時,對應的正態曲線“矮胖”,隨機變量X的分布比較分散B.在做回歸分析時,可以用決定系數刻畫模型回歸效果,越小,說明模型擬合的效果越好C.一元線性回歸模型中,如果相關系數,表明兩個變量的相關程度很強D.在列聯表中,若所有數據均變成原來的2倍,則不變(,其中)二、多選題5.(2024·海南海口·模擬預測)某校為了解學生的身體狀況,隨機抽取了50名學生測量體重,經統計,這些學生的體重數據(單位:千克)全部介于45至70之間,將數據整理得到如圖所示的頻率分布直方圖,則( )A.頻率分布直方圖中的值為0.04B.這50名學生體重的眾數約為52.5C.該校學生體重的上四分位數約為61.25D.這50名學生中體重不低于65千克的人數約為106.(2024·湖北武漢·模擬預測)某科技公司統計了一款App最近5個月的下載量如表所示,若與線性相關,且線性回歸方程為,則( )月份編號 1 2 3 4 5下載量(萬次) 5 4.5 4 3.5 2.5A.與負相關 B.C.預測第6個月的下載量是2.1萬次 D.殘差絕對值的最大值為0.27.(2024·江西新余·模擬預測)已知對個數據做如下變換:當為奇數時,對應的變為;當為偶數時,對應的變為,則對于該組數據的變化,下列情況中可能發生的是:( ).A.平均數增大 B.方差不變C.分位數減小 D.眾數減小三、填空題8.(2024·四川成都·模擬預測)已知關于x的一組數據:x 1 m 3 4 5y 0.5 0.6 n 1.3 1.4根據表中數據得到的線性回歸直線方程為,則的值 .四、解答題9.(2024·浙江嘉興·二模)為了有效預防流感,很多民眾注射了流感疫苗.市防疫部門隨機抽取了1000人進行調查,發現其中注射疫苗的800人中有220人感染流感,另外沒注射疫苗的200人中有80人感染流感.醫學研究表明,流感的檢測結果有檢錯的可能,已知患流感的人其檢測結果有呈陽性(流感),而沒有患流感的人其檢測結果有呈陰性(未感染)(1)估計該市流感感染率是多少?(2)根據所給的數據,判斷是否有99%的把握認為注射流感疫苗與預防流感有關;(3)已知某人的流感檢查結果呈陽性,求此人真的患有流感的概率.(精確到0.001)附:.0.050 0.010 0.001k 3.841 6.635 10.82810.(2024·陜西安康·模擬預測)某乒乓球訓練機構以訓練青少年為主,其中有一項打定點訓練,就是把乒乓球打到對方球臺的指定位置(稱為“準點球”),在每周末,記錄每個接受訓練的學員在訓練時打的所有球中“準點球”的百分比(),A學員已經訓練了1年,下表記錄了學員最近七周“準點球”的百分比:周次(x) 1 2 3 4 5 6 752 52.8 53.5 54 54.5 54.9 55.3若.(1)根據上表數據,計算與的相關系數,并說明與的線性相關性的強弱;(若,則認為與線性相關性很強;若,則認為與線性相關性一般;若,則認為與線性相關性較弱)(精確到)(2)求關于的回歸方程,并預測第周“準點球”的百分比.(精確到)參考公式和數據:,,.一、單選題1.(2024·江蘇鎮江·三模)命題P:的平均數與中位數相等;命題Q: 是等差數列,則P是Q的( )A.充分不必要條件 B.必要不充分條件C.充要條件 D.既不充分也不必要條件2.(2024·江西新余·模擬預測)已知一組數據大致呈線性分布,其回歸直線方程為,則的最小值為( ).A. B. C. D.無法確定3.(2024·吉林·模擬預測)設樣本數據,,…,的平均數為,標準差為,若樣本數據,,…,的平均數比標準差少3,則的最大值為( )A.1 B. C.4 D.二、多選題4.(2024·湖南邵陽·三模)為了解一片經濟林的生長情況,隨機抽取了其中60株樹木,測量底部周長(單位:cm),所得數據均在區間內,其頻率分布直方圖如圖所示,則( )A.圖中的值為0.025B.樣本中底部周長不小于110cm的樹木有12株C.估計該片經濟林中樹木的底部周長的分位數為115D.估計該片經濟林中樹木的底部周長的平均數為104(每組數據用該組所在區間的中點值作代表)5.(2024·遼寧·模擬預測)已知由樣本數據組成的一個樣本,得到回歸直線方程為,且,去除兩個歧義點和后,得到新的回歸直線的回歸系數為2.5,則下列說法正確的是( )A.相關變量具有正相關關系B.去除兩個歧義點后,隨值增加相關變量值增加速度變小C.去除兩個歧義點后,重新求得回歸方程對應的直線一定過點D.去除兩個歧義點后,重新求得的回歸直線方程為6.(2024·吉林長春·模擬預測)已知變量x和變量y的一組成對樣本數據()的散點落在一條直線附近,,,相關系數為,線性回歸方程為,則( )A.當越大時,成對樣本數據的線性相關程度越強B.當時,C.,時,成對樣本數據()的相關系數滿足D.時,成對樣本數據()的線性回歸方程滿足參考公式:7.(2024·福建·模擬預測)已知一組數據的平均數、中位數、眾數依次成等差數列,現在丟失了其中一個數據,另外六個數據分別是7,9,10,7,15,7.將丟失數據的所有可能值從小到大排列成數列,記,則( )A. B.C.是等差數列 D.是等比數列8.(2024·湖北·模擬預測)已知互不相同的20個樣本數據,若去掉其中最大和最小的數據,設剩下的18個樣本數據的方差為,平均數;去掉的兩個數據的方差為,平均數;原樣本數據的方差為,平均數,若,則( )A.B.C.剩下18個數據的中位數大于原樣本數據的中位數D.剩下18個數據的分位數不等于原樣本數據的分位數三、解答題9.(2024·海南海口·模擬預測)制定適合自己的學習計劃并在學習過程中根據自己的實際情況有效地安排和調整學習方法是一種有效的學習策略.某教師為研究學生制定學習計劃并堅持實施和數學成績之間的關系,得到如下數據:成績分 成績分 合計制定學習計劃并堅持實施沒有制定學習計劃合計(1)依據小概率值的獨立性檢驗,能否認為“制定學習計劃并堅持實施”和“數學成績高于分”有關聯?(2)若該校高三年級每月進行一次月考,該校學生小明在高三開學初認真制定了學習計劃,其中一項要求自己每天要把錯題至少重做一遍,做對為止.以下為小明堅持實施計劃的月份和他在學校數學月考成績的校內名次數據:月考時間 月初 月初 次年月初 次年月初 次年月初時間代碼月考校內名次參考數據:,.(ⅰ)求月考校內名次與時間代碼的線性回歸方程;(ⅱ)該校老師給出了上一年該校學生高考(月初考試)數學成績在校內的名次和在全省名次的部分數據:校內名次全省名次利用數據分析軟件,根據以上數據得出了兩個回歸模型和決定系數:模型① 模型②在以上兩個模型中選擇“較好”模型(說明理由),并結合問題(ⅰ)的回歸方程,依據“較好”模型預測小明如果能堅持實施學習計劃,他在次年高考中數學成績的全省名次(名次均保留整數).(參考數據:,,)附:(ii),其中.(i)對于一組數據,其回歸直線的斜率和截距的最小二乘估計分別為:,.10.(2024·江蘇無錫·模擬預測)由于人們對工業高度發達的負面影響預料不夠,預防不利,導致了全球性的三大危機:資源短缺、環境污染、生態破壞環境污染指自然的或人為的破壞,向環境中添加某種物質而超過環境的自凈能力而產生危害的行為或由于人為的因素,環境受到有害物質的污染,使生物的生長繁殖和人類的正常生活受到有害影響由于人為因素使環境的構成或狀態發生變化,環境質量下降,從而擾亂和破壞了生態系統和人類的正常生產和生活條件的現象據研究,某種污染物具有極強的污染力,現在對這種污染物的污染力進行調查研究,通過實驗調查,可以得到某地區該污染物到來后的污染時間小時與該污染物的污染面積平方米的一些數據如下:通過分析可知,數據與之間存在很強的線性回歸關系.(1)求出與之間的關系式;(2)根據中的關系式,該污染物到來后的污染時間是多少時,該污染物的污染面積的平均增長最慢?參考公式:對于一組數據,其回歸直線的斜率和截距的最小二乘估計分別,..1.(2024·天津·高考真題)下列圖中,線性相關性系數最大的是( )A. B.C. D.2.(2024·全國·高考真題)某工廠進行生產線智能化升級改造,升級改造后,從該工廠甲、乙兩個車間的產品中隨機抽取150件進行檢驗,數據如下:優級品 合格品 不合格品 總計甲車間 26 24 0 50乙車間 70 28 2 100總計 96 52 2 150(1)填寫如下列聯表:優級品 非優級品甲車間乙車間能否有的把握認為甲、乙兩車間產品的優級品率存在差異?能否有的把握認為甲,乙兩車間產品的優級品率存在差異?(2)已知升級改造前該工廠產品的優級品率,設為升級改造后抽取的n件產品的優級品率.如果,則認為該工廠產品的優級品率提高了,根據抽取的150件產品的數據,能否認為生產線智能化升級改造后,該工廠產品的優級品率提高了?()附:0.050 0.010 0.001k 3.841 6.635 10.8283.(2024·上海·高考真題)為了解某地初中學生體育鍛煉時長與學業成績的關系,從該地區29000名學生中抽取580人,得到日均體育鍛煉時長與學業成績的數據如下表所示:時間范圍學業成績優秀 5 44 42 3 1不優秀 134 147 137 40 27(1)該地區29000名學生中體育鍛煉時長不少于1小時人數約為多少?(2)估計該地區初中學生日均體育鍛煉的時長(精確到0.1)(3)是否有的把握認為學業成績優秀與日均體育鍛煉時長不小于1小時且小于2小時有關?(附:其中,.)4.(2023·全國·高考真題)一項試驗旨在研究臭氧效應,試驗方案如下:選40只小白鼠,隨機地將其中20只分配到試驗組,另外20只分配到對照組,試驗組的小白鼠飼養在高濃度臭氧環境,對照組的小白鼠飼養在正常環境,一段時間后統計每只小白鼠體重的增加量(單位:g).試驗結果如下:對照組的小白鼠體重的增加量從小到大排序為15.2 18.8 20.2 21.3 22.5 23.2 25.8 26.5 27.5 30.132.6 34.3 34.8 35.6 35.6 35.8 36.2 37.3 40.5 43.2試驗組的小白鼠體重的增加量從小到大排序為7.8 9.2 11.4 12.4 13.2 15.5 16.5 18.0 18.8 19.219.8 20.2 21.6 22.8 23.6 23.9 25.1 28.2 32.3 36.5(1)計算試驗組的樣本平均數;(2)(ⅰ)求40只小白鼠體重的增加量的中位數m,再分別統計兩樣本中小于m與不小于m的數據的個數,完成如下列聯表對照組試驗組(ⅱ)根據(i)中的列聯表,能否有95%的把握認為小白鼠在高濃度臭氧環境中與在正常環境中體重的增加量有差異?附:,0.100 0.050 0.0102.706 3.841 6.6355.(2023·全國·高考真題)一項試驗旨在研究臭氧效應.實驗方案如下:選40只小白鼠,隨機地將其中20只分配到實驗組,另外20只分配到對照組,實驗組的小白鼠飼養在高濃度臭氧環境,對照組的小白鼠飼養在正常環境,一段時間后統計每只小白鼠體重的增加量(單位:g).(1)設表示指定的兩只小白鼠中分配到對照組的只數,求的分布列和數學期望;(2)實驗結果如下:對照組的小白鼠體重的增加量從小到大排序為:15.2 18.8 20.2 21.3 22.5 23.2 25.8 26.5 27.5 30.132.6 34.3 34.8 35.6 35.6 35.8 36.2 37.3 40.5 43.2實驗組的小白鼠體重的增加量從小到大排序為:7.8 9.2 11.4 12.4 13.2 15.5 16.5 18.0 18.8 19.219.8 20.2 21.6 22.8 23.6 23.9 25.1 28.2 32.3 36.5(i)求40只小鼠體重的增加量的中位數m,再分別統計兩樣本中小于m與不小于的數據的個數,完成如下列聯表:對照組實驗組(ii)根據(i)中的列聯表,能否有95%的把握認為小白鼠在高濃度臭氧環境中與正常環境中體重的增加量有差異.附:0.100 0.050 0.0102.706 3.841 6.6356.(2023·全國·高考真題)某廠為比較甲乙兩種工藝對橡膠產品伸縮率的處理效應,進行10次配對試驗,每次配對試驗選用材質相同的兩個橡膠產品,隨機地選其中一個用甲工藝處理,另一個用乙工藝處理,測量處理后的橡膠產品的伸縮率.甲、乙兩種工藝處理后的橡膠產品的伸縮率分別記為,.試驗結果如下:試驗序號 1 2 3 4 5 6 7 8 9 10伸縮率 545 533 551 522 575 544 541 568 596 548伸縮率 536 527 543 530 560 533 522 550 576 536記,記的樣本平均數為,樣本方差為.(1)求,;(2)判斷甲工藝處理后的橡膠產品的伸縮率較乙工藝處理后的橡膠產品的伸縮率是否有顯著提高(如果,則認為甲工藝處理后的橡膠產品的伸縮率較乙工藝處理后的橡膠產品的伸縮率有顯著提高,否則不認為有顯著提高)7.(2022·北京·高考真題)在北京冬奧會上,國家速滑館“冰絲帶”使用高效環保的二氧化碳跨臨界直冷制冰技術,為實現綠色冬奧作出了貢獻.如圖描述了一定條件下二氧化碳所處的狀態與T和的關系,其中T表示溫度,單位是K;P表示壓強,單位是.下列結論中正確的是( )A.當,時,二氧化碳處于液態B.當,時,二氧化碳處于氣態C.當,時,二氧化碳處于超臨界狀態D.當,時,二氧化碳處于超臨界狀態8.(2022·全國·高考真題)某社區通過公益講座以普及社區居民的垃圾分類知識.為了解講座效果,隨機抽取10位社區居民,讓他們在講座前和講座后各回答一份垃圾分類知識問卷,這10位社區居民在講座前和講座后問卷答題的正確率如下圖:則( )A.講座前問卷答題的正確率的中位數小于B.講座后問卷答題的正確率的平均數大于C.講座前問卷答題的正確率的標準差小于講座后正確率的標準差D.講座后問卷答題的正確率的極差大于講座前正確率的極差9.(2022·全國·高考真題)甲、乙兩城之間的長途客車均由A和B兩家公司運營,為了解這兩家公司長途客車的運行情況,隨機調查了甲、乙兩城之間的500個班次,得到下面列聯表:準點班次數 未準點班次數A 240 20B 210 30(1)根據上表,分別估計這兩家公司甲、乙兩城之間的長途客車準點的概率;(2)能否有90%的把握認為甲、乙兩城之間的長途客車是否準點與客車所屬公司有關?附:,0.100 0.050 0.0102.706 3.841 6.63510.(2022·全國·高考真題)一醫療團隊為研究某地的一種地方性疾病與當地居民的衛生習慣(衛生習慣分為良好和不夠良好兩類)的關系,在已患該疾病的病例中隨機調查了100例(稱為病例組),同時在未患該疾病的人群中隨機調查了100人(稱為對照組),得到如下數據:不夠良好 良好病例組 40 60對照組 10 90(1)能否有99%的把握認為患該疾病群體與未患該疾病群體的衛生習慣有差異?(2)從該地的人群中任選一人,A表示事件“選到的人衛生習慣不夠良好”,B表示事件“選到的人患有該疾病”.與的比值是衛生習慣不夠良好對患該疾病風險程度的一項度量指標,記該指標為R.(ⅰ)證明:;(ⅱ)利用該調查數據,給出的估計值,并利用(ⅰ)的結果給出R的估計值.附,0.050 0.010 0.001k 3.841 6.635 10.82811.(2021·全國·高考真題)甲、乙兩臺機床生產同種產品,產品按質量分為一級品和二級品,為了比較兩臺機床產品的質量,分別用兩臺機床各生產了200件產品,產品的質量情況統計如下表:一級品 二級品 合計甲機床 150 50 200乙機床 120 80 200合計 270 130 400(1)甲機床、乙機床生產的產品中一級品的頻率分別是多少 (2)能否有99%的把握認為甲機床的產品質量與乙機床的產品質量有差異 附:0.050 0.010 0.001k 3.841 6.635 10.82812.(2020·江蘇·高考真題)已知一組數據的平均數為4,則的值是 .13.(2020·全國·高考真題)在一組樣本數據中,1,2,3,4出現的頻率分別為,且,則下面四種情形中,對應樣本的標準差最大的一組是( )A. B.C. D.14.(2020·全國·高考真題)設一組樣本數據x1,x2,…,xn的方差為0.01,則數據10x1,10x2,…,10xn的方差為( )A.0.01 B.0.1 C.1 D.1015.(2020·全國·高考真題)某校一個課外學習小組為研究某作物種子的發芽率y和溫度x(單位:°C)的關系,在20個不同的溫度條件下進行種子發芽實驗,由實驗數據得到下面的散點圖:由此散點圖,在10°C至40°C之間,下面四個回歸方程類型中最適宜作為發芽率y和溫度x的回歸方程類型的是( )A. B.C. D.16.(2020·海南·高考真題)我國新冠肺炎疫情進入常態化,各地有序推進復工復產,下面是某地連續11天復工復產指數折線圖,下列說法正確的是A.這11天復工指數和復產指數均逐日增加;B.這11天期間,復產指數增量大于復工指數的增量;C.第3天至第11天復工復產指數均超過80%;D.第9天至第11天復產指數增量大于復工指數的增量;17.(2020·天津·高考真題)從一批零件中抽取80個,測量其直徑(單位:),將所得數據分為9組:,并整理得到如下頻率分布直方圖,則在被抽取的零件中,直徑落在區間內的個數為( )A.10 B.18 C.20 D.3618.(2020·全國·高考真題)某廠接受了一項加工業務,加工出來的產品(單位:件)按標準分為A,B,C,D四個等級.加工業務約定:對于A級品、B級品、C級品,廠家每件分別收取加工費90元,50元,20元;對于D級品,廠家每件要賠償原料損失費50元.該廠有甲、乙兩個分廠可承接加工業務.甲分廠加工成本費為25元/件,乙分廠加工成本費為20元/件.廠家為決定由哪個分廠承接加工業務,在兩個分廠各試加工了100件這種產品,并統計了這些產品的等級,整理如下:甲分廠產品等級的頻數分布表等級 A B C D頻數 40 20 20 20乙分廠產品等級的頻數分布表等級 A B C D頻數 28 17 34 21(1)分別估計甲、乙兩分廠加工出來的一件產品為A級品的概率;(2)分別求甲、乙兩分廠加工出來的100件產品的平均利潤,以平均利潤為依據,廠家應選哪個分廠承接加工業務 19.(2017·全國·高考真題)為了監控某種零件的一條生產線的生產過程,檢驗員每隔從該生產線上隨機抽取一個零件,并測量其尺寸(單位:).下面是檢驗員在一天內依次抽取的16個零件的尺寸:抽取次序 1 2 3 4 5 6 7 8零件尺寸 9.95 10.12 9.96 9.96 10.01 9.92 9.98 10.04抽取次序 9 10 11 12 13 14 15 16零件尺寸 10.26 9.91 10.13 10.02 9.22 10.04 10.05 9.95經計算得,,,其中為抽取的第個零件的尺寸,.(1)求的相關系數,并回答是否可以認為這一天生產的零件尺寸不隨生產過程的進行而系統地變大或變小(若,則可以認為零件的尺寸不隨生產過程的進行而系統地變大或變小).(2)一天內抽檢零件中,如果出現了尺寸在之外的零件,就認為這條生產線在這一天的生產過程可能出現了異常情況,需對當天的生產過程進行檢查.(ⅰ)從這一天抽檢的結果看,是否需對當天的生產過程進行檢查?(ⅱ)在之外的數據稱為離群值,試剔除離群值,估計這條生產線當天生產的零件尺寸的均值與標準差.(精確到)附:樣本的相關系數,.20.(2016·全國·高考真題)下圖是我國2008年至2014年生活垃圾無害化處理量(單位:億噸)的折線圖. (Ⅰ)由折線圖看出,可用線性回歸模型擬合y與t的關系,請用相關系數加以說明;(Ⅱ)建立y關于t的回歸方程(系數精確到0.01),預測2016年我國生活垃圾無害化處理量.附注:參考數據:,,,≈2.646.參考公式:相關系數回歸方程中斜率和截距的最小二乘估計公式分別為:21世紀教育網(www.21cnjy.com) 展開更多...... 收起↑ 資源列表 2025年高考數學第一輪復習考點講與練第09講統計與統計案例(學生版).docx 2025年高考數學第一輪復習考點講與練第09講統計與統計案例(教師版).docx 縮略圖、資源來源于二一教育資源庫