資源簡介 階段質量評價(四) 統 計(時間:120分鐘 滿分:150分)一、單項選擇題(本大題共8小題,每小題5分,共40分.在每小題所給的四個選項中,只有一項是符合題目要求的)1.下列兩個變量中能夠具有相關關系的是 ( )A.人所站的高度與視野B.人眼的近視程度與身高C.正方體的體積與棱長D.某同學的學籍號與考試成績2.設變量X和變量Y的相關系數為r1,變量U和變量V的相關系數為r2,且r1=-0.734,r2=0.984,則 ( )A.X和Y之間呈正線性相關關系,且X和Y的線性相關程度強于U和V的線性相關程度B.X和Y之間呈負線性相關關系,且X和Y的線性相關程度強于U和V的線性相關程度C.U和V之間呈負線性相關關系,且X和Y的線性相關程度弱于U和V的線性相關程度D.U和V之間呈正線性相關關系,且X和Y的線性相關程度弱于U和V的線性相關程度3.變量X與Y相對應的一組數據為(10,1),(11.3,2),(11.8,2),(12.5,4),(13,5);變量U與V相對應的一組數據為(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).r1表示變量Y與X之間的相關系數,r2表示變量V與U之間的相關系數,則 ( )A.r2C.r2<04.下列關于獨立性檢驗的說法正確的是 ( )A.獨立性檢驗是對兩個變量是否具有線性相關關系的一種檢驗B.獨立性檢驗可以100%確定兩個變量之間是否具有某種關系C.利用χ2獨立性檢驗推斷吸煙與患肺病的關聯中,有99%的把握認為吸煙與患肺病有關系時,則我們可以說在100個吸煙的人中,有99人患肺病D.對于獨立性檢驗,隨機變量χ2的值越小,“兩變量有關系”的概率越小5.在一組樣本數據(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散點圖中,若所有樣本點(xi,yi)(i=1,2,…,n)都在直線y=-x+1上,則這組樣本數據的相關系數為 ( )A.-1 B.-C. D.16.在下列各圖中,兩個變量具有線性相關關系的是 ( )7.某校團委對“學生性別和喜歡某個APP是否有關”作了一次調查,其中被調查的男女生人數相同,男生喜歡的人數占男生人數的,女生喜歡的人數占女生人數的,若有95%的把握認為是否喜歡和性別有關,則調查人數中男生可能有 ( )P(χ2≥x0) 0.050 0.010x0 3.841 6.635附:χ2=.A.30人 B.54人C.60人 D.75人8.用模型y=aekx擬合一組數(xi,yi)(i=1,2,…,2 024),若x1+x2+…+x2 024=2 024,y1y2…y2 024=e20 240,設z=ln y,變換后的線性回歸方程為=bx+6,則ak= ( )A.20 240 B.6e4C.4e6 D.2 024二、多項選擇題(本大題共3小題,每小題6分,共18分.在每小題給出的四個選項中,有多項符合題目要求,全部選對的得6分,部分選對的得部分分,有選錯的得0分)9.某廠近幾年陸續購買了幾臺 A 型機床,該型機床已投入生產的時間x(單位:年)與當年所需要支出的維修費用y(單位:萬元)有如下統計資料:x 2 3 4 5 6y 2.2 3.8 5.5 6.5 7根據表中的數據可得到線性回歸方程為y=1.23x+,則 ( )A.=0.08B.y與x的相關系數r>0C.表中維修費用的60百分位數為6D.該型機床已投入生產的時間為 10年時,當年所需要支出的維修費用一定是12.38萬元10.某校有在校學生900人,其中男生400人,女生500人,為了解該校學生對學校課后延時服務的滿意度,隨機調查了40名男生和50名女生.每位被調查的學生都對學校的課后延時服務給出了滿意或不滿意的評價,統計過程中發現隨機從這90人中抽取一人,此人評價為滿意的概率為.在制定2×2列聯表時,由于某些因素缺失了部分數據,而獲得如下2×2列聯表,下列結論正確的是 ( )滿意 不滿意 合計男 10女合計 90參考公式與臨界值表:χ2=,其中n=a+b+c+d.P(χ2≥x0) 0.100 0.050 0.025 0.010 0.001x0 2.706 3.841 5.024 6.635 10.828A.滿意度的調查過程采用了分層抽樣的抽樣方法B.50名女生中對課后延時服務滿意的人數為20C.χ2的觀測值為9D.根據獨立性檢驗,不能認為“對課后延時服務的滿意度與性別有關系”11.下列說法中,正確的是 ( )A.一組數據10,11,11,12,13,14,16,18,20,22的40百分位數為12B.若樣本數據2x1+1,2x2+1,…,2x10+1的方差為8,則數據x1,x2,…,x10的方差為2C.已知隨機變量X服從正態分布N(μ,σ2),若P(X≥-2)+P(X≥6)=1,則μ=2D.在獨立性檢驗中,提出假設H0:分類變量X和Y獨立.當χ2≤x0時,我們就推斷H0不成立,即認為X和Y不獨立;當χ2>x0時,我們沒有充分證據推斷H0不成立,可以認為X和Y獨立三、填空題(本大題共3小題,每小題5分,共15分.把答案填在題中的橫線上)12.甲、乙、丙、丁各自研究兩個隨機變量的數據,若甲、乙、丙、丁計算得到各自研究的兩個隨機變量的相關系數分別為r1=0.66,r2=-0.97,r3=0.92,r4=0.89,則這四人中, 研究的兩個隨機變量的線性相關程度最高. 13.預制菜指以農、畜、禽、水產品為原輔料,配以調味料等經預選、調制等工藝加工而成的半成品.近幾年預制菜市場快速增長.某城市調查近4個月的預制菜市場規模y(萬元)得到如表所示的數據,根據數據得到y關于x的非線性回歸方程=.x 1 2 3 4y e4.2 e4.4 e4.6 e4.8按照這樣的速度,預估第8個月的預制菜市場規模是 萬元.(結果用e表示) 14.下面是一個2×2列聯表:y1 y2 合計x1 a 21 70x2 5 c 30合計 b d 100則b-d= ,χ2= .(保留小數點后3位) 四、解答題(本大題共5小題,共77分.解答應寫出文字說明、證明過程或演算步驟)15.(13分)某校對學生課外活動進行調查,結果整理成下表,用你所學過的知識進行分析,能否有99.5%的把握認為“喜歡體育還是文娛與性別有關系” 體育 文娛 合計男生 21 23 44女生 6 29 35合計 27 52 79附:χ2=.P(χ2≥x0) 0.05 0.025 0.010 0.005x0 3.841 5.024 6.635 7.87916.(15分)隨著科技發展的日新月異,人工智能融入了各個行業,促進了社會的快速發展.其中利用人工智能生成的虛擬角色因為擁有更低的人工成本,正逐步取代傳統的真人直播帶貨.某公司使用虛擬角色直播帶貨銷售金額得到逐步提升,以下為該公司自2023年8月使用虛擬角色直播帶貨后的銷售金額情況統計.年月 2023年 8月 2023年 9月 2023年 10月 2023年 11月 2023年 12月 2024年 1月月份編號x 1 2 3 4 5 6銷售金額 y/萬元 15.4 25.4 35.4 85.4 155.4 195.4若y與x的相關關系擬用線性回歸模型表示,回答如下問題:(1)試求變量y與x的相關系數r(結果精確到0.01);(2)試求y關于x的線性回歸方程,并據此預測2024年2月份該公司的銷售金額.(均保留一位小數)參考數據:xiyi=2 463.4,=20..17.(15分)數獨是源自18世紀瑞士的一種數學游戲,玩家需要根據9×9盤面上的已知數字,推理出所有剩余空格的數字,并滿足每一行、每一列、每一個粗線宮(3×3)內的數字均含1~9,且不重復.數獨愛好者小明打算報名參加“絲路杯”全國數獨大賽初級組的比賽.(1)賽前小明進行了一段時間的訓練,每天解題的平均速度y(秒/題)與訓練天數x(天)有關,經統計得到如下數據:x(天) 1 2 3 4 5 6 7y(秒/題) 910 800 600 440 300 240 210現用=+作為回歸方程模型,請利用表中數據,求出該回歸方程;(用分數表示)(2)小明和小紅玩“對戰賽”,每局兩人同時開始解一道數獨題,先解出題的人獲勝,不存在平局,兩人約定先勝3局者贏得比賽.若小明每局獲勝的概率為,且各局之間相互獨立,設比賽X局后結束,求隨機變量X的分布列及均值.參考數據:tiyi t-721 750 0.37 0.55參考公式:對于一組數據(u1,v1),(u2,v2),…,(un,vn),其線性回歸方程=+μ的斜率和截距的最小二乘估計分別為= ,=-.18.(17分)我國風云系列衛星可以監測氣象和國土資源情況.某地區水文研究人員為了了解汛期人工測雨量x(單位:dm)與遙測雨量y(單位:dm)的關系,統計得到該地區10組雨量數據如表:樣本號i 1 2 3 4 5 6 7 8 9 10人工測 雨量xi 5.38 7.99 6.37 6.71 7.53 5.53 4.18 4.04 6.02 4.23遙測雨 量yi 5.43 8.07 6.57 6.14 7.95 5.56 4.27 4.15 6.04 4.49|xi-yi| 0.05 0.08 0.2 0.57 0.42 0.03 0.09 0.11 0.02 0.26并計算得≈353.6,≈361.7,xiyi≈357.3,≈33.62,≈34.42, ≈34.02.(1)求該地區汛期遙測雨量y與人工測雨量x的相關系數(精確到0.01),并判斷它們是否具有線性相關關系;(2)規定:數組(xi,yi)滿足|xi-yi|<0.1為“Ⅰ類誤差”;滿足0.1≤|xi-yi|<0.3為“Ⅱ類誤差”;滿足|xi-yi|≥0.3為“Ⅲ類誤差”.為進一步研究,該地區水文研究人員從“Ⅰ類誤差”“Ⅱ類誤差”中隨機抽取3組數據與“Ⅲ類誤差”數據進行對比,記抽到“Ⅰ類誤差”的數據的組數為X,求X的概率分布與數學期望.附:相關系數r=,≈17.4.19.(17分)為考察藥物M對預防疾病A以及藥物N對治療疾病A的效果,科研團隊進行了大量動物對照試驗.根據100個簡單隨機樣本的數據,得到如下列聯表:(單位:只)藥物M 疾病A 合計未患病 患病未服用 30 15 45服用 45 10 55合計 75 25 100(1)根據表中所給數據,判斷能否有99%的把握認為藥物M對預防疾病A有效果;(2)用頻率估計概率,現從患病的動物中用隨機抽樣的方法每次選取1只,用藥物N進行治療.已知藥物N的治愈率如下:對未服用過藥物M的動物治愈率為,對服用過藥物M的動物治愈率為.若共選取3次,每次選取的結果是相互獨立的.記選取的3只動物中被治愈的動物個數為X,求X的分布列和數學期望.階段質量評價(四)1.選A 人所站的高度越高則視野越開闊,具有正相關關系,故A正確;人眼的近視程度與身高不具有相關關系,故B錯誤;正方體的體積與棱長是一種確定關系,故C錯誤;某同學的學籍號與考試成績不具有相關關系,故D錯誤.故選A.2.選D 由相關系數r1=-0.734<0,可知變量X與Y之間呈負線性相關關系,由相關系數r2=0.984>0,可知變量U與V之間呈正線性相關關系,又|r1|<|r2|,所以變量U與V的線性相關程度比變量X與Y的線性相關程度強.故選D.3.選C Y隨X的增大而增大,故變量Y與X正相關,即r1>0;V隨U的增大而減小,故變量V與U負相關,即r2<0,故r2<04.選D 對于A,獨立性檢驗是通過卡方計算來判斷兩個變量存在關聯的可能性的一種方法,并非檢驗二者是否是線性相關,故錯誤;對于B,獨立性檢驗并不能100%確定兩個變量相關,故錯誤;對于C,99%是指“吸煙”和“患肺病”存在關聯的可能性,并非吸煙人中患肺病的發病率,故錯誤;對于D,根據卡方計算的定義可知該選項正確.故選D.5.選A 因為所有樣本點(xi,yi)(i=1,2,…,n)都在直線y=-x+1上,所以它們負相關,相關系數為-1.故選A.6.選C 對于A,兩個變量為函數關系,不是線性相關關系,故A錯誤;對于B,所有點不是在一條直線附近波動,不是線性相關關系,故B錯誤;對于C,對于兩個變量x,y,y隨著x的增加而減少,且所有點都在一條直線附近波動,所以具有線性相關關系,故C正確;對于D,兩個變量不具有相關性,故D錯誤.故選C.7.選BC 設男生的人數為6n(n∈N*),根據題意列出2×2列聯表如下表所示:男生 女生 合計喜歡 5n 4n 9n不喜歡 n 2n 3n合計 6n 6n 12n則χ2==,由于有95%的把握認為是否喜歡和性別有關,則3.841<χ2≤6.635,即3.841<≤6.635,得8.642 3因為n∈N*,則n的可能取值有9,10,11,12,13,14,因此,調查人數中男生人數的可能值為54,60,66,72,78,84.故選BC.8.選C 由條件可知=1,=ln yi=10,代入=bx+6 b=4,則z=ln y=ln a+kx=4x+6 k=4,a=e6,故C正確.故選C.9.選ABC 根據題意可得,=4,==5,所以樣本中心點為(4,5).將樣本中心點(4,5)代入線性回歸方程y=1.23x+中,可得=0.08,故A正確;由表中數據可得y隨著x增大而增大,x與y正相關,所以相關系數r>0,故B正確;維修費用從小到大依次為2.2,3.8,5.5,6.5,7,60百分位數為=6,故C正確;根據回歸分析的概念,機床投入生產的時間為 10年時,所需要支出的維修費用大概是12.38萬元,故D錯誤.故選ABC.10.選AD 因為在校學生中有400名男生,500名女生,隨機調查了40名男生和50名女生,男女比例始終是4∶5,所以采用了分層抽樣的方法,故A正確;調查的90人中,對學校課后延時服務滿意的人數為90×=60,其中男生滿意的人數為40-10=30,所以女生滿意的人數為30,女生不滿意的人數為20,故B錯誤;由B選項的分析,補全列聯表如下:滿意 不滿意 合計男 30 10 40女 30 20 50合計 60 30 90由列聯表可得χ2==,故C錯誤;提出假設H0:對課后延時服務的滿意度與性別無關,由χ2=<10.828,沒有充足的證據推斷H0不成立,即不能認為“對課后延時服務的滿意度與性別有關系”,故D正確.故選AD.11.選BC 由于10,11,11,12,13,14,16,18,20,22共10個數據,且10×0.4=4,故40百分位數為第4,5個數據的平均數=12.5,故A錯誤;設數據x1,x2,…,x10的平均數為=,方差為s2=[++…+],則數據2x1+1,2x2+1,…,2x10+1的平均數為'===2+1,方差為=[++…+]=[++…+]=[++…+]=4s2=8,所以s2=2,故B正確;P(X≥-2)+P(X≥6)=1則P(X≥6)=1-P(X≥-2)=P(X≤-2),即P(X≥6)=P(X≤-2),由正態分布N(μ,σ2)的性質可得μ==2,故C正確;在獨立性檢驗中,提出假設H0:分類變量X和Y獨立.當χ2≥x0時,我們就推斷H0不成立,即認為X和Y不獨立;當χ212.解析:因為|r2|=0.97>|r3|>|r4|>|r1|,所以這四人中,乙研究的兩個隨機變量的線性相關程度最高.答案:乙13.解析:由題設,令z=ln =-a,則==,==,所以=-a a=-4,則z=ln =+4,所以x=8代入回歸方程,則z=ln =5.6,可得=e5.6萬元.答案:e5.614.解析:補全2×2列聯表:y1 y2 合計x1 49 21 70x2 5 25 30合計 54 46 100所以b-d=54-46=8,χ2=≈24.047.答案:8 24.04715.解:提出假設H0:喜歡體育還是文娛與性別沒有關系.因為a=21,b=23,c=6,d=29,n=79,則χ2===8.106>7.879,因為當H0成立時,χ2≥7.879的概率約為0.005,所以我們有99.5%的把握認為喜歡體育還是文娛與性別有關系.16.解: (1)==3.5,==85.4,-6=1+4+9+16+25+36-6×12.25=17.5,所以r===≈0.96.(2)由題意==≈38.3,所以=85.4-38.3×3.5≈-48.7,所以y關于x的線性回歸方程為y=38.3x-48.7,所以預測2024年2月份該公司的銷售金額為y=38.3×7-48.7=219.4萬元.17.解: (1)因為=+,ti=,所以=+t.因為==500,所以====,所以=-=500-×0.37=,所以=+t,所以所求回歸方程為=+.(2)隨機變量X的所有可能取值為3,4,5,則P(X=3)=+=,P(X=4)=××+××=,P(X=5)=××+××=.所以隨機變量X的概率分布為X 3 4 5PE(X)=3×+4×+5×=.18.解: (1)因為r==≈=≈0.98,所以該地區汛期遙測雨量與人工測雨量有很強的線性相關關系.(2)依題意,“Ⅰ類誤差”有5組,“Ⅱ類誤差”有3組,“Ⅲ類誤差”有2組.若從“Ⅰ類誤差”和“Ⅱ類誤差”數據中抽取3組,抽到“Ⅰ類誤差”的組數X的所有可能取值為0,1,2,3,則P(X=0)==,P(X=1)==,P(X=2)===,P(X=3)===,所以X的概率分布為X 0 1 2 3P法一 E(X)=0×+1×+2×+3×=.法二 因為X~H(3,5,8),所以E(X)==.19.解:(1)提出假設H0:藥物M對預防疾病A無效果,根據列聯表中的數據,經計算得到χ2==≈3.030>2.706,因為當H0成立時,P(χ2≥2.706)≈0.1,所以有99%的把握認為藥物M對預防疾病A有效果.(2)設A表示藥物N的治愈率,B1表示未服用過藥物M,B2表示服用過藥物M,由題意可得P(B1)==0.6,P(B2)==0.4,且P(A|B1)=0.5,P(A|B2)=0.75,P(A)=P(B1)×P(A|B1)+P(B2)×P(A|B2)=0.6×0.5+0.4×0.75=0.6,所以藥物N的治愈率P=0.6=,則X~B,所以P(X=0)==,P(X=1)==,P(X=2)==,P(X=3)==,所以隨機變量X的概率分布如下表所示:X 0 1 2 3PE(X)=0×+1×+2×+3×=.1 / 8 展開更多...... 收起↑ 資源預覽 縮略圖、資源來源于二一教育資源庫